WhisperKit是一个开源项目,旨在帮助开发者和企业在用户设备上部署商业规模的推理工作负载,Argmax WhisperKit官网入口网址
Stable Diffusion XL AI, 开源的 AI 图片生成器,StableDiffusion XL官网入口网址
开源项目,复现OpenAI的Sora模型,Open-Sora-Plan官网入口网址
一款AI自动创作小说工具,免费使用。StoryGenius官网入口网址
只需要100美金,就能手搓一个Humane Pin。ADeus官网入口网址
基于RWKV语言模型的开源聊天助手,ChatRWKV官网入口网址
ComfyUI和N-Sidebar的组合,用于创建舒适的用户界面和导航栏,ComfyUI-N-Sidebar官网入口网址
cog-become-image是一个可以将任何人的面部图片转换成另一张图片的工具,cog-become-image官网入口网址
使用大型语言模型进行逆向工程:反编译二进制代码,LLM4Decompile官网入口网址
模拟OpenAI Sora API的开源项目,FakeSoraAPI官网入口网址
一个用于文本到语音转换的开源项目。ChatTTS官网入口网址
开源项目,用于估算模型训练或推理所需的显存。
一个集成DeepSeek API的多功能项目,包括智能聊天机器人、文件处理及模型部署。
利用扩散模型为黑白图片上色
DragGAN是一个创新的AI图像编辑工具,它提供了一种新颖的交互方式,允许用户通过直观的点拖动操作来编辑图像,DragGAN(GitHub)官网入口网址
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
开源的音乐生成模型
由AI完全自主创作的300页小说
记录AI发展里程碑的开源项目,AITimeline官网入口网址
个性化语言学习工具,结合Duolingo风格课程与自定义词汇表,通过互动测验和LLM生成课程复习。
EmojiGen 是一个基于人工智能技术的开源表情符号生成器,它允许用户通过简单的文字描述来快速创建有趣和个性化的表情符号图片,EmojiGen官网入口网址
一个强大的图像超分辨率工具,它利用深度学习和生成对抗网络,在没有真实高分辨率图像作为参考的情况下,通过合成退化过程来提升低分辨率图像的质量,Real-ESRGAN官网入口网址
一个创新的文本到图像生成系统,它通过结合大语言模型的解析能力和领域专家模型的生成能力,实现了从多样化文本提示到高质量图像的高效转换,DiffusionGPT官网入口网址
扩展LLaVA模型,集成Phi-3和LLaMA-3,提升视觉与语言模型的交互能力。
Vast 3D Gaussians for Large Scene Reconstruction的非官方实现
git历史查询助手,贡献者分析工具
通过强化学习微调大型视觉-语言模型作为决策代理
ChatTTS项目的入门指南和资源汇总。
使用Apple Vision Pro实现人形机器人Unitree H1_2的遥控操作。
旨在帮助我们理解AI代理的工程化提示项目。
开源自回归视觉生成模型项目
股票经纪人人工智能助手,提供专业投资建议。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适