WhisperKit是一个开源项目,旨在帮助开发者和企业在用户设备上部署商业规模的推理工作负载,Argmax WhisperKit官网入口网址
Stable Diffusion XL AI, 开源的 AI 图片生成器,StableDiffusion XL官网入口网址
开源项目,复现OpenAI的Sora模型,Open-Sora-Plan官网入口网址
一款AI自动创作小说工具,免费使用。StoryGenius官网入口网址
只需要100美金,就能手搓一个Humane Pin。ADeus官网入口网址
基于RWKV语言模型的开源聊天助手,ChatRWKV官网入口网址
ComfyUI和N-Sidebar的组合,用于创建舒适的用户界面和导航栏,ComfyUI-N-Sidebar官网入口网址
cog-become-image是一个可以将任何人的面部图片转换成另一张图片的工具,cog-become-image官网入口网址
使用大型语言模型进行逆向工程:反编译二进制代码,LLM4Decompile官网入口网址
模拟OpenAI Sora API的开源项目,FakeSoraAPI官网入口网址
一个用于文本到语音转换的开源项目。ChatTTS官网入口网址
记录AI发展里程碑的开源项目,AITimeline官网入口网址
扩展LLaVA模型,集成Phi-3和LLaMA-3,提升视觉与语言模型的交互能力。
Vast 3D Gaussians for Large Scene Reconstruction的非官方实现
git历史查询助手,贡献者分析工具
通过强化学习微调大型视觉-语言模型作为决策代理
ChatTTS项目的入门指南和资源汇总。
使用Apple Vision Pro实现人形机器人Unitree H1_2的遥控操作。
开源项目,用于估算模型训练或推理所需的显存。
旨在帮助我们理解AI代理的工程化提示项目。
开源自回归视觉生成模型项目
多物种鲸鱼声音检测工具
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
股票经纪人人工智能助手,提供专业投资建议。
基于Segment-Anything-2和Segment-Anything-1的自动全视频分割工具
开源的音乐生成模型
提升户外虚拟试穿效果的模型训练代码库
利用扩散模型为黑白图片上色
由AI完全自主创作的300页小说
总奖金超 233 万!
报名即将截止