开源项目

Argmax WhisperKit

WhisperKit是一个开源项目，旨在帮助开发者和企业在用户设备上部署商业规模的推理工作负载，Argmax WhisperKit官网入口网址

StableDiffusion XL

Stable Diffusion XL AI，开源的 AI 图片生成器，StableDiffusion XL官网入口网址

Open-Sora-Plan

开源项目，复现OpenAI的Sora模型，Open-Sora-Plan官网入口网址

StoryGenius

一款AI自动创作小说工具，免费使用。StoryGenius官网入口网址

ChatRWKV

基于RWKV语言模型的开源聊天助手，ChatRWKV官网入口网址

ADeus

只需要100美金，就能手搓一个Humane Pin。ADeus官网入口网址

ComfyUI-N-Sidebar

ComfyUI和N-Sidebar的组合，用于创建舒适的用户界面和导航栏，ComfyUI-N-Sidebar官网入口网址

cog-become-image

cog-become-image是一个可以将任何人的面部图片转换成另一张图片的工具，cog-become-image官网入口网址

LLM4Decompile

使用大型语言模型进行逆向工程：反编译二进制代码，LLM4Decompile官网入口网址

FakeSoraAPI

模拟OpenAI Sora API的开源项目，FakeSoraAPI官网入口网址

ChatTTS

一个用于文本到语音转换的开源项目。ChatTTS官网入口网址

DragGAN(GitHub)

DragGAN是一个创新的AI图像编辑工具，它提供了一种新颖的交互方式，允许用户通过直观的点拖动操作来编辑图像，DragGAN(GitHub)官网入口网址

QA-MDT

开源的音乐生成模型

DeepSeek Project

一个集成DeepSeek API的多功能项目，包括智能聊天机器人、文件处理及模型部署。

Open-MAGVIT2

开源自回归视觉生成模型项目

BooW-VTON

提升户外虚拟试穿效果的模型训练代码库

Real-ESRGAN

一个强大的图像超分辨率工具，它利用深度学习和生成对抗网络，在没有真实高分辨率图像作为参考的情况下，通过合成退化过程来提升低分辨率图像的质量，Real-ESRGAN官网入口网址

AutoSeg-SAM2

基于Segment-Anything-2和Segment-Anything-1的自动全视频分割工具

LLaVA++

扩展LLaVA模型，集成Phi-3和LLaMA-3，提升视觉与语言模型的交互能力。

WordPecker App

个性化语言学习工具，结合Duolingo风格课程与自定义词汇表，通过互动测验和LLM生成课程复习。

Awesome-ChatTTS

ChatTTS项目的入门指南和资源汇总。

Factorio学习环境

基于《Factorio》游戏的大语言模型测试与学习环境

SuperPrompt

旨在帮助我们理解AI代理的工程化提示项目。

ComfyUI-PyramidFlowWrapper

Pyramid-Flow的ComfyUI包装节点，用于高效视觉生成。

DiffusionGPT

一个创新的文本到图像生成系统，它通过结合大语言模型的解析能力和领域专家模型的生成能力，实现了从多样化文本提示到高质量图像的高效转换，DiffusionGPT官网入口网址

How Much VRAM

开源项目，用于估算模型训练或推理所需的显存。

Multispecies Whale Detection

多物种鲸鱼声音检测工具

AITimeline

记录AI发展里程碑的开源项目，AITimeline官网入口网址

NLR

由AI完全自主创作的300页小说

assistant-ui-stockbroker

股票经纪人人工智能助手，提供专业投资建议。

Color-diffusion

利用扩散模型为黑白图片上色

VastGaussian

Vast 3D Gaussians for Large Scene Reconstruction的非官方实现

OpeniTab