开源 - 第 9 页 - Home

开源

实时AI视频生成开源模型

HunyuanVideo

腾讯开源的大型视频生成模型训练框架

上下文驱动的图像生成工具，保持前景保真度。

Reka Flash 3

一款 21B 通用推理模型，适合低延迟应用。

On-device Sora

On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。

easegen-admin

开源数字人课程制作平台

智能AI辅助编写邮件模板，简化邮件发送流程。Volamail官网入口网址

Go with the Flow

一种用于控制视频扩散模型运动模式的高效方法，支持运动模式的自定义和迁移。

kokoro-onnx

基于Kokoro和ONNX运行时的文本到语音（TTS）项目。

Ollama OCR for web

一个强大的OCR包，使用最先进的视觉语言模型提取图像中的文本。

MLX-Auto-Subtitled-Video-Generator

基于 Apple MLX 框架的视频字幕生成工具

ComfyUI-MochiEdit

视频编辑工具，使用Genmo Mochi技术

开放高效的视频水印技术

ClearerVoice-Studio

开源AI语音处理工具包，支持语音增强、分离和目标说话人提取。

开源AI代码编辑器，提供强大的AI功能和完全的数据控制。

Llama-3.1-Tulu-3-8B-SFT

先进的文本生成模型，支持多样化任务

FLUX.1-dev-Controlnet-Union-alpha

一种先进的文本到图像的生成模型。FLUX.1-dev-Controlnet-Union-alpha官网入口网址

Excel MCP Server

一个模型上下文协议服务器，用于 Excel 文件操作。

OpenManus 是一个无需邀请码即可使用的开源智能代理项目。

Aya Vision 32B

Aya Vision 32B 是一个支持多语言的视觉语言模型，适用于OCR、图像描述、视觉推理等多种用途。

Janus-Pro-1B

Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。

一个仅100行代码的极简LLM框架，使LLM能够自主编程。

Tencent-Hunyuan-Large

业界领先的开源大型混合专家模型

开源项目，实现AI音乐服务的API接口

Sana_1600M_1024px

高分辨率、高效率的文本到图像生成框架，Sana_1600M_1024px官网入口网址

开源的 AI 研究助手，集成多种外部资源。

F Lite 是一款 10B 参数的扩散模型，专注于合法和安全内容。

一款基于 Vue3 + ElementPlus 的聊天应用，内置多个大语言模型。

NeoBase 是一款开源的 AI 数据库助手，让你用自然语言与数据库交互。

加速数字团队的AI驱动设计转代码、可视化编辑和企业级CMS的视觉开发平台。

一键生成数据的直观反射图

开源的RAG基础聊天工具，与文档对话。

1…7 8910 11…14