开源 - 第 7 页

Exa & Deepseek Chat App

一个开源的聊天应用，使用Exa的API进行网络搜索，结合Deepseek R1进行推理。

DocDecoder.app

使用AI技术，快速总结网站法律政策。

ComfyUI-LTXTricks

为LTX视频模型提供额外控制的ComfyUI节点集合

YuLan-Mini

一款高效率的2.4亿参数轻量级语言模型

face_anon_simple

人脸匿名化技术，保留关键细节同时有效保护隐私。

Llama-3-Patronus-Lynx-70B-Instruct

一个用于检测幻觉的开源评估模型，基于Llama-3架构，拥有700亿参数。

audiblez

将电子书转换为有声书的工具。

RealtimeSTT

一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。

Sana_1600M_512px

高分辨率、高效率的文本到图像生成框架

Wiki-Go

一款现代、功能丰富的无数据库平面文件 Wiki 平台。

DeepSeek-V3-0324

一个强大的文本生成模型，适用于多种对话应用。

DeepSeek-R1-Zero

DeepSeek-R1-Zero 是一款通过大规模强化学习训练的推理模型，无需监督微调即可实现卓越推理能力。

Tülu 3

开源的先进语言模型后训练框架

Praises

一款文本转语音工具，帮助您轻松阅读文本。

Moonshine Web

实时浏览器端语音识别应用

ComfyUI-StableAudioSampler

音频采样器，创造音乐节奏

Llama-3.1-Tulu-3-8B-DPO

先进的文本生成模型，支持多样化任务，Llama-3.1-Tulu-3-8B-DPO官网入口网址

Alpha-VLLM

多功能文本到多模态内容生成框架，Alpha-VLLM官网入口网址

12306 MCP Server

高性能火车票查询后端系统，支持官方实时数据服务。

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型，适用于文本生成和推理任务。

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型，适用于多种文本生成任务。

Mini-Omni

开源多模态大型语言模型，支持实时语音输入和流式音频输出。Mini-Omni官网入口网址

Pandrator

一个开源的GUI音频书和配音生成器。Pandrator官网入口网址

蛐蛐 (QuQu)

开源免费的 Wispr Flow 替代方案，为中文用户打造的桌面端语音输入与文本处理工具。

StarVector

生成高质量 SVG 代码的基础模型。

IndexTTS

工业级可控高效的零样本文本到语音系统

FireRedASR-AED-L

开源工业级自动语音识别模型，支持普通话、方言和英语，性能卓越。

PengChengStarling

PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别（ASR）模型开发工具包。

Codename Goose

本地运行的人工智能代理，无缝自动化工程任务。

Flex.1-alpha

一个基于文本生成图像的预训练模型，具有80亿参数和Apache 2.0开源许可。

fixa

AI语音代理测试与可观测性平台

OmniSenseVoice

极速语音识别，精准时间戳

开源

OpeniTab