业界领先的开源大型混合专家模型
一款文本转语音工具,帮助您轻松阅读文本。
统一的开放命名实体和语音识别模型
开源AI语音处理工具包,支持语音增强、分离和目标说话人提取。
智能AI辅助编写邮件模板,简化邮件发送流程。Volamail官网入口网址
一个开源文本转语音系统,致力于实现人类语音的自然化。
CocoIndex 是一个开源的数据索引引擎,支持自定义转换逻辑和增量更新。
OpenManus 是一个无需邀请码即可使用的开源智能代理项目。
探索大型语言模型作为编程辅导工具的潜力,提出Trace-and-Verify工作流。
DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型,适用于文本生成和推理任务。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
AI语音代理测试与可观测性平台
AI驱动的开源笔记/研究平台,尊重您的隐私。
开源替代品,基于搜索结果生成AI报告
高效视频生成建模的金字塔流匹配技术
开放高效的视频水印技术
一站式AI数字人系统,支持视频合成、声音合成、声音克隆。
与大型语言模型进行自然的语音对话
MCP服务器目录,汇集多个MCP服务器资源。
一个用于检测幻觉的开源评估模型,基于Llama-3架构,拥有700亿参数。
开源的全能 AI 助手,帮助完成各种任务。
8亿参数的多语言视觉语言模型,支持OCR、图像描述、视觉推理等功能
通过强化学习提升大型语言模型在开源软件演变中的推理能力
On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。
中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用,支持中英双语问答的对话语言模型,并针对中文进行了优化,清华开源模型ChatGLM-6B可本地官网入口网址
一个开源项目,用于在浏览器中演示 AI 视频生成模型。
地球科学的开源大预言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调,K2-上海交通大学官网入口网址
DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型,适用于多种文本生成任务。
通过视频扩散变换器将自定义照片与视频混合的项目。
世界领先的数学开源大语言模型
Android平台上的私有、设备端语音识别键盘和文字服务
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适