Scira 是一个极简主义的 AI 驱动搜索引擎,帮助用户在互联网上查找信息。
Wan2.1 是一款开源的先进大规模视频生成模型,支持多种视频生成任务。
开源的工业级普通话自动语音识别模型,支持多种应用场景。
DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型,适用于文本生成和推理任务。
DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型,适用于多种文本生成任务。
AI语音代理测试与可观测性平台
一键生成数据的直观反射图
统一的开放命名实体和语音识别模型
一款高效率的2.4亿参数轻量级语言模型
高效的文本到音频生成模型
先进的文本生成模型,支持多样化任务,Llama-3.1-Tulu-3-8B-DPO官网入口网址
一个强大的文本生成模型,适用于多种对话应用。
Vibe Coder 是一款开源的 VS Code 扩展,用于探索基于语音的 AI 编程体验。
Migician 是一个专注于多图像定位的多模态大语言模型,能够实现自由形式的多图像精确定位。
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
一个强大的OCR包,使用最先进的视觉语言模型提取图像中的文本。
AI驱动的开源笔记/研究平台,尊重您的隐私。
业界领先的开源大型混合专家模型
一款文本转语音工具,帮助您轻松阅读文本。
与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
一个模型上下文协议服务器,用于 Excel 文件操作。
在视频扩散变换器中合成任何内容的框架。
生成高质量 SVG 代码的基础模型。
一款开源的14B参数量的数学模型,通过强化学习训练,性能卓越。
为Firefox浏览器翻译功能优化的CPU加速神经机器翻译模型。
8亿参数的多语言视觉语言模型,支持OCR、图像描述、视觉推理等功能
Magic 1-For-1 是一个高效的图像到视频生成模型,可在一分钟内生成一分钟的视频。
一个开源的编程助手工具,帮助开发者简化编程任务。
加速数字团队的AI驱动设计转代码、可视化编辑和企业级CMS的视觉开发平台。
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适