一键将视频和音频转化为各种风格的文档。
数学领域的开源AI模型,助力数学竞赛。Numina Math 7B官网入口网址
通过文本搜索快速找到完美表情包,Meme Search官网入口网址
s1是一个基于Qwen2.5-32B-Instruct微调的推理模型,仅用1000个样本进行训练。
探索AI前沿,精选国内外AI产品与应用。
AI抠图项目,使用开源模型实现图像抠图。image-matting官网入口网址
复旦大模型MOSS,正式开源了,MOSS 复旦大模型官网入口网址
文本到视频生成领域的先进模型架构,Open-Sora Plan v1.2官网入口网址
可视化和透明的开源ChatGPT替代品
开源的全能 AI 助手,帮助完成各种任务。
一款通过生成模型提升图像生成一致性的工具。
一个开源的NotebookLM实现,使用Deepseek-V3和PlayHT TTS技术。
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
在视频扩散变换器中合成任何内容的框架。
DeepSeek 是一款先进的 AI 语言模型,擅长逻辑推理、数学和编程任务,提供免费使用。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
开源自主软件开发系统,SuperCoder 2.0官网入口网址
一个高效的语音合成模型,支持中英文及语音克隆。
一个开源项目,用于在浏览器中演示 AI 视频生成模型。
一个社区驱动的深度研究框架,结合语言模型与多种工具。
Inductive Moment Matching 是一种新型的生成模型,用于高质量图像生成。
高效视频生成建模的金字塔流匹配技术
基于大型语言模型的高性能MacOS聊天应用,ChatMLX官网入口网址
Magic 1-For-1 是一个高效的图像到视频生成模型,可在一分钟内生成一分钟的视频。
Mochi视频生成器的ComfyUI包装节点
先进的医疗领域大型语言模型
开源的工业级普通话自动语音识别模型,支持多种应用场景。
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
强大的开源Kimi K2聊天平台,通过Kimi AI在编程和数学基准测试中超越GPT-4。企业级Kimi AI,成本降低95%。
开源视频生成模型,支持多种生成任务。
一个开源文本转语音系统,致力于实现人类语音的自然化。
Wan2.1 是一款开源的先进大规模视频生成模型,支持多种视频生成任务。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适