免费AI音频转文本,含说话人标签、时间戳,支持TXT/DOCX/SRT导出
Qwen Image是阿里巴巴的免费开源AI图像生成器,擅长在图像中进行文本渲染。
Dream 7B 是最强大的开放扩散大语言模型。
将文本即时转换为令人惊叹的 3D 模型。
SmolVLM2 是一个专注于视频内容分析和生成的轻量化语言模型。
Gemini Embedding 是一种先进的文本嵌入模型,通过 Gemini API 提供强大的语言理解能力。
CogView4 是一个支持中文和英文的高分辨率文本到图像生成模型。
QwQ-32B 是一款强大的推理模型,专为复杂问题解决和文本生成设计,性能卓越。
Magma-8B 是微软推出的一款多模态 AI 模型,能够处理图像和文本输入并生成文本输出。
一个基于强化学习优化的大型语言模型,专注于数学问题解决能力的提升。
Hunyuan3D 2.0 是腾讯推出的高分辨率 3D 资产生成系统,基于大规模扩散模型。
SmolVLM-256M 是世界上最小的多模态模型,可高效处理图像和文本输入并生成文本输出。
Llasa-1B 是一个基于 LLaMA 的文本转语音 (TTS) 模型,支持中英文语音合成。
多语言生成语言模型
一个实验性的文本到语音模型
由10个AI代理共同创作的小说
基于文本生成姿态并进一步生成图像的模型
基于Qwen-Agent的Chrome浏览器插件,提供网页和文档讨论、记录及自动化写作功能。
多模态原生Mixture-of-Experts模型
高分辨率、多语言文本到图像生成模型
70亿参数的多语言大型语言模型
手訫风格的铅笔素描生成模型
多模态大型语言模型,融合视觉与语言理解。
AI驱动的文章摘要工具,快速获取文章概要。
LG AI Research开发的双语文本生成模型
一个展示Gemini 2.0原生音频能力的实验性文本编辑器
AI论文写作平台,10分钟生成万字论文
LG AI Research开发的多语言生成模型
开源幻觉评估模型
先进的多模态大型语言模型,具备卓越的多模态推理能力。
高效率自回归视频生成模型,Pyramid Flow miniFLUX官网入口网址
高性能的文本到语音合成模型,OuteTTS-0.2-500M官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适