AI助手,探索宇宙,获取真实答案
与先进AI学习60种外语,跨越语言边界,提升口语能力。
多语言对话生成模型,Meta-Llama-3.1-405B-Instruct-FP8官网入口网址
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
8B参数的大型多语言生成模型,Meta-Llama-3.1-8B官网入口网址
InternLM3 是一个专注于文本生成的模型集合,提供多种优化版本以满足不同需求。
智能翻译,电商领域的语言专家
AI视频多语言配音服务,Speax AI官网入口网址
DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型,适用于文本生成和推理任务。
Gemini Embedding 是一种先进的文本嵌入模型,通过 Gemini API 提供强大的语言理解能力。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
AI驱动的个性化多语言翻译平台
Scribe 是全球最准确的语音转文字模型,支持99种语言。
Zonos TTS 是一款支持多语言、情感控制和零样本文本到语音克隆的高质量 AI 文本转语音技术。
音刻转录是一款快速、精准、丝滑的音视频转录工具。
基于Llama框架的TTS基础模型,兼容16万小时标记化语音数据。
Whisper Turbo 是一款免费在线快速准确的语音识别工具。
记录、转录和翻译音频笔记的终极应用
轻量级、多语言的先进文本生成模型,Phi-3.5-mini-instruct官网入口网址
Step-Audio是一个开源智能语音交互框架,支持多语言对话、情感语调和语音克隆等功能。
这是一个基于Qwen2.5-32B模型的4位量化版本,专为高效推理和低资源部署设计。
AI购物助手,提升电商购物体验
在线AI贴纸生成器,快速创建个性化贴纸
多语言大型语言模型,支持23种语言
70亿参数的多语言大型语言模型
7B参数的多语言文本生成模型,c4ai-command-r7b-12-2024官网入口网址
利用 Gaga 的 AI 生成逼真头像和生动视频。
SigLIP2 是谷歌推出的一种多语言视觉语言编码器,用于零样本图像分类。
Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型,能够提供高质量的语音合成服务。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适