AI助手,探索宇宙,获取真实答案
与先进AI学习60种外语,跨越语言边界,提升口语能力。
多语言对话生成模型,Meta-Llama-3.1-405B-Instruct-FP8官网入口网址
InternLM3 是一个专注于文本生成的模型集合,提供多种优化版本以满足不同需求。
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
AI视频多语言配音服务,Speax AI官网入口网址
8B参数的大型多语言生成模型,Meta-Llama-3.1-8B官网入口网址
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
Gemini Embedding 是一种先进的文本嵌入模型,通过 Gemini API 提供强大的语言理解能力。
DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型,适用于文本生成和推理任务。
智能翻译,电商领域的语言专家
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
AI驱动的个性化多语言翻译平台
多语言生成语言模型
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
音刻转录是一款快速、精准、丝滑的音视频转录工具。
Scribe 是全球最准确的语音转文字模型,支持99种语言。
Step-Audio是一个开源智能语音交互框架,支持多语言对话、情感语调和语音克隆等功能。
AI购物助手,提升电商购物体验
Zonos TTS 是一款支持多语言、情感控制和零样本文本到语音克隆的高质量 AI 文本转语音技术。
基于Llama框架的TTS基础模型,兼容16万小时标记化语音数据。
SigLIP2 是谷歌推出的一种多语言视觉语言编码器,用于零样本图像分类。
Whisper Turbo 是一款免费在线快速准确的语音识别工具。
多语言大型语言模型,支持23种语言
利用 Gaga 的 AI 生成逼真头像和生动视频。
在线AI贴纸生成器,快速创建个性化贴纸
记录、转录和翻译音频笔记的终极应用
轻量级、多语言的先进文本生成模型,Phi-3.5-mini-instruct官网入口网址
Aya Vision 32B 是一个支持多语言的视觉语言模型,适用于OCR、图像描述、视觉推理等多种用途。
LLaDA是一种大规模语言扩散模型,具备强大的语言生成能力,与LLaMA3 8B性能相当。
一个提供语音克隆和AI语音内容创作的平台。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适