使用AI技术将视频翻译成多种语言,D-ID AI Video Translate官网入口网址
多语言对话生成模型,Meta-Llama-3.1-405B-Instruct-FP8官网入口网址
与先进AI学习60种外语,跨越语言边界,提升口语能力。
8B参数的大型多语言生成模型,Meta-Llama-3.1-8B官网入口网址
AI视频多语言配音服务,Speax AI官网入口网址
风车AI翻译,专注于图片、视频翻译及智能抠图等多模态翻译服务,助力外贸出海。
Aya Vision 32B 是一个支持多语言的视觉语言模型,适用于OCR、图像描述、视觉推理等多种用途。
基于Llama框架的TTS基础模型,兼容16万小时标记化语音数据。
Whisper Turbo 是一款免费在线快速准确的语音识别工具。
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
智能翻译,电商领域的语言专家
音刻转录是一款快速、精准、丝滑的音视频转录工具。
Scribe 是全球最准确的语音转文字模型,支持99种语言。
Step-Audio是一个开源智能语音交互框架,支持多语言对话、情感语调和语音克隆等功能。
7B参数的多语言文本生成模型,c4ai-command-r7b-12-2024官网入口网址
AI驱动的数学解题助手,Math AI官网入口网址
提供超逼真的交互式虚拟形象,用于变革数字互动体验。
DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型,适用于文本生成和推理任务。
InternLM3 是一个专注于文本生成的模型集合,提供多种优化版本以满足不同需求。
高分辨率、多语言文本到图像生成模型
免费在线AI聊天机器人服务,AIChatru.ru官网入口网址
Gemini Embedding 是一种先进的文本嵌入模型,通过 Gemini API 提供强大的语言理解能力。
8亿参数的多语言视觉语言模型,支持OCR、图像描述、视觉推理等功能
一个提供语音克隆和AI语音内容创作的平台。
Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型,能够提供高质量的语音合成服务。
这是一个基于Qwen2.5-32B模型的4位量化版本,专为高效推理和低资源部署设计。
语音到语音翻译系统,保留声音和等时性特征
记录、转录和翻译音频笔记的终极应用
多语言生成语言模型
多模态大型语言模型,支持图像与文本的交互理解。
多模态大型语言模型,融合视觉与语言理解。
大规模多语言文本数据集
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适