多语言

Grok App

AI助手，探索宇宙，获取真实答案

TalkAI练口语

与先进AI学习60种外语，跨越语言边界，提升口语能力。

Meta-Llama-3.1-405B-Instruct-FP8

多语言对话生成模型，Meta-Llama-3.1-405B-Instruct-FP8官网入口网址

InternLM3

InternLM3 是一个专注于文本生成的模型集合，提供多种优化版本以满足不同需求。

Kokoro TTS

一款基于StyleTTS 2架构的先进AI文本转语音模型，拥有8200万参数，提供高质量的自然语音合成。

Speax AI

AI视频多语言配音服务，Speax AI官网入口网址

Meta-Llama-3.1-8B

8B参数的大型多语言生成模型，Meta-Llama-3.1-8B官网入口网址

PengChengStarling

PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别（ASR）模型开发工具包。

Gemini Embedding 文本嵌入模型

Gemini Embedding 是一种先进的文本嵌入模型，通过 Gemini API 提供强大的语言理解能力。

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型，适用于文本生成和推理任务。

Aidge

智能翻译，电商领域的语言专家

YuE-s1-7B-anneal-en-cot

YuE是一个开源的音乐生成模型，能够将歌词转化为完整的歌曲。

Omni Translator

AI驱动的个性化多语言翻译平台

aya-101

多语言生成语言模型

FireRedASR-AED-L

开源工业级自动语音识别模型，支持普通话、方言和英语，性能卓越。

音刻

音刻转录是一款快速、精准、丝滑的音视频转录工具。

ElevenLabs Scribe

Scribe 是全球最准确的语音转文字模型，支持99种语言。

Step-Audio

Step-Audio是一个开源智能语音交互框架，支持多语言对话、情感语调和语音克隆等功能。

BrowseBuddy

AI购物助手，提升电商购物体验

Zonos TTS

Zonos TTS 是一款支持多语言、情感控制和零样本文本到语音克隆的高质量 AI 文本转语音技术。

Llasa

基于Llama框架的TTS基础模型，兼容16万小时标记化语音数据。

SigLIP2

SigLIP2 是谷歌推出的一种多语言视觉语言编码器，用于零样本图像分类。

Whisper Turbo.online

Whisper Turbo 是一款免费在线快速准确的语音识别工具。

Aya Expanse 32B

多语言大型语言模型，支持23种语言

Aya Expanse-8b

多语言大型语言模型，支持23种语言

Gaga AI

利用 Gaga 的 AI 生成逼真头像和生动视频。

Easy Sticker Maker

在线AI贴纸生成器，快速创建个性化贴纸

iMemo

记录、转录和翻译音频笔记的终极应用

Phi-3.5-mini-instruct

轻量级、多语言的先进文本生成模型，Phi-3.5-mini-instruct官网入口网址

Aya Vision 32B

Aya Vision 32B 是一个支持多语言的视觉语言模型，适用于OCR、图像描述、视觉推理等多种用途。

LLaDA

LLaDA是一种大规模语言扩散模型，具备强大的语言生成能力，与LLaMA3 8B性能相当。

Supertone Play

一个提供语音克隆和AI语音内容创作的平台。

OpeniTab