多模态大型语言模型,支持图像与文本的交互理解。
多模态大型语言模型,融合视觉与语言理解。
Phind是一款先进的人工智能搜索工具,支持多语言和多搜索功能。
SigLIP2 是谷歌推出的一种多语言视觉语言编码器,用于零样本图像分类。
Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型,能够提供高质量的语音合成服务。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
这是一个基于Qwen2.5-32B模型的4位量化版本,专为高效推理和低资源部署设计。
使用Eskritor AI Writer,从文章到社交帖子,让您5倍更快地创建完美定制内容。
Sesame AI 是一款先进的语音合成平台,能够生成自然对话式语音并具备情感智能。
Chikka.ai 是一款利用 AI 技术进行客户访谈并提取深度洞察的产品。
一个支持DeepSeek R1的AI驱动研究助手,结合搜索引擎、网络爬虫和大型语言模型进行深度研究。
LLaDA是一种大规模语言扩散模型,具备强大的语言生成能力,与LLaMA3 8B性能相当。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
AI购物助手,提升电商购物体验
您的全天候心理健康伴侣
AI驱动的语言学习平台,让学习变得简单、有趣、个性化
AI驱动的PPT制作工具,快速创建和编辑演示文稿。
多语言预训练数据集
商业领域基础模型与代理
在线AI贴纸生成器,快速创建个性化贴纸
免费中文在线Google翻译和GPT翻译工具
可扩展的流媒体语音合成技术,结合大型语言模型。
多语言大型语言模型,支持23种语言
高分辨率、多语言支持的文本到图像生成模型
基于LLM的文章翻译工具,自动翻译并创建多语言Markdown文件。
CLaMP 3 是一个用于跨模态和跨语言音乐信息检索的统一框架。
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
Quenti是一款终极学习平台,可让您学习任何内容,使用闪卡、游戏等方式进行学习,无广告干扰。
大规模多语言偏好混合数据集
AI驱动的字幕生成器,快速创建时尚视频字幕
世界首款多语言输入系统
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适