Android平台上的私有、设备端语音识别键盘和文字服务
智能AI辅助编写邮件模板,简化邮件发送流程。Volamail官网入口网址
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
Xyne 是一款开源的、以 AI 为先的搜索与答案引擎,专为工作场景设计。
基于 PyTorch 的音乐、歌曲和音频生成工具包,支持高质量音频生成
地球科学的开源大预言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调,K2-上海交通大学官网入口网址
DeepSeek-R1-Distill-Llama-8B 是一个高性能的开源语言模型,适用于文本生成和推理任务。
通过视频扩散变换器将自定义照片与视频混合的项目。
一个强大的OCR包,使用最先进的视觉语言模型提取图像中的文本。
世界领先的数学开源大语言模型
开源数字人课程制作平台
为LTX视频模型提供额外控制的ComfyUI节点集合
与大型语言模型进行自然的语音对话
开源AI语音处理工具包,支持语音增强、分离和目标说话人提取。
可视化和透明的开源ChatGPT替代品
MCP服务器目录,汇集多个MCP服务器资源。
一个开源AI模型微调与变现平台,助力AI初创企业、机器学习工程师和研究人员。
一键生成多语言翻译的项目工具,由Azure AI服务支持。
实时语音和视频推理的开放标准,RTVI-AI官网入口网址
开源的全能 AI 助手,帮助完成各种任务。
基于 Intel Arc GPU 的 AI 图像生成与聊天机器人应用。
在视频扩散变换器中合成任何内容的框架。
增强文本与视觉任务处理能力的开源模型。
一款开源的14B参数量的数学模型,通过强化学习训练,性能卓越。
一个基于 DuckDB 和 3FS 构建的轻量级数据处理框架
TableGPT2-7B 是一款专注于表格数据处理的大语言模型,适用于数据分析和商业智能任务。
On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。
中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用,支持中英双语问答的对话语言模型,并针对中文进行了优化,清华开源模型ChatGLM-6B可本地官网入口网址
BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练,乾元BigBangTransformer官网入口网址
一个开源项目,用于在浏览器中演示 AI 视频生成模型。
这是一个基于Qwen2.5-32B模型的4位量化版本,专为高效推理和低资源部署设计。
DeepSeek-R1-Distill-Qwen-7B 是一个开源的推理模型,专注于数学、代码和推理任务。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适