Scira 是一个极简主义的 AI 驱动搜索引擎,帮助用户在互联网上查找信息。
为Firefox浏览器翻译功能优化的CPU加速神经机器翻译模型。
8亿参数的多语言视觉语言模型,支持OCR、图像描述、视觉推理等功能
Migician 是一个专注于多图像定位的多模态大语言模型,能够实现自由形式的多图像精确定位。
Magic 1-For-1 是一个高效的图像到视频生成模型,可在一分钟内生成一分钟的视频。
Gen AI Toolbox for Databases 是一个开源服务器,用于简化与数据库交互的 Gen AI 工具的开发。
PengChengStarling 是一个基于 icefall 项目的多语言自动语音识别(ASR)模型开发工具包。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
AI语音代理测试与可观测性平台
一键生成数据的直观反射图
开源替代品,基于搜索结果生成AI报告
开放高效的视频水印技术
一站式AI数字人系统,支持视频合成、声音合成、声音克隆。
与大型语言模型进行自然的语音对话
统一的开放命名实体和语音识别模型
智能AI辅助编写邮件模板,简化邮件发送流程。Volamail官网入口网址
强大的开源Kimi K2聊天平台,通过Kimi AI在编程和数学基准测试中超越GPT-4。企业级Kimi AI,成本降低95%。
CocoIndex 是一个开源的数据索引引擎,支持自定义转换逻辑和增量更新。
OpenManus 是一个无需邀请码即可使用的开源智能代理项目。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
探索大型语言模型作为编程辅导工具的潜力,提出Trace-and-Verify工作流。
Xyne 是一款开源的、以 AI 为先的搜索与答案引擎,专为工作场景设计。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练,乾元BigBangTransformer官网入口网址
一个开源项目,用于在浏览器中演示 AI 视频生成模型。
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
一个仅100行代码的极简LLM框架,使LLM能够自主编程。
AI驱动的开源笔记/研究平台,尊重您的隐私。
高效视频生成建模的金字塔流匹配技术
视频处理界面,提供视频编码和解码功能
自动语音识别工具,提供词级时间戳和说话人识别
ComfyUI节点,用于MMAudio模型的音频处理
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适