NeoBase 是一款开源的 AI 数据库助手,让你用自然语言与数据库交互。
Scira 是一个极简主义的 AI 驱动搜索引擎,帮助用户在互联网上查找信息。
一个基于 DuckDB 和 3FS 构建的轻量级数据处理框架
一个为LLM生成Git提交信息的插件
两个会话型AI代理在确认彼此为AI后切换到声音级协议进行通信
Migician 是一个专注于多图像定位的多模态大语言模型,能够实现自由形式的多图像精确定位。
Wan2.1 是一款开源的先进大规模视频生成模型,支持多种视频生成任务。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
QwQ-Max-Preview 是 Qwen 系列的最新成果,基于 Qwen2.5-Max 构建,具备强大的推理和多领域应用能力。
一个用于构建Retrieval-Augmented Generation (RAG)应用的开源项目。
一个基于音频驱动的实时2D聊天头像生成模型,可在仅使用CPU的设备上实现30fps的实时推理。
探索大型语言模型作为编程辅导工具的潜力,提出Trace-and-Verify工作流。
隐私优先的AI会议助手,自动记录会议笔记,提升会议效率。
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用,支持中英双语问答的对话语言模型,并针对中文进行了优化,清华开源模型ChatGLM-6B可本地官网入口网址
BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练,乾元BigBangTransformer官网入口网址
百川智能开发的专为医疗场景优化的开源大语言模型,具备卓越的通用能力和医疗领域性能。
EasyWeb是一个用于构建和部署与浏览器交互的AI代理的开放平台。
一个开源项目,用于在浏览器中演示 AI 视频生成模型。
一种用于控制视频扩散模型运动模式的高效方法,支持运动模式的自定义和迁移。
国内首个开源的千亿级中文对话大模型,轩辕大模型官网入口网址
将电子书转换为有声书的工具。
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
这是一个基于Qwen2.5-32B模型的4位量化版本,专为高效推理和低资源部署设计。
本地运行的人工智能代理,无缝自动化工程任务。
加速数字团队的AI驱动设计转代码、可视化编辑和企业级CMS的视觉开发平台。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适