开源AI桌面机器人,具有表情屏幕、双轴控制台和语音聊天功能。
一个社区驱动的深度研究框架,结合语言模型与多种工具。
一个简单易用的语音克隆和语音模型训练工具。
一个基于 DuckDB 和 3FS 构建的轻量级数据处理框架
Migician 是一个专注于多图像定位的多模态大语言模型,能够实现自由形式的多图像精确定位。
PhotoDoodle 是一个基于少量样本对数据学习艺术图像编辑的代码实现。
一种通过文本迷宫解决任务来增强大型语言模型视觉推理能力的创新方法
Huginn-0125是一个35亿参数的潜变量循环深度模型,擅长推理和代码生成。
一个仅100行代码的极简LLM框架,使LLM能够自主编程。
一键生成数据的直观反射图
业界领先的开源大型混合专家模型
开源项目,实现AI音乐服务的API接口
300行代码实现基于LLM的语音转录。WeST官网入口网址
一个开源的多云平台客户端,支持LangGraph代理和前端应用开发。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
一个用于LLM预训练的高效网络爬虫工具,专注于高效爬取高质量网页数据。
一个开源的多智能体聊天界面,支持在一个动态对话中管理多个智能体。
视频编辑工具,使用Genmo Mochi技术
腾讯开源的大型视频生成模型训练框架
将任何PDF转换为播客集!
开源AI搜索引擎,提供网络搜索能力。openperplex_backend_os官网入口网址
AI DevOps代理,帮助您在终端中安全、部署和维护生产就绪基础设施。
一个用于从文本和图像中提取结构化数据的代理API,基于LLMs实现。
8亿参数的多语言视觉语言模型,支持OCR、图像描述、视觉推理等功能
SkyReels V1 是一个开源的人类中心视频基础模型,专注于高质量影视级视频生成。
一个快速启动带有OpenAI集成的Django项目的模板。
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
加速数字团队的AI驱动设计转代码、可视化编辑和企业级CMS的视觉开发平台。
DeepSeek-R1-Distill-Llama-70B 是一款基于强化学习优化的大型语言模型,专注于推理和对话能力。
开源工具,简化从非结构化文档中提取和探索结构化数据。
开源替代品,基于搜索结果生成AI报告
开源的语音识别和说话人分割模型推理代码
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适