与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
高效编码的开源大型语言模型,Yi-Coder官网入口网址
开源AI图像生成器,功能强大且免费。Flux Image Generator官网入口网址
一个强大的统一多模态模型,支持文本到图像生成及图像编辑。
代理法官,用于自动评估任务和提供奖励信号。
一种通过文本迷宫解决任务来增强大型语言模型视觉推理能力的创新方法
一个基于音频驱动的实时2D聊天头像生成模型,可在仅使用CPU的设备上实现30fps的实时推理。
一个快速启动带有OpenAI集成的Django项目的模板。
开源数字人课程制作平台
开源的语音识别和说话人分割模型推理代码
全栈开源机器人
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
Huginn-0125是一个35亿参数的潜变量循环深度模型,擅长推理和代码生成。
开源、自托管、AI驱动的应用构建器。
自动语音识别工具,提供词级时间戳和说话人识别
一个开源AI模型微调与变现平台,助力AI初创企业、机器学习工程师和研究人员。
为Cursor.sh IDE提供AI辅助编码的开源仪表板。CursorLens官网入口网址
基于flux-dev的Deforum实现,deforum-x-flux官网入口网址
开源的 MidJourney 界面克隆,提供 AI 图像和视频生成。
GEO 驱动的 SaaS 启动器,内置品牌监控、身份验证和计费功能。
一个开放源代码的 14B 参数编程模型,具备高效的代码推理能力。
一个开源的多云平台客户端,支持LangGraph代理和前端应用开发。
CocoIndex 是一个开源的数据索引引擎,支持自定义转换逻辑和增量更新。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
FilmAgent是一个基于LLM的多智能体协作框架,用于虚拟3D空间中的端到端电影自动化制作。
EasyWeb是一个用于构建和部署与浏览器交互的AI代理的开放平台。
开源的协作写作Web应用
开源视频生成模型
Proxy Lite 是一款开源的 3B 参数视觉语言模型(VLM),专注于网页自动化任务。
基于 Intel Arc GPU 的 AI 图像生成与聊天机器人应用。
一款开源的14B参数量的数学模型,通过强化学习训练,性能卓越。
8亿参数的多语言视觉语言模型,支持OCR、图像描述、视觉推理等功能
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适