开源 - 第 11 页 - Home

开源

Open-LLM-VTuber

与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址

高效编码的开源大型语言模型，Yi-Coder官网入口网址

Flux Image Generator

开源AI图像生成器，功能强大且免费。Flux Image Generator官网入口网址

一个强大的统一多模态模型，支持文本到图像生成及图像编辑。

Agent-as-a-Judge

代理法官，用于自动评估任务和提供奖励信号。

AlphaMaze-v0.2-1.5B

一种通过文本迷宫解决任务来增强大型语言模型视觉推理能力的创新方法

一个基于音频驱动的实时2D聊天头像生成模型，可在仅使用CPU的设备上实现30fps的实时推理。

一个快速启动带有OpenAI集成的Django项目的模板。

easegen-front

开源数字人课程制作平台

开源的语音识别和说话人分割模型推理代码

智元灵犀X1开发指南

全栈开源机器人

OmniParser-v2.0

OmniParser 是一款通用屏幕解析工具，可将 UI 截图转换为结构化格式，提升基于 LLM 的 UI 代理性能。

Huginn-0125

Huginn-0125是一个35亿参数的潜变量循环深度模型，擅长推理和代码生成。

开源、自托管、AI驱动的应用构建器。

BetterWhisperX

自动语音识别工具，提供词级时间戳和说话人识别

一个开源AI模型微调与变现平台，助力AI初创企业、机器学习工程师和研究人员。

为Cursor.sh IDE提供AI辅助编码的开源仪表板。CursorLens官网入口网址

deforum-x-flux

基于flux-dev的Deforum实现，deforum-x-flux官网入口网址

Openjourney

开源的 MidJourney 界面克隆，提供 AI 图像和视频生成。

GEO 驱动的 SaaS 启动器，内置品牌监控、身份验证和计费功能。

一个开放源代码的 14B 参数编程模型，具备高效的代码推理能力。

open-mcp-client

一个开源的多云平台客户端，支持LangGraph代理和前端应用开发。

CocoIndex 是一个开源的数据索引引擎，支持自定义转换逻辑和增量更新。

通过强化学习提升大型语言模型在开源软件演变中的推理能力

FilmAgent是一个基于LLM的多智能体协作框架，用于虚拟3D空间中的端到端电影自动化制作。

EasyWeb是一个用于构建和部署与浏览器交互的AI代理的开放平台。

Open Canvas

开源的协作写作Web应用

开源视频生成模型

Proxy Lite 是一款开源的 3B 参数视觉语言模型（VLM），专注于网页自动化任务。

AI Playground

基于 Intel Arc GPU 的 AI 图像生成与聊天机器人应用。

Light-R1-14B-DS

一款开源的14B参数量的数学模型，通过强化学习训练，性能卓越。

Aya Vision 8B

8亿参数的多语言视觉语言模型，支持OCR、图像描述、视觉推理等功能

1…9 101112 13 14