一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型,适用于多种文本生成任务。
AI语音代理测试与可观测性平台
一键生成数据的直观反射图
开源视频生成模型
视频编辑工具,使用Genmo Mochi技术
一款文本转语音工具,帮助您轻松阅读文本。
音频采样器,创造音乐节奏
开源AI代码编辑器,提供强大的AI功能和完全的数据控制。
人脸匿名化技术,保留关键细节同时有效保护隐私。
高分辨率、高效率的文本到图像生成框架
开源监控工具,提升LLM应用性能。Langtrace官网入口网址
与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
一种先进的文本到图像的生成模型。FLUX.1-dev-Controlnet-Union-alpha官网入口网址
AI时代的视频编辑工具,Clapper.app官网入口网址
多功能文本到多模态内容生成框架,Alpha-VLLM官网入口网址
一个模型上下文协议服务器,用于 Excel 文件操作。
一个高效的语音合成模型,支持中英文及语音克隆。
生成高质量 SVG 代码的基础模型。
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
一个开源的多云平台客户端,支持LangGraph代理和前端应用开发。
一个用于从文本和图像中提取结构化数据的代理API,基于LLMs实现。
8亿参数的多语言视觉语言模型,支持OCR、图像描述、视觉推理等功能
Migician 是一个专注于多图像定位的多模态大语言模型,能够实现自由形式的多图像精确定位。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
SkyReels V1 是一个开源的人类中心视频基础模型,专注于高质量影视级视频生成。
Gen AI Toolbox for Databases 是一个开源服务器,用于简化与数据库交互的 Gen AI 工具的开发。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
AI驱动的开源笔记/研究平台,尊重您的隐私。
文件解析器,专为LLMs解析PDF、Docx、PPTx等文档。
开放高效的视频水印技术
微软开源的视频分词器家族
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适