开源知识图谱构建模型,成本低廉,Triplex官网入口网址
AI视频编辑器,为生成式电影制作设计。Clapper官网入口网址
极简AI搜索引擎,助你快速获取网络信息。MiniPerplx官网入口网址
基于大型语言模型的高性能MacOS聊天应用,ChatMLX官网入口网址
智能AI辅助编写邮件模板,简化邮件发送流程。Volamail官网入口网址
多功能文本到多模态内容生成框架,Alpha-VLLM官网入口网址
CocoIndex 是一个开源的数据索引引擎,支持自定义转换逻辑和增量更新。
为Firefox浏览器翻译功能优化的CPU加速神经机器翻译模型。
工业级可控高效的零样本文本到语音系统
SkyReels V1 是一个开源的人类中心视频基础模型,专注于高质量影视级视频生成。
一个专注于超大规模系统设计和优化的工具,提供高效解决方案。
一个开源的多智能体聊天界面,支持在一个动态对话中管理多个智能体。
Gen AI Toolbox for Databases 是一个开源服务器,用于简化与数据库交互的 Gen AI 工具的开发。
On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
基于 PyTorch 的音乐、歌曲和音频生成工具包,支持高质量音频生成
Huginn-0125是一个35亿参数的潜变量循环深度模型,擅长推理和代码生成。
s1是一个基于Qwen2.5-32B-Instruct微调的推理模型,仅用1000个样本进行训练。
RAG-FiT是一个用于提升LLMs利用外部信息能力的库,通过特别创建的RAG增强数据集对模型进行微调。
地球科学的开源大预言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调,K2-上海交通大学官网入口网址
SmolVLM-500M 是一个轻量级多模态模型,能够处理图像和文本输入并生成文本输出。
DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型,适用于多种文本生成任务。
通过视频扩散变换器将自定义照片与视频混合的项目。
AI语音代理测试与可观测性平台
一个仅100行代码的极简LLM框架,使LLM能够自主编程。
一个强大的OCR包,使用最先进的视觉语言模型提取图像中的文本。
隐私优先,自托管的全开源个人知识管理系统
开源数字人课程制作平台
与您的PDF文件进行对话
视频编辑工具,使用Genmo Mochi技术
实时AI视频生成开源模型
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适