开源数字人课程制作平台
实时AI视频生成开源模型
与大型语言模型进行自然的语音对话
Android平台上的私有、设备端语音识别键盘和文字服务
ComfyUI节点,用于MMAudio模型的音频处理
一个开源AI模型微调与变现平台,助力AI初创企业、机器学习工程师和研究人员。
一键生成多语言翻译的项目工具,由Azure AI服务支持。
探索AI前沿,精选国内外AI产品与应用。
一个开源的NotebookLM实现,使用Deepseek-V3和PlayHT TTS技术。
全球首款个人数据导出器,Surfer-Data官网入口网址
与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
精选全球AI前沿科技和开源产品,漫话开发者UWL.ME官网入口网址
高效编码的开源大型语言模型,Yi-Coder官网入口网址
基于大型语言模型的高性能MacOS聊天应用,ChatMLX官网入口网址
一种先进的文本到图像的生成模型。FLUX.1-dev-Controlnet-Union-alpha官网入口网址
一个开源的GUI音频书和配音生成器。Pandrator官网入口网址
开源AI搜索引擎,提供网络搜索能力。openperplex_backend_os官网入口网址
开源项目,为开源社区提供服务,Zitefy官网入口网址
多功能文本到多模态内容生成框架,Alpha-VLLM官网入口网址
隐私优先的AI会议助手,自动记录会议笔记,提升会议效率。
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
Xyne 是一款开源的、以 AI 为先的搜索与答案引擎,专为工作场景设计。
开源工业级自动语音识别模型,支持普通话、方言和英语,性能卓越。
中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用,支持中英双语问答的对话语言模型,并针对中文进行了优化,清华开源模型ChatGLM-6B可本地官网入口网址
BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练,乾元BigBangTransformer官网入口网址
百川智能开发的专为医疗场景优化的开源大语言模型,具备卓越的通用能力和医疗领域性能。
FilmAgent是一个基于LLM的多智能体协作框架,用于虚拟3D空间中的端到端电影自动化制作。
EasyWeb是一个用于构建和部署与浏览器交互的AI代理的开放平台。
一个开源项目,用于在浏览器中演示 AI 视频生成模型。
一种用于控制视频扩散模型运动模式的高效方法,支持运动模式的自定义和迁移。
国内首个开源的千亿级中文对话大模型,轩辕大模型官网入口网址
一个具有先进语音活动检测、唤醒词激活和即时转录功能的稳健、高效、低延迟的语音到文本库。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适