代码审查助手,确保代码无缺陷。
开源AI开发者助手,提升开发效率。
人脸匿名化技术,保留关键细节同时有效保护隐私。
领先的指令遵循模型家族,提供开源数据、代码和指南。
开源知识图谱构建模型,成本低廉,Triplex官网入口网址
AI视频编辑器,为生成式电影制作设计。Clapper官网入口网址
与任何大型语言模型进行快速的免提语音交互。Open-LLM-VTuber官网入口网址
精选全球AI前沿科技和开源产品,漫话开发者UWL.ME官网入口网址
实时语音和视频推理的开放标准,RTVI-AI官网入口网址
一个强大的文本生成模型,适用于多种对话应用。
一款开源的14B参数量的数学模型,通过强化学习训练,性能卓越。
为Firefox浏览器翻译功能优化的CPU加速神经机器翻译模型。
两个会话型AI代理在确认彼此为AI后切换到声音级协议进行通信
一个用于构建Retrieval-Augmented Generation (RAG)应用的开源项目。
一个基于音频驱动的实时2D聊天头像生成模型,可在仅使用CPU的设备上实现30fps的实时推理。
探索大型语言模型作为编程辅导工具的潜力,提出Trace-and-Verify工作流。
一个开源的多智能体聊天界面,支持在一个动态对话中管理多个智能体。
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
Gen AI Toolbox for Databases 是一个开源服务器,用于简化与数据库交互的 Gen AI 工具的开发。
On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。
开源的工业级普通话自动语音识别模型,支持多种应用场景。
s1是一个基于Qwen2.5-32B-Instruct微调的推理模型,仅用1000个样本进行训练。
中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用,支持中英双语问答的对话语言模型,并针对中文进行了优化,清华开源模型ChatGLM-6B可本地官网入口网址
BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练,乾元BigBangTransformer官网入口网址
一个开源项目,用于在浏览器中演示 AI 视频生成模型。
地球科学的开源大预言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调,K2-上海交通大学官网入口网址
DeepSeek-R1-Distill-Qwen-7B 是一个开源的推理模型,专注于数学、代码和推理任务。
DeepSeek-R1-Distill-Llama-70B 是一款基于强化学习优化的大型语言模型,专注于推理和对话能力。
一款基于StyleTTS 2架构的先进AI文本转语音模型,拥有8200万参数,提供高质量的自然语音合成。
通过视频扩散变换器将自定义照片与视频混合的项目。
一个开源的交互式开发环境,用于构建和优化基于LLM的数据处理管道。
一个仅100行代码的极简LLM框架,使LLM能够自主编程。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适