开源的工业级普通话自动语音识别模型,支持多种应用场景。
一个开源项目,用于在浏览器中演示 AI 视频生成模型。
地球科学的开源大预言模型,首先在收集和清理过的地球科学文献(包括地球科学开放存取论文和维基百科页面)上对 LLaMA 进行进一步预训练,然后使用知识密集型指令调整数据(GeoSignal)进行微调,K2-上海交通大学官网入口网址
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
DeepSeek-R1-Distill-Qwen-7B 是一个开源的推理模型,专注于数学、代码和推理任务。
一个基于文本生成图像的预训练模型,具有80亿参数和Apache 2.0开源许可。
DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型,适用于多种文本生成任务。
AI语音代理测试与可观测性平台
一个强大的OCR包,使用最先进的视觉语言模型提取图像中的文本。
开源数字人课程制作平台
AI驱动的开源笔记/研究平台,尊重您的隐私。
开源的先进语言模型后训练框架
一个用于多模型嵌入的图形库,支持多种模型和数据类型的可视化
开源视频生成模型
为LTX视频模型提供额外控制的ComfyUI节点集合
微软开源的视频分词器家族
与大型语言模型进行自然的语音对话
统一的开放命名实体和语音识别模型
全栈开源机器人
可视化和透明的开源ChatGPT替代品
代码审查助手,确保代码无缺陷。
Qwen2.5-Coder系列中的14B参数代码生成模型
Qwen2.5-Coder系列的1.5B参数指令调优模型
将任何GitHub仓库转换成交互式图表,用于项目可视化。
人脸匿名化技术,保留关键细节同时有效保护隐私。
一个由Together.ai驱动的开源AI搜索引擎。
基于ESP32的AI聊天机器人项目,可实现多语言对话与声纹识别
领先的指令遵循模型家族,提供开源数据、代码和指南。
先进的文本生成模型,支持多样化任务
高性能英文文本生成模型
一个开源的NotebookLM实现,使用Deepseek-V3和PlayHT TTS技术。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适