一个尝试复现OpenAI O1模型的编程辅助工具
NotaGen 是一个用于符号音乐生成的模型,采用大语言模型训练范式,专注于生成高质量古典乐谱。
一个用于强化学习人类反馈训练过程可视化的工具,帮助深度理解与调试。
一个开放源代码的 14B 参数编程模型,具备高效的代码推理能力。
VLM-R1 是一个稳定且通用的强化视觉语言模型,专注于视觉理解任务。
一种无需搜索即可激励 LLM 搜索能力的框架。
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适