一个基于强化学习优化的大型语言模型,专注于数学问题解决能力的提升。
一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视频不仅清晰度高,而且时序连贯,细节丰富,具有很高的真实感和艺术性,I2VGen-XL:阿里推出的图生视频模型官网入口网址
一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台,StarCoder 2官网入口网址
开源大型语言模型,支持多语言和专业领域应用。
Lumina-Video 是一个用于视频生成的初步尝试项目,支持文本到视频的生成。
BEN2是一个基于深度学习的图像分割模型,专注于背景擦除和前景提取。
一个开源的视频生成模型,用于创造生动的视频内容。CogVideoX-2B官网入口网址
Hibiki 是一款用于流式语音翻译(即同声传译)的模型,能够实时逐块生成正确翻译。
YuE 是一个专注于全曲生成的开源音乐基础模型,能够根据歌词生成完整的音乐作品。
用于理解任意视频中的相机运动的工具。
DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习,DeepFloyd官网入口网址
多模态原生混合专家模型
文本到视频的生成模型,CogVideoX官网入口网址
高性能英文对话生成模型
先进的文本到视频生成模型
Qwen2.5-Coder系列的3B参数指令调优模型
Qwen2.5-Coder系列中的3B参数指令调优模型
开源AI辅助编程模型系列
在图像理解和文本处理任务上展现出卓越的性能,并通过定制化微调和本地部署,推动了AI技术的开放性和可访问性,Llama 3.2官网入口网址
新一代开放代码模型,提升编程效率。
PIKE-RAG 是一种专注于领域知识和推理增强生成的模型。
一个强大的图生视频模型,它通过先进的技术实现了从静态图片到动态视频的转变。这款模型不仅能够提供高质量的视频输出,还具有广泛的应用前景,包括娱乐、教育、电影制作等多个领域,CogVideoX-5B-I2V官网入口网址
Qwen2.5-Coder系列中的1.5B参数代码生成模型
提供高级 AI 聊天体验,完全私密。
Qwen2.5-Coder系列中的3B参数量指令调优模型
VORAvideo连接多AI模型,支持文生视频、图生视频,享Sora 2特惠
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适