展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。
通过多样化合成数据和全局到局部自适应感知增强文档布局分析
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
高精度视频唇形同步技术
利用AI创作音乐
图像水印技术,可在图片中嵌入局部化水印信息
人脸匿名化技术,保留关键细节同时有效保护隐私。
先进的多模态图像生成模型,结合文本提示和视觉参考生成高质量图像。
深度推理翻译模型,通过长思考链优化神经机器翻译。
多功能文本到多模态内容生成框架,Alpha-VLLM官网入口网址
一个高效的语音合成模型,支持中英文及语音克隆。
Pruna 是一个模型优化框架,帮助开发者快速高效交付模型。
HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。
QwQ-32B 是一款强大的推理模型,专为复杂问题解决和文本生成设计,性能卓越。
Huginn-0125是一个35亿参数的潜变量循环深度模型,擅长推理和代码生成。
强大的视频替换与编辑软件,利用AI技术实现自然效果。
百度旗下AI算力、学习和实训平台,飞桨AI Studio星河社区官网入口网址
Tarsier 是由字节跳动推出的用于生成高质量视频描述的大型视频语言模型。
行业领先的人工智能基础架构解决方案商,思腾合力官网入口网址
YuE是一个开源的音乐生成模型,能够将歌词转化为完整的歌曲。
Frames 是 Runway 推出的高级图像生成基础模型,提供前所未有的风格控制和视觉保真度。
OmniThink 是一种通过模拟人类思考过程来提升机器写作知识密度的框架。
生数以其创新的多模态大模型和深度生成式算法研究,为艺术设计、游戏制作、影视后期和内容社交等领域提供了强大的技术支持和解决方案,生数官网入口网址
Janus-Pro-7B 是一个新型的自回归框架,统一多模态理解和生成。
FaceSwap是一个功能强大且用户友好的在线换脸工具,利用AI技术提供快速、高质量的换脸效果。无论是个人娱乐还是专业项目,FaceSwap都能满足用户的需求,FaceSwap AI官网入口网址
InternLM3-8B-Instruct是一个开源的80亿参数指令模型,用于通用用途和高级推理。
开源自回归视觉生成模型项目
革命性深度学习工具,用于面部转换和视频生成。
快速因果视频生成器,实现即时视频生成。
微软开源的视频分词器家族
轻量级端到端文本到语音模型
基于MaskGCT模型的文本到语音演示
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适