端侧全模态理解开源模型
AnyParser Pro 是一款能够快速准确地从 PDF、PPT 和图像中提取内容的大型语言模型。
AI驱动的视觉搜索引擎,探索视觉故事。
文档版面分析工具,RapidLayout官网入口网址
由 Google 训练的 AI 模型,用于对野生动物相机陷阱图像中的物种进行分类。
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
本课程将教授如何利用人工智能(AI)技术来进行图像处理。通过学习AI图像处理的基本原理和实践技巧,您将能够利用AI工具和算法对图像进行增强、修复、分割、识别等处理,提升图像处理效果和质量。无论您是摄影师、设计师还是对图像处理感兴趣的人,本课程都将为您提供实用的技能和工具,让您的图像处理更加出色和专业,AI图像处理官网入口网址
专注研发基于存算一体先进技术的人工智能芯片,知存科技官网入口网址
126课时从简单到复杂带领大家深入学习和应用深度学习技术,深度学习框架【TensorFlow2】官网入口网址
覆盖了从个人使用到企业级应用的多个方面的多模态大模型,Step-1V官网入口网址
一个由moondream创建的Hugging Face Space,用于展示注视点相关技术
Kimi 视觉模型可理解图片内容,包括文字、颜色和物体形状等。
将图片中的表格和文本准确转换为Excel文件的AI工具
通过多样化合成数据和全局到局部自适应感知增强文档布局分析
通过AI技术将菜单图片转化为单个菜品图片,辅助点餐决策。
视觉语言模型增强工具,结合生成式视觉编码器和深度广度融合技术。
基于InternViT-6B-448px-V1-5的增强版视觉模型
基于人工智能的图像描述生成器
视觉语言模型,结合图像和文本信息进行智能处理。
多模态大型语言模型,支持图像和文本理解
多模态大型模型,处理文本、图像和视频数据
TranslatePic是一款功能强大的图像翻译工具,支持多语言识别和翻译,帮助用户快速准确地翻译图像中的文本内容,TranslatePic官网入口网址
- 智能浏览器新标签页 -
完全免费 · 简洁大方功能丰富 · 高效舒适