图像识别 - 第 3 页 - Home

图像识别

覆盖了从个人使用到企业级应用的多个方面的多模态大模型，Step-1V官网入口网址

Agentic Object Detection

基于推理驱动的目标检测技术，通过文本提示实现类似人类精度的检测。

DeepSeek-VL2-Tiny

先进的大型混合专家视觉语言模型

InternVL2_5-1B

多模态大型语言模型，支持图像和文本理解

Florence-VL

视觉语言模型增强工具，结合生成式视觉编码器和深度广度融合技术。

AI图像处理

本课程将教授如何利用人工智能（AI）技术来进行图像处理。通过学习AI图像处理的基本原理和实践技巧，您将能够利用AI工具和算法对图像进行增强、修复、分割、识别等处理，提升图像处理效果和质量。无论您是摄影师、设计师还是对图像处理感兴趣的人，本课程都将为您提供实用的技能和工具，让您的图像处理更加出色和专业，AI图像处理官网入口网址

Megrez-3B-Omni

端侧全模态理解开源模型

AnyParser Pro

AnyParser Pro 是一款能够快速准确地从 PDF、PPT 和图像中提取内容的大型语言模型。

Qwen2.5-VL 是一款强大的视觉语言模型，能够理解图像和视频内容并生成相应文本。

Image to excel

将图片中的表格和文本准确转换为Excel文件的AI工具

Torii Image Translator

浏览器插件，一键翻译网页上的图片文字。

PaliGemma 2 mix

PaliGemma 2 mix 是一款多功能的视觉语言模型，适用于多种任务和领域。

Joy Caption Alpha One

基于人工智能的图像描述生成器

新一代视觉语言模型，更清晰地看世界。Qwen2-VL官网入口网址

RapidLayout

文档版面分析工具，RapidLayout官网入口网址

通过AI技术将菜单图片转化为单个菜品图片，辅助点餐决策。

知存科技

专注研发基于存算一体先进技术的人工智能芯片，知存科技官网入口网址

一个由moondream创建的Hugging Face Space，用于展示注视点相关技术

一款通过生活场景学习日语的APP。

AI驱动的视觉搜索引擎，探索视觉故事。

Google CameraTrapAI

由 Google 训练的 AI 模型，用于对野生动物相机陷阱图像中的物种进行分类。

moonshot-v1-vision-preview

Kimi 视觉模型可理解图片内容，包括文字、颜色和物体形状等。

深度学习框架【TensorFlow2】

126课时从简单到复杂带领大家深入学习和应用深度学习技术，深度学习框架【TensorFlow2】官网入口网址

1 23