图像识别

Picurious

发现每张图片的魔力并满足您的好奇心！，Picurious官网入口网址

Imagga

Imagga图像识别API是一款强大的计算机视觉人工智能工具，提供图像标记和分类、视觉搜索、内容审核等解决方案，Imagga官网入口网址

Scenic

Jax 库，计算机视觉研究及更多，Scenic官网入口网址

Gemini 1.5 Flash

Google 一款轻量级、高效能的AI模型，专为大规模高频任务设计。Gemini 1.5 Flash官网入口网址

Onyxium

一站式AI工具平台，Onyxium官网入口网址

Falcon 2

Falcon 2 是一款开源、多语言、多模态的模型，具备图像到文本转换能力。Falcon 2官网入口网址

ImageInWords

一种用于生成超详细图像描述的模型，用于训练视觉语言模型。ImageInWords官网入口网址

MetaCLIP

一种用于图像和文本数据的先进机器学习模型，专注于数据质量和透明度。MetaCLIP官网入口网址

llama3v

基于llama3 8B的SOTA视觉模型，llama3v官网入口网址

ComfyUI Ollama

使用ollama Python客户端与ComfyUI工作流集成的大型语言模型（LLM），ComfyUI Ollama官网入口网址

Say What You See

Google AI辅助下的艺术图像学习游戏，Say What You See官网入口网址

TextIn Tools

是一款免费在线OCR工具，包含文字识别、表格识别，PDF转文件，文件转PDF、其他格式转换，识别率高，体验好，免费，TextIn Tools官网入口网址

LLaVA-NeXT

大型多模态模型，处理多图像、视频和3D数据。LLaVA-NeXT官网入口网址

Kimi视觉思考模型k1

基于强化学习技术的视觉思考模型，理科测试行业领先

TruthPix

AI图像检测工具，识别篡改照片，TruthPix官网入口网址

MiniMax Agent

MiniMax Agent 是基于顶尖多模态大语言模型打造的智能AI伙伴，为你带来全方位的智能体验：精准搜索解答、一目了然的图像识别、沉浸式语音对话、专业创意写作、文档闪速解析，还有独家悬浮球功能让复杂任务变得轻而易举。支持MCP多智能体协作，让AI团队为你高效解决复杂问题。10倍速获取信息，10倍速解决问题，无论你是学生、职场人士、自由工作者还是创作者，Agent都能随叫随到，一触即用。AI写作、搜题、办公、翻译、编程、创作、文档总结，甚至是日常聊天、语言学习、面试准备，Agent都能胜任，成为你的全能智慧助手，MiniMax Agent官网入口网址