OCR

Ollama-OCR

一个强大的OCR（光学字符识别）工具，Ollama-OCR官网入口网址

话袋AI笔记【需安装】

话袋致力于让记录变得简单，让生活更加精彩。多端同步技术让信息随时随地触手可及，无论是微信对话、语音备忘录、文本资料、视频剪辑还是重要文档，话袋都能帮您快速保存和整理，成为您身边的智能信息管理伙伴，话袋AI笔记【需安装】官网入口网址

eSearch

一款多功能的屏幕搜索和截屏软件。

ViTLP

文档智能的视觉引导生成文本布局预训练模型

Excerptor

从实体书籍中提取划线或手写标记的文本

Zerox OCR

一种简单直观的PDF OCR工具，使用gpt-4o-mini进行文档转换。Zerox OCR官网入口网址

Electronic-Component-Sorter

AI驱动的电子元件分类器，智能组件管理的终极解决方案。

EdgeOne Pages Functions AI OCR

AI驱动的图像文字识别服务

Ollama OCR for web

一个强大的OCR包，使用最先进的视觉语言模型提取图像中的文本。

Parseflow

智能文档处理解决方案

Aya Vision 32B

Aya Vision 32B 是一个支持多语言的视觉语言模型，适用于OCR、图像描述、视觉推理等多种用途。

LlamaOCR

将图像转换成结构化的Markdown文档

Mathpix Tool

强大的文档转换工具，支持图像和 PDF 转换为 LaTeX 等格式。

InternViT-6B-448px-V2_5

基于InternViT-6B-448px-V1-5的增强版视觉模型

TurboLens

一站式OCR代理，快速从图像中生成洞见。

Aya Vision 8B

8亿参数的多语言视觉语言模型，支持OCR、图像描述、视觉推理等功能

MinerU

一站式开源高质量数据提取工具，将PDF转换成Markdown和JSON格式。

kreuzberg

一个支持从PDF、图像、办公文档等多种格式中提取文本的Python库。

ExtractThinker

智能文档处理框架，专为LLMs设计

swift-ocr-llm-powered-pdf-to-markdown

利用OpenAI的GPT-4 Turbo模型进行高效OCR处理

MiniCPM-V 2.6

高性能多模态语言模型，适用于图像和视频理解。MiniCPM-V 2.6官网入口网址

Versatile-OCR-Program

一个针对机器学习优化的多模态 OCR 管道。

Chunkr

开源数据摄取API服务

pdf-extract-api

高精度将图片或PDF转换为Markdown文本或JSON结构化文档的API

docsynecx by SynecX AI Labs

智能文档处理AI平台，利用AI、机器学习和OCR技术自动化数据提取、分类和组织各种文档类型。

OpeniTab