#OCR #开源 #AI

Zerox - 一款开源的 AI OCR 工具

Zerox可以将 PDF、DOCX、图片等格式的文档转换为 Markdown

它基于 AI 视觉模型(如 GPT-4o-mini 等)实现 OCR 并直接生成结构化内容

📑相关阅读

Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元

📮
投稿 📢频道 💬群聊 🔎索引
#AI #OCR

Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元

免费试用: chat.mistral.ai/chat
API: console.mistral.ai/home

与传统的 OCR API 不同,Mistral OCR 是一款多模态 API,它不仅可以识别文本中是否嵌入了插图或照片,还会为这些图形元素创建边界框,并将它们包含在输出中。

表格+数字、数学公式、不规则PDF、带水印文本通通不在话下!

📮投稿 📢频道 💬群聊 🔎索引
#开源 #OCR #PDF #AI #PDF

OlmOCR - 从 PDF 中提取文字的开源 AI 工具

🐙 开源页面

OlmOCR 基于 Qwen2-VL-7B-Instruct 模型,用 GPT-4o 标记了 25 万页 PDF 对其进行了微调。

完全开源,可以在本地 Nvidia GPU(4090以上) 上运行

📮投稿 📢频道 💬群聊 🔎索引
番石榴实验室 AI 智能应用
#OCR #图片文字提取 #文档比对

图片文字提取,OCR 文字提取,表格结构识别,文档比对

https://ai.maogoujiaoliuqi.com/picToText
#OCR #AI #票据识别
欢迎使用这款OCR(票据识别、合同识别)产品,专业性比较强,有一定门槛,但主打一个免费。

https://www.scnet.cn/ui/mall/detail/shop?id=1859136430839443457

['登机牌', 'BOARDING', 'PASS', '舱位', 'CLASS', '序号 SERIALNO.', '座位号', '日期 DATE', 'SEAT NO', '航班 FLIGHT', '03DEC', 'W', '035', 'MU2379', '始发地', 'FROM', '登机口', 'GATE', '登机时间BDT', '目的地TO', '福州', 'TAIYUAN', 'G11', 'FUZHOU', '身份识别IDNO', '姓名NAME', 'ZHANGQIWEI', '票号TKTNO', '张祺伟', '票价FARE', 'ETKT7813699238489/1', '登机口于起飞前10分钟关闭GATESCLOSE10MINUTESBEFOREDEPARTURETIME']
 
 
Back to Top