法国AI初创公司 Mistral AI 近日正式推出全新文档识别模型 OCR 4,在光学字符识别(OCR)领域带来显著升级。这一模型覆盖全球10个语系、共170种语言,在权威评测 OmniDocBench 中取得 93.07 分的成绩,输出质量在多项对比测试中被认为优于 GPT-5.5 Pro 与 Gemini 3.1 Pro Preview 等主流模型。
专注文档理解的轻量化模型
与通用大模型不同,OCR 4 并未追求参数规模扩展,而是专注于文档解析与结构化信息提取能力的优化。
在实际应用中,该模型不仅可以识别文本内容,还能同步输出:
- 文字区域边框定位
- 文档结构分类
- 识别置信度评分
这些能力使其能够更好地服务于RAG语义分块、智能体数据处理以及结构化内容构建等下游任务,在文档理解与数据处理链路中具备更高实用性。
面向开发者的API定价策略
在商业化方面,Mistral AI 为 OCR 4 提供了相对清晰的定价体系:
- 基础API调用:每千页 4 美元
- 批处理模式:可享受 50% 费用折扣
- 文档AI完整处理服务:每千页 5 美元
这一价格策略使其在大规模文档处理场景中具备一定成本优势,尤其适合企业级自动化处理需求。
向文档智能赛道延伸
作为欧洲最具代表性的AI创业公司之一,Mistral AI 此前已通过开源与闭源模型并行的策略在全球AI市场站稳脚跟。
此次 OCR 4 的发布,标志着其能力从通用语言模型进一步延伸至文档智能处理领域,正式进入与 OpenAI、Google 等厂商在基础AI工具层面的直接竞争阶段。
随着企业对结构化数据提取与自动化处理需求持续增长,OCR 4 的推出也为文档理解类AI应用提供了新的技术选择。
-
广告合作
-
QQ群号:4114653




