简介

更新时间：2025-04-28

概述

iOCR 全场景识别平台是一款基于 MoE 混合专家方案打造的一站式文档智能识别平台，依托于百度 OCR 模型与文心大模型3.5，无需定制训练、无需分类后调用，致力于提供更加全面、精准、易用的文档结构化服务，有效提升企业内部费用报销、保险理赔、贷款审批等业务处理效率。

平台预置意图识别大模型，可根据任务内不同文档类型，自动推荐并分发至对应专家模型，包括 10 余种 OCR 模型（支持结构化识别 20 多类文件）与通用抽取大模型（支持自动抽取任意文档的关键字段），从繁琐的人工分类、复杂的多接口调用升级为一站式全自动处理。此外，可在平台自定义文档抽取模型，不限类型与版式，只需上传一张图片、输入待抽取的字段，仅需 1 分钟，即可构建新模型，从此告别采集、标注、训练等传统模型构建的漫长流程。

使用方式

支持在线平台和API服务两种使用方式。

如需快速体验效果，可进入示例项目空间，一键上传文档，即可完成测试；如需使用API服务，可参见API文档。在线工具和API服务的额度共享互通。

核心功能

iOCR 全场景识别提供以下两大自定义功能：自定义项目空间、自定义抽取模型，结合使用，可实现对全场景不同类型文档的自动分类与结构化识别，分类准确率可达 99%，识别准确率可达 95%，详细介绍如下。

自定义项目空间

可基于业务需求，自主创建项目空间并配置识别规则，不同空间下，任务数据完全隔离，有效保障数据隐私性。

一键勾选所需模型：平台已预置丰富的预置模型，同时支持用户自定义我的模型，只需一键勾选，即可快速开启使用；
灵活选择兜底策略：若出现已选模型未覆盖的文件类型，可从全文识别、结构化识别、拒识别中任选一种作为兜底策略，避免业务流中断。

自定义抽取模型

若预置模型中未包含您想要的模型，可通过自定义抽取模型，快速扩展可识别的文件类型：只需上传一张样本图片、配置待识别字段，无需训练即可精准抽取字段值。

基础字段：指单个字段，例如单位名称、住所；
组合字段：指一组存在关联关系的字段，例如项目的详细信息，包含项目名称、子项目、项目参数。更直观的组名有利于模型抽取效果。

产品优势

开箱即用：MoE 混合专家方案驱动，预置丰富的 OCR 模型及文心大模型3.5，无需定制训练、无需分类后再调用，一个接口全识别，分钟级完成业务上线。
积木式组合：可按照实际业务场景灵活配置所需模型，依托意图识别模型自动分至对应专家模型，高效处理、提高资源利用率。
适应复杂场景：基于百度沉淀多年的 OCR 模型，以及文心大模型对海量文本的深度学习，准确识别文字并理解上下文信息，精准完成结构化识别。
使用方式灵活：支持 SaaS 平台在线使用、公有云 API 调用以及私有化本地部署，满足企业各场景使用需求。

评价此篇文章

有帮助没帮助

概览

API文档

百度智能云

文字识别