搜索本产品文档关键词
简介
所有文档
menu

文字识别

简介

概述

iOCR 全场景识别平台是一款基于 MoE 混合专家方案打造的一站式文档智能识别平台,依托于百度 OCR 模型与文心大模型3.5,无需定制训练、无需分类后调用,致力于提供更加全面、精准、易用的文档结构化服务,有效提升企业内部费用报销、保险理赔、贷款审批等业务处理效率。

平台预置意图识别大模型,可根据任务内不同文档类型,自动推荐并分发至对应专家模型,包括 10 余种 OCR 模型(支持结构化识别 20 多类文件)与通用抽取大模型(支持自动抽取任意文档的关键字段),从繁琐的人工分类、复杂的多接口调用升级为一站式全自动处理。此外,可在平台自定义文档抽取模型,不限类型与版式,只需上传一张图片、输入待抽取的字段,仅需 1 分钟,即可构建新模型,从此告别采集、标注、训练等传统模型构建的漫长流程。

使用方式

支持在线平台和API服务两种使用方式。

如需快速体验效果,可进入示例项目空间 ,一键上传文档,即可完成测试;如需使用API服务,可参见API文档。在线工具和API服务的额度共享互通。

核心功能

iOCR 全场景识别提供以下两大自定义功能:自定义项目空间、自定义抽取模型,结合使用,可实现对全场景不同类型文档的自动分类与结构化识别,分类准确率可达 99%,识别准确率可达 95%,详细介绍如下。

自定义项目空间

可基于业务需求,自主创建项目空间并配置识别规则,不同空间下,任务数据完全隔离,有效保障数据隐私性。

  • 一键勾选所需模型:平台已预置丰富的预置模型,同时支持用户自定义我的模型,只需一键勾选,即可快速开启使用;
  • 灵活选择兜底策略:若出现已选模型未覆盖的文件类型,可从全文识别、结构化识别、拒识别中任选一种作为兜底策略,避免业务流中断。

image.png

自定义抽取模型

若预置模型中未包含您想要的模型,可通过自定义抽取模型,快速扩展可识别的文件类型:只需上传一张样本图片、配置待识别字段,无需训练即可精准抽取字段值。

  • 基础字段:指单个字段,例如单位名称、住所;
  • 组合字段:指一组存在关联关系的字段,例如项目的详细信息,包含项目名称、子项目、项目参数。更直观的组名有利于模型抽取效果。

image.png

产品优势

  • 开箱即用:MoE 混合专家方案驱动,预置丰富的 OCR 模型及文心大模型3.5,无需定制训练、无需分类后再调用,一个接口全识别,分钟级完成业务上线。
  • 积木式组合:可按照实际业务场景灵活配置所需模型,依托意图识别模型自动分至对应专家模型,高效处理、提高资源利用率。
  • 适应复杂场景:基于百度沉淀多年的 OCR 模型,以及文心大模型对海量文本的深度学习,准确识别文字并理解上下文信息,精准完成结构化识别。
  • 使用方式灵活:支持 SaaS 平台在线使用、公有云 API 调用以及私有化本地部署,满足企业各场景使用需求。
上一篇
概览
下一篇
API文档