跳到主要内容

文字识别


文字识别也叫 OCR(optical Character Recognition,光学字符识别),OCR功能可以把文件中的文字信息快速精准的识别出来,并立刻自动填充到的对应的字段中。 例如读取身份证照片、发票等信息。

应用场景

  • 银行身份认证场景中,只需提交身份证信息,OCR 就能自动识别出身份证上的姓名、性别、地址等信息并填报到系统中;
  • 在企业资质审核场景中,通过上传营业执照,OCR 将营业执照的注册号、企业名称等信息识别出并填报到系统中,再通过营业执照校验接口,自动完成企业资质校验。

演示效果

以通过上传火车票自动识别并填写对应表单字段的功能

组件属性

识别模板

为了满足不同场景下的文字识别需求,我们提供了十二种专业的识别模板,每种模板均针对特定类型的文档进行了优化,以确保识别的准确性和效率。以下是各模板的详细说明:

模板名称识别内容应用场景
通用文字(默认)普通文本内容(无固定格式)适用于无固定格式的文本识别,如文档扫描、文字提取等。
智能财务票据智能识别火车票,出租车票,飞机行程单,增值税发票内容财务报销、票据管理、税务审计等。
火车票车票号、始发站、车次号、到达站、出发日期、车票金额、席别、乘客姓名等火车票预订、报销、行程管理等。
出租车票发票代号、发票号码、金额、日期、里程、车号等出租车票报销、费用统计等。
飞机行程单日期、出发地、目的地、旅客姓名、有效身份证号码、航班号、电子客票号码、燃油附加费、保险费、票价、填开日期、销售单位代号、民航发展基金、印刷序号、验证码等机票预订、报销、行程管理等。
增值税发票发票代码、发票号码、开票日期、金额、税率、销售方信息等财务报销、税务管理、发票核验等。
身份证姓名、性别、民族、出生日期、住址、身份证号码等身份验证、实名认证、用户注册等。
银行卡卡号、发卡行、有效期等银行卡绑定、支付、账户管理等。
营业执照公司名称、统一社会信用代码、法定代表人、成立日期等企业认证、工商管理、合同签署等。
车牌号车牌号码、车辆类型等车辆管理、停车场管理、交通违章处理等。
驾驶证姓名、驾驶证号、准驾车型、有效期等驾驶证验证、交通管理、租车服务等。
行驶证车牌号、车辆类型、所有人、住址等车辆管理、交通管理、保险理赔等。

字段映射

不同的模板对于不同的字段映射,点击「点击设置」按钮,在弹出的建立字段映射弹窗里面对相应的字段进行设置:

注意事项

1)文字识别控件每一次的识别都要扣除相应的费用,此功能为付费功能: 2)文字识别后不论是否储存原文件,都将消耗附件量。(附件量指的是附件流量,上传即消耗)
3)文字识别非 100% 精准,目前市面上的接口均无法保证 100% 识别,上传的内容越清晰越容易被识别。目前我们调用的是百度 OCR 识别接口,具体技术限制还可以参考百度官方文件。


👇文档问题反馈