文字识别
文字识别也叫 OCR(optical Character Recognition,光学字符识别),OCR功能可以把文件中的文字信息快速精准的识别出来,并立刻自动填充到的对应的字段中。 例如读取身份证照片、发票等信息。
应用场景
- 银行身份认证场景中,只需提交身份证信息,OCR 就能自动识别出身份证上的姓名、性别、地址等信息并填报到系统中;
- 在企业资质审核场景中,通过上传营业执照,OCR 将营业执照的注册号、企业名称等信息识别出并填报到系统中,再通过营业执照校验接口,自动完成企业资质校验。
演示效果
以通过上传火车票自动识别并填写对应表单字段的功能
组件属性
识别模板
为了满足不同场景下的文字识别需求,我们提供了十二种专业的识别模板,每种模板均针对特定类型的文档进行了优化,以确保识别的准确性和效率。以下是各模板的详细说明:
模板名称 | 识别内容 | 应用场景 |
---|---|---|
通用文字(默认) | 普通文本内容(无固定格式) | 适用于无固定格式的文本识别,如文档扫描、文字提取等。 |
智能财务票据 | 智能识别火车票,出租车票,飞机行程单,增值税发票内容 | 财务报销、票据管理、税务审计等。 |
火车票 | 车票号、始发站、车次号、到达站、出发日期、车票金额、席别、乘客姓名等 | 火车票预订、报销、行程管理等。 |
出租车票 | 发票代号、发票号码、金额、日期、里程、车号等 | 出租车票报销、费用统计等。 |
飞机行程单 | 日期、出发地、目的地、旅客姓名、有效身份证号码、航班号、电子客票号码、燃油附加费、保险费、票价、填开日期、销售单位代号、民航发展基金、印刷序号、验证码等 | 机票预订、报销、行程管理等。 |
增值税发票 | 发票代码、发票号码、开票日期、金额、税率、销售方信息等 | 财务报销、税务管理、发票核验等。 |
身份证 | 姓名、性别、民族、出生日期、住址、身份证号码等 | 身份验证、实名认证、用户注册等。 |
银行卡 | 卡号、发卡行、有效期等 | 银行卡绑定、支付、账户管理等。 |
营业执照 | 公司名称、统一社会信用代码、法定代表人、成立日期等 | 企业认证、工商管理、合同签署等。 |
车牌号 | 车牌号码、车辆类型等 | 车辆管理、停车场管理、交通违章处理等。 |
驾驶证 | 姓名、驾驶证号、准驾车型、有效期等 | 驾驶证验证、交通管理、租车服务等。 |
行驶证 | 车牌号、车辆类型、所有人、住址等 | 车辆管理、交通管理、保险理赔等。 |
字段映射
不同的模板对于不同的字段映射,点击「点击设置」按钮,在弹出的建立字段映射弹窗里面对相应的字段进行设置:
注意事项
1)文字识别控件每一次的识别都要扣除相应的费用,此功能为付费功能:
2)文字识别后不论是否储存原文件,都将消耗附件量。(附件量指的是附件流量,上传即消耗)
3)文字识别非 100% 精准,目前市面上的接口均无法保证 100% 识别,上传的内容越清晰越容易被识别。目前我们调用的是百度 OCR 识别接口,具体技术限制还可以参考百度官方文件。
👇文档问题反馈
- 文档中是否有错别字、内容过期、难以理解等问题?点此反馈给我们