ocr技术如何获取图片上的文字信息?

2019-05-04 05:08:35  阅读 113 次 评论 0 条

  在日常生活中,我们总会碰到需要从纸质文档、图片上提取文字的操作。有时候对照一张图摘抄里面的内容可以说是一件非常烦心且效率低下的操作,如下图:

  由古至今,从过往而来的手写摘抄、打字机、计算机、录音机等可以说都是对文字信息保留的工作行为。当下信息时代,我们依旧保留了传统的习惯,也在积极迎合最流行的工作方式。今天要说到的就是上述图片最终解决问题的一套技术——文字识别技术!

  文字识别技术亦可称呼为“文档识别技术”,区别于之前说到的“证件识别、发票识别、名片银行卡识别”等应用。他的存在更多是无规格的,在以SDK的方式让客户离线部署过后,样本是可以划区域或作全文识别的。所以无论你拿过来的是电脑截图照片、扫描件、拍照件等都有可以让其做识别的功能。

  备注: 文字识别核心识别语言功能因操作系统而已,目前win32具备以上所有识别功能。具体识别要素请联系技术支持。

  文字识别支持TIFF,图像PDF,BMP,JPG,PNG等样本类型。也支持自动校正和自动旋转功能。在识别区域能够支持版面分析。因此识别率的问题受样本干扰因素偏多,面对整洁如上的样本,识别率能够达到百分之百,当然通常情况下,样本不同识别率能维持在95%以上。

  8. 支持识别藏文、维文、哈萨克文、阿拉伯文、柯尔克孜文与中文、英文混排的文本图像;

  9. 支持移动端iOS以及Andeoid操作系统,支持中英文拍照OCR。返回搜狐,查看更多

本文地址:https://www.kudz.cc/post/49203.html
版权声明:本文为原创文章,版权归 酷读者 所有,欢迎分享本文,转载请保留出处!

发表评论


表情

还没有留言,还不快点抢沙发?