发布于2022年11月4日3年前 说实在的Pyhon在数据处理方面确实很牛。尤其是大数据的今天,我们和形形色色的数据形影不离。本文给大家介绍下利用百度OCR进行文字识别。实验环境Python (3.9.12)Kali Linux百度OCR申请百度OCR访问百度智能云,开通API网址:https://cloud.baidu.com/campaign/OCR202203/index.html可以使用百度账号登录,使用百度登录的好处是,你可以把百度的实名认证直接迁移过来,就不需要再等几天人工审核了。你可以选择免费试用,或者1块钱买1万次,我觉得没什么区别,都是够用的。领取免费额度的时候要勾选接口类型,要不然是一片空白。新建应用,获取token在控制台-文字识别-概览中点击创建应用应用归属选择个人,应用名称和概述就随便填创建完成之后,进入应用列表,可以看到API Key和Secret Key,记下来。文字识别根据官方示例,写了Python的简单列子。参考如下:from aip import AipOcr APP_ID = 'xxxxxx'#你的APP_ID API_KEY = 'xxxxxxxxx'#你的API_KEY SECRET_KEY = 'xxxxxxxx'#你的SECRET_KEY client = AipOcr(APP_ID, API_KEY, SECRET_KEY) def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() image = get_file_content('/root/img/44.jpg') result = client.basicGeneral(image) for item in result['words_result']: print(item['words'])识别车牌号效果如下:识别行程码其他在此基础上,我们可以深度开发。比如批量处理文件夹中的图片,并将其图片中的文字信息导出到Excel中。后期有时间深度研究下吧。 版权属于:逍遥子大表哥本文链接:https://blog.bbskali.cn/3201.html按照知识共享署名-非商业性使用 4.0 国际协议进行许可,转载引用文章应遵循相同协议。
创建帐户或登录后发表意见