借鉴了一篇博客:
http://my.oschina.net/yushulx/blog/359468#OSC_h3_4
英文版在这里:
http://www.codepool.biz/making-an-android-ocr-application-with-tesseract.html
我上传了一个android studio环境下的例子,可以拍照或者选择图库中图片进行识别。
这个链接(https://github.com/yuzhiyun/TesseractOCR2/)包括一份工程源代码和 两个压缩包(语言包),一个是中文汉字,一个是英文。
请注意:
必须现在手机内部存储根目录
(在程序中获取这个字符串就明白这个目录是什么了Environment.getExternalStorageDirectory())
下新建一个文件夹tessdata,然后把语言包解压后放进这个目录,如果没有语言包,程序会崩溃。
程序并不是特别精确,因为是直接识别的,没有对图片进行处理,我会在稍后的博客里讲述如何处理图片(比图锐化等)以提高精确度。
相关推荐
c#实现基于tesseract的ocr识别 ,二值化图片效果好
tesseract-ocr的语言库识别库文件,下载解压后放到tesseract-ocr安装目录下的tessdata 目录,存放的是语言字库文件,和在命令行界面中可能用到的参数所对应的文件. 这个安装程序默认包含了英文字库。
OCR,tesseract41,用C#封装接口生成调用库,方便C#使用,有使用例子。
python图片中文识别引擎Tesseract-OCR,支持英文中文的识别,语言库丰富可选择性安装需要的语言,解压之后直接点击安装下一步即可。安装完成之后设置pytesseract.py中的tesseract_cmd为'C:/Program Files (x86)/...
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。数年以后,HP意识到,与其将Tesseract束之高阁,...
一个Google支持的开源的OCR图文识别开源项目。去持多语言(当前3.02 版本支持包括英文,简体中文,繁体中文),支持...可以参考网上的相关资料进行对Tesseract字符识别进行样本训练,通过使用训练后的语言库会提高识别精度。
Tesseract-OCR识别中文,jTessBoxEditor训练字库增加准确度
基于Google的TesseractOCR识别引擎的设计的Winform识别系统,是学习OCR技术很好的一个例子。
tesseract中文简体识别库(繁体)支持ocr
通过java调用OCR来对图片进行识别,本人这里是做了一个小的应用,自己玩玩,用来识别一个试卷的题目,并处理出题目编号、题目名、小题数目及分值 等信息。
Tesseract-OCR识别,使用C#的winform开发,可以运行。里面有上传图片和DLL。 1、.NET Framework 4.5 2、C# Winform
累死的 几乎包括现在网上的教程例子了,5分绝对不贵,还做了一份26页doc教程 其中有ocr2能识别英文的 ocr3能识别中文,不过中文语言包太大我没上传,要用的童鞋自己下吧,doc里面有链接,里面还有一个AspriseOCR 识别速度...
C# TesseractOCR识别身份证号
Android Tesseract OCR光学字符识别相关的资料,主要来自github
绕过pytesser,直接使用Tesseract-OCR进行中文文字的识别,识别率相对较低,后续会上传优化版本
tesseract-ocr安装包和中文语言包.rar
tesseract OCR 文字识别! 文字数据库,支持多国语言!
Tesseract OCR多线程并发识别案例----只演示多线程并发识别,此工具不关注识别正确率,可通过训练tessdata来获得更高的识别正确率。
本资源提供Python文字识别之tesseract-ocr安装包和中文语言包chi_sim.traineddata免费下载。 tesseract-ocr:tesseract-ocr-w64-setup-v5.1.0.20220510.exe; 中文语言包:chi_sim.traineddata