Tesseract-OCR安装教程-​用PHP实现图片识别文字

PHP 来源:用户投稿 收藏

前几天有朋友想做一个网站,要用到图片识别,本来想直接调用API,说是每天要调用次数太多,最好自行搭建接口,然后搜索了一下,为防止以后忘掉,特意写个教程,作为备用!

1、准备工作

我用的是CentOS 7,宝塔面板,要用到composer(确认版本在2.0以上)。

2、安装Tesseract-OCR

step1:  yum search tesseract

step2:  yum install tesseract.x86_64

step3:yum install tesseract-devel.x86_64 tesseract-osd.x86_64

step4:yum install tesseract-langpack-chi_sim.noarch

3、Tesseract-OCR的使用

检查tesseract支持的语言:tesseract --list-langs

进行基于中文的OCR: tesseract chin-ocr.png chin-out -l chi_sim(tesseract 图片名称 输出文本名称 -l 语言)

4、安装PHP辅助包

composer require thiagoalessio/tesseract_ocr

5、实现远程图片识别

function get_img_text($img){
    require_once __DIR__ . '/vendor/autoload.php';
    $imageUrl = $img;
    $imageTempName = tempnam(sys_get_temp_dir(), 'image-from-kartaterazu');
    file_put_courses($imageTempName, file_get_courses($imageUrl));
    $text = (new TesseractOCR($imageTempName))->lang('chi_sim')->run();
    return $text; 
}



免责声明:1.凡本站注明“来源:XXX(非小二胡工作室)”的作品,均转载自其它媒体,所载的文章、图片、音频视频文件等资料的版权归版权所有人所有,如有侵权,请联系xiaoerhu#88.com处理;2.凡本站转载内容仅代表作者本人观点,与小二胡工作室无关。
0 条评论

网友留言