python 识别图片中的文字信息方法

yipeiwu_com6年前Python基础

最近朋友需要一个可以识别图片中的文字的程序,以前做过java验证码识别的程序;

刚好最近在做一个python项目,所以顺便用Python练练手

1.需要的环境:

2.7或者3.4版本的python

2.需要安装pytesseract库

依赖PIL和tesseract-ocr库

本地环境是ubuntu,下面说一下 具体步骤:

2.7

1.安装PIL:

直接使用pip 安装; pip install Pillow

2.安装tesseract-ocr:

apt-get install tesseract-ocr

3.安装pytesseract

pip install pytesseract

使用python 3.4安装时;将pip 命令修改为pip3(都知道)

测试:

import pytesseract
from PIL import Image
img = Image.open('hb1.png')
data = pytesseract.image_to_string(img)
print (data)

注意: 会出现乱码

以上这篇python 识别图片中的文字信息方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

对Python中type打开文件的方式介绍

这几天在看《利用Python进行数据分析》,在第六章数据加载、存储、与文件格式中遇到个小问题。 在Linux访问文件是用:!cat ch06/ex1.csv 在Windows命令行中使用...

TensorFlow安装及jupyter notebook配置方法

tensorflow利用anaconda在ubuntu下安装方法及jupyter notebook运行目录及远程访问配置 Ubuntu下安装Anaconda bash ~/file_...

Python使用selenium + headless chrome获取网页内容的方法示例

使用python写爬虫时,优选selenium,由于PhantomJS因内部原因已经停止更新,最新版的selenium已经使用headless chrome替换掉了PhantomJS,所...

Python中文字符串截取问题

先来看个例子: #-*- coding:utf8 -*- s = u'中文截取' s.decode('utf8')[0:3].encode('utf8') # 结果u'中文截取...

对Pytorch神经网络初始化kaiming分布详解

对Pytorch神经网络初始化kaiming分布详解

函数的增益值 torch.nn.init.calculate_gain(nonlinearity, param=None) 提供了对非线性函数增益值的计算。 增益值gain是一个...