python 识别图片中的文字信息方法

yipeiwu_com5年前Python基础

最近朋友需要一个可以识别图片中的文字的程序,以前做过java验证码识别的程序;

刚好最近在做一个python项目,所以顺便用Python练练手

1.需要的环境:

2.7或者3.4版本的python

2.需要安装pytesseract库

依赖PIL和tesseract-ocr库

本地环境是ubuntu,下面说一下 具体步骤:

2.7

1.安装PIL:

直接使用pip 安装; pip install Pillow

2.安装tesseract-ocr:

apt-get install tesseract-ocr

3.安装pytesseract

pip install pytesseract

使用python 3.4安装时;将pip 命令修改为pip3(都知道)

测试:

import pytesseract
from PIL import Image
img = Image.open('hb1.png')
data = pytesseract.image_to_string(img)
print (data)

注意: 会出现乱码

以上这篇python 识别图片中的文字信息方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python3实现腾讯云OCR识别

Python3实现腾讯云OCR识别

废话不多说,在网上找了下腾讯云OCR识别的,示例不多,用Python的还是Python2.7,花了点时间改成Python3的。 先上图,腾讯自己的示例图: 下面是代码: imp...

Python如何基于rsa模块实现非对称加密与解密

这篇文章主要介绍了Python如何基于rsa模块实现非对称加密与解密,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 1、简单介绍: R...

使用pandas将numpy中的数组数据保存到csv文件的方法

使用pandas将numpy中的数组数据保存到csv文件的方法

接触pandas之后感觉它的很多功能似乎跟numpy有一定的重复,尤其是各种运算。不过,简单的了解之后发现在数据管理上pandas有着更为丰富的管理方式,其中一个很大的优点就是多出了对数...

python django中8000端口被占用的解决

python django中8000端口被占用的解决

1. 问题截图:(8000端口被占用) 2. 第一种是可能会打开了多个运行窗口右键关闭即可: 3. 第二种是在你运行python的主机上查询出python所有在执行的python文件...

Python的Django REST框架中的序列化及请求和返回

序列化Serialization 1. 设置一个新的环境 在我们开始之前, 我们首先使用virtualenv要创建一个新的虚拟环境,以使我们的配置和我们的其他项目配置彻底分开。 $m...