python 识别图片中的文字信息方法

yipeiwu_com6年前Python基础

最近朋友需要一个可以识别图片中的文字的程序,以前做过java验证码识别的程序;

刚好最近在做一个python项目,所以顺便用Python练练手

1.需要的环境:

2.7或者3.4版本的python

2.需要安装pytesseract库

依赖PIL和tesseract-ocr库

本地环境是ubuntu,下面说一下 具体步骤:

2.7

1.安装PIL:

直接使用pip 安装; pip install Pillow

2.安装tesseract-ocr:

apt-get install tesseract-ocr

3.安装pytesseract

pip install pytesseract

使用python 3.4安装时;将pip 命令修改为pip3(都知道)

测试:

import pytesseract
from PIL import Image
img = Image.open('hb1.png')
data = pytesseract.image_to_string(img)
print (data)

注意: 会出现乱码

以上这篇python 识别图片中的文字信息方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

用python做一个搜索引擎(Pylucene)的实例代码

用python做一个搜索引擎(Pylucene)的实例代码

1.什么是搜索引擎? 搜索引擎是“对网络信息资源进行搜集整理并提供信息查询服务的系统,包括信息搜集、信息整理和用户查询三部分”。如图1是搜索引擎的一般结构,信息搜集模块从网络采集信息到网...

python图书管理系统

本文实例为大家分享了python图书管理系统的具体代码,供大家参考,具体内容如下 实现语言:python 图形框架:DTK+2.0 数据库框架:SQLite 3.0 本程序需要以下部件运...

python脚本生成caffe train_list.txt的方法

首先给出代码: import os path = "/home/data//" path_exp = os.path.expanduser(path) classes =...

python 采集中文乱码问题的完美解决方法

近几日遇到采集某网页的时候大部分网页OK,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录 1. 在正常情况下..可以用 import char...

python实现线程池的方法

本文实例讲述了python实现线程池的方法。分享给大家供大家参考。具体如下: 原理:建立一个任务队列,然多个线程都从这个任务队列中取出任务然后执行,当然任务队列要加锁,详细请看代码 文件...