详解Python数据可视化编程 - 词云生成并保存(jieba+WordCloud)

yipeiwu_com6年前Python基础

 思维导图:

效果(语句版):

源码:

# -*- coding: utf-8 -*-
"""
Created on Tue Mar 5 17:59:29 2019
@author: dell
"""
 
 
# =============================================================================
# 步骤:
# 分割aaa = jieba.cut(str,cut_all=True/False)
# 连接bbb = " ".join(aaa)
# 制作xxx = WordCloud(background_color,font_path).generate(bbb)  #bbb为字符串
# 显示plt.imshow(xxx)  #不能用plt.show()
# 取消坐标轴的显示Matplotlib.pyplot.axis("off")
# 存为图片xxx.to_file(path)
# =============================================================================
 
 
 
from wordcloud import WordCloud
from matplotlib import pyplot as plt
import jieba
 
with open("pythonTest.txt",encoding="utf-8") as f:
  text = f.read()
#textFromFile = open("pythonTest",encoding = "UTF-8").read()
 
 
word_list = jieba.cut("ABVDEFG",cut_all=True)  #切成了一个个的字符串
xxx = " ".join(word_list)  #"分隔符".join(需要被连接的数据) 将内容连接为字符串
 
myWordCloud = WordCloud(background_color="white",font_path='C:\windows\Fonts\STZHONGS.TTF').generate(text)
#myWordCloud = WordCloud(background_color="white",width=1000,height=860,font_path='C:\windows\Fonts\STZHONGS.TTF').generate(text)
plt.axis("off")
#plt.show(myWordCloud)  #没有实际显示,只有背景!!!
plt.imshow(myWordCloud)
 
myWordCloud.to_file("词云图片.jpg")  #保存为图片
 

注意事项:

<一>   jieba分词

  1. 分词后的返回值类型
  2. 分词后的返回值
  3. 如何去除所要分离文本的中英文符号,还有空格符
import jieba
wordList = jieba.cut("机器学习,算法对新鲜样本!的适应能力:叫泛化能力",cut_all=False)
print(type(wordList))  #类型是一个生成器generator
print(wordList)    #本身是一个生成器对象generator Object
for list in wordList:
  if list in ",./;'[]~!@#$%^&*()_+,。、;‘ 【】~!@#¥%……&*()——+《 》?:“{}<>?:\n\r":
    None
  else:
    print(list)

 <二>  对词图进行重新上色的注意事项

  1. recolor(color_func=color)    正确
  2. recolor(color)    错误

<三>    读取图片时候的注意事项

a = np.array(Image.open(路径))

<四>  python中文件路径注意事项

  1. 使用  \\
  2. 使用  /

<五>  Spyder中的注释快捷键

  1. 单行注释:Ctrl+1
  2. 块注释:Ctrl+4

以上所述是小编给大家介绍的Python数据可视化编程 - 词云生成并保存(jieba+WordCloud)详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持!

相关文章

Python可变参数*args和**kwargs用法实例小结

Python可变参数*args和**kwargs用法实例小结

本文实例讲述了Python可变参数*args和**kwargs用法。分享给大家供大家参考,具体如下: 一句话简单概括:当函数的参数不确定的时候就需要用到*args和**kwargs,前者...

python定时复制远程文件夹中所有文件

本文实例为大家分享了python定时复制远程文件夹中文件的具体代码,供大家参考,具体内容如下 import os, shutil, sys import threading impo...

Python 基础教程之闭包的使用方法

Python 基础教程之闭包的使用方法 前言: 闭包(closure)是函数式编程的重要的语法结构。函数式编程是一种编程范式 (而面向过程编程和面向对象编程也都是编程范式)。在面向过程编...

Python随机生成均匀分布在三角形内或者任意多边形内的点

Python随机生成均匀分布在三角形内或者任意多边形内的点

Python有一随机函数可以产生[0,1)区间内的随机数,基于此函数生成随机分布在任意三角形内的点 由数学知识得知: 几何体的向量表达形式 直线: 线段: 推广到高维 三维平面:...

用python做一个搜索引擎(Pylucene)的实例代码

用python做一个搜索引擎(Pylucene)的实例代码

1.什么是搜索引擎? 搜索引擎是“对网络信息资源进行搜集整理并提供信息查询服务的系统,包括信息搜集、信息整理和用户查询三部分”。如图1是搜索引擎的一般结构,信息搜集模块从网络采集信息到网...