文章目录
- wordcloud库概述
- wordcloud库的安装
- wordcloud库使用说明
- 配置对象参数
- wordcloud应用实例
- 实例: 政府工作报告词云
wordcloud库概述
wordcloud
是优秀的词云展示第三方库
词云以词语为基本单位,更加直观和艺术地展示文本
wordcloud库的安装
(cmd命令行) pip install wordcloud
wordcloud库使用说明
wordcloud
库把词云当作一个wordcloud
对象
- wordcloud.WordCloud() 代表一个文本对应的词云
- 可以根据文本中词语出现的概率等参数绘制词云
- 词云的绘制形状,尺寸和颜色都可以设定
wordcloud库常规方法
w = wordcloud.WordCloud()
- 以WordCloud对象为基础
- 配置参数,加载文件,输出文件
import wordcloud
c = wordcloud.WordCloud() # 步骤1: 配置对象参数
c.generate("wordcloud by Python") # 步骤2: 加载词云文本
c.to_file("pywordcloud.png") # 步骤三: 输出词云文件
配置对象参数
w = wordcloud.WordCloud(<参数>)
参数 | 描述 |
---|---|
width | 指定词云对象生成图片的宽度,默认400像素 w=wordcloud.WordCloud(width=600) |
height | 指定词云对象生成图片的高度,默认200像素 w=wordcloud.WordCloud(height=400) |
wordcloud应用实例
import wordcloud
txt = "life is short,you need python"
w = wordcloud.WordCloud(background_color="purple")
w.generate(txt)
w.to_file("pywcloud.png")
以空格分隔单词
中文需要先分词并组成空格分隔字符串
import wordcloud
import jieba
txt = "程序设计语言是计算机能够理解和\
识别用户操作意图的一种交互体系,它按照\
特定规则组织计算机指令,使计算机能够自\
动进行各种运算处理。"
w = wordcloud.WordCloud(width=1000,font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("py.jpg")
实例: 政府工作报告词云
问题分析: 直观了解政策文件
- 需求: 对于政府工作报告等政策文件,如何直观理解?
- 体会直观的价值: 生成词云 & 优化词云
政府工作报告等文件 ⇒ 有效展示的词云
这个案例我们使用的材料:材料
思路:
- 读取文件,分词整理
- 设置并输出词云
- 观察结果,优化迭代
代码:
import jieba
import wordcloud
f = open("1.txt","r",encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path="msy.ttc",width=1000,height=700,background_color="white")
w.generate(txt)
w.to_file("wordcloud.jpg")
还有一些其他更丰富的词云就自己探索叭!