当前课程知识点:计算思维与人工智能基础 > 第三部分:python基础 > 第八章:python生态库 > 8.6第三方库-词云库
下面我们给大家介绍一下第三方库
wordcloud库
wordcloud库是优秀的词云展示第三方库
以词语为基本单位
通过图形可视化的方式更加直观和艺术的展示文本
我们来看
左边是一个中文文本的词云展示文件
右边是一个英文的什么呀
词云展示文件
下面我们来看如何通过代码来实现呢
首先第一步呢
我们需要导入我们的wordcloud库
第二步呢需要配置一个参数
那么通过wordcloud这个方法下
可以设置背景参数
background的颜色
以及的我们图云生成的文件的高度和宽度
以及词频数等等
都可以在这里面设置
设置好了以后呢我们第三步就是加载这个文本
通过generate这个方法
把我们的什么呀
英文的文本把它生成一个词云文件
那么最后一步是需要我们通过to_file这个方法
那么保存这个词云文件
那么这个输出这个词云文件的时候
它是一个什么呀
png文件
这就是我们要产生一个词云文件的四步
第一步是设置
第二步配置参数
第三步是我们的加载我们的文本啊
最后呢我们输出我的词云文件
那么如果我们输出的是一个中文的一个词云的文件的话
这时我们不仅要导入我们的wordcloud
还可以导入我们的什么呀
要需要导入我们jieba的这个词库
那么jieba词库专门是处理中文的分词呀等等的一些操作
第二步的配置参数的时候
我们也需要注意一下要配置一个
关于中文字体的一个font-path
这样的一个路径
那么同样第三步是我们加载我们的什么呀
文本
第四步呢是输出我们的词云
下面呢我们在jupyter下看我们这个代码的实现的结果
我们在jupyter下看一下我们这样的一段文档
那么也是导入我们是什么呀
wordcloud
这个是我们的wordcloud一个设置
设置了一个背景的颜色是白色的
那么最大的words是可以有多少个单词
四十个啊
然后通过我们generate来去加载我们这个字符串
字符串作为它的生成的文本
然后把我们生成好的一个词云文件呢
你存入到是一个什么呀
English.png里面
我们运行一下
那我们生成这个文件是当前目录下的什么
English配置
那么在这个目录里面我们可以看到
在当前的这个目录下
我们在生态库这个目录下
我们可以看的到这有一个什么
English.png的文件
我们可以把它打开
可以看一下
打开是一个这样子的
那么也可以在我们这个啊
这个地方就可以看得到
我们可以打开我们English
我们也可以看到这个
这就是我们刚才生成的这个词云文件
如果我们这段文本呢是来自于文件的话
我们可以打开一个指定的文件
前面我们学过open
打开指定的目录下的一个文件
通过.read来读进来
那么读进来以后呢
我们下面就可以通过generate来去加载这段文本
加载这段文本以后一样我们可以输出
那么只不过我们这个English这个txt
是在这个我们这个jieba字库下面有一个English
让我们打开可以看一下
那么就是这样的一段文本
这里面是自动有逗号有一些空格的啊
那么在这个生成词云的时候
它是默认空格就把每一个单词可以分开
好的我们可以生成一下
运行
运行我们这个生成的English点配置
我们来看变了没有
那么在这个目录下
我们在这可以打开我们English.png这个文件
那么可以看这个就是我们新生成的词云
这个词云里面的单词呢
是从文件里面可以取出的啊
如果我们要输出一个中文的词云的话
我们这时候还要导入另外一个什么呀
jieba的词库
那么这个我们也是从一个文件里面啊
在这个指定的一个路径下的文件里面去打开这样的一个
放到这个txt里面
这个文本变量里面啊
然后呢
我们通过jieba的cut把它这个方法来进行分词啊
那么分完了以后我们通过
join空格把它再连起来
它就是一个字符串
然后呢
下面呢这是我们一个要进行背景一些参数的一些设置
比如说背景参数
要我们字体来自于指定的一个目录
那还可以一些字体的最大值啊
以及随机生成状态都可以在这设置
下面呢我们就可以通过generate去生成这个词云
然后一样存入Chinese.png这个文件
我们运行一下
我们可以看到
那么成功
一样我们在这个里面就生成了一个
Chinese.png这样的一个文件
我们可以打开
这就是我们刚才拆分的这个产生的中文的什么呀
词云
一样呢如果我们不用文本打开
我们可以指定一些字符串
然后你可以把这个注释掉
我们就不用这样取一段字符处理了
我们把这个可以都注释掉
跟刚才一样
我们先用
配置前面不用改
那么只是generate这个文件呢是可以
生成这个词云文件的时候可以
给定一个字符串也可以生成
那我们再运行一下
我们看这个Chinese这个文件输出的词云
就是这样子的啊
那我们就可以看得到是我们这些
给定的这一些什么呀
中文的文字来生成的这个词云
那么对于词云的使用
就给大家介绍到这儿
-章测试
-章测试
-第一章:python简介
--章测试
-第二章:编码规范
--2.2常量和变量
--章测试
-第三章:数据类型
--章测试
-第四章:基本运算
--4.2比较运算符
--4.3逻辑运算符
--4.4位运算符
--章测试
-第五章:程序控制结构
--5.1顺序结构
--5.2条件结构
--5.3循环结构
--5.4跳转结构
--5.5异常处理
--章测试
-第六章:函数、模块与面向对象
--6.2面向对象
--6.4模块与包
--章测试
-第七章:文件操作
--7.2文件的写入
--章测试
-第八章:python生态库
--章测试
-第九章:TensorFlow基础
--章测试
-第十章:实例分析与实践
--章测试
-第十一章:人工智能在自然语言中的应用
--章测试