当前课程知识点:计算思维与人工智能基础 >  第三部分:python基础 >  第八章:python生态库 >  8.6第三方库-词云库

返回《计算思维与人工智能基础》慕课在线视频课程列表

8.6第三方库-词云库在线视频

下一节:8.7第三方库-pyinstaller库

返回《计算思维与人工智能基础》慕课在线视频列表

8.6第三方库-词云库课程教案、知识点、字幕

下面我们给大家介绍一下第三方库

wordcloud库

wordcloud库是优秀的词云展示第三方库

以词语为基本单位

通过图形可视化的方式更加直观和艺术的展示文本

我们来看

左边是一个中文文本的词云展示文件

右边是一个英文的什么呀

词云展示文件

下面我们来看如何通过代码来实现呢

首先第一步呢

我们需要导入我们的wordcloud库

第二步呢需要配置一个参数

那么通过wordcloud这个方法下

可以设置背景参数

background的颜色

以及的我们图云生成的文件的高度和宽度

以及词频数等等

都可以在这里面设置

设置好了以后呢我们第三步就是加载这个文本

通过generate这个方法

把我们的什么呀

英文的文本把它生成一个词云文件

那么最后一步是需要我们通过to_file这个方法

那么保存这个词云文件

那么这个输出这个词云文件的时候

它是一个什么呀

png文件

这就是我们要产生一个词云文件的四步

第一步是设置

第二步配置参数

第三步是我们的加载我们的文本啊

最后呢我们输出我的词云文件

那么如果我们输出的是一个中文的一个词云的文件的话

这时我们不仅要导入我们的wordcloud

还可以导入我们的什么呀

要需要导入我们jieba的这个词库

那么jieba词库专门是处理中文的分词呀等等的一些操作

第二步的配置参数的时候

我们也需要注意一下要配置一个

关于中文字体的一个font-path

这样的一个路径

那么同样第三步是我们加载我们的什么呀

文本

第四步呢是输出我们的词云

下面呢我们在jupyter下看我们这个代码的实现的结果

我们在jupyter下看一下我们这样的一段文档

那么也是导入我们是什么呀

wordcloud

这个是我们的wordcloud一个设置

设置了一个背景的颜色是白色的

那么最大的words是可以有多少个单词

四十个啊

然后通过我们generate来去加载我们这个字符串

字符串作为它的生成的文本

然后把我们生成好的一个词云文件呢

你存入到是一个什么呀

English.png里面

我们运行一下

那我们生成这个文件是当前目录下的什么

English配置

那么在这个目录里面我们可以看到

在当前的这个目录下

我们在生态库这个目录下

我们可以看的到这有一个什么

English.png的文件

我们可以把它打开

可以看一下

打开是一个这样子的

那么也可以在我们这个啊

这个地方就可以看得到

我们可以打开我们English

我们也可以看到这个

这就是我们刚才生成的这个词云文件

如果我们这段文本呢是来自于文件的话

我们可以打开一个指定的文件

前面我们学过open

打开指定的目录下的一个文件

通过.read来读进来

那么读进来以后呢

我们下面就可以通过generate来去加载这段文本

加载这段文本以后一样我们可以输出

那么只不过我们这个English这个txt

是在这个我们这个jieba字库下面有一个English

让我们打开可以看一下

那么就是这样的一段文本

这里面是自动有逗号有一些空格的啊

那么在这个生成词云的时候

它是默认空格就把每一个单词可以分开

好的我们可以生成一下

运行

运行我们这个生成的English点配置

我们来看变了没有

那么在这个目录下

我们在这可以打开我们English.png这个文件

那么可以看这个就是我们新生成的词云

这个词云里面的单词呢

是从文件里面可以取出的啊

如果我们要输出一个中文的词云的话

我们这时候还要导入另外一个什么呀

jieba的词库

那么这个我们也是从一个文件里面啊

在这个指定的一个路径下的文件里面去打开这样的一个

放到这个txt里面

这个文本变量里面啊

然后呢

我们通过jieba的cut把它这个方法来进行分词啊

那么分完了以后我们通过

join空格把它再连起来

它就是一个字符串

然后呢

下面呢这是我们一个要进行背景一些参数的一些设置

比如说背景参数

要我们字体来自于指定的一个目录

那还可以一些字体的最大值啊

以及随机生成状态都可以在这设置

下面呢我们就可以通过generate去生成这个词云

然后一样存入Chinese.png这个文件

我们运行一下

我们可以看到

那么成功

一样我们在这个里面就生成了一个

Chinese.png这样的一个文件

我们可以打开

这就是我们刚才拆分的这个产生的中文的什么呀

词云

一样呢如果我们不用文本打开

我们可以指定一些字符串

然后你可以把这个注释掉

我们就不用这样取一段字符处理了

我们把这个可以都注释掉

跟刚才一样

我们先用

配置前面不用改

那么只是generate这个文件呢是可以

生成这个词云文件的时候可以

给定一个字符串也可以生成

那我们再运行一下

我们看这个Chinese这个文件输出的词云

就是这样子的啊

那我们就可以看得到是我们这些

给定的这一些什么呀

中文的文字来生成的这个词云

那么对于词云的使用

就给大家介绍到这儿

计算思维与人工智能基础课程列表:

第一部分:计算思维

-1.计算思维的提出

-2.计算思维的要素与应用

-3.培养计算思维

-4.智能时代的教师与教学

-章测试

第二部分:人工智能

-1.人工智能的发展

-2.人工智能的实现与机器学习

-3.人工智能产业

-章测试

第三部分:python基础

-第一章:python简介

--1.1python的介绍

--1.2.anaconda的安装

--章测试

-第二章:编码规范

--2.1 python编码规范

--2.2常量和变量

--章测试

-第三章:数据类型

--3.1数据类型概述

--3. 2.数据转换

--3.3数据类型区别

--章测试

-第四章:基本运算

--4.1.基本运算符

--4.2比较运算符

--4.3逻辑运算符

--4.4位运算符

--4.5成员运算符与身份运算符

--4.6运算符的优先级

--章测试

-第五章:程序控制结构

--5.1顺序结构

--5.2条件结构

--5.3循环结构

--5.4跳转结构

--5.5异常处理

--章测试

-第六章:函数、模块与面向对象

--6.1函数的定义与调用

--6.2面向对象

--6.3魔法函数的应用

--6.4模块与包

--章测试

-第七章:文件操作

--7.1文件的打开与读取

--7.2文件的写入

--7.3CSV模块的应用

--章测试

-第八章:python生态库

--8.1第三方库的安装

--8.2标准库-Os库与Sys库

--8.3.标准库-Time库

--8.4标准库-Random库

--8.5标准库-Turtle库

--8.6第三方库-词云库

--8.7第三方库-pyinstaller库

--8.8第三方库-numpy库(上)

--8.9第三方库-numpy库(下)

--8.10第三方库-pandas库

--8.11第三方库-matplotlib库

--章测试

-第九章:TensorFlow基础

--9.1TensorFlow简介

--9.2TensorFlow 2.0的改进

--9.3TensorFlow的数据应用

--9.4 TensorFlow的设备应用

--9.5.TensorFlow中常用操作

--章测试

-第十章:实例分析与实践

--10.1认识回归问题

--10.2房价的预测

--10.3手写数字识别

--10.4卷积神经网络的介绍

--10.5全连接网络的搭建

--10.6卷积神经网络的实现服饰图片的分类

--10.7LeNet的介绍

--章测试

-第十一章:人工智能在自然语言中的应用

--11.1自然语言处理

--11.2命名实体识别技术

--11.3词向量表示

--11.4自然语言处理的挑战及应用

--章测试

8.6第三方库-词云库笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。