当前课程知识点:信息素养——学术研究的必修课 > Week-12 你的知识需要管理,你的工具需要换代(2) > 7.6 通过文本分析和可视化软件创建知识图谱 > 通过文本分析和可视化软件创建知识图谱
下面我们将介绍通过文本分析
和可视化软件来创建知识图谱
在科学研究中无论是新研究者
还是资深研究者
虽然只是集中关注自己的研究领域
但依然会检索到海量数据
如何在海量数据中
找到自己最感兴趣的主题或文献
如何找到最关键 最重要的文献
进而摸清楚科学发展的脉络
识别最活跃的研究前沿和发展趋势
这对我们的信息素养提出了更高的要求
在信息检索 信息管理之外
研究者还需要具备一些信息分析的能力
往更高深的角度说
我们可以在信息检索之后
借助文本分析和可视化软件
来构建知识图谱
我们前面讲过的一些数据库
已经集成了一些信息分析的功能
比如Web of Science核心合集中的
分析检索结果和创建引文报告功能
这里我们介绍两款比较典型的
文本分析和可视化软件HistCite和CiteSpace
这两款软件名字中的Cite
标示了它们都是基于引文的分析软件
HistCite也就是history of cite
也被称为引文历史或引文图谱分析软件
这个软件由加菲尔德博士发明
还记得加菲尔德博士吗
没错 他就是引文索引SCI的发明人
HistCite可以用图示的方式
展示某一领域不同文献之间的关系
可以帮我们快速地绘制出一个领域的发展历史
定位该领域的重要文献
以及一些最新的重要文献
下面我们介绍如何使用HistCite软件
以及一些使用案例
访问这个网址
简单地留下联系信息
签署终端用户授权协议之后
你就可以免费下载HistCite到你的电脑上
接下来我们要准备用来分析的数据
这里我还想再强调一句
分析的基础是检索
信息领域有一句名言叫
garbage in garbage out
用在这里很恰当
我们要随时关注自己的检索效果
关注查全率和查准率为分析打下基础
HistCite主要用来处理
web of Science core collection中的数据
我们进行检索后
将检索结果进行导出
保存为其他文件格式
系统限定每一次最多导出500条记录
超过500条记录需要分多次导出
导出内容务必是全记录加参考文献格式
保存为纯文本格式
这里记住
要打开记事本
修改第一行中的Science 为Knowledge
这是因为web of science 曾一度改名为web of Knowledge
现在又改回去了
可是Histcite还没有更新
还使用的是web of Knowledge
将保存的记录
直接拖入到Histcite图标中加载分析
或者使用File菜单 Add File
成功导入了948条记录
如果导入不成功
通常是因为路径中有中文字符
建议大家给用于histcite的数据
建立一个专门的文件夹
路径中不要含有中文
如果导入不成功
而出现No such file or directory字样
那就需要在ie的internet选项中
将http://127.0.0.1添加为安全站点
软件显示论文来自3098个作者
发表在342个期刊上
一共引用15814篇文献
涉及到1449个关键词
软件还提供按年份 文献类型 语言 机构
包括二级单位的机构
以及国家来进行分析
在文献中有三种排序方式
按时间 作者和来源期刊名
可以是升序或者是降序
如果histcite只有前面这些分析功能
你也许会想
这跟直接在web of Science中进行分析
有什么不同呢
大家往右面看
这四列信息才是histcite提供的有价值的指标信息
LCS GCS LCR CR
我们可以通过Histcite帮助文件中的术语表
来了解每一项指标的含义
LCS Local Citation Score
表示这篇文章在本组948篇文章中的被引用次数
GCS Global Citation Score
表示这篇文章在web of science
数据库中的总被引次数
如果GCS很高
但在本组中被引比较低
这样的文章可能与我们的主题相关度并不很高
LCR Local Cited References
表示这篇文章在本组其他文献的参考文件中出现的次数
显示论文和其他文献的相关度
CR Number of Cited References
表示这篇文章有多少参考文献
我们可以通过调整VIEW菜单中的选项
来显示更多的指标
或个性化定制一些指标
我们来找一下近几年比较重要的文章
它们的被引频次可能不高
我们使用yearly input按钮
点击Tools中的Marking and Tagging Tool
选中2013到2016年的论文
点击Mark
现在我们只分析这几年的论文
看比较核心的论文是哪些
接下来我们用Tools菜单中的Graph maker来作图
让文献之间的引用关系更清晰可视化
我们可以对图进行调整 设计
也可以直接导出或打印
以上就是Histcite的基本用法
CiteSpace软件由国际著名的信息可视化专家
美国德雷塞尔大学计算机与情报学院陈超美教授开发
在2003年正式发布
至今已累计更新270多次
通过可视化的手段来呈现科学知识的结构
规律和分布情况
通过此类方法分析得到的可视化图形
称为科学知识图谱
下面这些论文中的可视化知识图谱
就是使用citespace软件来制作的
接下来
我们介绍CiteSpace软件的使用方法
结合实际案例讲解
文献共被引分析 耦合分析
科研合作网络分析和共词分析等功能
访问这个网址
点击Download按钮
下载Citespace压缩文件到你的电脑上
这里需要注意的是
你的电脑需要一个JAVA运行环境
点击Downlad Java Jre
选择适用于你电脑系统的JRE版本
运行安装即可
Citespace本身不需要安装
环境设置好
将Citespace解压缩之后
在文件夹中点击StartCitespace即可
Citespace中提供了一些样例数据
可以帮助我们快速了解Citespace的功能
这些数据有的来自Web of Science
有的来自Scopus
有的来自CSSCI CNKI CSCD等
Citespace还可以处理
来自Derwent专利索引的数据
帮助我们进行专利分析
软件中预设的样例数据
已经进行了数据格式的处理
但如果我们要自己导入数据
要注意有时还需要对数据进行转换
数据转换需要用到DATA菜单中的Import Export选项
我们用Web of Science来演示数据的下载
跟Histcite一样
我们需要将检索到的文献保存为其他文件格式
保存全记录和参考文献
每500条记录做一次导出
生成一个文件名以dowload下划线开头的文本文件
这是Citespace对数据文件名的要求
我们以样例数据2来演示一下
Citespace的分析功能
其中Node Types节点类型中的不同选项
对应的是不同的分析
Author Institution Country
可以帮助我们进行科研合作网络的分析
Term和Keyword可以用来进行共词分析
而cited reference可以进行文献共被引分析
Paper则用于文献耦合分析
我们选择cited reference来进行文献共被引分析
点击Go
软件处理数据需要一点时间
处理完之后会问你
是否要进行可视化
我们点击可视化后
可以看到一个动态的背景为黑色的图
这表示可视化图正在生成
当背景变为白色时
表示处理完毕
这时我们可以对图进行调整 美化 分析 保存
Citespace是一款功能非常强大的文本分析软件
不仅可以进行一维分析
还可以进行多维分析
更多有关Citespace的使用方法
推荐大家关注陈超美老师编写的使用教程
以及他在科学网的博客
2016年首都经济贸易大学李杰
和陈超美老师合著了一本新书
《Citespace科技文本挖掘及可视化》
这里也把这本书
推荐给给想深入学习Citespace的同学
文本分析和可视化软件
为我们提供了了解信息文献的不同视角
让我们能够更快地找到有价值的信息
熟练使用HistCite和CiteSpace 这些软件
可以帮助我们绘制知识图谱
大大提升我们对信息的分析和信息处理的能力
进而将我们的信息素养能力推向更广阔的空间
好了 经过十二周的学习
我们的《信息素养——学术研究的必修课》进入了尾声
希望你在课程中有所收获
信息素养获得了提升
学术研究之路一片光明
-1.1 认识信息素养
--认识信息素养
-1.2 信息素养是学术素养的重要组成部分
-1.3 测一测你的信息素养
--week-1 --1.3 测一测你的信息素养
--测试结果
-1.4 是时候提高你的信息素养了
-2.1文献信息的分类
--文献信息的分类
--week-2 --2.1文献信息的分类
-2.2认识文献数据库与检索系统
--week-2 --2.2认识文献数据库与检索系统
-2.3 做研究,一定要使用文献数据库吗
--week-2 --2.3 做研究,一定要使用文献数据库吗
--讨论题
-2.4 如何避免文献调研中的常见错误
--week-2 --2.4 如何避免文献调研中的常见错误
-3.1 文献从何找起
--文献从何找起
--Week-3 --3.1 文献从何找起
-3.2 书山有路-查找图书
--html
-3.2.1 查找课题图书的3个途径
--Week-3 --3.2.1 查找课题图书
-3.2.2 关于馆藏目录
--关于馆藏目录
--Week-3 --3.2.2 关于馆藏目录
-3.2.3 馆藏目录的使用
--馆藏目录的使用
--Week-3 --3.2.3 馆藏目录的使用
-3.2.4 关于电子图书
--关于电子图书
--Week-3 --3.2.4 关于电子图书
-3.2.5 电子图书的使用
--电子图书的使用
--Week-3 --3.2.5 电子图书的使用
-3.3 巨人的肩膀——查找期刊和会议论文•国内篇
--html
-3.3.1 查找国内学术论文的主要途径
--Week-4 --3.3.1 查找国内学术论文的主要途径
-3.3.2 顺藤摸瓜找论文
--顺藤摸瓜找论文
--Week-4--3.3.2 顺藤摸瓜找论文
-3.3.3 实例:城市改造中的旧城区问题
--Week-4 --3.3.3 实例:城市改造中的旧城区问题
-3.3.4 实例:霉菌与甲醛的相互作用
--Week-4 --3.3.4 实例:霉菌与甲醛的作用
-3.3.5 片段信息及其他
--片段信息及其他
--Week-4--3.3.5 片段信息及其他
-3.3.6 屠呦呦教授的期刊论文
-3.3.7 查找中文学术论文的其他途径
--Week-4 拨开云雾见月明——查找文献的方法(2)3.3.7 查找中文学术论文的其他途径讨论题
-解析3.3节的讨论题
-3.4 巨人的肩膀——查找期刊和会议论文•国外篇
--html
-3.4.1 文摘数据库 & 全文数据库
--Week-5--3.4.1 文摘数据库 & 全文数据库
-3.4.2 关于Web of Science核心合集
--Week-5--关于Web of Science核心合集
-3.4.3 碳纳米管力学性能的综述性论文
--Week-5 --3.4.3 碳纳米管力学性能的综述性论文
--讨论题
-3.4.4 植物捕获PM2.5的机制和其影响因素
--Week-5-3.4.4植物捕获PM2.5的机制和其影响因素
--讨论题
-3.4.5 检索结果的深度挖掘与自动追踪
--Week-5--3.4.5 检索结果的深度挖掘与自动追踪
--讨论题
-3.4.6 概论全文数据库
--概论全文数据库
--Week-5 --3.4.6 概论全文数据库
-3.4.7 核心期刊和高水平国际会议
--Week-5--3.4.7 核心期刊和高水平国际会议
-3.5 文献信息源的综合利用
-3.5.1 文献调研的常见误区与基本原则
--Week-6--3.5.1 文献调研的常见误区与基本原则
--讨论题
-3.5.2 你不能放弃检索多种类型文献
--Week-6 --3.5.2 你不能放弃检索多种类型文献
--讨论题
--课程讲义
-3.5.3 图书馆的资源发现系统
-3.5.4 获得全文与文献阅读
--Week-6--3.5.4 获得全文与文献阅读
-4.1 我们需要数据与事实的检索
--Week-7 --4.1 我们需要数据与事实的检
-4.2 认识概念、了解定义、读懂术语/缩略语
--Week-7--4.2 认识概念、了解定义、读懂术语/缩略语
--讨论题
-4.3 掌握事实
--掌握事实
--4.3 掌握事实
--讨论题
-4.4 查找性能指标、理化常数和器件参数等
--Week-7--4.4 查找性能指标、理化常数和器件参数等
-4.5 检索标准文献
--检索标准文献
--week-8 --4.5 检索标准文献
--讨论题
-4.6 查阅法律文件与司法案例/裁判文书
--week-8 --4.6 查阅法律文件与司法案例/
--讨论题
-4.7 获取统计数据
--获取统计数据
--week-8 --4.7 获取统计数据
--讨论题
-4.8 查找人物传记
--查找人物传记
--week-8 --4.8 查找人物传记
-5.1 信息访问的权限
--信息访问的权限
--Week-9 --5.1 信息访问的权限
-5.2 开放获取资源
--开放获取资源
--Week-9 --5.2 开放获取资源
-5.3 一般搜索引擎
--一般搜索引擎
--Week-9 --5.3 一般搜索引擎
--一般搜索引擎
-5.4 学术搜索引擎:简介
--讨论题
-5.5 学术搜索引擎:实例
--Week-9--5.5 学术搜索引擎:实例
-5.6 科学评价与合理使用网络资源
--Week-9--5.6 科学评价与合理使用网络资源
-6.0 引言
--引言
--Week-10 学术交流与学术规范--6.0 引言
-6.1 学术信息交流模式
--学术信息交流模式
--Week-10 学术交流与学术规范--6.1 学术信息交流模式
-6.2 出版,还是出局
--出版,还是出局
--Week-10 学术交流与学术规范--6.2 出版,还是出局
--讨论题
-6.3 学术期刊与同行评审
--Week-10 学术交流与学术规范--6.3 学术期刊与同行评审
-6.4 选择交流平台——投稿
--Week-10 学术交流与学术规范--6.4 选择交流平台——投稿
-6.5 学术规范
--学术规范
--Week-10 学术交流与学术规范--6.5 学术规范
-6.6 常见的参考文献引用格式
--Week-10 学术交流与学术规范--6.6 常见的参考文献引用格式
--讨论题
-7.1 引子
--引子
--Week-11 --7.1 引子
-7.2 有效管理个人文献信息
-7.2.1 概述
--概述
--Week-11--7.2.1 概述
-7.2.2 建立个人文献数据库
-7.2.3 向数据库中添加记录
--Week-11--7.2.3 向数据库中添加记录
-7.2.4 编辑/整理记录,添加附件与笔记,记录的导入/导出与共享
-7.2.5 利用个人文献数据库
--Week-11--7.2.5 利用个人文献数据库
-7.2.6 更多使用方法与更多管理内容
--讨论题
-7.3 通过邮箱或RSS Feed订阅与追踪最新信息
--讨论题
-7.3.1 邮箱订阅(Email Alerts)
--Week12-7.3.1邮箱订阅(Email Alerts)
--讨论题
-7.3.2 RSS订阅
--RSS订阅
--Week-12 --7.3.2 RSS订阅
-7.4 利用云笔记随时记录、收集、分享信息
--Week-12 --7.4利用云笔记随时记录、收集、分享信息
-7.5 使用思维导图整理大脑中发散性的信息
--Week-12 --7.5使用思维导图整理大脑中发散性的信息
-7.6 通过文本分析和可视化软件创建知识图谱
--Week-12--7.6通过文本分析和可视化软件创建知识图谱
--讨论题