当前课程知识点:大学计算机基础(艺术类) > 第六章 信息检索 > 6.3 艺术类信息检索 > 6.3.2 计算机检索技术2
同学们好
上节课我们介绍了布尔逻辑算符
这节课我们继续学习其它的一些计算机检索技术
尽管布尔逻辑算符为用户提供了较为理想的检索效果
但它所造成的误检率是很高的
为了弥补其不足
检索系统又提供了另一些检索功能
即位置检索算符
它表示词与词之间的相互位置关系及前后顺序
增强了选词的灵活性
从而大大降低了误检率
关于位置检索算符的符号很多
我们只列出了一些最常见的位置检索算符
包括
“(W)”算符
“(nw)”算符
“(N)”算符
“(nN)”算符
“(F)”算符和“(S)”算符
例如
我在“万方数据”主页的搜索框内
键入关键词“民族服饰”检索数据库内的文献信息
一共找到符合要求的12977篇文献
由于数量过大
逐一排除找到我需要的目标文献依然不容易
那么我们就可以将上述关键词分为2个“民族”和“服饰”
并根据我的实际需求
结合位置算符进行关键词表达式的描述
1、“(W)”算符
“W”含义为“with”
这个算符表示其两侧的检索词必须紧密相连
除空格和标点符号外
不得插入其他词或字母
两词的词序不可以颠倒
我在“万方数据”的搜索框内键入 “民族(w)服饰”
检索到符合要求的14篇文献
2、“(nw)”算符
“(nw)”中的“w”的含义为“word”
表示此算符两侧的检索词必须按此前后
邻接的顺序排列
顺序不可颠倒
而且检索词之间最多有n个其他词
我在“万方数据”的搜索框内键入
“民族(1w)服饰”
检索到符合要求的2篇文献
3、“(N)”算符
“N”的含义为“near”
这个算符表示其两侧的检索词必须紧密相连
除空格和标点符号外
不得插入其他词或字母
两词的词序可以颠倒
我在“万方数据”的搜索框内键入
“民族(N)服饰”
检索到符合要求的34篇文献
4、“(nN)”算符
“(nN)”表示允许两词间插入最多n个其他词
包括实词和系统禁用词
我在“万方数据”的搜索框内键入 “民族(3N)服饰”
检索到符合要求的2篇文献
5、“(F)”算符
“(F)”中的“F”含义为“field”
这个算符表示其两侧的检索词必须在同一字段
例如同在题目字段或文摘字段中出现
词序不限
中间可插入任意检索词项
我在“万方数据”的搜索框内键入
“民族(F)服饰”
检索到符合要求的16篇文献
6、“(S)”算符
“(S)”中的“S”算符是
“Sub-field/sentence”的缩写
表示在此运算符两侧的检索词
只要出现在记录的同一个子字段内
例如
在文摘中一个句子就是一个子字段
在此信息即被命中
要求被连接的检索词
必须同时出现在记录的同一句子字段中
不限制它们在此子字段中的相对次序
中间插入词的数量也不限
例如我在“万方数据”的搜索框内键入
“民族(S)服饰”
检索到符合要求的717篇文献
在上面的例子中我们可以看出
灵活的使用不同的位置检索算符
可以极大的提升信息检索的准确率
在搜索引擎中
能提供位置检索算符的较少
接下来我们来学习精确检索
也可称之为词组检索
是把检索词当做一个精确的词组进行检索和匹配
一般在检索词两边用英文双引号“”
或书名号《》进行标注
精确检索就是指输入的检索词在检索结果字序
字间间隔是完全一样的
即不对查询词进行拆分
尤其适合于输入的查询字中包含有连接号
空格等特殊符号的情况下
例如
我们要查询2020年云南艺术学院本科招生的相关信息
那么我们可以在百度的搜索框内
键入关键词“2020年本科招生 云南艺术学院”
那么可以检索到179,000个相关信息
那么此时我们换一个检索方式
将关键词2020年本科招生 云南艺术学院
用英文双引号引起
再进行搜索
就只检索到9540个相关信息
相应的查准率大幅提升
这就是我们的精确检索
同时
在大部分的数据库检索平台内
精确检索也被普遍应用
例如“中国知网”的高级检索对话框中
无论是关键词还是文献来源
都可以选择“模糊”或“精确”检索
精确检索中使用《》
是指在关键词上加《》有两层特殊功能
一是书名号会出现在搜索结果中
二是被书名号扩起来的内容
不会被拆分
例如
查询电影“手机”
如果不加书名号
很多情况下出来的是通讯工具—手机
而加上书名号以后
《手机》结果就都是关于电影方面的了
精确检索可以帮助我们在有限时间内
搜索到较为准确的结果
那么在检索系统中
可以提高检索准确度和检索效率的另一种常用方法
就是限定字段检索又称为字段检索
它是指计算机检索时
限定检索词在数据库内查找区域的检索技巧
可以根据检索需求将检索词限定在摘要
作者
作者机构
出版社出版年
文献类型
语种分类号等字段进行检索
主要用于限定检索词出现在相关信息中的具体位置
当然
不同的检索系统或检索不同的信息时
字段的设定和选择都可能存在区别
例如
我校图书馆高级检索界面内
“检索途径”提供的检索字段
和“万方数据”的高级检索界面内
提供的检索字段就有区别
那么下面这个表格
就是在数据库文献检索中常用检索字段名称及其简写
希望同学们能花点时间了解一下
好了
这节课我们就讲到这里
下节课我们继续讲解计算机检索技术中的其它知识
同学们再见
-1.1 计算思维概述
--1.1 计算思维
-1.2 了解计算机
-1.3 计算机中信息的表示及存储
-1.4 计算机中信息的表示及存储(2)
-1.5 了解计算机系统
-第一章测验题
-2.1 操作系统概述
-2.2 Windows 基本操作
-2.3 Windows 文件管理
-2.4 Windows 程序管理
-2.5 Windows 设备管理
-第二章测验题
-3.1 Word文本编辑基础
-3.2 Word高级应用——毕业论文排版
-3.3 Excel表格编辑基础
-3.4 Excel高级应用——数据分析与处理
-3.5 PowerPoint幻灯片设计基础
-3.6 毕业论文答辩演示文稿制作
-第三章测验题
-4.1 计算机网络概述
-4.2 认识Internet及应用
-4.3 防治计算机病毒
-第四章测验题
-5.1 云计算
--5.1 云计算
-5.2 人工智能
--5.2 人工智能
-5.3 大数据
-5.4 VR、AR、MR、CR
-5.5 3D打印
--5.5 3D打印
-5.6 “互联网+”
-5.7 区块链
--5.7 区块链
-5.8 物联网
--5.8 物联网
-第五章测验题
-6.1 信息检索概述
-6.2 信息检索系统
-6.3 艺术类信息检索
-第六章测验题
-7.1 多媒体技术概论
--7.1.1 多媒体技术1-习题
--7.1.2 多媒体技术2-习题
-7.2 多媒体计算机系统
--7.2 多媒体计算机系统-习题
-7.3 多媒体技术的发展与艺术类应用
--7.3 多媒体技术的发展与艺术类应用-习题
-8.1 计算机图形学概论
--8.1.1 计算机图形学1-习题
--8.1.2 计算机图形学2-习题
-8.2 计算机视觉
--8.2 计算机视觉-习题
-8.3 数字图像处理技术
--8.3 数字图像处理技术-习题
-9.1 计算机动画基础
--9.1 计算机动画基础-习题
-9.2 计算机视频基础
--9.2 计算机视频基础-习题
-10.1 计算机听觉
--10.1 计算机听觉-习题
-10.2 数字音频技术
--10.2 数字音频技术-习题