当前课程知识点:文献检索 > 第一章 文献信息检索概论 > 1.2 文献信息检索的一般方法 > 检索词的组配与限定
检索词确定以后
若是有多个检索词
如何将它组配起来呢
这就要用到布尔逻辑运算符
一般我们简称布尔逻辑检索
布尔逻辑算符有三种
逻辑与 逻辑或 逻辑非
逻辑与是用“and”或者是“*”连接
两个以上的检索词
表述为“A and B”或“A*B”
表示记录中必须同时含有
A和B这两个概念
如检索马铃薯收获
我们可以表示为“马铃薯 AND 收获”
用逻辑与可以缩小检索范围
而且用逻辑与组配的检索词越多
检索范围会越小
专指度也越强
检索结果数也越少
它有助于提高查准率
比如说这个图意味着
apple、breeding、plant
这三个检索词相交的那一部分
才是我们检中的对象
逻辑或用“or”或“+” 来表示
它连接两个以上的检索词
表示为“A or B”或“A+B”
表示记录中单独或者同时含有检索词A和B
用逻辑或组配检索的词越多
检索结果数会越大
它可以扩大检索范围
提高查全率
比方说这个图的
college、university 、campus
属于近义词
我们检索对象中只要包含
其中任何一个词都可以
再比如一个课题“果汁浓缩加工”
我们检索时候除了用果汁这个词以外
苹果汁 梨汁 葡萄汁
桃汁等
这些果汁的下位词
都需要与果汁进行逻辑“或”的组配
才可能把果汁浓缩方面的文献查全
逻辑非或者叫逻辑差
是用“not”或“-”来连接检索概念
表示为“A not B”或“A-B”
他表示凡含用检索词A但
不含检索词B的记录
为我们的命中纪录
用逻辑非来检索
可以缩小检索范围
提高检索的专指度
但是逻辑非一般要慎用
因为它有可能会把有用的文献给否掉了
这张图
意思是检索包含cats
但不包括dogs的文章
因为cats和dogs会经常的存在
即我们说的猫狗不分家
我们现在要检索的是包含cats 的文献
但不要dogs的概念
布尔检索算符
优先执行顺序通常是NOT
AND
OR
但是在有括号的情况下
先执行括号内的逻辑运算
在有多层括号时先执行
最内层括号中的运算
在检索中我们会经常遇到一些
词干相同词意相近的检索词
或者有英式 美式英语不同拼写的词
虽然我们可以利用前面介绍的布尔逻辑或
将不同形式的检索词进行组配起来检索
但一方面会增加检索词的输入量
另一方面并不能完全将词
的所有形式都找出来
为了减少检索词的频繁输入
我们可以使用截词符
一般也称为通配符来提高检索效率
所谓截词是指在检索词的某个局部截断
利用某些检索词的词干
或者说不完全的词形
加上截词符进行检索
其目的是查找某一词干的不同变体
做到一词多用
已达到较高的查全率
截词分前截词、后截词、
前后截词和中截词四种
一般用“?”、“*”和“$”表示截词符
前截词是将截词符放在词根的前面
进行后方一致检索
表示在词根的前方有无限个字符的变化
比方说“?Computer”
可以检出来
Minicomputer和
Microcomputer
后截词是将截词符
放在词根的后面
执行前方一致检索
比方说computer我们可以
在该词词根后加一个*
即computer*可以检索出
computers
computerised
computerization这些形式
中截词一般放在单词的中间
代表0-1个字符
比方说用colour这个词
英美的不同拼写方式
中间少了一个“U”我们就
可以用“?”来代替“U”
它可以检索出两种不同的形式
而前后截词是将截词符放在
词根的前面和后面
执行中间一致检索
例如computer
我们在词跟前后都加一个“?”表述为
“?computer?”
可检索出microcomputer
minicomputer
computer、computers、computerised、
computerization等等这些
形式
我们运用布尔逻辑算符进行检索的时候
由于只能对检索词进行一个逻辑组配
如逻辑AND只要求两边的检索词同时
出现在同一个记录中就可以
但检索词间的前后顺序 间隔的多少
出现的位置等无法准确确定
所以我们就要用到位置检索
也叫邻近检索
它是利用位置算符对词与词
之间的逻辑关系进行组配
对检索词之间的相对位置进行限制
常用于自然语言 自由词的检索过程中
它可以弥补布尔逻辑检索的不足
常用的位置逻辑算符主要
有“With”
他用两个检索词之间限定
这两个检索词必须同时
出现在同一个字段中
但不限制两个词的先后的顺序
比如
EI数据库
“NEAR”
用于两个检索词之间限定两个检索
词之间间隔的词数及前后的顺序
比如说“ONEAR/n”
表示由该检索算符连接的检索
词之间相隔0-n个单词
但两词的顺序不能颠倒
而“NEAR/n”就表示两个检索
词之间相隔0-n个单词
但顺序可颠倒
这个功能同样见于EI数据库
“Field”
有时简称“F” 表示两侧连接的检索
词必须同时出现在同一个字段中
两词之间的相对次序和
相对位置的距离不限
“Same”
表示连接的两个检索词必须同时出现
在同一个字段或者是同一句话中
比如说Web of Science数据库
在编制检索式时使用限制检索符
可以限定检索词
在数据库记录中出现的位置
对命中太多的记录进行筛选
一般用于字段限制 字段限制
检索有后缀方式和前缀方式
比方说前缀方式 CNKI用
SU =‘北京’*‘奥运’
意思是北京和奥运这两个词必须
同时出现在主题字段中
比方说后缀方式
Pubmed数据库中用
检索词后加字段限制符号
如“Science[Journal]”
表示在期刊science上发表的文献
使用字段限制
必须熟悉数据库常用的字段表示符号
比如说
TI-title表示题目
AU-author表示作者
AD-address表示作者单位
SO-source表示文献的来源出处
也就是我们说的期刊名称
AB-abstract表示摘要
SU-subject表示主题词
除了上述常用的检索技术外
检索中还会用到全文检索
和大小写敏感检索
全文检索是指直接在文章
原文的全文中进行检索
从而更加深入到语言的细节
全文检索扩展了用户查询的自由度
使用户能对原文的所有内容进行检索
比如说CNKI就可实现全文检索
大小写敏感检索主要是指西文检索系统
中对检索词字母的大小写的处理方法
对是具有区分大小写检索功能的检索系统
如果输入检索词是小写字母
则检索系统既匹配大写
字母 又匹配小写字母
但如果输入的是大写字母 检索系统
则只查找那些与输入形式完全相同的结果
比方说我们输入“china”
小写的“china”检索系统
会检索出china(瓷器)的意思
以及“China”(中国)
但如果输入以大写的C
打头的“China”的话
它则只检出“China”
表示中国的意思
-1.1 文献信息检索基础知识
--基本概念
--常用术语与数据库
--1.1 测试
-1.2 文献信息检索的一般方法
--检索词的确定
--检索的一般步骤
-1.3 数据库资源总览
--数据库资源概览
-2.1 中国知网检索与利用
--2.1 测试
-2.2 万方数据知识服务平台概览与利用
--2.2 测试
-2.3 维普期刊服务平台及其他中文数据库介绍
--2.3 测试
-2.4 电子书资源概览与利用
--电子书资源概览
--2.4 测试
-3.1 英语课程及模拟题库
--3.1 测试
-3.2 英语课程及模拟题库使用方法
--3.2 测试
-3.3 利用数据库及多媒体资源提高英语水平
--3.3 测试
-4.1 统计数据获取途径及网络统计数据的获取
--4.1 测试
-4.2 统计类商业数据库的使用
--4.2 测试
-5.1 Web of Sciences检索与利用
--5.1 测试
-5.2 EI检索与利用
--EI基本检索
--EI 检索举例
--5.2 测试
-6.1 农业类英文数据库资源概览及利用
--6.1 测试
-6.2 食品营养类英文数据库资源概览及利用
--6.2 测试
-6.3 生命科学与医学类英文数据库资源概览及利用
--6.3 测试
-6.4 机械工程类英文数据库概览与利用
--6.4 测试
-6.5 信息与电气科学类英文数据库概览与利用
--资源简介
-- IEL 检索方法
--6.5 测试
-6.6 水利/土木/环境类信息检索
--ASCE使用详解
--6.6 测试
-6.7 经济管理类英文数据库概况与利用
--6.7测试
-7.1 特种文献的概念与类型
--7.1 测试
-7.2 PQDT博硕士论文文摘数据库检索举例
--7.2 测试
-7.3 国内外专利文献检索举例
--7.3 测试
-8.1 英文全文数据库的检索与利用
--8.1测试
-8.2 全文文献的获取
--8.2测试题
-9.1 基于NoteExpress的文献管理
--文章全文的导入
--9.1 测试
-9.2 基于NoteExpress的论文写作
--认识科技论文
--边撰写边引用
--9.2 测试
-10.1 中外文核心期刊的确认
--10.1 测试
-10.2 中外文核心期刊投稿指南
--10.2 测试