当前课程知识点:计算机文化基础 > 第10课:从信息为王到选择为王 > 认识搜索引擎 > 搜索引擎技术的发展
搜索结果如何排序
从第一代搜索引擎采用的
分类目录至今
已经有了质的飞跃
纵观当代企业
唯有不断创新
才能在竞争中处于主动
立于不败之地
在技术为王的时代
搜索引擎技术
也需要不断的更新换代
才能更好的留住用户
让我们思考一下
搜索结果排序技术
有什么样的一个发展轨迹
我们从技术层面了解一下搜索引擎发展
分类目录时代
雅虎就是这个时代的代表
采取分类目录的方式
在这中间
手工加入了人工智能
一般被收入的网站
质量都较高
因为分类目录内
所收录的网站
都是经过人工精心筛选
所以具有很强的可信赖性
但这种方式
维护量大
可扩展性不强
绝大多数网站
不能被收入其中
这个时期对于用户需求
和信息相关性是不做考虑的
搜索的信息完全靠用户自由浏览
来确定
第二代
文本检索
查询方式和现在类似
查询时
用户输入查询关键词
查询结果排序
依据的是查询关键词和
网页内容的匹配程度
简单的说
相关性由计算得到
采用经典的信息检索模型
比如布尔模型
向量空间模型
或者概率模型
来计算用户查询关键词
和网页文本内容的相关程度
与分类目录相比
这种方式不再人工下载网页
所以可以收录更多的网页
排序是按照网页内容
和用户查询关键词的匹配程度进行的
我们知道
网页之间有丰富的链接关系
而这一代搜索引擎排序的时候
并未考虑这些链接信息
链接分析的一代
搜索质量相比文本检索
又有了大幅度的提升
在考虑内容相似性的同时
还要考虑网页的流行性
就是通过链接分析
在海量内容中找出重要的网页
深入挖掘和利用了网页链接
所代表的含义
实际上
网页链接代表了一种推荐关系
获得越多推荐的网页
其链接分析的得分就会越高
这其实是一种对网页可信度的度量标准
因为
被推荐次数多的网页
其实代表了它更具有流行性
采用链接分析
能够有效改善搜索质量
但是
这种搜索引擎
并未考虑用户的个性化要求
任何人只要输入的查询请求相同
就会得到相同的搜索结果
比如我们输入苹果
你想得到什么呢
用户中心时代
目前的搜索引擎
大都可以归入这一代
以理解用户需求为核心
不同的用户
输入同一个查询关键词
其目的有可能是不一样的
即使同一个用户
输入相同的关键词
也可能因为时间
地点
不同的需求
有所改变
以用户为中心的搜索引擎
大都致力于解决
如何能够理解用户
查询词背后所包含的真正的需求
为了能够获取用户的真实需求
目前
搜索引擎大都做了很多技术方面的尝试
利用用户发送查询词的时间
地理位置信息
利用用户过去发出的查询词
相应的点击记录等历史信息
试图或尝试理解
用户此时此地的真正需求
输入相同的关键词
可以得到不一样的结果
输入苹果
你是想得到水果呢
还是想得到苹果的产品
-由一个短片引出......
-梳理IT产业大脉络(上)
-梳理IT产业大脉络(下)
-你的第一门计算机入门课
--课程介绍及要求
-实践:图像处理入门
--实践小作业要求
--操作前的几点准备
-第1课习题作业
-第1课导学帖
--第1课导学帖
-现代计算机为什么是电子数字的?
-二进制与十进制有什么区别?
--了解二进制
-为什么莱布尼兹没有认识到二进制的重要性?
--与、或、非
-从ENIAC到现代通用计算机
--新材料带来新发展
-摩尔定律会失效吗?
--摩尔定律失效
-讲座:计算机世界中的巨无霸
-参观:感受世界巨无霸(太湖之光)
--神威太湖之光简介
--探秘神威太湖之光
-参观补充:走进济南国家超算中心
--走进国家超算中心
-实践:我的计算机有多快?
-第2课习题作业
-第2课导学帖
--第2课导学帖
-数码相机是如何“计算”出一张数字照片?
--如何拍摄彩色照片
-认识图像数字化过程中的采样和量化
--采样和量化
-计算机是如何感知声音波形的?
--声音量化三要素
-换一种思路来数字化文本信息
--字符集的发展历程
-实践:常用网络资源下载
--常见下载方法介绍
--常见文件类型下载
- 第3课习题作业
-第3课导学帖
--第3课导学帖
-软件解决的目标是什么?
--软件的目的是什么
-我们使用的软件是怎么来的?
--软件是怎么来的1
--软件是怎么来的2
-操作系统拥有什么样的神力?
--操作系统的演变1
--操作系统的演变2
--CPU的管理调度
--虚拟存储技术
-访谈:如何成功研发一款手机APP
-实践:如何利用注册表进行系统优化
--注册表概述
--注册表与信息安全
-第4课习题作业
-第4课导学帖
--第4课导学帖
-数字存储前言
--梳理数字存储历史
--磁、光存储介质
--半导体存储介质
-怎样在存储介质上表示1和0?
-怎样从存储介质读取1和0?
-如何找到所需的数据?
-实践:文章排版基本技能
--引言
--中文输入
--图文混排
--页面设置
--利用表格布局标题
--分栏和首字下沉
--设置页眉与页脚
--设置插图润色排版
--LaTeX入门
-第5课习题作业
-第5课导学帖
--第5课导学帖
-演示文稿制作准备
--操作前的几个概念
--实践前的环境准备
-制作演示文稿
--设置超链接按钮
--设置超链接文本
-作品赏析
-第6课习题作业
-第6课导学帖
--第6课导学帖
-联网目的和资源共享模式的变迁
--资源共享模式
--异构网互联
-物联网连入互联网
--互联网与因特网
-访谈:PC在智能穿戴生态系统中的定位
--对话联想(上)
--对话联想(下)
-参观:联想创新中心掠影
--探秘联想创新中心
-第7课习题作业
-第7课导学帖
--第7课导学帖
-从网络组织来描述计算机网络
--计算机网络的定义
--网络软件
-从功能角度来认识计算机网络
--网络体系结构
--IPv4(上)
--IPv4(下)
--IPv6
-实践:网络不通怎么办
--网络连接
-第8课习题作业
-第8课导学帖
--第8课导学帖
-认识图像传感器
--认识图像传感器
--图像传感器的应用
--图像传感器的市场
-图像传感器的应用
--在汽车中的应用1
--在汽车中的应用2
--物联网中的应用
-了解图像传感器技术
--图像传感器的技术
-图像传感器的挑战
--问题与挑战
-讲座:如何在大数据中精准生活
--走进大数据
--生活中的大数据
-实践:HTML入门实践
--HTML作业要求
--HTML基本标记
--综合样例(上)
--综合样例(下)
-第9课习题作业
-第9课导学帖
--第9课导学帖
-认识搜索引擎
--这就是搜索引擎
-信息检索背后的关键技术
--海量数据的获取
--搜索结果排名
-搜索引擎的未来
--情境感知的搜索
--社会化搜索
--智能搜索
-实践:Aminer学术搜索
--Aminer介绍
-第10课习题作业
-第10课导学帖
--第10课导学帖
-信息安全的基本要求
--早期的计算机安全
-新型的网络攻击有哪些
--信息泄露
--移动安全
-未知攻 焉知防
--未知攻焉知防
--未知攻焉知防2
--信息加密
--安全防范原则
-实践:Excel实践
--实例操作
--实例操作2
--实例操作3
--绘制图表
-第11课习题作业
-第11课导学帖
--第11课导学帖
-回顾与展望
--回顾与展望1
--回顾与展望2
--回顾与展望3
--回顾与展望4
-什么是计算
--什么是计算
-访谈:信息技术交叉应用
--对话风投专家1
--对话风投专家2
--对话风投专家3
-嘉宾分享:闲谈数字产业创新
-第12课习题作业
-第12课导学帖
--第12课导学帖