当前课程知识点:网络、群体与市场 > 第一部分 图论与社会网络 > 第2讲:同质性 > Video
各位同学 大家好
欢迎来到网络 群体与市场的
在线课堂 我是这门课的
主讲老师——石兵
来自武汉理工大学
在上一讲我们介绍了三元闭包
三元闭包是影响社会网络结构的
内部因素
在这一讲我们将介绍同质性
同质性是影响社会网络结构的
外部因素
首先我们看什么是同质性
其实我们看每个人的特性可以
分为两种 一种是固有的特性
也就是说你与生俱来的
比如说你的性别 种族 母语等等
还有一种是什么呢 可变的
比如说你的爱好 你的特长
这可能随着时间的发展都会发生
一些变化 我们可以看到这种同质性
比如说你们有相同的性质
会影响这样一个社会网络结构
比如说你们住在同一个地方或者说
有类似的兴趣爱好
那么过一段时间之后你们
很可能成为朋友
这个就可以用一句俗语来说
物以类聚 人以群分
近朱者赤 近墨者黑
其实 物以类聚 人以群分
讲的是什么呢
讲的是你们有共同的爱好
所以你们成为了朋友
近朱者赤 近墨者黑
讲的是什么呢
讲的是你们成为朋友之后
你们的爱好慢慢地变得类似
那么我们现在有这样
一个基本的问题
你们是因为相似才成为朋友
也就是说是选择在起作用
还是说你们成为朋友之后才变得相似
也就是说是社会影响的作用
在本讲我们将会分析这些问题
首先在本讲我们将会刻画怎么来
测量同质性
接着我们再用一些在线数据分析
同质性对社会网络的影响是什么样的
最后我们分析朋友间相似性的成因
首先我们来看给你一个社会网络
你怎么样判断这个网络有没有
体现出同质性
我们假设有这样一个社会网络
有这样9个人 我们按照性别来区分
男生是白色节点 女生是粉色的节点
如果说这样一个网络体现出同质性
直观上给我们的感觉应该是
相同颜色的节点聚集程度比较高
也就是说很多边的两个端点的颜色
都应该是一样的
也就是说两个端点颜色相同的边
特别多的话 同质性的迹象就明显
我们就说这样一个图体现了同质性
但是有这样一个问题
什么叫做 太多 这是个形容词
我们最好有个方法来定量地刻画它
这个时候我们就要想到
我们要找一个基准
跟这个基准来比较
如果比这个基准大
那我们就可以说 太多
这个基准怎么找呢 其实很简单
我们只要考虑这样一个
混合得比较均匀 的情况
混合得比较均匀 的情况就是说
在这样的一个图里面任何两个点之间
都有一种相同的概率建立联系
产生边 我们接下来看
具体怎么来找到这样一个基准
我们现在假设橙色节点的比例是p
白色节点在整个节点的占比是q
q=1-p
如果这些点随机地独立地分布在
这个网络中 那么对任意一条边来说
两个端点颜色不同的概率
分别是多少 两个端点颜色一样
都是橙色的概率是多少呢 是p×p
两个端点颜色不一样 一端为p
另外一端为q 可能是这种情况
也有可能是这种情况
所以就应该是2pq
当然还有另外一种情况是
两个端点的颜色都是白色
那么它的可能性是q2
我们可以看到在这种均匀的情况下
两个端点的颜色不同的边的比例
应该是2pq
我们就可以把2pq作为这样一个
判断的基准
我们看具体怎么来判断
基本思想就是说
如果两个端点的颜色相同的边比较多
我们就说这样一个图体现了同质性
具体来说 给你一个二色图G
p是其中一种颜色出现的比例
q=1-p是另外一种颜色的
节点出现的比例
我们现在假定按照这种比例随机的
给它们涂上颜色
因此这时候两个端点颜色不同的边
出现的概率是多少
我们刚才已经讨论了2pq
这个2pq就是我们判断的基准
我们现在看我们要分析的这个图
我们现在数一下在这个图里面端点
颜色不一样的那些边的条数有多少个
把它除以总的边数
我们就得到这样一个图里面实际的
端点颜色不同边的比例是多少
把这个比例跟2pq进行比较
如果这样一种边出现的比例
远远小于2pq 我们就认为说
原来那个图同质性的现象比较明显
我们看一个例子:现在有9个节点
其中红的节点是三个
所以红的在所有节点中的
比例就是1/3 白色有6个
在所有节点中的比例就是2/3
这个时候我们考虑它们
均匀随机的情况
1条随机边两个端点颜色不一样的
概率是多少呢
2*(1/3)*(2/3)=4/9
4/9就是我们之前
讨论的2pq的值
也就是我们判断的基准
我们现在看实际的图
我们数一下总共有多少条边
有18条边
端点颜色不一样有多少个呢
有5条 这是一条 这是一条
这是一条 这是一条
我们5除以18得到颜色
不一样的边的比例
我们把实际的值和基准值4/9
也就是8/18来做比较
我们发现是小于的
这就说明这个网络存在同质性
我们刚才已经解释了怎么对网络
的同质性进行测量
我们现在来分析这样的同质性
对社会网络的影响是什么
我们回顾一下 三元闭包
三元闭包 是两个陌生人之间
的共同朋友数越多
则这两个陌生人成为朋友的
可能性就越高
那么我们现在分析什么呢
分析如果说这两个人有相同的兴趣
或者他们会共同参与某一种活动
那么他们会不会建立这种
朋友的关系呢
如果说他们共同参与的活动越多
那么他们建立朋友关系的
可能性是不是也越高呢
我们可以用一个归属网路
描述这样一个问题
我们看在这里面
Anna和Daniel
有一个共同的爱好
他们都加入了空手道俱乐部
可能过了一段时间之后
由于他们两个都加入了
这样一个俱乐部
他们见面的机会多
所以他们成为了朋友
这个其实也是一个闭包
我们可以看到这是一个三角形
这是什么闭包呢
它叫做 社团闭包
社团闭包我们可以看到
它其实源于 物以类聚
因为他们有共同的爱好
所以他们成为朋友
这也就是选择的作用
我们看另外一方面
社交关系也就是朋友关系
是不是也能促进人们参与
原来他没有参与的活动呢
也是可能的
比如说 AB是朋友
B参加了某个俱乐部
过了这段时间A也会
参加这个俱乐部
我们又看到另外一种闭包现象
称作 会员闭包
会员闭包 源于人们的互相影响
我们现在可以用一个社会归属网
把我们前面介绍的各种
闭包一起考虑
也就是说 三元闭包
社团闭包 会员闭包 等等
我们看这个里面有 三元闭包
因为Claire跟Bob是朋友
Anna跟Bob是朋友
也就是说他们有共同的朋友
过了这段时间之后
Anna和Claire她们建立了
联系成为朋友
这就是 三元闭包
我们看另外一种是 会员闭包
Anna加入了空手道俱乐部
Bob跟Anna是朋友
则过一段时间之后
Bob也会加入这个空手道俱乐部
这就是 会员闭包
另外就是 社团闭包
社团闭包是什么呢
Anna加入了这个空手道俱乐部
Daniel也加入了
则过一段时间之后
他们两个也成为了朋友
我们要注意一下
刚才前面讲了 社团闭包
是源于选择
会员闭包 是源于社会影响
我们现在来验证一下
这样一个社团闭包现象是不是
说真的就可以起作用:
当你们的共同兴趣越多
你们两个建立朋友关系的
可能性是不是越高
我们回顾在上一章介绍
的三元闭包
那里面我们用电子邮件数据
来做这样一个分析
我们现在在这个电子邮件数据
的基础上加上选课信息
选课信息表达什么意思呢
选课信息就表达了你们的共同爱好
如果说你们选了
同样一门课的课数比较多
那你们成为朋友的可能性
是不是就越高呢
我们发现确实是这样的
也就是说当你们有同一门课的时候
你们建立朋友关系的
可能性就明显的不再是0了
而且我们可以看到
一直到3的时候
也就是说你们共同选了一门课
的课数是3 在这种情况下
你们建立朋友关系的
可能性也在提高
当然了 我们按照实际数据发现
当是4或者是5
也就是说共同选课的门数是
4或者是5的时候
这个概率反而会降低
这可能是由于一些外部因素的干扰
比如说你们共同选课的
门数是4或者是5的时候
可能是学校的一些强制性的规定
你们必须要选这门课造成的
我们现在在进一步利用
在线数据研究什么呢
研究 会员闭包 现象
也就是要分析你们两个如果是朋友
你的朋友参加某个活动
那你是不是也要参加这个活动
我们怎么来分析呢
我们可以看有这样一群人
A B C D E
他们是博主
其中AC AD AE
他们是朋友
C D E这些人会参加一些话题
我们现在分析过一段时间之后
A是不是也会加入
C D E感兴趣的话题
我们利用这样一个实际的
在线数据分析发现确实是这样的
我们看加入某一个话题的
朋友数越多的时候
你也加入那个话题的可能性就越高
我们可以看到这是 正相关 的
在这之前我们已经介绍了
社团闭包 和
会员闭包 现象
并且用在线数据来验证了它
我们现在进一步分析最后一个问题:
朋友间相似性的成因
其实我们要来分析什么呢
当我们看到两个关系不错的人
在一起的时候
我们要来分析他们是因为
相似而成为朋友
还是说是因为
成为朋友所以他们才相似
也就是说我们要考察两种力量
选择 和 社会影响
到底谁在起作用
我们可以用这样一个在线数据来分析
有这样一些编辑:
A B C D E
然后有一些维基百科的文章
我们现在就要分析什么呢:
这些编辑是因为他们成为朋友之后
他们才会对同一个文章进行修改
还是说他们是因为对同一个文章
进行编辑所以才成为朋友的
我们对这样一个数据分析发现
在这样两个编辑认识之前相似性
的变化是 选择 在起作用
是因为他们对同一篇文章感兴趣
所以他们才会变得认识
建立联系
但是当他们建立联系之后
我们发现这时候主要是
社会影响 在起作用
也就是说他们在成为朋友之后
他们才会对其他人感兴趣的
文章去做编辑
也就是说
这样的朋友间相似性的成因是
随着时间的发展而变化的
在本讲我们介绍了同质性的概念
以及怎么来测量同质性
接着我们还介绍了
社团闭包 和 会员闭包
并且还进一步分析了
朋友间相似性的成因
以上就是本讲的内容 谢谢
-第1讲:社会网络的结构与关系强度
--Video
--三元闭包
-第2讲:同质性
--Video
--同质性
-第3讲:社会网络中的正负关系及平衡
--Video
-第4讲:博弈论简介(1):占优策略
--Video
--严格占优策略
-第5讲:博弈论简介(2):纳什均衡
--Video
--纳什均衡
-第6讲:博弈论简介(3):混合策略纳什策略
--Video
-第7讲:进化博弈论(1):进化稳定策略
--Video
-第8讲:进化博弈论(2):进化稳定策略与纳什均衡的关系
--Video
-第9讲:博弈论应用:交通网络流分析
--Video
-第10讲:博弈论应用:拍卖分析
--Video
-第二部分 博弈论--习题
-第11讲:匹配市场
--Video
--二部图匹配
-第12讲:中间商市场
--Video
-第13讲:社交关系价值的均衡
--Video
-第14讲:万维网的结构
--Video
-第15讲:网络信息的链接分析
--Video
-第16讲:搜索引擎中的广告市场:匹配市场机制
--Video
-第17讲:搜索引擎中的广告市场:GSP和VCG机制
--Video
-第四部分 信息网络与万维网--习题
-第18讲:信息级联
--Video
--信息级联
-第19讲:网络效应
--Video
--网络效应
-第20讲:网络中的级联行为
--Video
--网络级联
-第21讲:小世界现象
--Video
--网络效应
-第六部分 网络动力学:结构模型--习题
-第22讲:市场与信息(1):外生事件
--Video
-第23讲:市场与信息(2):内生事件
--Video
--市场与信息
-第24讲:表决
--Video
--表决
-第七部分 机构及其聚合行为--习题






