当前位置:
文档之家› 01-社会网络分析与算法研究
01-社会网络分析与算法研究
20
江湖人物网络
21
语言网络
22
NETWORK VIEW OF THE WORLD
Communication Social
Transportation
Network View
Biological
Power Grid
Language
24
什么是社会网络?
! 广义上来说,从图论角度理解网络,社会网络可以看作由一些具 有独立特征的又与其他个体相互连接的节点的集合,每个个体可视 为图中一个节点,节点间的相互连接视为图中的边,连线表示系统 元素之间的相互作用。 ! 社会网络包括两个层面:作为其连接拓扑结构的图和作为其状态 和功能的系统。 ! 社会网络分析是研究复杂系统的一种角度和方法,它关注系统中 因子相互关联作用的拓扑结构,是理解复杂系统性质和功能的基 础,反映结构与功能的关系。 Biblioteka 小世界实验:“六度分离”
! 米尔格伦的实验过程是:他计划通过人传人的送信方式来统计人与人之 间的联系。 ! 首先把信交给志愿者A,告诉他信最终要送给收信人S。如果他不认识 S,那么就送信到某个他认识的人B手里,理由是A认为在他的朋友圈里B 是最可能认识S的。但是如果B也不认识S,那么B同样把信送到他的一个 朋友C手中,……,就这样一步步最后信终于到达S那里。这样就从A到B 到C到……最后到S连成了一个链。斯坦利•米尔格伦就是通过对这个链做 了统计后做出了六度分离的结论。 ! 然而在这个实验中,实际上只有三分之一的信送到了收信人那里,因此 实验的完成率很低。
考核方式
! 期末成绩 40% " 考试 ! 平时成绩 50% " 分组作业 ! 日常考勤 10%
研究对象:各种系统 。。。
5
6
7
城市公共交通系统
8
9
各种复杂系统的共性是什么?
社会网络分析的发展历史 I
! 社会网络分析作为一种独特的理论和研究方法从20世纪60年代兴 起、70年代快速发展、80年代成熟到90年代长盛不衰, 历时近40年。 ! 从20世纪70年代初期至今占据着欧美社会学特别是美国社会学主 流地位的则是社会网络分析,提出了从“经济人”到“社会人”的 转变。其领军人物包括:伯特(Ronald Burt) 、格兰诺维特(Mark Gr anoveter)、诺科(David Knoke)、马斯登(PeterMarsden)、维尔 曼(BarryWellman)、怀特(HarrisonWhite)等学者。 ! 社会网络分析提出了一系列指导着社会网络研究的概念、命题、 基本原理及其相关的理论,使社会学对于社会结构的研究面目一 新。社会网络分析形成了得到大规模的经验研究支持的一致的特征 和原理。在社会关系的层次上将微观社会网和宏观的社会结构连结 起来.
33
互联网实验:“六度分离”
! 2001年,美国的社会学研究者D.Wacs在互联网上以电子邮件为工具重 复了Milgram的实验。 ! Wacs随机选定18个志愿者,并从中任意选择一位做为接收者(记为 O),然后由其他志愿者发送电子邮件给最有可能联系到O的朋友,一直 重复该过程直到电子邮件到达O。在一年多时间里,总共有166个国家和 地区的6万多名志愿者参与实验。 ! 结果表明:在互联网上,一封邮件平均被转发六次,即可到达目标接收 者。
社会网络分析(狭义)
! 狭义上来说,社会网络是指由个人或团体以及他们之间存在的各 种关系所组成的社交网络。这些网络关系包括: 好友关系、关注关 系、博客间的评论关系、标签系统( tagging systems)中用户间的协 作标签关系等。 ! 在过去的半个世纪,社交人际网络一直是社会学、社会心理学和 人类学的活跃的研究领域。如今,社会网络涵盖了社会和技术性的 网络,以及具有内在社会化结构的信息系统。特别是随着Web 2.0 的发展,出现了很多基于Web的社会网络数据,包括在线社区( 如 Facebook、人人网、校内网等) 、微博、微信、文献发表数据库等。 ! 社会网络分析主要对社会化网络中的关系进行分析,得到个人或 社团( community) 的信息。因此,社会网络分析可以用于检测可 信任的重要用户、好友预测、提高网络搜索性能、商品推荐等。
18
中药方剂网示意图
! 点(药材), 边(药材之间相互作用), 局域网(方剂)
19
中国淮扬菜肴网
• 节点-食料 • 边-菜肴中两种食料 之间的相互作用 • 每道菜肴-局域网 (完全图) • 通过公共节点连接 构成中国淮扬菜肴 网。 • 329道菜肴,242 个顶点(食品), 1713条边。
社会网络的复杂性
(2)节点复杂性 A)节点的独立或固有特性 网络中的节点可能是具有分岔和混沌等复杂多样性的动力系 统。例如,基因网络中每个节点都具有复杂的时间演化行为。而 且,一个网络中可能存在多种不同类型的节点。例如,控制哺乳动 物中细胞分裂的生化网络就包含各种各样的基质和酶。或者社交网 络中每个用户的兴趣偏好。 B) 关联引发的节点特性 当关联失去时这类特性会在节点处消失或改变。例如,耦合 神经元重复地被同时激活,那么它们之间的连接就会加强,这被认 为是记忆和学习的基础。
一切系统的基础结构都是网络!
10
The Network !
不同领域的复杂网络
! 社会网:社交网,演员合作网,姻亲关系网,科研合作网, Email网 ! 生物网:神经网,新陈代谢网,蛋白质网,基因网络 ! 信息网络:WWW,专利使用,论文引用,计算机共享 ! 技术网络:电力网,Internet,电话线路网 ! 交通运输网:航线网,铁路网,公路网,自然河流网
2
参考资料
! 《网络、群体与市场—揭示高度互联世界的行为原理与效应机 制》大卫•伊斯利[美] /乔恩•克莱因伯格[美]著,李晓明 等译,清 华大学出版社,2011年10月 《Networks Crowds and Markets: Reasoning about a Highly Co nnected World》 David EASLEY and Jon KLEINBERG ! 《复杂网络基础理论》 郭世泽、陆哲明 编著,科学出版社 ,201 2年6月 ! 《链接:网络新科学》巴拉巴西[美]著,徐彬译,湖南科学技术 出版社,2007年4月 ! 《社会网络分析:理论、方法与应用》林聚任、景天魁著,北京 师范大学出版社,2009年8月
社会网络的复杂性
(1)结构复杂性 网络连接结构错综复杂、极其混乱,同时又蕴含着丰富的结 构:社区、基序、聚集性、生成规律性等等,而且网络连接结构可 能是随时间变化的,例如,WWW上每天都不停地有页面和链接的 产生和删除。 " 静态结构的复杂性和结构动态演化的复杂性。 例:神经系统 由神经元互连形成,连接以“突触连接结构”实现,突触有强 弱、兴奋与抑制、不同的神经递质;连接不断改变,形成连接 结构变化(重边,加权等)。
社会网络分析与算法研究
主讲教师:高 昇 Email: gaosheng@ Office:教三楼803-模式识别实验室 助教: 李俊岑 Email: mlijuncenm@ Office:教三楼731-模式识别实验室 公共邮箱:buptsna@ 密码: 2014social
11
Social Network
12
9/11恐怖分子交流网络
13
Information Network
14
Webpage Hyperlinks
World Wide Web
15
经济合作网络
16
大脑神经元网络
17
中药方剂网
! 虽然中药方剂的数量很大,但目前还没有统计用的数据 库。不得不用手工进行统计,因此统计的数据量受到很大 限制。选用了1536付药方,681种药物进行了统计。 ! 节点:药物,边:在一付方剂中药物的相互作用。 ! 方剂:药物、药物的相互作用构成的固定完全图局域网, 同时也可以看作是节点(药物) 的合作成果。 ! 各个完全图通过共用的节点(药物)架起桥梁,构成网 络。网络由完全图连接而成,如图所示。
社会网络分析的研究方法
! 社会网络分析是一门社会学、信息学、计算机科学、物理学、生 物学、统计学等多学科交叉的新兴领域,涉及了网络建模、数据挖 掘、机器学习、信息抽取与检索、统计分析等不同领域。 ! 社会网络分析的发展是建立在: " 组织社会学与社会测量学 " 复杂网络理论 " 机器学习算法与模型
34
" 小世界实验—Bacon数 ! 为了检验“六度分离”的正确性,美国Virginia大学计算机系的科学家 建立了一个电影演员的数据库,放在网上供人们随意查询。网站的数据库 里目前总共存有近60万个世界各地的演员的信息以及近30万部电影信息。 通过简单地输入演员名字就可以知道这个演员的Bacon数。 ! 目前比如输入Stephen Chow(周星驰)就可以得到这样的结果:周星 驰在1991年的《豪门夜宴(Haomen yeyan)》 中与洪金宝(Sammo Hung Kam-‐‑Bo)合作;而洪金宝又在李小龙的最后一部电影,即1978年的《死亡 的游戏 (Game of Death)》 中与 Colleen Camp 合作;Colleen Camp 在去年的电影《Trapped》 中与Kevin Bacon 合作。这样周星驰的Bacon 数为3。 ! 对78万个演员所做的统计,最大的Bacon数仅仅为8,平均Bacon数仅为 2.948。 35
社会网络分析的发展历史 I
! 我们或许有过这样的经历:偶尔碰到一个陌生人,同他聊了一会后发现 你认识的某个人居然他也认识,然后一起发出”这个世界真小”的感叹。 那么对于世界上任意两个人来说,借助第三者、第四者这样的间接关系来 建立起他们两人的联系平均来说最少要通过多少人呢? ! 20世纪60年代美国哈佛大学的社会心理学家斯坦利•米尔格伦(Stanley Milgram) 通过一些实验后得出结论:中间的联系人平均只需要5个。他把 这个结论称为“六度分离理论(Six Degrees of Separation)”: 平均只要 通过5个人,你就能与世界任何一个角落的任何一个人发生联系。这个结 论定量地说明了我们世界的”大小”,或者说人与人关系的紧密程度。 ! 30多年来,六度分离理论一直被作为社会心理学的经典范例之一。尽管 如此,实际上这个理论并没有得到严格的证实。