介绍了指数随机图(P *)社交网络模型(加里·罗宾斯,皮普派特森,尤瓦尔·卡利什,院长Lusher)心理学系,行为科学,墨尔本大学商学院。
3010,澳大利亚摘要:本文提供的介绍总结,制定和应用指数随机的图模型的社交网络。
网络的各个节点之间的可能的关系被认为是随机的变量和假设,这些随机的领带变量之间的依赖关系确定,一般形式的指数随机图模型的网络。
不同的相关性假设的例子及其相关的模型,给出了包括伯努利,对子无关,马尔可夫随机图模型。
在社会选择机型演员的加入属性也被审查。
更新,更复杂依赖的假设进行了简要介绍。
估计程序进行了讨论,其中包括新的方法蒙特卡罗最大似然估计。
我们预示着在其它组织了讨论论文在这款特别版:弗兰克和施特劳斯的马氏随机图模型[弗兰克,澳,施特劳斯,D.,1986年马氏图。
杂志美国统计协会81,832-842]不适合于许多观察到的网络,而Snijders等人的新的模型参数。
[Snijders,TAB,派特森,P.,罗宾斯,GL,Handock,M.新规范指数随机图模型。
社会学方法论,在记者]提供实质性的改善。
关键词:指数随机图模型;统计模型的社交网络; P *模型在最近几年,出现了在指数随机图模型对于越来越大的兴趣社交网络,通常称为P *类车型(弗兰克和施特劳斯,1986;派特森和沃瑟曼,1999;罗宾斯等人,1999;沃瑟曼和帕蒂森,1996年)。
这些概率模型对一组给定的演员网络允许泛化超越了早期的P1模型类(荷兰和Leinhardt,1981年)的限制二元独立性假设。
因此,它们允许模型从社会行为的结构基础的一个更为现实的构建。
这些模型车的研究多层次,multitheoretical假说的有效性一直在强调(例如,承包商等,2006)。
已经有一些自Anderson等重大理论和技术的发展。
(1999)介绍了他们对P *型号知名底漆。
我们总结了本文上述的进步。
特别是,我们认为重要的是在概念上从依赖假设的衍生地,这些模型,模型的基本依据,然后作出了明确,并与有关(不可观察)社会进程底层网络的形成假说更容易联系。
正是通过新的模式,可以开发一个有原则的方式,包括结合了演员的属性模型这样的做法。
在模型规范和估计最近的发展需要注意的是,因为这样做就设置结构和部分新技术的步骤依赖的假设,不仅扩大了级车型,但具有重要意义的概念。
特别是,我们现在有一个更好的了解马尔可夫随机图,和有前途的新规格的性能已经提出来克服他们的一些不足之处。
本文介绍了模型,并总结当前方法的发展与扩展概念的阐述(更多技术总结最近被沃瑟曼和罗宾斯,2005年定;知更鸟和派特森,2005; Snijders等人,出版。
)我们首先简要介绍理分析社交网络的统计模型(第1节)。
然后,我们提供指数随机图模型的基本逻辑进行了概述,并概述我们框架模型构建(第2节)。
在第3节中,我们讨论的重要概念一个依赖假设的建模方法的心脏。
在第4节中,我们提出了一系列不同的相关性假设和模型。
对于模型估计(第5章),我们简单总结伪似然估计(PLE)的方法,并检讨最近的事态发展蒙特卡罗马尔可夫链最大似然估计方法。
在第6节中,我们提出拟合模型,网络数据的简单的例子。
总之,我们注意到的重要性新的型号规格是关注在这款特别版的其他论文的重点。
1.为什么模型的社交网络?有许多公知的技术,用于测量网络性能的节点,或节点的子(如密度,中心性和凝聚力的子集)的。
这些技术服务有价值的目的,描述和理解的网络功能,可以承受在特定的研究问题。
那么,为什么我们会想要超越这些技术和搜索合身的一个观察到的社交网络的模型,特别是一个统计模型?原因这样做有以下内容:(1)社会行为是复杂的,并且随机模型使我们能够同时捕获的规律在该过程引起网络的联系,而在同一时间识别存在是可变性,我们是不太可能能够进行详细建模。
此外,如瓦(1999)已令人信服地证明,“加入”少量随机性的,否则便会定期进程可以极大地改变了这一进程的可能结果的性质。
它是因此,重要的是要允许的随机性,如果我们认为它最能反映过程我们的目标模型。
也许最重要的是,良好的特定的随机模型使我们要了解与观察到的结果的不确定性:我们可以了解可能结果的模型一个给定的规格分布,或者我们可以估算,对于给定的观察到的数据,从该数据可能已被产生的虚拟模型的参数(并且也获得与其相关联的不确定性的定量估计估计)。
(2)统计模型也允许关于是否特定网络子结构的推论 - 通常由一个或少量的参数所表示的模型 - 在网络中被更普遍观察到可能比偶然预期。
那么我们可以假设开发了解可能产生这些结构性质的社会过程。
(3)有时,不同的社会进程可能会做出类似的网络质量预测结构,它只有通过仔细的定量模型,在预测的差异进行评估。
例如,群集在网络可能产生的内源性(自组织)结构的影响(例如,结构平衡),或者通过节点级效果(例如,同质性)。
要在两个方案之间作出决定,需要一个模型,结合这两种效应,然后评估每个的相对贡献。
(4)在更复杂的网络上的数据结构,更有用的适当配制的模型可以在实现高效的表示。
值得注意的是,有avariety的确定性方法FO ranalyzing单个二进制网络,但其中许多都是不恰当的,或者是太复杂,对于更复杂的数据。
为了了解网络的演进(Snijders,2001)或多个网络结构(Lazega和派特森,1999),模型可以有很大的价值。
(5)在社会网络分析的几个长期存在的问题,涉及到如何本地化的社会过程和结构结合起来,形成全球网络模式,而这种本地化的进程是否足以说明全球网络性能的谜题。
它是难以调查这些问题没有一个模型,如在所有的除了相当简单的情况下,由许多小规模结构的组合所造成的全球结果没有立即明显,即使是定性的。
具有良好的本地指定型号的社交网络,它可能会穿越这条微宏的差距,往往是通过模拟。
我们特别强调显影可信模型,这些模型可估计从数据并因此经验为基础的值。
有多种型号的网络文学,这对于模拟,假设生成的重要工具,而“思想实验”。
但是,我们的主要目标是估算数据模型的参数,然后评估如何充分的模型表示的数据。
这些互补的方法成为有用的,但不同的目的,用数据驱动的方法显然是其支撑结构的模型假设的实证审讯能力的独特价值。
2后面的P *模型对社会的逻辑网络,大纲我们描述了作为观测到的网络的研究者已收集并且可以在网络数据有兴趣建模。
所观察到的网络是从一组可能的看作一个实现网络具有类似的重要特征(至少是,行动者的数量相同),即是,由于一些(未知)的随机过程的结果。
换句话说,观察到的网络被看作是关系一个特定图案出一大组可能的图案。
在一般情况下,我们做不知道什么随机过程产生所观察到的网络和我们在制定目标模型是提出一种可行的和理论上的原则假设此过程。
例如,我们的研究课题之一可以是是否在所观察到的网络有显著更多,或者更少,感兴趣结构特征比偶然预期。
我们可能会看到这些特性当地社会进程的成果。
例如,我们可能会问的莫雷诺和詹宁斯(1938年)的统计数据,社交网络的第一个应用程序做了观察网络是否显示了对等的强烈倾向,超出了一些回报的关系,如果关系的机会亮相发生完全是随机的。
换句话说,你所观察到的网络中的行动者往往回报关系的选择?这里的结构特点(投桃报李的关系)是一个社会过程(个人选择来回报他人的选择)的结果。
因此,作为一个简单的例子,我们可以断定一个随机网络模型具有两个参数,一个反映的倾向关系发生在随机和一种反映了一个额外的倾向往复运动的发生。
在一般情况下,在质询帮助的结构特性来塑造模型的形式。
一一个对等进程的假设使我们提出一个模型,其中所述电平的指标互惠是参数。
这个假设也反映了什么样的期望网络更容易。
对于一个给定的演员组成的网络统计模型分配概率就这些演员的所有可能的网络。
例如,由于互惠关系是通常观察到的功能,在友谊网络,良好的模式很可能意味着网络与往复运动是比较常见和网络没有回报是相当不可能的。
正如往常一样,我们代表的网络节点和边的图。
对于一个给定的模型,所述节点集合被认为是固定的。
可能的网络的范围内,和它们发生的概率该模型下,通过在该组的所有可能的曲线图上的概率分布表示同节点的这个号码。
在图的这种分布,这些图表有大量的水平往复运动都可能具有比图少往复运动的概率较高,具有取决于相关的参数,值的精确概率,如对等参数。
需要注意的是所观察到的网络是在该分布的特定图形,所以它也具有特定概率。
当然,在一开始,我们不知道在分配概率在分布图形要使用的参数值。
我们的目标,更确切地说,是要找到最好的值(通过估算模型用所观察到的网络作为引导参数)。
必要的最大似然准则是选择的参数值以这样一种方式,往复运动的最可能的程度是这发生在所观察到的网络。
如果模型有一个对等的参数(定义为零时相互关系发生偶然的),如果有,在许多往覆关系观测到的网络,则一个模型,它是一种非常适合于数据中往复运动的程度方面将产生积极的对等参数。
如果我们估计互惠参数的观测网络,如果我们可以相信,这个参数是正的,我们可以推断,还有更多互惠中所观察到的网络不是偶然的预期。
一旦我们定义该组的所有图形的概率分布与节点的一个固定数目的,我们也可以从分配根据分配给它们的概率绘制图形随机的,并且我们可以在任何其他比较采样的曲线图,以观察到的1感兴趣的特征。
如果该模型是一个很好的数据,然后将采样的图形将类似于所观察到的1在很多不同的方面。
在这种理想的情况下,我们甚至可以推测这种建模的结构效应可以解释在网络的出现。
我们可以以了解网络,有可能从这些影响出现的性质研究采样图形的属性。
作为一个例子,考虑在一所学校的教室友谊。
所观察到的网络是为我们所测得的友谊关系网络。
有可能已经观察到对于特定的教室许多可能的网络。
我们检查了教室里所有可能的网络结构的情况下观察到的友谊结构在教室里。
一些结构在教室可以是相当容易和一些不太可能发生,和该组所有可能的结构,有关其相应的机率一些假设是曲线图上的概率分布。
我们把观察到的这个网络中的分布,而不是在其他教室观察网友谊网络进行比较。
(当然,我们的模型中所观察到的网络也可以是用于其它教室的良好模型,但是这并不是问题,在这一点上)。
注意,假设是,网络是由一个随机过程,其中关联关系进入在于,可通过其它关系(和可能的节点级属性)的存在或不存在的形状的方式被产生。
换句话说,网络被概念化为关系型关系的自组织系统。
实质上,索赔是有产生二元关系,当地的社会进程,而这些社会过程可能取决于周围的社会环境(即在现有的关系)。
例如,我们可以假设,具有类似属性的行动者更可能形成友谊关系(同质性),或者,如果两个未连接的参与者被连接到第三演员,在某些时候,他们有可能形成它们之间的友好提携(及物)。
需要注意的是,除了随机性的假设,这种描述也隐时间和动态。