说到社交网络分析,不得不先讲讲社交网络中的几个重要度量。 度中心性(Degree):表示节点的链接数量。如果网络中的链接都是强关系,那么度中心性高的人就比度中心性低的人受欢迎。图1是一个训练班的同学之间的关系(下面就以代号TC表示),Bill度中心性是6,Tom和Mark的是1,说明Bill最受欢迎,而Tom和Mark则比较边缘化。在有向图中,度中心性分为出度中心性(Out-Degree)和入度中心性(In-Degree)。A的出度中心性是从A节点指向其它节点的链接数,A的入度中心性是指向A节点的链接数。 图1
中介中心性(Betweenness Centrality):在路径上能够到达其它节点的度量。在TC中,Bill的中介中心性是17,Joseph是14,远高于其它节点,因为如果没有Joseph,Willian和Tom就会与其他人断开关系,同样,Mark必须通过Bill与其他人建立关系。而James、Mark、Henry和Tom的中介中心性为0,因为他们不在其他关系的路径上。 接近中心性(Closeness Centrality):有能力在最短路径到达其它节点的度量。接近中心性的值越小说明节点更容易到达其它节点,即平均路径最短。 特征向量中心性(Eigenvector Centrality):不仅考虑链接总数,还考虑与谁连接。即"把那些与特定行动者相联结的其他行动者的中心性考虑进来而量度一个行动者中心性指标"。在图2中,William和James的度中心性都是3,但James的特征向量中心性比William的高,因为James与第二受欢迎的Charles连接,而William与处于边缘的Tom连接(他们各自的另一个联系人具有相同的度中心性)。 图2
聚类系数(Clustering Coefficient):有时候,一个人的朋友之间也是朋友,形成一个小团体(派系)。例如,Henry的三个朋友Gary、Bill和Charles之间也直接相互连接。有时候,一个人的朋友之间没有连接,像William的朋友Tom和Joseph就没有关系。聚类系数用来衡量节点的邻点之间的关系。准确的计算是,邻点之间实际的连接数/邻点之间可能的连接数。辟如说,Joseph有三个朋友,他们之间最多可以有三个连接,而实际上只有一个(Bill和Gary之间),因此,聚类系数是1/3。
|