社会网络分析论坛 social network analysis forum

标题: [数据集] 国外知名博客网站BlogCatalog3爬取的友谊网络数据集 [打印本页]

作者: snachina    时间: 2019-6-20 18:47
标题: [数据集] 国外知名博客网站BlogCatalog3爬取的友谊网络数据集
数据集介绍:

摘自于BlogCatalog是管理博客和博客的社交博客目录。包括联系网络和选定的组员资格信息。

节点数量:10312  边数:333983

数据集信息:

这是从BlogCatalog爬取的数据集。BlogCatalog是一个社交博客目录网站。
这包含友谊网络抓取和组成员资格。为了便于理解,所有内容均以CSV文件格式组织。

基本统计:

博主的人数:10,312

友谊人数:333,983 人数:39人

属性信息:

包括4个文件:

1. nodes.csv
- 它是所有用户的文件。该文件作为该数据集中所有用户的字典。这对快速参考很有用。它包含
数据集

2中使用的所有节点标识符。groups.csv
- 它是所有组的文件。它包含数据集

3中使用的所有组标识。edges.csv
- 这是博主之间的友谊网络。博主的朋友用边表示。
由于网络是对称的,每个边只能被表示一次。这是一个例子。

1,2 这意味着ID为“1”的博主是博客ID为“2”的朋友。

4. group-edges.csv
- 用户组成员资格。在每一行中,第一个条目代表用户,第二个条目是组索引。


下载地址回复可见:









欢迎光临 社会网络分析论坛 social network analysis forum (http://snachina.com/) Powered by Discuz! X3.3