社会网络分析论坛 social network analysis forum
标题:
[数据集] 国外知名博客网站BlogCatalog3爬取的友谊网络数据集
[打印本页]
作者:
snachina
时间:
2019-6-20 18:47
标题:
[数据集] 国外知名博客网站BlogCatalog3爬取的友谊网络数据集
数据集介绍:
摘自于BlogCatalog是管理博客和博客的社交博客目录。包括联系网络和选定的组员资格信息。
节点数量:10312 边数:333983
数据集信息:
这是从BlogCatalog爬取的数据集。BlogCatalog是一个社交博客目录网站。
这包含友谊网络抓取和组成员资格。为了便于理解,所有内容均以CSV文件格式组织。
基本统计:
博主的人数:10,312
友谊人数:333,983 人数:39人
属性信息:
包括4个文件:
1. nodes.csv
- 它是所有用户的文件。该文件作为该数据集中所有用户的字典。这对快速参考很有用。它包含
数据集
2中使用的所有节点标识符。groups.csv
- 它是所有组的文件。它包含数据集
3中使用的所有组标识。edges.csv
- 这是博主之间的友谊网络。博主的朋友用边表示。
由于网络是对称的,每个边只能被表示一次。这是一个例子。
1,2
这意味着ID为“1”的博主是博客ID为“2”的朋友。
4. group-edges.csv
- 用户组成员资格。在每一行中,第一个条目代表用户,第二个条目是组索引。
下载地址回复可见:
欢迎光临 社会网络分析论坛 social network analysis forum (http://snachina.com/)
Powered by Discuz! X3.3