社会网络分析论坛 social network analysis forum

 找回密码
 立即注册
查看: 2315|回复: 0
打印 上一主题 下一主题

[数据集] 国外知名博客网站BlogCatalog3爬取的友谊网络数据集

[复制链接]

683

主题

924

帖子

998万

积分

管理员

Rank: 9Rank: 9Rank: 9

金币
9977499
贡献
448
威望
448
积分
9980072
跳转到指定楼层
楼主
发表于 2019-6-20 18:47:36 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
数据集介绍:

摘自于BlogCatalog是管理博客和博客的社交博客目录。包括联系网络和选定的组员资格信息。

节点数量:10312  边数:333983

数据集信息:

这是从BlogCatalog爬取的数据集。BlogCatalog是一个社交博客目录网站。
这包含友谊网络抓取和组成员资格。为了便于理解,所有内容均以CSV文件格式组织。

基本统计:

博主的人数:10,312

友谊人数:333,983 人数:39人

属性信息:

包括4个文件:

1. nodes.csv
- 它是所有用户的文件。该文件作为该数据集中所有用户的字典。这对快速参考很有用。它包含
数据集

2中使用的所有节点标识符。groups.csv
- 它是所有组的文件。它包含数据集

3中使用的所有组标识。edges.csv
- 这是博主之间的友谊网络。博主的朋友用边表示。
由于网络是对称的,每个边只能被表示一次。这是一个例子。

1,2 这意味着ID为“1”的博主是博客ID为“2”的朋友。

4. group-edges.csv
- 用户组成员资格。在每一行中,第一个条目代表用户,第二个条目是组索引。


下载地址回复可见:

游客,如果您要查看本帖隐藏内容请回复



回复

使用道具 举报

QQ|Archiver|手机版|小黑屋|社会网络分析论坛 social network analysis forum ( 88876751 )

GMT+8, 2024-11-22 23:18 , Processed in 0.143892 second(s), 23 queries .

Powered by www.snachina.com X3.3

© 2001-2017 snachina.com.

快速回复 返回顶部 返回列表