Mark Newman AS级对称快照复杂网络数据集
互联网结构的结构快照用得多了,但像 Mark Newman 这份 AS 级别的对称快照数据集,真不多见。数据挺干净的,格式是.gml
和.txt
,一个可视化友好,一个结构信息全。这种级别的自治系统网络,拿来做复杂网络合适,像是度分布、聚类系数、路径长度这些经典指标,全能搞。
MarkNewman 的复杂网络数据集里,每个节点代表一个 AS(自治系统),边就是它们的连接。你用Gephi一导入as-22july06.gml
,图结构立马就出来了。想看中心节点?调一下度数。想看社区结构?跑个 Louvain 算法也不难。
如果你更喜欢老派工具,Pajek也能读.gml
文件,功能不输 Gephi,适合搞定一些静态任务。哦对了,数据虽然是 2006 年的,但网络结构稳定,照样能拿来做算法验证和模型实验。
要注意的是,as-22july06.txt
里的数据偏原始,想直接用得清洗一下,比如提取边列表、节点 ID。拿 Python 配上networkx
还挺顺的,比如:
import networkx as nx
g = nx.read_gml("as-22july06.gml")
print(nx.degree_histogram(g))
如果你对网络演化也感兴趣,这份数据还能和其它 AS 历史快照做对比,比如看看哪些节点连接变了,哪些形成了新的社区。
,这套数据对做复杂网络研究的你来说,算是蛮经典的参考资源。如果你还想拓展别的方向,可以看看这些:
- 复杂网络常用数据集,资源全,适合做 benchmark
- 互联网社区结构算法,结合算法练手更香
- 欧洲邮件 Gephi 数据集,练图形可视化不错
如果你是第一次搞这种 AS 层级的网络,建议先用 Gephi 熟悉结构,再进阶玩算法。嗯,先跑起来,再琢磨优化不迟。
下载地址
用户评论