cluster coefficient hadoop 使用MapReduce在Hadoop上实现集群系数计算
集群系数-hadoop使用MapReduce在Hadoop上实现集群系数计算。聚类系数定义为三角形数与三元组数之比。这个系数表明一个人的两个朋友也是朋友的可能性,在社交网络分析中特别有用。要编译,运行./compile_make_jar.sh运行程序前,将jar文件复制到slave节点./copy_jar.sh运行程序前,将数据文件拷贝到HDFS中/home/scratch/hadoop_core/bin/hadoop dfs -put datafile /user/mygroup/intput运行程序./execute.sh该程序计算一个大型网络的集群系数。网络的边缘被分成小文件。小文件中的每一行代表一条边。两个顶点由空格或制表符分隔。这些小文件的名字就是程序的输入。程序完成后,输出系数在HDFS的输出目录中。这主要是一种MapR
下载地址
用户评论