颜色分类leetcode kaggle mushroom classification 使用SparkMLLib的Kaggle蘑...
颜色分类leetcode Kaggle蘑菇分类挑战赛使用Spark MLLib。为Spark 2设置环境变量当Spark 1和2都安装在一台机器上时,它默认使用Spark 1,并且您需要在使用pyspark或spark-submit之前通过运行以下命令明确告诉机器使用Spark 2: $ export SPARK_MAJOR_VERSION=2导入模块我使用pyspark的以下模块来pyspark这项任务from pyspark import SparkContext from pyspark . sql import SparkSession , Row from pyspark . ml . feature import VectorAssembler , StringIndexer , OneHotEncoder from pyspark . ml import Pipeline from pyspark . ml . classification import RandomForestClassifier设置SparkContext和Spark
下载地址
用户评论