机器学习挑战:系外行星探索 源码
机器学习作业-系外行星探索 背景 开普勒太空天文台是2009年发射的NASA人造卫星。该望远镜正在寻找我们自身之外的恒星系统中的系外行星。 卫星的最终目标是确定可居住的行星。 由于机械故障,最初的任务于2013年结束,但该望远镜自2014年以来一直在执行“ K2”扩展任务。 截至2016年5月,开普勒已验证了1284颗新系外行星。截至2017年10月,共有3,000多种已确认的系外行星(使用所有探测方法,包括基于地面的探测方法)。 望远镜仍处于活动状态,并继续收集其扩展任务的新数据。 目标 使用开普勒太空天文台创建的数据,创建一个机器学习模型,该模型能够对模型分数大于85%的候选系外行星进行分类。 此过程在以下阶段执行: 阶段 预处理数据 数据是从Kaggle上的系获得的。 初始数据集为3.5 Mb,包含50个类别(列)的数据,这些数据代表开普勒进行观测的10,000个系外行星候选者。
用户评论