Kepler_project 源码
开普勒计划 特雷弗·圣地亚哥(Trevor Santiago) 用开普勒数据对系外行星进行分类 该项目的目的是了解我们如何预测开普勒感兴趣的物体(KOI)是否被确认为系外行星或假阳性。 我主要关注的是获得尽可能最高的准确性,但同时也关注对数损失以了解模型的可信度。 数据 我使用的数据集来自 ,但最初来自NASA。 目标变量是koi_pdisposition ,其值CONFIRMED和FALSE POSITIVE和相当均衡。 广泛的数据字典可从美国航空航天局。 方法 幸运的是,数据集已经相当整洁。 通过探索性分析和数据字典,我认为有很多列不重要或包含泄漏。 在每个模型拟合期间,都会借助Sci-kit Learn的ColumnTransformer丢弃这些列。 每个模型拟合都利用其Pipeline和ColumnTransformer对象。 我从使用sklearn的KneighborsClas
用户评论