MachineLearninginR:R for Data Science课程的机器学习作业 源码
机器学习 R for Data Science课程的机器学习作业在本课程中,我们涵盖了概念和R库,以帮助我们在训练机器学习模型和各种机器学习算法之前处理数据问题。 R markdown文件包含用于在R中训练的机器学习算法的代码。在培训之前,我们被告知要检查的几件事情包括: 通过多次插补缺失值 找出我们的数据是否偏斜,以及如何通过不同的变换(Box-Cox,Tukey,对数,立方/平方根变换,数据归一化/标准化)解决偏斜问题 有效线性回归的假设,探索性数据分析的描述性统计量等我们尝试了以下机器学习算法: 线性和逻辑回归 回归树 知识网络 朴素贝叶斯 Kmeans和层次聚类 文本挖掘入门 对于本课程的作业1,我们涵盖了基本数据清理,缺失值插补,在R中编写函数以过滤,变异和选择特定变量\ 对于本课程的作业2,使用以下库进行分析: tidyverse,dplyr,lmtest,ggplot2,r
用户评论