基于美国人口普查数据,分类预测个人收入能否超过五万美元

这个数据科学项目由个人完成,注释比较完善,有目录与结论,最后被老师评为机器学习章节考核的参考。  结论: 从连续型数据集来看,随机森林算法经过参数调整,测试集的准确度从85.95提升到了86.22,有一些效果,而AUC面积从0.9123提升到了0.9134,仅仅微微地提升。 从连续型数据集来看,梯度提升算法经过参数调整,测试集的准确度从86.57提升到了8 [...]