数据科学

主页>>技术系列>>数据科学

安装JupyterLab插件渲染matplotlib, plotly, bokeh, pytecharts的动态图

在Python安装了了matplotlib, plotly都可以比较方便绘制静态的图片,静态图片以特殊的字符串,保存在ipynb文件里面,而绘制动态图片需要安装插件。bokeh, pyecharts本身就是利用Javascript技术绘制动态的图片,而在JupyterLab里要加载使用的JS,也需要安装插件,或用一些方式来加载。 1.Matplotlib插件 [...]

|2020-10-09T12:01:23+08:002020/10/9|分类:原创, 数据科学|标签:, |0 条评论

基于日本店铺客流与天气数据,回归预测店铺未来两个月的客流

这个数据科学项目由个人完成,注释比较完善,有目录与结论。涉及时间序列的处理,但有完善的地方,在结尾会补充。  总结 1.特征工程部分: 做这次考核作业用了4.5天时间,2天半的时间都在反复处理特征工程当中,1天半用来对比训练模型和做最后预测要提交的数据。 这次训练数据约25万多条,比较完好,821个店铺,分布在9个大区,103个城市当中。从不同店的客流图看 [...]

|2020-10-14T11:20:37+08:002020/9/21|分类:原创, 数据科学|标签:, |0 条评论

基于美国人口普查数据,分类预测个人收入能否超过五万美元

这个数据科学项目由个人完成,注释比较完善,有目录与结论,最后被老师评为机器学习章节考核的参考。  结论: 从连续型数据集来看,随机森林算法经过参数调整,测试集的准确度从85.95提升到了86.22,有一些效果,而AUC面积从0.9123提升到了0.9134,仅仅微微地提升。 从连续型数据集来看,梯度提升算法经过参数调整,测试集的准确度从86.57提升到了8 [...]

|2020-10-14T11:10:41+08:002020/9/20|分类:原创, 数据科学|标签:, |0 条评论
返回顶部