ds bazaar workshop:使用Python将实证研究扩展到更大的数据 源码
使用Python将实证研究扩大到更大的数据 威斯康星大学麦迪逊分校的讲习班材料。 该研讨会的目的是为那些在分析适合内存的数据方面具有丰富经验但对扩展到大于内存数据集感兴趣的研究人员提供帮助。 将涉及以下主题:测量性能和内存使用情况; 抽样和拆分合并策略; 数据类型优化; 镶木地板的高效存储; 简单并行化; Dask简介。 感兴趣的参与者将获得示例数据集和有关设置编程环境的说明。 所有研讨会资料将在此GitHub存储库中公开提供。 应使您对预期的Python和熊猫知识有所了解。 如果您不Python,建议阅读有关和。 这展示了如何使用Jupyter笔记本进行教学,而讲座则使用Python进
用户评论