1. 首页
  2. 数据库
  3. 其它
  4. Python使用稀疏矩阵节省内存实例

Python使用稀疏矩阵节省内存实例

上传者: 2020-12-30 05:43:24上传 PDF文件 52.66KB 热度 25次
推荐系统中经常需要处理类似user_id, item_id, rating这样的数据,其实就是数学里面的稀疏矩阵,scipy中提供了sparse模块来解决这个问题,但scipy.sparse有很多问题不太合用: 1、不能很好的同时支持data[i, ...]、data[..., j]、data[i, j]快速切片; 2、由于数据保存在内存中,不能很好的支持海量数据处理。 要支持data[i, ...]、data[..., j]的快速切片,需要i或者j的数据集中存储;同时,为了保存海量的数据,也需要把数据的一部分放在硬盘上,用内存做buffer。这里的解决方案比较简单,用一个类Dict的东西来存储数据,对于某个
用户评论