1. 首页
  2. 数据库
  3. 其它
  4. 《动手学深度学习》学习笔记

《动手学深度学习》学习笔记

上传者: 2021-01-16 16:53:03上传 PDF文件 44.02KB 热度 21次
文本预处理 常见的四个步骤: 读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型 import collections import re def read_time_machine(): with open('/home/kesci/input/timemachine7163/timemachine.txt', 'r') as f: lines = [re.sub('[^a-z]+', ' ', line.strip().lower()) for line in f] return li
下载地址
用户评论