1. 首页
  2. 数据库
  3. 其它
  4. bpemb:基于字节对编码(BPE)的275种语言的预训练子词嵌入 源码

bpemb:基于字节对编码(BPE)的275种语言的预训练子词嵌入 源码

上传者: 2021-02-10 00:54:30上传 ZIP文件 22.27KB 热度 27次
BPEmb BPEmb是基于字节对编码(BPE)并在Wikipedia上进行过训练的275种语言的预训练子词嵌入的集合。 它的预期用途是作为自然语言处理中神经模型的输入。 ··· · · 用法 用pip安装BPEmb: pip install bpemb 嵌入和SentencePiece模型将在您首次使用时自动下载。 >> > from bpemb import BPEmb # load English BPEmb model with default vocabulary size (10k) and 50-dimensional embeddings >> > bpemb_en
用户评论