1. 首页
  2. 人工智能
  3. 深度学习
  4. libtorchwinsharedwithdeps1.4.0.zip

libtorchwinsharedwithdeps1.4.0.zip

上传者: 2020-07-16 05:35:24上传 ZIP文件 65.82MB 热度 28次
自己以for循环展开torch::lstm_cell写的inference,OMP_NUM_THREADS=4的情况下只比torch::lstm慢一点点,前者约为16ms,后者约为19ms(这里lstm cell的输入=256,输出=1024,序列长度为80)。细微的差距大概和torch::lstm一次性算完matmul_ih,仅在时间步以for循环计算matmul_hh有关。比起python + script jit,直接以libtorch c++ api来搭建常用模型基本上几乎没有overhead,写起来也和python差不多。后面考虑给for循环展开的lstm的版本加入zoneout,或
下载地址
用户评论