great:可变滥用任务的数据集在ICLR 2020年论文“源代码的全球关系模型”中使用[https Forum source code
伟大的 在ICLR 2020年论文“源代码的全局关系模型”中描述了变量滥用任务的数据集[ ] 这是该论文中使用的数据集的公开版本。 由于许可问题,用于生成纸上图表的原始文档无法开源。 有关从该数据集产生的结果,请参见公共关联的代码存储库[ ]。 该数据集是从ETH Py150 Open数据集[ ]中的Python代码库综合生成的。 数据集分为3个部分:训练数据集train ,验证数据集dev和评估(测试)数据集eval 。 这些中的每一个均来自相应的ETH Py150 Open拆分。 每个数据集拆分都存储在分片文本文件中。 每个__VARIABLE_MISUSE__SStuB.txt--of-都被命名为__VARIABLE_MISUSE__SStuB.txt-<shard number
下载地址
用户评论