The Children’s Book Test 问答数据集 数据集
CBT 数据集由文字段落和相应问题构建,问答数据均来自古腾堡项目免费提供的书籍,该数据集用于直接测量语言模型、更广泛的语言环境用于问答和仿真查找。 cbt_test.txt cbtest_CN_test_2500ex.txt cbtest_CN_valid_2000ex.txt cbtest_NE_test_2500ex.txt cbtest_NE_valid_2000ex.txt cbtest_P_test_2500ex.txt cbtest_V_valid_2000ex.txt ._stats_all_CBT.txt ._stats_CN.txt ._stats_NE.txt ._stats_P.txt ._stats_V.txt stats_all_CBT.txt stats_CN.txt stats_NE.txt stats_P.txt stats_V.txt cbt_valid.txt cbt_train.txt ._BOOK_SPLIT.txt BOOK_SPLIT.txt LICENSE.txt cbtest_P_valid_2000ex.txt cbtest_V_test_2500ex.txt cbtest_CN_train.txt cbtest_V_train.txt cbtest_NE_train.txt cbtest_P_train.txt
用户评论