有学生作者的医学论文数据收集:该代码自2012年以来用于收集有关至少有1位学生作者的医学期刊论文数据的代码 源码
与学生作者的医学论文数据收集 目标:收集至少有一名学生作者并在2012年1月1日至2017年12月31日之间发表的医学期刊论文的数据集。 目的:描述和分析医学生在01/01/2012至31/12/2017期间进行的生物医学研究的进展。 收集此数据集的几乎所有步骤都是自动化的,并且此存储库包含源代码。 该代码在收集数据的过程中利用了对XML文件的解析,对Web的爬网以及csv和xlsx文件的操纵。 收集过程概述: 收集数据的过程分为以下步骤: PubMed查询: 第一步是对数据库运行以下查询: (medical student[Affiliation] OR medical stude
下载地址
用户评论