用于自然语言处理的电影语料集。该数据集包含2005-2009期间发布的电影的元数据,财务信息和评论评论,供学术研究使用。这些数据由Mahesh Joshi, Dipanjan Das, Kevin Gimpel和Noah Smith收集 。 如果您撰写任何涉及上述数据使用的论文,请引用本文: 电影评论和收入:文本回归实验 Mahesh Joshi, Dipanjan Das, Kevin Gimpel和 Noah A. Smith 在计算语言学人类语言技术协会北美分会会议录,2010年6月,加利福尼亚州洛杉矶。