nashvillest_wayback:Wayback Machine中的Nashvillest内容 源码
Wayback Machine的Nashvillest内容 所以,有趣的故事。 一堆数据可能已经在服务器崩溃中肯定丢失了。 这是尝试将内容拼凑在一起。 它使用从提取站点内容。 抓取内容 要求: 捆扎机 bundle install bundle exec wayback_machine_downloader http://nashvillest.com --exclude "/^http:\/\/nashvillest.com(:80)?\/(tag|page|category|\?)\/.*/" 这需要几个小时才能完成。 上面的RegEx排除了一些最终会重复的页面(可能对数据提取没有用)
用户评论