alexa php spiderPHP爬虫工具获取Alexa网站排名数据
alexa-php-spider 是一个轻量级的 PHP 爬虫工具,用于获取 Alexa 排名数据。该工具可用于抓取不同分类的 Top 500 网站 数据。使用时,您可以自行设置 MySQL 信息,工具基于 phpQuery 库来实现网页抓取。
主要功能:
-
支持获取不同分类的 Alexa Top 500 数据。
-
配置 MySQL 信息后即可自动存储抓取的数据。
-
若遇到 30秒超时错误,可尝试刷新重试,建议使用 代理 访问以保证抓取顺利。
-
文件 alexa_top_global.sql 用于抓取 global 分类数据,详细参数设置见 index.php。
参数说明:
-
category: 分类参数,支持 global
、countries
、category
。
-
page: 页码,支持从 0 开始的分页。
-
name: 子类别,global
无子分类,countries
和 category
见 index.php。
-
times: 运行时次数,0 表示首次运行,1 表示表已存在。
支持获取不同分类的 Alexa Top 500 数据。
配置 MySQL 信息后即可自动存储抓取的数据。
若遇到 30秒超时错误,可尝试刷新重试,建议使用 代理 访问以保证抓取顺利。
文件 alexa_top_global.sql 用于抓取 global 分类数据,详细参数设置见 index.php。
-
category: 分类参数,支持
global
、countries
、category
。 -
page: 页码,支持从 0 开始的分页。
-
name: 子类别,
global
无子分类,countries
和category
见 index.php。 -
times: 运行时次数,0 表示首次运行,1 表示表已存在。
Demo: 运行链接 spiderall.php?category=global&page=0
可开始抓取数据。
下载地址
用户评论