WordPress纯代码实现搜索引擎蜘蛛爬行记录

痴痴资讯网 • 2022年6月14日 pm4:56 • 网站建设 • 阅读 397

新站或网站收录有问题时，就会可能需求连续的搜索引擎蜘蛛的抓取环境。网站文章不收录时，第一时间就是要看看网站蜘蛛抓取的日志，但通过访问服务器的方式查看蜘蛛日志有点麻烦，我们可以用代码来实现给WordPress网站添加记录蜘蛛抓取日志的功能!

1.WordPress将以下代码复制主题functions.php文件中

// 记录蜘蛛访问记录
function get_naps_bot(){
$useragent = strtolower($_SERVER[‘HTTP_USER_AGENT’]);
if (strpos($useragent, ‘googlebot’) !== false){
return ‘Googlebot’;
}
if (strpos($useragent, ‘msnbot’) !== false){
return ‘MSNbot’;
}
if (strpos($useragent, ‘slurp’) !== false){
return ‘Yahoobot’;
}
if (strpos($useragent, ‘baiduspider’) !== false){
return ‘Baiduspider’;
}
if (strpos($useragent, ‘sohu-search’) !== false){
return ‘Sohubot’;
}
if (strpos($useragent, ‘lycos’) !== false){
return ‘Lycos’;
}
if (strpos($useragent, ‘robozilla’) !== false){
return ‘Robozilla’;
}
return false;
}
function nowtime(){
date_default_timezone_set(‘Asia/Shanghai’);
$date=date(“Y-m-d.G:i:s”);
return $date;
}
$searchbot = get_naps_bot();
if ($searchbot) {
$tlc_thispage = addslashes($_SERVER[‘HTTP_USER_AGENT’]);
$url=$_SERVER[‘HTTP_REFERER’];
$file=“robotslogs.txt”;
$time=nowtime();
$data=fopen($file,“a”);
$PR=“$_SERVER[REQUEST_URI]”;
fwrite($data,“Time:$time robot:$searchbot URL:$tlc_thispagen page:$PRrn”);
fclose($data);
}

创建robotslogs.txt文件在网站根目录下创建 robotslogs.txt 文件可写权限，最好是：777或755权限!

在完成上面的步骤之后，查看蜘蛛日志访问域名+robots.txt即可！https://域名/robots.txt，例:https://www.chichizixun.com/robots.txt.

版权声明：本站部分文章来源或改编自互联网及其他公众平台，主要目的在于分享信息，版权归原作者所有，内容仅供读者参考，如本站内容侵犯了您的权益请联系我们，邮箱：1511977125@qq.com 我们核实后会及时处理，发布内容不代表痴痴资讯网立场，本文标题：WordPress纯代码实现搜索引擎蜘蛛爬行记录本文链接：https://www.chichizixun.com/1744.html

搜索引擎网站建设

痴痴资讯网管理员

0

iphonex无限重启是什么原因 iphonex无限重启解决方法

上一篇 2022年6月14日 am10:13

win11系统剪贴板可以跨设备同步吗？怎么实现

下一篇 2022年6月14日 pm5:30