首页站长学院技术分享正文

实现搜索引擎爬行记录的PHP代码

汇站技术分享

2024-01-25 0 1,040

前言：

之前分享过类似的代码，但是没有进行注释，并且部分代码有冗余，所以重新分享一下。以下是完整的代码：

// 记录搜索引擎爬行记录$searchbot = get_naps_bot();


if ($searchbot) 
{ $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); //首先读取 UA 并小写处理
$url = $_SERVER['HTTP_REFERER']; //输出 URL
$file = WEB_PATH.'robotslogs.txt'; //这里设置蜘蛛记录文件的路径及文件名
$date = date('Y-m-d H:i:s'); //输出时间
$data = fopen($file,'a'); //调用文本
fwrite($data,"Time:$date robot:$searchbot URL:$tlc_thispage/r/n");  //这里进行蜘蛛输出
fclose($data);
}

WEB_PATH 是 index.php 中定义的根目录路径，即 robotslogs.txt 文件位于根目录下。

使用 get_naps_bot()函数获取蜘蛛爬行记录，并使用 addslashes()函数对数据进行处理，将结果存储在变量$tlc_thispage 中。

使用 fopen()函数打开 robotslogs.txt 文件，使用 fwrite()函数将数据写入文件，最后使用 fclose()函数关闭文件。


<?php 
/**
* 获取搜索引擎爬行记录
* edit by https://www.huizhanii.com/34497.html
*/
function get_naps_bot() 
{ 
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']); 
if (strpos($useragent, 'googlebot') !== false){ 
return 'Google'; 
} 
if (strpos($useragent, 'baiduspider') !== false){ 
return 'Baidu'; 
} 
if (strpos($useragent, 'msnbot') !== false){ 
return 'Bing'; 
} 
if (strpos($useragent, 'slurp') !== false){ 
return 'Yahoo'; 
} 
if (strpos($useragent, 'sosospider') !== false){ 
return 'Soso'; 
} 
if (strpos($useragent, 'sogou spider') !== false){ 
return 'Sogou'; 
} 
if (strpos($useragent, 'yodaobot') !== false){ 
return 'Yodao'; 
} 
return false; 
} 
function nowtime(){ 
$date=date("Y-m-d.G:i:s"); 
return $date; 
} 
$searchbot = get_naps_bot(); 
if ($searchbot) { 
$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); 
$url=$_SERVER['HTTP_REFERER']; 
$file="www.jb51.net.txt"; 
$time=nowtime(); 
$data=fopen($file,"a"); 
fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n"); 
fclose($data); 
} 
?>

结语：

以上所述是汇站给大家介绍的 php 记录搜索引擎爬行记录，希望对大家有所帮助，如果大家有任何疑问请在文章下方留言，看到会及时回复大家的。

本文章已结束，如转载请注明：汇站网 » 实现搜索引擎爬行记录的 PHP 代码

赏

微信扫一扫

支付宝扫一扫

免责声明

1 网站名称：汇站网

2 永久网址：https://www.huizhanii.com

3 本站资源来源于网友投稿和付费购买，仅供编程人员及源代码爱好者下载参考与研究，不提供任何技术支持服务！

4 资源展示图片及相关信息仅供参考，不代表本站立场！本站仅作为信息存储平台

5 禁止在服务器和虚拟机上搭建运营，所有资源仅限本地调试与研究使用，不支持联网运行！

6 未经版权方授权，严禁用于商业用途。使用者如违反国家法律法规，需自行承担全部法律责任！

7 请在下载后24小时内删除！建议支持正版授权作品

8 如资源侵犯您的合法权益，请提供版权证明及相关作品信息发送至邮箱：972908224@qq.com我们将及时处理

9 如遇下载链接失效或支付未到账，请联系站长处理

10 欢迎投稿优质源码或教程，审核通过后将获得相应奖励

11 资源收费仅用于维持网站正常运营

12 数字商品具有特殊性质，一经购买概不退款

13 查看更多详情

html return 函数变量搜索引擎汇站汇站网

站长资源下载中心-找源码上汇站

上一篇：通过使用宝塔面板通过，可以简单地对MySQL性能使用宝塔进行调优

下一篇：增强宝塔Nginx免费防火墙的功能添加User-Agent屏蔽规则

常见问题

如何下载？

如果付款后没有弹出下载页面，多刷新几下，有问题联系客服！

免费下载或者VIP会员专享资源能否直接商用？

本站所有资源版权均属于原作者所有，这里所提供资源均只能用于参考学习用，请勿直接商用。若由于商用引起版权纠纷，一切责任均由使用者承担。

相关文章

WordPress网站安全防护：利用Nginx规则屏蔽核心PHP文件

WordPress网站安全防护：利用Nginx规则屏蔽核心PHP文件

6个月前 451

利用Shell 脚本实时检测Linux MySQL运行状态异常自动重启

利用Shell 脚本实时检测Linux MySQL运行状态异常自动重启

6个月前 1,646

利用Shell 脚本实时检测Linux Nginx运行状态异常自动重启

利用Shell 脚本实时检测Linux Nginx运行状态异常自动重启

6个月前 1,378

Nginx实现MySQL负载均衡（提升网站性能大法）

Nginx实现MySQL负载均衡（提升网站性能大法）

6个月前 774

猜你喜欢

WordPress网站安全防护：利用Nginx规则屏蔽核心PHP文件 2024-10-25
利用Shell 脚本实时检测Linux MySQL运行状态异常自动重启 2024-10-24
利用Shell 脚本实时检测Linux Nginx运行状态异常自动重启 2024-10-24
Nginx实现MySQL负载均衡（提升网站性能大法） 2024-10-22
利用宝塔面板Nginx开启Brotli压缩给网站加载速度教程 2024-10-18
利用Nginx防止XSS 攻击、SQL 注入实践配置方法 2024-10-14
利用Nginx屏蔽电脑端+屏蔽蜘蛛+屏蔽微信,QQ等方法 2024-10-04
宝塔面板实现秒级监控定时访问教程 2024-10-04
一键脚本自动清除宝塔面板所有计划任务日志 2024-10-04
PHP过滤XSS攻击利用WAF.PHP进行防护（教程） 2024-10-03

发表评论

暂无评论

联系官方客服

为您解决烦忧 - 24小时在线专业服务

联系官方客服在线提交工单

如遇问题，请联系客服咨询售前客服咨询售后客服 &site=qq&menu=yes" target="_blank">汇站交流群
联系客服请注明来意欢迎光临汇站网
微信公众号
汇站网
返回顶部