介绍
本篇文章给大家分享的是有关使用php怎么获取蜘蛛爬过的痕迹,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
<强>示例代码强>
& lt; php ?//获取蜘蛛爬虫名或防采集 function isSpider () { 时间=美元才能bots 阵列( ,,,,,,,,,& # 39;谷歌# 39;,,=祝辞,& # 39;广告# 39; ,,,,,,,,,& # 39;百度# 39;,,,,=祝辞,& # 39;baiduspider& # 39; ,,,,,,,,,& # 39;雅虎,,,,,=祝辞,& # 39;yahoo 把# 39; ,,,,,,,,,& # 39;李玖哲# 39;,,,,=祝辞,& # 39;sosospider& # 39; ,,,,,,,,,& # 39;msn # 39;,,,,=祝辞,& # 39;msnbot& # 39; ,,,,,,,,,& # 39;altavista # 39;,,=祝辞,& # 39;scooter & # 39; ,,,,,,,,,& # 39;搜狗# 39;,,,,=祝辞,& # 39;sogou 蜘蛛# 39; ,,,,,,,,,& # 39;Yodao& # 39;,,,,=祝辞,& # 39;yodaobot& # 39; ,,,,,); 时间=美元才能userAgent 函数($ _SERVER [& # 39; HTTP_USER_AGENT& # 39;]); foreach 才能;(bots 美元;as k 美元;=祝辞,美元v) { ,,,if (strstr (v, userAgent美元)){ ,,,,,return $ k; ,,,,,休息; ,,,} ,,} return 才能;假; },//获取哪种蜘蛛爬虫后保存蜘蛛痕迹。//根据采集时HTTP_USER_AGENT是否为空来防止采集//抓蜘蛛爬虫 美元spi ,=, isSpider (); 如果美元(spi) { 美元才能tlc_thispage ,=, addslashes ($ _SERVER [& # 39; HTTP_USER_AGENT& # 39;]); file 美元才能,,,,,,=,& # 39;robot.txt& # 39;; time 美元才能,,,,,,=,日期(& # 39;Y-m-d H:我:& # 39;,mktime ()); handle 美元才能,,,,,,=,fopen(文件,美元& # 39;a + & # 39;); PR 美元才能,,,,,,,,=,$ _SERVER [& # 39; REQUEST_URI& # 39;]; 写入文件才能(手柄,美元,“时间:{$时间},机器人:{$ spi},代理:{$ tlc_thispage}, URL:{$公关},\ n \ r"); 文件关闭才能(处理); } ?在
以上就是使用php怎么获取蜘蛛爬过的痕迹,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。