简介说明
1. 站长主动向百度搜索推送数据,可缩短爬虫发现网站链接时间,可加快爬虫抓取速度,但无法解决网站内容是否收录问题。
2. 百度搜索资源平台为站长提供链接提交通道,但不保证一定能够收录提交的链接。
3.通过程序代码方式,将根据自己需要将网站的链接提交给百度蜘蛛。
4.本程序代码是将文章的id提取出来,再和单页页面组合成新的数组,提交的时候按20条进行分割,最终提交给百度蜘蛛。
get_results($sql);foreach ($myrows as $b) {$id=$b->ID;$url=$qianzui.$id.$houzui;$ar[] = $url;}$urls = array(‘https://news.dianjiwl.com/pm’,’https://news.dianjiwl.com/cloud’,’https://news.dianjiwl.com/cloud/domains’,’https://news.dianjiwl.com/idcnews’,’https://news.dianjiwl.com/btc’,); //更改为自己的单页面
$num=array_merge_recursive($urls,$ar);$chunk_result = array_chunk($num, 20);foreach ($chunk_result as $a){$api = ‘http://data.zz.baidu.com/urls?site=https://news.dianjiwl.com//这里要替换为自己在百度官方的api地址,如何获取文章有介绍$ch = curl_init();$options = array(CURLOPT_URL => $api,CURLOPT_POST => true,CURLOPT_RETURNTRANSFER => true,CURLOPT_POSTFIELDS => implode(” “, $a),CURLOPT_HTTPHEADER => array(‘Content-Type: text/plain’),);curl_setopt_array($ch, $options);$result = curl_exec($ch);echo $result;}?>
将上述代码保存命名为push.php,上传到网站根目录,然后就可以直接访问https://你的域名地址/push.php这个页面来推送给百度蜘蛛了,可以每隔几天访问一次。
参数说明:
1、$sql语句中,limit 0,195这里是提取最近195篇文章,可以根据自己需要调整。
2、$houzui 网址后缀,有些站长可能没有用.html这种方式,比如是https://你的域名地址/1437/这种链接,那么$url=$qianzui.$id.$houzui这段就要修改为$url=$qianzui.$id
3、$urls变量是自定义需要提取的链接地址,可以根据自己需要添加,如果不需要可以删除这部分代码,删除以后后面$chunk_result = array_chunk($num, 20);就需要修改为$chunk_result = array_chunk($ar, 20);
百度蜘蛛主动推送的api获取方式如下图:
wordpress使用代码向百度蜘蛛主动推送链接
如果有什么疑问,可以联系点击网络技术客服。