俊哥学seo第一节:被动抓取干预
大家好,我是俊哥!今天是我学习seo的第一天,由于本人理解能力较差,所以我准备把学到的知识点当日记的形式记录下来,在以后的日子里,我会每天坚持在知乎上更新一篇学到的seo知识点,一方面是深度加强学习,一方面是想与同在做seo的同学们共同学习进步。今天的话先更新第一个知识点:被动抓取干预,主要涉及到百度蜘蛛和百度索引两个知识点。
百度蜘蛛:是百度搜索引擎的一个自动程序,又名百度爬虫。可以分为高权重蜘蛛,低权重蜘蛛,降权蜘蛛,内页蜘蛛,网页内容蜘蛛,网页内容蜘蛛,图片收集蜘蛛模拟,真实浏览器反作弊爬虫(含js)
百度索引:是百度蜘蛛抓取网站的页面数;收录率=收录量/爬取数量;作为站长,完美要定期进行web日志检查,计算收录率;当收录率非常低时,需要增加内容质量和外链。
如何识别真假蜘蛛?
通过DNS反查!!!
1、linux平台
使用host ip命令反解ip来判断。
Baiduspider的hostname以 *. http://baidu.com 或 *. http://baidu.jp 的格式命名,非 *. http://baidu.com 或 *. http://baidu.jp 即为冒充。
2、windows平台或IBM OS/2平台
使用nslookup ip命令反解ip来判断。
打开命令处理器,输入nslookup+IP地址就能解析ip。
Baiduspider的hostname以*. http://baidu.com 或*. http://baidu.jp 的格式命名,非 *. http://baidu.com 或 *. http://baidu.jp 即为冒充。
3、mac os平台
使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。
打开命令处理器 输入dig+IP地址就能解析ip
Baiduspider的hostname以 *. http://baidu.com 或*. http://baidu.jp 的格式命名,非 *. http://baidu.com 或 *. http://baidu.jp 即为冒充。
如何引导蜘蛛抓取新页面?
1、制作更新列表网页并在放置所有页面底部;
2、在内容页面放置专门的列表,跟随爬虫访问放出新链接;
3、在一些高权重站留下外链,增加链接的发现机率;
4、持续输出优质内容,增加收录和搜索的曝光率;
5、网站使用独立IP地址,子域名过多会分流蜘蛛;
6、保持内容的更新频度,不要操之过急;
7、保证网页的打开速度,最好有CDN加速。
如何让蜘蛛更喜欢你?
1、给蜘蛛特殊稳定优质线路确保稳定可用;
2、不给蜘蛛冗余的HTML;
3、屏蔽时占率过少的搜索引擎,留取个更多资源给好的引擎;
4、蜘蛛喜欢经常更新站点,得经常保持更新;
5、蜘蛛喜欢原创内容,如果不会,也可尽量做伪原创。
6、不要过度优化网站,更不要取碰“黑帽”。
2022/4/19 ,天气晴,俊哥写于重庆市!