设为首页 | 收藏本站 | 汇款方式 | 客户登录
       广州网站建设服务热线
网站首页>>营销学堂 >>网站优化知识

SEO优化公司详解下收录和索引的关系及区别,收录和索引下降原因及解决方案

本文来源: SEO优化公司  发布者: SEO优化公司  点击: 3347  加入时间:2016-4-7 11:24:41

 SEO优化公司详解下收录和索引的关系及区别,收录和索引下降原因及解决方案

 
网站要从搜索引擎过来流量,简单的说需要几个步骤:抓取、索引、收录、排名、点击。很多站长都知道索引跟收录不同,索引量一般会大于收录量,但是具体到里面的一些细节,可能不是很清楚。 SEO优化公司下面用一些具体的情况,来说说收录和索引的区别。
 
1,收录和索引分别指什么
  收录:页面被Baiduspider发现、分析过
  索引:Baiduspider经初步分析后认为有意义,做建库处理
2, 收录和索引的关系
  包含关系,先收录才可以建索引,收录量大于索引量。百度站长平台链接提交工具是通往收录的大门。
3, 收录和索引的意义
  【收录意义1】收录是索引的前提,站点需要保持服务器稳定(参考抓取诊断工具、抓取异常工具)、robots正确(《robots写法和需求用法对应表》),为Baiduspider抓取铺平道路
  【收录意义2】Baiduspider只能处理已分析过的页面,面对新旧页301和移动适配,可为已收录页面完成权值评分以及流量切换
  【索引意义1】只有被建入索引库的网页才有获得流量的机会(网页虽然被建入索引库,但获得流量的机会并不同,无效索引很难获得流量)
  【索引意义2】新闻源站点(新闻源目录)内的链接,必须先被网页库建索引,才有机会出现在新闻检索中
4, 如何查询收录量和索引量
  目前百度未提供查询收录的工具,任何第三方提供的所谓收录查询都是不靠谱儿的。站长可以通过LOG日志分析估算收录,注意真假Baiduspider(《如何识别百度蜘蛛》)
  真实索引量只能通过百度站长平台索引量工具查询
 
5、索引量多于收录量
 
  一般来说,索引量数据大于收录数据,特别是对于新站来说,刚开始面临一个审核周期,索引数据不断增加,而收录很难增长,这需要一些时间,不过当索引量高于收录很多的时候,就要注意了,应该是文章内容的问题,这时SEO优化公司应该增加原创文章的更新,尽量减少转载,特别是一些低质量内容的转载。
 
6、索引量少于收录量
 
  也有不少情况是索引量少于收录量的,这个有可能是数据的不准确造成的,也有可能就是索引的页面放出情况良好,对应了多个快照页面,造成收录高于索引,要注意的是这两个数据应该相差不会太多,相差太大的话一般都是网站出现了问题,有人可能会说我的网站索引量和收录量完全一致,是不是就不存在问题,其实,收录数据(Site命令)是实时变动的,也不是非常准确,如果索引量和收录量完全一致的话,我只能说是巧合。
 
  索引量和收录数据能够在一定程度上反映出蜘蛛对网站喜好和信任程度, SEO优化公司单纯的看这两个数据还是不够的,还要结合网站的页面数量,快照的更新时间以及网页的收录时间等,通过综合的数据表现,发现网站潜在的问题,评估工作内容的效果和下一步工作重点。
 
 
网站收录减少的原因及解决方案
 
一、网站自身问题:
 
1、文章质量: SEO优化公司站点收录从50多一下下降到10几条,当时第一感觉就是这个网站文章质量存在问题,然后 SEO优化公司排除了其他原因后,在检查了日志等,就断定是因为这个文章质量的原因才造成的,在后期我就改善了文章质量,虽然每天还是一篇,但是这个网站在经过一个星期的调整后,收录慢慢恢复,并且在不断增加中。大家都知道采集,在3年前,采集文章不作任何更改,这样的文章搜索引擎也喜欢,在2年前,要适当伪原创一下,但是在现在一般的伪原创,搜索引擎都能识别出来。一些站点在刚开始的时候培养出了一定的权重,在后期就到处转载,这些转载的文章页是秒收,但是后期搜索引擎发现这些站点到处是些没用的东西,势必会给你的站点降权甚至直接K掉。这样的例子比比皆是, SEO优化公司相信做站比较多的会遇到。
 
2、网站被黑:做站长的最蛋疼的时间莫过于主机不稳定和网站被黑,而 SEO优化公司做过的一些网站被黑的情况也非常多,而且有时候根本是无处可防,因为有的可能是通过服务器其他站点旁注的,遇见这样蛋疼的事情,只有通过FTP一个文件一个文件的查看修改时间来确定哪个文件被改了。而因为网站被黑导致收录减少的情况也时有发生,如果是直接改掉程序代码的话,搜索引擎只能认为你是一个新面孔了,只有重新对你考核,而如果是加上什么黑链的话,影响也不是非常大(我通过大量实验来看的,这里还是有必要说下,一些网上的理论文章只针对笔者的文章,而不适应其他网站,对于网站排名这个东西,是通过大部分的因素来的,看见一些人说网站被挂黑链,排名倒退什么的,我无语了)当然,还是有影响的,对于网站有坏处的,我们都要斩断,有好处的,都要去发挥!
 
3、空间不稳定:在前面选择虚拟主机这篇文章中应该有说过,一个好的虚拟主机对于一个网站就是一个好的基础,而虚拟主机的不稳定,将直接导致这个网站的排名和收录等情况,蜘蛛爬虫程序到我们的网站来索引的时候就相当于一个普通的访客,如果蜘蛛来了网站也打不开,来几次都不能顺利打开,它就以为你网站关闭了,减少来你网站爬寻的频率,最终将导致网站的排名和收录持续下降。
 
4、使用作弊手法:正正经经规规矩矩的做网站,咱们就不用怕搜索引擎K我们的站,这句话是我现在时常挂在嘴边的,就算之前SEO排名首页直接降权,我也只是想想就不过分气恼了,虽然我没使用作弊的手法,但是很多站点都是这个情况被降权,那我也就算了。很多人对于作弊都很喜欢,觉得网站排名节节攀升,收录狂飙,其实我想说的是不是你聪明而是你暂时没触发到搜索引擎的相关机制,不是不报,是时候未到,时候一到,你的站马上杀掉!而使用作弊手法能在短期内使收录大幅上升,而搜素引擎发现你使用了非常规手法后,会对你的文章进行重新审判,直到降低你的收录量来对您惩罚。
 
5、网站改版:网站改版,路径更改,模板替换,主题变了等等都会造成收录减少,相信改版的童鞋都有这样的体会哈。
 
二、外部原因:
 
 
1、搜索引擎调整:每次百度更新,都有人发现外链增加、外链减少、收录增加、收录减少,比如11月12日写的百度收录增加,对于这样的情况,我不想过多写什么,站长们,别自己折腾自己,百度爱怎么折腾是他们的事情,我们只要我们的排名就行了!
 
2、新站效应:很多新站做出来并且让搜索引擎找到后,搜索引擎一般都会收录,但是文章内容先不放出来,而在这个过程会考核一下,行的话,放出来了,但是紧接着文章收录数量可能会锐减,而且这样的情况现在是愈演愈烈,可能是搜索引擎对于您站点的一个警示吧,发生这样的情况,我们一般要提高网站权重,要慢慢培养,网站的排名非一朝一夕啊,培养了权重什么都好办。
 
这篇文章主要是针对百度来说的,其实搜索引擎是算法大体都一样,但是很多细节又不一样,这个大家自己去发现!找到了原因,大家也就知道收录减少了我们该怎么应对,有矛必有盾,好好发挥你的盾吧!
 
 
网站索引减少的原因及解决方案
 
1、内容数据所在的网址url未规范统一
【自己站点url规范统一】
多域名都可以200状态正常访问网页内容;一域名下出现多种url形式可以访问相同内容,如大小写url、url规则变更等。
解决:选择主域名(或主url),其他域名下的所有url都301重定向到主域名(或主url),并站长工具提交域名改版(或目录url改版)
【外部平台使用己站数据】
A、市场合作,站点数据调用到其他平台上;内容主动外发,推广人员完整转发自有内容到高质量平台——这两个原因都有可能导致搜索引擎收录了外部平台的内容而拒绝了原网站内容
解决:使用站长平台链接提交工具的主动推送功能,及时提交网站新出现的链接,延迟将内容调用到其他平台的时间;
B、被镜像,用户通过其他举办主体的域名或url直接可访问己方内容。
解决:关注域名解析安全和服务器安全;绑定唯一可解析的域名或唯一可访问的url;页面内容中链接使用绝对地址
2、站点受青睐度下降
【网页内容相关】
A、内容质量度下降
解决:提高内容质量度,详见百度站长学院相关内容;杜绝简单拷贝,多做整合信息。
B、更新量及频率下降
解决:稳定的更新频率,视内容发展情况,扩充编辑团队,生产更多新内容,让网站索引避免下降,持续增加。(当更新量及频率下降明显,那么配额就会下降,首先表现抓取频次下降,导致索引量下降)
C、时效性信息消失
解决:时效性的信息,大部分一般在数据库不会长期保留,所以需要持续挖掘新的时效信息点,整合相关内容。
D、部分区域出现不良信息
解决:杜绝大量外链软文、恶劣弹窗广告、非法敏感类信息、专门针对搜索引擎作弊的内容等
【触犯惩罚算法】
解决:关注站长工具消息和百度网页搜索动态。按官方公告说明来整改站点,并进行反馈,然后等待算法更新。
【特型url不被信任】
解决:定制各类url的索引查询规则;定位索引量下降的特型url;排查该类url当日、前一日、本周、历史索引情况;找出未被入库的数据可能存在的问题;处理完后,增强该类url与百度数据沟通(途径有sitemap、批量提交url、数据推送等)。
【站点被搜索引擎信任度下降】
A、非法投票嫌疑(链接工厂等)
解决:珍惜自己页面的投票权,对于劣质网页坚决不投票,尽量减少站点的导出链接。
B、主题变动(如从教育领域跨入医疗领域)
解决:将旧领域的网页进行死链处理后向百度进行提交,封禁相关旧url的被访问权,然后再上线新主题相关内容,加强对百度的数据提交
C、受牵连
相同ip下非法站点偏多,同一域名所有人举办的网站大都被惩罚且情况恶劣等
解决:离开恶邻,获取搜索引擎的各产品的相关反馈方式,请求给予解禁,等待恢复正常索引。
D、政策性原因
如香港主机、国外主机站点由于各种你懂的原因,稳定性可能较差
解决:国内主机备案,合法符合政策经营
3、网页模板相关
【主体内容区域对蜘蛛的限制】
解决:取消登陆查看信息等限制,让蜘蛛便捷畅快的“采集”到己站数据
【启用了对蜘蛛不友好的技术】
解决:对需要蜘蛛识别的内容,不要启用对蜘蛛不友好的技术来调用。
【响应式模板干扰蜘蛛识别页面类型(pc、移动)】
解决:提交特定的url对应关系(尽量parrten级);meta标记移动版本url及适合浏览的设备;自主适配;增强pc、移动不同模板源码标签的区分度,帮助百度识别页面类型
4、源码相关
【源码错误较严重,如编码错误、标签使用错误等;源码改动严重,蜘蛛“采集”数据后重新观察分析;某类url下的TD(网页title、description)变化,如变化比例大、变化页面量大,页面进行更改后会重走建索引库流程,如果页面质量达不到建索引库标准会从线上消失】
解决:校验源码,准确的源码是蜘蛛“采集”数据进行分析的基础;link内链结构、url地址形式、页面主题、页面各区域html标记等尽量维持改动前的情况;逐步、分期更换TD(网页title、description),结合页面主题、用户实际需求来制定合理的TD,不欺骗不误导用户。
5、已入库的url对蜘蛛状态有变化
【robots声明,禁止蜘蛛抓取】
解决:查看百度站长工具robots及抓取情况。
【url规则变化,原有url无法访问】
解决:特别是linux和win服务器之间的数据迁移,可能会出现大小写url支持变化,确保各类url规则不变化。url必须重构的时候,做好旧新url301重定向,站长工具提交改版需求。
【提示错误页面】
解决:由于误删,则可以数据恢复,并维持url对应网页内容的更新变化,提高抓取频次。如果确定要删除,那么提交死链,删除死链后,再robots禁止,这种情况的索引下降无需担忧。
【被入侵】
解决:防止url对蜘蛛进行非法跳转操作;防止url对应的网页内容对蜘蛛出现内容大变化,特别是一些违法乱纪的内容
6、DNS、服务器问题
【DNS问题】
dns不稳定;dns不安全
解决:选择可靠的dns服务;沟通强调对蜘蛛的稳定性;防止dns解析到非正常ip;防止解析的网站ip频繁变动。防止dns管理漏洞,导致被恶意解析;防止dns解析挂靠在小代理等技术能力、管理规范、道德法律约束都欠缺的平台上。
【服务器问题】
A、可访问性差
解决:尽量让目标地区所有运营商来路的用户都能在3秒内打开网站,最佳1秒内;监控网站运行状态,合理设置目标地区的所有运营商监控节点及监控项目、监控频率
B、屏蔽百度ua或ip
解决:多利用百度站长工具,查看百度抓取网页的情况
C、防刷压力值设定
解决:将蜘蛛解析到专用空间;如出现访问陡增的ip,查看是否为蜘蛛再确定是否禁止访问。
三、导致百度索引量下降的常见原因——百度方原因
1、配额再分配
同类数据量接近索引分配总额,配额量再分配,有升的就会有降的
解决:超过竞品,争取高额分配。
2、数据异常错误
A、错误惩罚
应对某类作恶行为而新算法上线,但由于蝴蝶效应,导致部分站点被错误惩罚而清除大量索引。
解决:反馈百度方,请求解除惩罚。
B、地区性数据异常
部分地区数据抓取或查询异常,导致误判站点情况而清除相应索引数据或输出错误索引量,如百度dns系统升级事件。
解决:反馈百度方,由百度检查各地蜘蛛执行情况。
C、接口调用数据错误、数据丢失、数据备份衍生异常
解决:反馈百度方,由百度检查相关数据情况。
打印本页】    【关闭窗口】     【向上

公司介绍 | 新闻动态 | 联系方式 | 招聘英才 | 帮助与反馈 | 服务与支持 | 网站地图
版权所有 广州翔云网络(广告)有限公司 服务热线:020-34054519 13760861763 传真:020-34054519
地址:  广州白云区黄石东路江夏北二路(A或B地铁出口)强盛大厦B栋203  粤ICP备12072795号-14 
旗下网站:翔云网络 翔云商务网  翔云团购网 广州书生商友网