隐藏

快照只更新网站首页 而内页不收录原因

发布:2014/5/15 15:52:21作者:管理员 来源:本站 浏览次数:1984

快照只更新网站首页 而内页不收录原因时间:
分析 网站首页天天快照,而网站内页打死不快照,两个多月了! 昨天在论坛里面看到有个朋友在那里提问、正好我看了这个贴子,这种问题以前“小向”自己也碰到过,就是不收入你的内页、当时我的还只是一个目录不收录,而这位朋友的是整站都不收录!
春节的时候我的站做的是低碳,做到3月份 感觉没IP就换了程序关键词,下了个dedecms就开始做新闻类的站,开始更新文章,那时候发一篇文章,半小时就收录,收录率7成以上,因为那时候我不懂dede所以帐号被人盗走,开始百度收录我500文章,3月9日上网一看,一夜之间全部删除了,结果有没做了,再下个dedecms准备做非主流图片,我每天更新文章,百度开始收录首页,我很高兴,我 想过段时间应该会收录内页的,苦等我快2个月,内页一直不收录!快照正常,网站健康,网站结构内容都问题,大家帮忙分析下 谢谢!
当时,应该只是关注下没有怎么仔细想,就回了下他的贴子!
因为你你自己在这个站,没有换域名,只是换了程序、那么在这之前、你的网站一定是有收录的,而且也有排名,虽然排名很不好,不管你是只只收录了首页还是其它,就证明了你的网站有蜘蛛来过,被百度程序索引过!
那么现在你的网站在没有任何防范的情况下就换了整站的权重,别说你的网站只是个新站,就算你是老站,你搞个这么大的动静,难道百度会坐视不理,首先降权是肯定的!
你现在能做的就有: 1,检查你的程序有没有出错 2,检查Robost文件有没有禁止 3,查看日志IIS日志! 是否有蜘蛛记录
匆匆回答了他的问题后,昨天晚上这位发贴的朋友不知道怎么找到我的Q,加了我为好友! 让我帮我解决下现在这个办法、(新的不能在新手),今天小向把自己的分析过程发布下,好让大家以后遇到同样的问题,也可以独立自己处理好!
1、网站主页收录正常,说明你的主页已经被索引到百度数据库中
2、网站页主页快照正常,说明主页程序蜘蛛可以抓取的正常
从以上2条,我们可以说明,
1)、网站域名、网站服务器是正常!
2)、网站被收录了,一定有蜘蛛爬取过
那什么样的情况会导致网站主页快照正常,内页2个月都没有快照了! 我们也知道对于网站内页来说除了知名网站,很多中小企业网站,内页更新都很慢(由其是企业站一个月更新一次是正常).对于每天都更新内容的朋友来说,如果2个月都不快照你的内页、可以说明网站有一定问题!
影响网站快照不更新的原因只有两个!(可能小向只知道这两个大因素)高手有其它意见可以提出
1、网站程序或服务器阻止了搜索引擎抓取内页
2、网站内页内容从不更新或全是重复垃圾内容
至于从这2点中我们又可以细分为很多小细节,但是有一点共同之处,如果符合这两点,那么不止你的网站内容不会更新,甚至就算你网站有蜘蛛来爬取,如果是被服务器禁止、被网站程序屏蔽或网站大量重复内容. 你说搜索引擎怎么来抓取或收录你网站.
那么如果来找出网站的病根了、
一、网站程序或服务器阻止了搜索引擎抓取内页
1、检查网站程序是否出错
(可以用模拟搜索引擎来抓取试试)
1)、[蜘蛛爬取特性分析工具_WinHTTrack HTTrack]
2)、[蜘蛛抓取工具分析_Lynx 在线版以及浏览器插件]
3)、[Xenu Link Sleuth (死链接检查工具)]
4)、 [引擎爬取与引擎抓取工具_Google管理工具]
这些可以帮我解决,网站死链接,模拟蜘蛛爬取等等!
2、网站Robost.txt文件是否书写正确、可参考:[Robost.txt-SEO细节操作]
3、网站目录权限是否设置正确、如:R-W-X 的设置
检查好了网站程序、空间目录后,确定没有出现任何问题后,我们接下来的就要了解IIS日志了(当然,如果你是高手,你可以直接了解IIS日志、从中得到是否真是程序有问题).
如果你不懂IIS日志:
1、首先把服务器中的IIS日志下载到本地进么分析
2、了解各大搜索引擎蜘蛛名称[搜索引擎(蜘蛛)Robot]
3、了解网站IIS日志代码含义[网站IIS日志爬行状态码]
最后分析得出,搜索引擎蜘蛛有没有爬取过你的网站,(如果有,只否只爬取了主页,更本没有爬过内页,还是说在爬取内页中出错)
1、 如果日志中根本没有爬取过内页、那么何来收录与快照
2、如果爬取过内页、但是返回“状态码”错误,我们就可以根据错误“状态码”来找出答应!