百度就像一个女人,她的脾气难以捉摸,今天她喜欢你喜欢的不得了,明天也许就把pass掉了。相信很多站长都会有同感,同样也会带着些许疑问,究竟什么样的网站是符合百度胃口的?百度喜欢什么样内容的网站?
如果我说,百度喜欢重视用户体验的网站,因为用户喜欢的就是百度喜欢的,那么你一定会觉得我在应付你,但这也是没有办法的事情,百度内部算法谁也不知道,小的细节调整天天在变,唯独不变是大的方向,我可以假想,如果百度与用户的意愿背道而驰会是什么结果,百度的用户是全国5亿网民,百度提供的搜索结果和网民想看到的不一致,最终就会导致用户的流失。
我们都说做人做事要将心比心,那我们将自己摆在百度的角度来看,你会如何选择?
我想,我是百度的话优先抓取的就是那些原创的质量内容,新的原创内容是前提,原创的还能保证一定质量就一定会有用户喜欢,所以百度也会喜欢。其次,如果网站内容不是纯粹的原创,内容中包含了一些引用的部分以及一些个人的见解,那这样的内容我也会喜欢,因为一定会有用户喜欢。再者,如果网站内容既不是原创,也没有什么个人见解,如果他能够为用户集中整理出一些相关性极高的内容,那我相信一定会有用户喜欢的,所以,毫无疑问,百度也会喜欢。
下面我们用数据分析的方法进一步证明上面的假想。我们都知道,百度的算法中有着许多道提取内容的工序,除去代码、除去和内容无关的文本、分词处理、近义词处理、计算关键词密度等。那么一篇新撰写的文章被百度蜘蛛检测到以后,经过这一系列处理过后,假设他是纯抄袭内容,和已存入百度数据库缓存的某篇文章相似度就会是100%。我们假设文章相似度为50%以下时百度会对内容发起兴趣,于是有的站长会将采集来的文章进行批量换词处理,但是百度的算法肯定比你简单的换近义词要高端的多,所以用这种方式得来的文章相似度预计不会低过80%。
但如果我在采集的内容中加入许多自己的想法和心得,或者将数篇内容相关联的文章进行一个有机的组合,这种方法得到的文章相似度就极有可能低于50%了。当然百度现实中对文章的处理要比这复杂的多,但他毕竟是一个程序,所以大的思路不会变。
既然以上三类内容都会符合百度的喜好,在网站优化的过程中,如果没有精力撰写足够的原创内容,我们就可以用二、三类内容来补充。但最关键的还是要保证文章的质量,用户喜欢的,百度才会喜欢。
注:转载本文请注明出处http://www.ocean-ad.cn澳煦互动