顾名思义,网页相似度就是两个或以上的网页差不多的程度。当然我们知道网页和网站内容不只包括文字和图片,还包括网站的结构以及CSS等因素。如果两个网站都是相似的。我相信大家也会不喜欢看吧?搜索引擎也一样,它会认为这个网站是垃圾网站。一般来说,超过6成的相似度就会认为整站抄袭,可见,这个值还是很大的。一般的网站都不会被认为网站相似。
网站相似度太高会导致网站的权重以及收录方面的问题。
网页相似度的计算方式是什么:
A.如果多个网页摘要的md5值一样,证明这些网页有很高的相似性
B.根据网页出现关键词,按照词频排序,可以取N 个词频高的,如果md5值一样,也代表可能相似
降低网页相似度的方法
1.将一样的部分放进JS里面
因为JS不会被搜索引擎认为是很有用的代码,所以你可以将相似的页面放进JS里面,对于百度来说,JS都是不可见的。
2.使用Iframe
这个就不用说了吧。把相似的嵌套进一个页面就行了。
3.放入图片或者FLASH
可以将相似的页面内容放进这些里面,哪怕是相似的,你也不用担心。
4.增加原创的内容
原创的内容不用担心和别的内容相似的。在和搜索引擎打交道的时候,是最合他们口味的。
如果整站抄袭别人的网站,有可能被认为相似度高的。还有就是网站内页也不要过于相似,会直接导致网站的收录页面减少。这些都是网站设计过程中要注意的地方。
注:转载本文请注明出处http://www.ocean-ad.cn澳煦互动