什么是恶意镜像网站?

镜像网站指的是和你的网站基本一样、并且实时同步的其它网站。就像照镜子一样,所以名为镜像。重庆SEO就在这里给大家简要分析下:

有的镜像网站是没有恶意的,很可能是你自己设置的,为了方便用户能从多个域名访问网站,被封了一个,还有其它的域名。

有的镜像,也就是这里讨论的镜像,是不怀好意的,通常是别人设置的,要么为了负面SEO你的网站,要么为了利用你的内容获得排名,然后把用户转向到敏感、非法内容网站上去。

网上有的文章把采集和镜像混在一起。虽然表现形式差不多,但严格来说,采集和镜像实现方法、表现形式是有区别的。

采集的网站一般是提前抓取别人网站的内容,放入自己数据库,再用程序调用到页面上。被采集网站有新内容时,采集网站并不能实时同步更新,要再采集之后才能出现。一旦被采集,内容已经在对方数据库里了,从技术上是无法阻止采集网站显示这些内容的。这篇帖子说的不是这种。

镜像网站并不事先抓取内容,而是有人访问网站时,实时从被镜像的网站调取内容,做些处理(替换URL、文字,加文字、加JS等),然后实时显示。被镜像的网站有任何更新,镜像网站是实时同步的。

网上有卖用于镜像网站的小偷程序的。小偷程序通常也可以用来做采集。为了不给他们做宣传,就不提名字了。从他们的官网摘取几条程序功能,有助于理解后面的内容:

全自动分析,内外链接自动转换、图片地址、css、js,自动分析CSS内的图片

内置强大替换和过滤功能,标签过滤、站内外过滤、字符串替换、等等

伪原创,近义词替换有利于seo

增加URL路由,实现全站URL变换,个性化本站URL地址

超级模板增加移动模板、自定义栏目功能

增加自动获取301、302重定向的采集,解决跳WWW,跳https采集

代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自定义cookie,以便应对防采集措施。

 

Comments are closed.