主要打击如下四类恶劣采集:
1、大量采集其他站点和搬运内容,数据未经清洗排版杂乱,无可读性,明显采集痕迹,无价值页面:
内容出现HTML代码,以及错乱排版。内容没有任何可读性的采集网站。
2.文章中出现各种拼接内容,无可读性和逻辑。无法解决用户的需求,阅读性极其差。
3.网站中内容大量采集,自身则无任何生产内容的纯采集站点。
4.站点内存在大量与本站主题不相干内容,领域专注非常差,利用热点蹭流量。例如科技类型网站采集新闻、八卦热点。
看来这次百度推出飓风算法2.0,总算可以严厉打击下采集站了。
地址:https://ziyuan.baidu.com/wiki/2585
关键字词: