搜索引擎是如何区分原创的?-seo知识

在如今的互联网上,存在着庞大而繁杂的内容、信息,大量重复的内容或者信息是不可避免的,那么搜索引擎爬虫是如何区分这这些内容的呢?换句话说,它是如何判断原创内容的呢?seo了解这些有助于我们可以做一个高质量内容的站点。下面先看一张图片:

seo-yuanchuang

从上面图中我们可以得知搜索引擎是如何判断原创内容的,以下四步

1.发现:当搜索引擎爬虫发现新的内容,他会立刻与之前收录的内容进行比较确保内容的原创性。

2.丢弃:首先,搜索引擎会放弃收录那些来自链接工厂,MFA站点(Made For Adense)和被列入黑名单的IP的页面

3.分析:这一步就是分析每个页面的入站链接,判断链接的质量和源头。

4.确定:最后就是回顾之前收录的页面和相关链接,决定哪一个页面才是绝对原创。

根据这四点我们做的工作有很多,这个是区分不同网站或者不同域名的一个判断,那么我们自己的网站内部有许多重复内容又怎么去避免呢?下回有空可以分享一下这方面的文章,希望大家继续关注叶松的博客,谢谢!



14 条评论:

  1. 可以深入的讲一下吗?

    [回复]

    小张 said on: 2010年1月29日 08:42
  2. 不错不错~ 支持下,不过没有考虑网站本身的质量吧。

    [回复]

    集团电话 said on: 2010年1月29日 09:05
  3. 好的!很有帮助!等待你的下个经验介绍

    [回复]

    门禁网 said on: 2010年1月29日 09:08
  4. 这个方面好像很复杂

    [回复]

    先看看 said on: 2010年1月29日 09:47
  5. 看来我的还不错,不过软件的描述部分很少改动,同质性很严重。

    [回复]

    LAONB said on: 2010年1月29日 10:44
  6. 不错,知道了做伪原创也很难!呵呵!

    [回复]

    雪狼子 said on: 2010年1月29日 12:20
  7. 不错不错~ 支持!

    [回复]

    hxyhbkj said on: 2010年1月29日 19:23
  8. 用谷歌搜东西,偶然搜到你的博客,觉得您的博客非常的优秀,从您的文章中可以看出您是seo高手,我看过很多seo博客,都是抄袭网上的seo文章,我一般不经常留言,不过,您的seo博客和文章令我眼前一亮,我觉得我非常有必要留言赞美您一下,您绝对是seo界数一数二的高手,我决定把您的文章都看一遍,好好学习学习。以后会经常光临您的网站的。

    [回复]

    小峰 said on: 2010年1月29日 19:58
  9. 好东东,学习了先

    [回复]

    童宝宝 said on: 2010年1月30日 00:04
  10. 好东西,学习了!

    [回复]

    hxyhbkj said on: 2010年1月30日 11:07
  11. 如果我的原创收录晚,别人转载的收录快怎么算呢?

    [回复]

    醉生梦死 said on: 2010年1月30日 21:37
  12. 这个好强大啊。。。。赶紧收藏一下

    [回复]

    聚云seo said on: 2010年3月3日 18:01
  13. [回复]

    429 said on: 2010年3月10日 04:12
  14. [回复]

    776 said on: 2010年4月18日 11:56

给我留言

我们绝对不会公开您的邮箱. 必填项*

*

*

请输入您的留言: