SEO超初心者のための
5分で理解するGoogleアルゴリズムへのアプローチ
『 Google人気の秘密 』は、google自身が正式にWEB上で公開しているドキュメントです。
その内容の一部を抜粋すると
つまりGoogleの検索結果として表示されるためには、まずGoogleのデーターベースにインデックスされる必要があること、表示順位を決めるアルゴリズムにはテキストマッチとページランクの2つが重要である事がわかります。
検索対象のドキュメントのテキストと、検索キーである「キーワード」のテキストが一致することをテキストマッチと言います。
googleの検索ロボットは、対象ページ内のテキスト上にキーワードが出現する際に、目的キーワードとの関連の高さを様々な要素で評価しています。
例えば対象ドキュメントに「牛丼」というキーワードが出現することで、そのウェブページが、何らかの形で「牛丼」に関連のあるウェブページであることを認識しています。
さらに本文中に「牛丼」というキーワードが複数回出現する場合、それが「牛丼」について、より詳細に述べられているドキュメントである可能性が高いと考えます。(出現頻度)
またキーワードの出現位置によっても関連度の重み付けを行っています。例えば「表題部分」や「見出し」、もしくは本文の最初に、「牛丼」という「キーワード」が出現するウェブページは、「牛丼」についてより詳しく述べられている文書である可能性が高いと考えます。(出現位置)
しかしながら「牛丼は美味しい」という一文だけしか書かれていないドキュメントや、キーワードの扱われ方が明らかに不自然なドキュメント(同一キーワードの連呼等)は、おそらくユーザーにとって利用価値は低いものと考え、低く(あるいはマイナス)に評価している場合もあります。
さらにgoogleは、ページの重要度を外部からのリンクによって評価しています。
多くのウェブページからリンクされているウェブページは質が高い
そのような質の高い(多数の被リンクがある)ページから、リンクを受けているウェブページは、さらに質が高いと判断します。 つまりページランクの高いページから、多数の被リンクがあるウェブページ程、googleに良質のウェブページと判断されて、高いページランクが与えられます。
googleツールバーをインストールすることで、具体的なページランクの数値を知ることができます。
日本語版のgoogleツールバーは、ページランクをグラフで表示する機能しかありません。ページランクの具体的な数値を知りたい場合は、英語版を利用する必要があります。
さらにgoogleには、アンカーテキストマッチという被リンク要素があります。
アンカーテキストとは、リンクされる際に使用されるテキストを指します。ソースでは<a>ホニャララ</a> のホニャララの部分のテキストを指します。
これは例えば、「牛丼」というアンカーテキストでリンクされている場合、そのリンク先のウェブページの内容は、「牛丼」と関連が強いという考え方です。有名な例になりますが、「exit」や「18歳未満」というキーワードの例があります。
googleで「exit」や「18歳未満」というキーワードで検索した場合、一位で表示されるのは、ヤフーです。しかし、ヤフーのトップページには「exit」や「18歳未満」というテキストはありません。
それでは何故これらのキーワードで検索が行われた際にヤフーが一番にピックアップされるのでしょうか?
その答えがアンカーテキストマッチです。アダルトサイト等、来訪者に年齢制限を設けているサイトの多くは、入場資格を有していない来訪者には、出口のためのリンク先として「exit」や「18歳未満」というアンカーテキストを用いてヤフーへのリンクを設けています。その結果googleのアルゴリズムは、「exit」や「18歳未満」というキーワードと、リンク先であるヤフーの関連付けを考慮し、最も関連の強いウェブページとしてヤフーを選んだという結論になります。
これは多数のウェブページから「○○株式会社」というアンカーテキストでリンクされているウェブページは、「○○株式会社のウェブページそのもの」である可能性が非常に高いという考え方によるものです。
このアンカーテキストマッチというアルゴリズムの導入の結果、検索エンジンgoogleはユーザーにとってさらに利用しやすいものになったと言えるでしょう。