検索エンジンの仕組みを初心者にもわかりやすく解説【SEO上位表示のコツ】

ブログのアクセスの大半は検索からの流入です。

訪問者を増やすには、SEO対策をしっかり行って、検索された際に上位(10位以内)に表示されるようにすることが必要です。

Googleがウェブページの順位を決めるまでには、以下のプロセスで行われています。

  1. クロール
  2. インデックス
  3. ランキング

上記のステップごとに対策を行って、上位に表示されやすくしましょう。

このページの内容(目次)

検索エンジンが順位を決めるのは大きく3工程

検索エンジンが順位を決定するまでには以下の3つの工程を踏んでいます。

  1. ページを見つける(クロール)
  2. ページをデータベースに登録する(インデックス)
  3. ページの順位を決める(ランキング)

それぞれのプロセスについて、運営者側で注意することやできることもあるので詳しく解説していきます。

クロール:データを見つける

Googleがページを発見する方法は以下のように記載されています。

クロールのプロセスは、過去のクロールから得られたウェブアドレスとウェブサイトの所有者から提供されたサイトマップで構成されるリストから始まります。

Google「検索が情報を整理する仕組み」

少し表現としてややこしいですが、平たく言えば、

  • 被リンク(自サイト・他サイト)
  • サイトマップの送信(サーチコンソールからの送信)

によってページを発見している、ということになります。

検索エンジンがウェブサイトを発見する際には、「クローラー」といわれるプログラムがウェブサイト上にあるリンクを順にたどっていき、ページを発見します。

このクローラーのことを「Googlebot」といいます。

Googlebotはリンクをたどっていく際、発見されたページが既に発見済みのページなのか、新しいページなのか、リンク切れをしていたりページの表示ができなかったりして無効な状態になっていないかを確認します。

検索順位を決める以前に、ページが見つかっていなければ評価のしようがありません。SEO対策の最初の1手はページが確実に見つけてもらえるようにすること、です。

クロールのしやすさのことを「クローラビリティ」と言います

クローラビリティを高めるためにできること
  • 新しいページを作ったらインデックスリクエストを送信する(手動)
  • サイトマップを最新の状態に保つ(WordPressを使っていれば自動)
  • 関連するページへの内部リンクをしっかり張る
  • リンクは<a>タグで張る
  • 画像で内部リンクを貼る場合はALT属性を必ず入れる

検索エンジンはページを被リンクやサイトマップの送信で発見する、検索エンジンがページを検出しやすいようにしておくことが重要、と覚えてください。

インデックス:データを登録する

発見したページをもとにGoogleは検索用のデータベースへ格納します。

重複の確認

データベースに登録するにあたって、Googleが特に重視しているのが「重複していないか」という点です。

重複なんてしていないよ、と言う人は多いのですが、気を付けて作らないと案外重複してしまうものなのです。重複する時のパターンとして、以下のようなものがあります。

  • httpでも、httpsでも、どちらでもアクセスして表示できる状態になっている
  • スラッシュエンドのURLと、/index.htmlのどちらでもアクセスできる状態になっている
  • 「/abc/?p=hoge」というアドレスと「/abc/」の両方がアクセスできて、どちらも同じ内容になっている
  • スマホ版とPC版でURLが異なる設定をしている
  • 量産して作成したページでページの一部だけが異なる内容になっている(ECサイトの商品ページに多い、色違いでページが違う場合など)
  • 内容が似通ったページを複数作成してしまう(長期運営していると発生しがち)

上記のような場合、Googleはどれか一つのアドレスを採用し、それ以外は重複とみなしてクロール頻度を大きく下げます。

WordPressを利用し、最近のサーバーを使っていればほとんど発生しない問題ですが、一番最後の「内容が似たページ」は運営期間が長くなるとついつい作ったことを忘れて書いてしまいがちです。

内容の解釈

データベースへ登録するにあたっては、記事の内容が何であるかを「解釈(理解)」している必要があります。

文字情報はもちろん、画像などのメディア情報も理解している必要があります。Googleは実は画像に何が映っているのか大まかに把握することができます。文字が入っていればOCR技術で読み取ることもできます。

画像検索で「シェパード」と検索したときに「コリー」は出てこないですよね。これは画像に映っているものが何か、AIなどで判断しているとされています。ただし、人間が「識別」できるほど正確というわけではありません。そのための補助として、画像ならALT属性が参考にされます。

画像の例が典型的ですが、他にも書かれている文字が「見出し」なのか「本文」なのか、といった情報でも、レイアウトの形や文意からある程度適切に処理されるものの、間違えないとは限りません。

見出しには適切な<hn>タグを使うべきですし、引用部分には<blockquote>でマークアップされるべきです。

Googleが正確にインデックスしてくれるためにできること
  • <title>タグの内容とページの内容が一致するようにする
  • URLの正規化(どのURLが正しいのか)をrel=canonicalなどを使って伝える
  • ユーザーに価値を提供できないナビゲーション用のページなどにはnoindexを付けてインデックスされないようにする
  • 適切なマークアップを行い、ページに書かれている内容が理解しやすいようにする

ランキング:順位を決める

ページを見つけ、検索できる状態にしたら、あとは検索が行われたときにどの順で表示するか、になります。

Googleが順位を決定するためのランキング要素(シグナル)は200以上あるといわれています。

これらのランキング要素について、「採点」をしていき合計得点の高いものから表示するのだと考えるとイメージしやすいかと思います。

各キーワード(クエリ)ごとに、使われるシグナルの割合は異なります。

各要因に適用される重み付けはクエリの性質によって異なります。たとえば、最新のニュース トピックに関するクエリに回答する場合は、言葉の定義に関するクエリに回答する場合よりも、コンテンツの鮮度がより大きな役割を果たします。

Google:検索アルゴリズムの仕組み

Googleは検索者の検索意図を理解しようとし、最も関連性の高いと思われるページを検索結果の上位に表示します。

検索クエリによって使われるシグナルが異なり、その組み合わせは無限ともいえるほどあるため、Googleでは「アルゴリズムに対応することに力を注ぐのをやめて、ユーザーのためになる情報を発信してください」と薦めています。

現時点で本来であれば上位に表示されるべきページが上位表示されていなかったとしても、ユーザーがそのページを支持すればいずれ上位に表示されるような仕組みになっています。

一方、ランキングの上位に表示するべきではないページというのは明らかです。

  • 利用者にとって安全ではないページ
  • 低速なモバイル回線で、表示が完了するまでに30秒くらい待たせるようなページ
  • どこにでもある内容を焼き直した程度のページ
  • 不自然な日本語など読みづらいページ(過剰なSEO対策が施されているページ)
  • メインのコンテンツが少なく広告ばかりが大きく目立っているページ
  • 検索したクエリ(キーワード)に対する答えが載っていないページ

もし、あなたが Google だったら上記のようなページを「推薦」するでしょうか?

実はこの質問こそがSEOをしていくうえで割と重要な考え方であると私は考えています。

上記の問いにYESと答える人はまずいないはずです。

ランキングをあげるためにできること
  • SSLに対応する(暗号化された通信にする)
  • ページの表示速度を早くする
  • どこにでもある情報ではなく、ここにしかない情報を届ける
  • 誤字脱字がなく、自然な日本語で読みやすく保つ
  • 広告で埋め尽くさない
  • 検索者が調べたクエリの答えが載っているページにする

ランキングが決定されるためのシグナルと使用されるバランスは異なるので「プラス」になることは一概に「コレだ!」と言い切ることは難しいです。

ですが、「マイナスになること」は明らかです。

基本の「き」ともいえることですが、SSL対応やページ速度が下がらないようにするところから始めましょう。

Googleの理念と収益構造を理解すれば応用が利く

検索エンジンのシェアはPCでは91.49%、モバイルでは99.4%がGoogleである、とする調査結果が2020年7月に発表されました。

日本だけでなく、世界中、のきなみ検索といえばGoogleの状況です。

SEO対策といえばGoogle対策、と言っても過言ではありません。

このような状況で自身の運営するウェブサイトで上位表示をするためにはまずGoogleが何を目指しているのか、どのように収益を得ようとしているのかを知っておくとSEO対策を考える上で応用が利くようになります。

Googleがしたいこと

Googleの共同創設者ラリーペイジは

完璧な検索エンジンとは、ユーザーの意図を正確に把握し、ユーザーのニーズにぴったり一致する答えを返すものである

Google:便利な検索サービス

と言っています。

また、Googleの使命は、

Google の使命は、世界中の情報を整理し、世界中の人がアクセスできて使えるようにすることです。

Googleについて

としています。

なぜ、Googleはそのようにしたいのか

人々が疑問に思った時に検索を行う際、Googleを必ず使うようになれば、検索したキーワードに対して関連性の高い広告を表示することができます。

Googleの収益源は82%が広告収入によるものです。Googleの広告はリスティング広告を中心としており、ユーザーが検索結果を表示する際に表示されます。

つまり、Googleの利用者が増えれば増えるほど、Googleの収益は増加します

Google検索の利用者を増やすためには、検索を行って訪問したサイトで疑問が解決できる必要があります。

検索しても見つけたかった答えが毎回見つからなかった場合、その検索エンジンを使い続けるでしょうか?

だからこそ、Googleはユーザーを大切にし、ユーザーの意図を正確に把握してユーザーのニーズにぴったり一致する答えを返すことを追求しているのです。

SEOを考える上では、Googleの考えに沿っているか、を判断基準の一つにすれば様々な疑問に割と正しい答えにたどり着けます。

まとめ:理想的な検索体験をGoogleと共に

検索エンジンの仕組みについて、まとめてきました。

再度おさらいをしておきます。

  • 検索順位を決めるプロセスは大きく3つ、クロール・インデックス・ランキング
  • クローラビリティを高めるようにするべき
  • インデックスされやすいように検索エンジンに理解できるようにするべき
  • ランキングで上位に入れるよう、マイナス部分を解消し、少しでもプラスになる部分に注力するべき(アルゴリズムの裏をかくことは人間には不可能)
  • Googleの理念と収益構造を理解しておけば応用が利く

最後に、Googleはあくまで入れ物・仕組みのようなものです。一部を除き、コンテンツを提供しているのはあくまで「あなた(我々)」です。

Googleだけでも検索者の検索体験を充足することはできませんし、あなただけでは検索者にページを届けることができません。

検索者が満足できる記事をGoogleとともに

SEOの本質はこれにつきます。

このページの内容(目次)
閉じる