googleアルゴリズムとは、膨大なWEBサイトのさまざまな情報から、検索ユーザーにとって好ましい検索結果を表示するための手順で、google独自の指標によって計算されている。
以下の情報は2009年に話題になった記事ですが、Googleアルゴリズムの200の要素について書かれています。(Let’s Try to Find All 200 Parameters in Google Algorithm)日本・中国・韓国以外の国ではパンダアップデートが適用され大きな変動を伴っています。また、毎月さまざまなアップデートが繰り返されており、精度の向上のために改善が行われています。しかし基本的な重要な項目は現在でもあまり変わらないと考えられます。
多くはGoogleの特許(合衆国特許出願0050071741)に基づいていますが、この記事を書いた筆者のアン自身の解析結果や予測を盛り込んでいる事で、より実践に近い内容になっています。以下の項目の中でどの項目がどのくらい重要視しているのかは定かではないですが、ここは経験と勘が頼りになってくる部分かもしれません。
ドメインに関する13要因 | ドメイン年齢 |
---|---|
ドメイン取得からの長さ | |
ドメイン登録情報(Who is情報)の表示/非表示 | |
ドメイン種類(サイトレベルドメイン(.com や co.uk) | |
トップレベルドメイン(.comや.info) | |
サブドメインまたはルートドメイン | |
ドメイン過去履歴 (IPアドレスの変更履歴や頻度) | |
ドメイン過去の所有者(過去所有者の履歴や変更頻度) | |
ドメインにキーワードが含まれているか | |
ドメイン(サーバー)のIPアドレス | |
同一IPを使用する別ドメインとの関係 | |
外部リンクとの関連性 | |
Googleウェブマスターツールの使用 | |
サーバー:2つの要因 | サーバーの場所 |
サーバーの信頼性/稼働時間 | |
アーキテクチャ(構造や仕組み):8因子 | URL構造 |
HTML構造 | |
論理的な構造 | |
外部CSS、JavaScriptファイル | |
ウェブサイト構造、アクセシビリティ | |
URLの正規使用 | |
正しいHTMLコード | |
クッキーの使用 | |
コンテンツ:14要因 | コンテンツの言語 |
コンテンツの一貫性 | |
コンテンツ量(HTML形式とテキスト) | |
リンクの数とそれ以外のテキスト量との関係(比率) | |
純粋なテキストコンテンツ(リンク、画像、コード、など以外) | |
コンテンツの時事的要素(新鮮さ) | |
Semantic information | |
カテゴリのコンテンツフラグ(トランザクション、情報、ナビゲーション) | |
コンテンツの質(情報の深さ) | |
フラグが設定されたキーワードの使用(ギャンブル、出会い系等) | |
ALT属性 | |
悪意のあるコンテンツ有無 | |
単語の入力ミス | |
使用するフレーズの新鮮さ(他サイトで使い回されていない言い回し) | |
内部のクロスリンク :5要因 | ページへの内部リンク |
ターゲットページに対しての同一アンカーテキストの使用 | |
全ページ共通部分(グローバルナビゲーション等以外)の内部リンク | |
“nofollow”属性を使用したリンク | |
内部リンクの密度 | |
ウェブサイトの要因:7要因 | robots.txtファイルの有無と内容 |
サイト全体の更新頻度 | |
サイト全体のサイズ(ページ数) | |
Googleがサイトを最初にインデックスした時から経過時間 | |
XMLサイトマップ有無 | |
コンタクトフォーム、プライバシーポリシー、利用規約など、信頼性を向上させるページの有無 | |
ホームページの種類(ブログ形式、ポータル形式、企業サイトなど) | |
ページ固有の要因:9要因 | ページのメタタグ |
ページ年齢 | |
ページの鮮度(更新頻度や新鮮さ) | |
ページ更新の割合(更新時に何%が更新されたか) | |
サイト内の類似ページの有無 | |
ページ内容(専門性) | |
ページの読み込み時間 | |
ページタイプ(メインコンテンツからのアクセシビリティ) | |
サイト内でのページの話題性(多くの内部リンクが張られている) | |
キーワードの使用頻度、 キーワード使用方法 :13要因 |
ページタイトル内キーワードの有無 |
ページタイトルのキーワード位置 | |
altタグ内でのキーワード使用 | |
内部リンクでのアンカーテキスト内にキーワード使用 | |
外部サイトへの発リンクにキーワード使用 | |
太字や斜体などの強調タグでのキーワード使用 | |
コンテンツ上部でのキーワード使用 | |
上部でのキーワード使用 | |
ページ/サイトのテーマと関連するキーワード同義語の使用 | |
ファイル名のキーワード使用 | |
URL内のキーワード使用 | |
「キーワード」を、ドメイン、ファイル名、説明とキーワードタグの最初のラインの最初の言葉を故意に使用したり乱用している | |
外部サイトからの人気(外部サイトから多くのリンクが張られている) | |
アウトバウンドリンク:8要因 | 外部発リンクドメイン数 |
外部発リンクページ数 | |
リンク先ページの品質 | |
低品質なサイトへのリンク | |
外部リンク先の関連性 | |
404ページとその他エラーページへのリンク | |
クライアントサイトからSEO業者サイトへのリンク | |
関連画像へのリンク | |
バックリンクのプロファイル:22要因 | リンクサイトとの関連性 |
リンクページとの関連性 | |
リンクサイトの品質 | |
リンクページの品質 | |
リンクネットワークとのつながり | |
同様のバックリンクソースを持つサイトの存在 | |
リンクソースのパターン | |
アンカーテキストのパターン | |
リンクしているサイトIPアドレスパターン | |
リンク元サイトのIPアドレスパターン | |
トップレベルドメインパターン | |
話題のパターン | |
リンクサイトのパターン(過去ログ、ディレクトリ系など) | |
リンク設置場所のパターン | |
オーソリティサイトとのリンク(CNNやBBC放送など) | |
質が低いフラグを持ったサイトからのリンク | |
全体の被リンクに対しての相互リンク比 | |
全体の被リンクに対するソーシャルメディアからのリンク比 | |
被リンクの急激な増加や自作的パターン | |
WikipediaやDMOZからの引用 | |
これまでのリンク購入履歴(過去の傾向) | |
ソーシャルブックマークサイトからの被リンク | |
個別のバックリンク:6因子 | トップレベルドメインの権限(.comに対する.govなど) |
オーソリティドメインからのリンク | |
オーソリティページからのリンク | |
リンクの位置(フッター、グローバルメニュー及び本文) | |
アンカーテキスト中のリンク | |
リンクのタイトル属性 | |
訪問者のプロフィールと行動:6因子 | トラフィック |
訪問者の統計(パターン) | |
直帰率(類似サイトとの比較) | |
訪問者の閲覧パターン | |
再訪問や新規セッションなどのパターン | |
SERPs内でのクリック数 | |
ペナルティ、フィルタなどのフラグ:12要因 | キーワードスタッフィング使用上のキーワード |
リンクの購入フラグ | |
リンク販売フラグ | |
スパム歴(コメント、その他のリンクスパム) | |
クローキング | |
隠しテキスト | |
重複コンテンツ(外部複製) | |
ドメインの過去のペナルティ歴 | |
ドメイン所有者の過去のペナルティ歴 | |
ドメイン所有者のその他の特性の過去ペナルティ歴 | |
過去のハッキング歴 | |
301及び404を用いたリダイレクトスパム | |
その他の要因6個 | Googleウェブマスターツールの登録 |
Googleニュースのインデックス履歴 | |
Googleブログ検索のインデックス履歴 | |
Googleアドワーズ広告利用 | |
Google Analyticsの登録 | |
サイト名、企業名のブランド |
Googleは常に検索機能を変更し続けており、強化点は1年間で500件を超えます。2011年11月ごろより米google公式よりその月に修正・更新した内容を公開するようになりました。webmaster・SEO関係者は今後の対策や方向性に大きくいかしていけることでしょう。情報については随時追加更新します。
2011年11月 (参考:google公式11月前半・google公式11月後半) | 鮮度が高く有用な情報をすばやく提供(「Caffeine」のアップデート。約35%の検索結果に効果が及ぶ) |
---|---|
ページコンテンツを備えたスニペットを増加 | |
検索結果内のページタイトルを改善 | |
画像検索のシグナル変更 | |
検索結果内のページタイトルを改善 | |
公式ページの検出を絞り込む | |
関連する検索結果の改良 | |
多くのロングテールのインデックス拡大 | |
画像結果鮮度 | |
より新しく、より内容にあったブログ記事を検索結果に表示 | |
オリジナルコンテンツ判断を追加 | |
ブレット上でレイアウト変更 | |
トップの結果を選択するコードの書き換え | |
2011年12月 (参考:google公式12月 30修正) | 画像検索でのスパム検出の強化 |
より適切なサイトリンク | |
日本のGoogleのインスタントの強化 | |
画像検索のシグナル変更 | |
オートコンプリートのためのインフラ改善 | |
セーフサーチの改善 | |
モバイル(スマートフォン)のブラウジング高速化 | |
スマートフォン版Googlebot-Mobileを導入(公式ページ) | |
2012年1月 (参考:google公式1月 17修正) | 11月に導入したフレッシュネス・アップデートをマイナー更新 |
オートコンプリートのスピードアップ・スペル訂正 | |
高品質サイトアルゴリズムの改善 | |
画像検索の品質を改善 | |
関連性がより高い関連検索に対応 | |
ニュース記事を検索結果にブレンド | |
2012年2月 (参考:google公式2月 40修正) | パンダ・アップデート |
スパムアップデート | |
フレッシュネスの改良(最新情報をすばやく表示) | |
“site:”検索の更新 | |
関連検索のデータをリフレッシュ | |
同義語の改善 | |
ローカル検索結果の順位への改良・改善 | |
公式ページをより正確に検出 | |
関連検索のデータをリフレッシュ | |
Googleバーの更新 | |
2012年3月 (参考:google公式3月 50修正) | 高品質なサイトアルゴリズムデータの更新と新鮮さを改善 |
サイトリンクデータのリフレッシュ | |
インデックスのシンボルの処理の改善 | |
ナビゲーションクエリの結果への改良 | |
プロフィールページのインデックス付けの改善 | |
オートコンプリートのバックエンドは、カバレッジの改善 | |
より関連性の高い画像の検索結果 | |
セーフサーチのアルゴリズムチューニング | |
アンカーテキストの処理に微調整 | |
サイトの品質を検出するための処理の改善 | |
ナビゲーションとローカルの両方の目的を持つクエリの処理を改善 | |
アンカーテキストの優れた解釈と使用 | |
鮮度への改良 | |
優れた同義語の精度と性能 | |
検索システムのチューニング | |
パーソナライゼーション情報の更新通知 | |
ブログ/フォーラムページの日付の検出の改善 | |
2012年4月 (参考:google公式4月 52修正) | アンカーのバグ修正 |
複数のドメインの多様性 | |
ローカルナビゲーション検索の改良 | |
検索用語をランキングで得点される方法への改良 | |
スニペットで顕現を無効 | |
最新情報のシグナルの改良 | |
最新結果を得るためにスムーズに順位変更 | |
より適切な検索の解釈改善 | |
代替タイトルを効率的に生成 | |
改良されたセーフサーチ | |
新しいインデックスの階層 | |
ベース インデックス サイズを15%増加 | |
ページの始めの方のテキストからのスニペット | |
低クオリティのコンテンツは最新でも上位表示しない | |
ランキングにおける検索キーワードのスコアリングの改善 | |
サイトリンクデータのリフレッシュ | |
キーワードスタッフィングの分類改良 | |
パンダ・アップデート 4/27 | |
ペンギン・アップデート(スパムの取締り強化) | |
2012年5月 (参考:google公式5月 39修正) | 新鮮さに対するランキングの関数を円滑化 |
鮮度アルゴリズムの簡略化 | |
新鮮なコンテンツを検索結果に検出改善 | |
タイトルがない場合のaltのタイトル利用 | |
代替タイトルの生成の改善 | |
ランキングアルゴリズムのパフォーマンスの最適化 | |
ニュースコンテンツのランキングの改良 | |
長期的スコアリングアルゴリズムの簡略化 | |
ペンギン・再アップデート(スパムの取締り強化 5/26) | |
2012年6月(59) (参考:google公式6.7月 86修正) | 自然言語検索のサポートを追加し、辞書検索機能を向上 |
複数の重要なランキング機能を組み合わせてて、この新しく改善されたランキング機能を使用して最高の結果の順序に改善 | |
ページの品質を改善し、信頼できるソースから、より高品質なコンテンツ取得(Bamse・Bamse-17L) | |
高品質なサイトとページをより適切に検出するためにパンダアルゴリズムに新しいデータを追加(GreenLandII) | |
パンダのデータを更新し、高品質なサイトアルゴリズム化。 | |
ロングテールのクエリを検索するために使用されるシステムのためのデータのリフレッシュ。(komodo) | |
ランキング内のクエリの同義語(シノニム)の使用を向上させます。元の検索語とは異なる意味を持つ同義語を検索結果に表示が減少 | |
その他ランキングのコンポーネントとして、信頼できるソースから、より高品質なコンテンツを見つける | |
ローカルな検索結果にカーソルを合わせると、右側にその場所についての情報を閲覧可能 | |
検索結果にアダルトビデオコンテンツの処理を統一するためにセーフサーチを更新 | |
検索クエリに行事の特定日を質問する「母の日はいつ?」や通貨を質問する「500ドルはユーロだといくら?」・単位換算機能「5マイルはキロメートルだといくつ?」といった自然文章の検索理解が向上 | |
クラスタリングと拡張されたサイトリンク機能でリンクのランクが向上 | |
8言語でシステをスペルのアルゴリズムのリフレッシュ。 | |
同じサイト、または同じパス(最後のスラッシュまで、同じURL上)より一貫したウェブ検索結果をクラスタリングするためのアルゴリズムを導入。 | |
ユニークなコンテンツを持つ高品質なページを発見する(Hamel) | |
2012年7月(27) (参考:google公式6.7月 86修正) | サイトリンクから多くの有用なテキスト(スニペット)の表示 |
ページに記事があるかどうかを検出する我々のアルゴリズムのマイナーアップデート。この変更で、優れたスニペットを容易表示 | |
Googleのインスタントがオフになっているとき、時々オートコンプリートの予測のサイトへの直接リンクを紹介。予測のためのデータをリフレッシュ。(Golden Eagle) | |
インデックスの容量を節約し、待ち時間を改善するためにシステムの側面を向上 | |
スニペットでの、ウェブ検索結果のタイトルリンクを一般的なボイラープレート·テキストを取り除くのを改善 | |
翻訳したクエリの検出を向上 | |
特定地域のGoogleマップのデータに大きなアップデートを実行(ユニバーサル検索で表示) | |
日本と韓国のユーザーのためのより高品質なサイトを促進するためにgoogle.co.jpとgoogle.co.krにパンダを開始 | |
鮮度アルゴリズムのバグ修正。結果に影響を及ぼすべきではない特定のケースで鮮度アルゴリズムをオフに | |
シンプルなウェブ検索結果にするためにクラスタリング化 | |
より多様な検索の改良(Refinements) | |
サイト階層を検索結果のスニペットの表示するアルゴリズムを改善 | |
アダルトコンテンツを検出するためのセーフサーチのアルゴリズムを更新 | |
パンダ高品質なサイトのアルゴリズムのためのデータを更新 | |
ユニバーサル検索で、ナレッジグラフからエンティティを使用して、ニュースユニバーサルディスプレイを向上 | |
ユーザーがオートコンプリートの一環として、日本でより多くの新鮮な傾向クエリーを見出 | |
2012年8月(43) (参考:google公式8.9月 65修正) | [Page Quality ページの品質] 信頼できる情報源から、より高品質のコンテンツを見つけるよう改善 |
[Page Quality ページの品質] “パンダ” 高品質なサイトのアルゴリズムのデータをリフレッシュ 8/20 | |
[Snippets スニペット”]サイトリンクを生成するために使用されるデータをリフレッシュ | |
[Snippets スニペット”]可能性のある結果のタイトルが実際にページがいかに関連するかを決定するために使用する信号を改善 | |
[Snippets スニペット”]“についてのコメント”を検索し、検索結果のタイトルに含めるよう改善 | |
[Freshness 新鮮]古くなった記事の取り扱いを更新し、ドキュメント公開日に基づき適用 | |
[Knowledge Graph 知識グラフ]ナレッジ·グラフにリストとコレクションのコンポーネントを追加 | |
[Knowledge Graph 知識グラフ]ナレッジ·グラフは、検索の多くの種類に関連する事実情報と改良が表示されます。米国だけでなく英語圏に公開 | |
[Knowledge Graph 知識グラフ]ナレッジグラフを英語だけでなくグローバルに拡大 | |
[Answers 回答]より良い変換検索機能を表示するための自然言語解析を導入 | |
[Other Search Features その他の検索機能]robots.txtでクロールしないページを設定したページのためのスニペットを生成することができないため、交換用のスニペットを追加 | |
[Other Ranking Components その他ランキングコンポーネント]固定リンクがランキングに使用されている方法に関連するマイナーなバグを修正 | |
[SafeSearch セーフサーチ]セーフサーチが厳密に設定されているときに画像検索モードで表示されますアダルトコンテンツの量を減少 | |
[SafeSearch セーフサーチ]セーフサーチ”厳格な”モードにあるときに表示されるのアダルトコンテンツを防ぐ | |
[Spelling スペル]ロングテールオートコンプリートの予測の妥当性を向上させるために綴りアルゴリズムを使用 | |
Googleの検索アルゴリズムのアップデート 8/10 | |
音声検索は13の新しい言語に到着 8/17 | |
2012年9月(22) (参考:google公式8.9月 65修正) | [Page Quality ページの品質] 信頼できる情報源から、より高品質のコンテンツを見つけるよう改善 |
[Snippets スニペット”]より良いスニペットのタイトルに改善 | |
[Snippets スニペット”]よりWebページ上の重要なフレーズを識別 | |
[Freshness 新鮮]同じドメインの2つ以上の記事が、検索クエリに関連しているときに、最新のコンテンツ表示するよう改善 | |
[Knowledge Graph 知識グラフ]右側のパネルのトピックの要約を表示するタイミングを決定し、更新信号の変更 | |
[SafeSearch セーフサーチ]より良いアダルトコンテンツを検出するために、セーフサーチのアルゴリズムを更新 | |
[Knowledge Graph 知識グラフ]右側のパネルのトピックの要約を表示するタイミングを決定し、更新信号の変更 | |
[Synonyms シノニム]ユーザの意図に関連する結果を返すように検索用語の同義語の使用を改善 | |
構造化データのテストツール 9/20 | |
新しいGoogleトレンド 9/27 | |
旅行者が、今では錠剤からフライトの検索にアクセスすることができます 9/28 |