JetB株式会社

【Googleアルゴリズムが流出】新事実まとめ

今回Googleのアルゴリズムが流出し、Google社の広報担当者であるデイビス・トンプソン氏もそれが本物であると認めました。

theverge Google、流出した検索文書が本物であることを確認
https://www.theverge.com/2024/5/29/24167407/google-search-algorithm-documents-leak-confirmation

トンプソン氏によると「古い情報に基づいている可能性がある」と、検索に関する不正確な仮定を避けるよう警告をしていますが、いままでGoogleが公式に示していた見解と異なると思われる事実が多分に含まれており、大変興味深い内容となっています。

新事実とその内容

実際の流出データはGitHubにて公開されています。

GitHub:yoshi-code-bot elixir-google-api
https://github.com/yoshi-code-bot/elixir-google-api/commit/d7a637f4391b2174a2cf43ee11e6577a204a161e

おそらくGoogle社員の内部リークというよりも、yoshi-code-botというBOTによって自動的に収集されてしまったデータなのでしょう。

Google社の公表と流出したデータの矛盾点、新事実のみをまとめてみました。

クリックデータの使用

以前の公表: Googleは検索ランキングにクリックデータを使用していないと公表していました。

新事実: NavBoostやGlueといったシステムでクリックデータを使用し、クリックとエンゲージメントが検索結果に影響を与えることが確認されました。具体的には「良いクリック」「悪いクリック」「長いクリック」「短いクリック」を区別し、これらをランキングに使用しています。

Chromeデータの利用

以前の公表: GoogleはChromeブラウザのデータを検索ランキングには使用していないと公表していました。

新事実: Chromeブラウザから収集したクリックストリームデータが、サイトリンクの生成や他の検索機能に使用されていることが明らかになりました。

 

サンドボックスの存在

以前の公表: Googleは新しいウェブサイトをサンドボックスに隔離しているという概念を否定していました。

新事実: ドキュメントによると、新しいサイトや信頼性の低いサイトを「sandbox fresh spam」として扱う機能が存在することが示されています。

※これが一般的にエイジングフィルターと呼ばれていた、新規ドメインのサイトがなかなか上位表示されなかった原因と思われます。

 

ドメインオーソリティの使用

以前の公表: Googleはドメインオーソリティの概念を使用していないと公表していました。

新事実: Googleの内部では「siteAuthority」と呼ばれるスコアが存在し、ドメイン全体の信頼性を評価するために使用されています。

 

コンテンツとリンクの評価

以前の公表: Googleはリンクの質とページのトピックの関連性を評価していますが、具体的な評価方法は詳細には公表していませんでした。

新事実: 内部文書によれば、リンク元ページの信頼性やリンクのフォントサイズ、リンクの速度などが評価に使用されていることが明らかになりました。また、内部リンクの特定条件下での無効化や、スパムリンクの速度を測定する機能も存在します。

 

品質評価者のフィードバックの使用

以前の公表: Googleは品質評価者のフィードバックを検索ランキングには直接使用していないと公表していました。

新事実: 品質評価者のフィードバックが実際のランキングシステムに影響を与えていることが示されています。

参考

searchqualityevaluatorguidelines(検索品質評価者ガイドライン)

検索品質評価ガイドライン アイレップ私訳版

Google 検索品質評価者と協力して検索品質を向上させる取り組み

 

世界には約16,000人の検索品質評価者が雇用されているとのことですが、日本のGoogleにおける検索品質評価者の人数は公開されていません。
Google検索ヘルプで「検索結果の順位に直接影響することはありません。」と名言していましたが、今回の流出情報によると影響を与えている可能性は高そうです。

 

Pandaアルゴリズムの仕組み

以前の公表: Pandaアルゴリズムの詳細な仕組みについては詳細に公表されていませんでした。
新事実: Pandaアルゴリズムは、ユーザー行動データと外部リンクデータに基づいてスコアリングを行い、これがドメインレベル、サブドメイン、サブディレクトリレベルで適用されることが明らかになりました。

 

YMYL(Your Money Your Life)ページの評価

以前の公表: GoogleはYMYLページの評価基準について曖昧な表現をしていました

新事実: YMYLページには特別なスコアリングシステムが存在し、健康やニュースに関するページが特に厳しく評価されることが確認されました。

これは全く驚きませんね。

 

小規模サイトの特定

以前の公表: Googleは小規模サイトを特別に扱うアルゴリズムがあるとは公表していませんでした。

新事実: 内部文書によれば、小規模な個人サイトを特定し、特定のアルゴリズム的扱いを行う機能が存在することが示されています。

これは中小起業、個人事業主にとってはある意味朗報になる可能性があります。
このアルゴリズムを解析して小規模サイトであることをGoogleに理解してもらうことができれば、SEO対策を有利に行うことができるかもしれません。

 

フォントサイズの評価

以前の公表: GoogleはフォントサイズがSEOに影響を与えるとは公表していませんでした。

新事実: 内部文書によれば、ページ内の用語やリンクのフォントサイズが評価の対象となっていることが確認されました。

 

コンテンツのオリジナリティ

以前の公表: Googleはコンテンツのオリジナリティを重視するとは公表していましたが、その具体的な評価方法については不明でした。

新事実: 内部文書によれば、短いコンテンツでもオリジナリティが評価され、オリジナルコンテンツスコアが存在することが確認されました。

 

情報元

An Anonymous Source Shared Thousands of Leaked Google Search API Documents with Me; Everyone in SEO Should See Them By Rand Fishkin May 27, 2024

Secrets from the Algorithm: Google Search’s Internal Engineering Documentation Has Leaked By Mike King May 27, 2024

 

まとめ

Googleのアルゴリズムが流出した今回の騒動はSEO界隈にとって大事件ではありますが、中身をみてみるとそこまで驚くようなことはなく、今まで通り「やるべきことをやるしかない」というのが答えだと思います。

JetB株式会社はこれからもGoogleのアルゴリズムをハックするようなブラックハットSEOを行わず、ガイドラインに則って真に価値ある情報を発信するコンテンツマーケティングを事業者の皆様にご提案いたします。

もしSEOやサイト制作にご不安がお有りなら、お気軽に無料相談をお申し付けください。