Googleにおけるエンティティとは?SEO効果や強化方法を特許文章から解説

検索エンジン知識

※この記事は、当コラムのコンテンツ制作・編集ポリシーに沿って制作されています。

エンティティとは、Googleが検索精度を高めるために重視している「明確に特定できるモノや概念」のことです。

従来のようなキーワードベースの検索では、ユーザーの意図を正確に読み取ることが困難でしたが、Googleは検索対象を“エンティティ”として捉えることで、文脈や意味を理解し、より的確な情報提供を実現しています。

本記事では、エンティティの基本的な定義から、その識別メカニズム、SEOとの関係性、そして自社や自分自身をGoogleに正しく認識させるための具体的な方法までを、体系的にわかりやすく解説します。

この記事でわかる内容
  • エンティティの定義と検索アルゴリズムとの関係
  • Googleがエンティティを識別・分類する仕組み
  • エンティティとして正しく認識されるための実践方法
プロフィール
この記事を書いた人
山口耀平(Yamaguchi Yohei)

株式会社検索順位の海賊CEO。日本マーケティング学会会員。SEO歴5年のSEOコンサルタント。自身のアフィリエイトサイトをグロースさせた経験から、現在は企業のSEM支援を行っている。具体的には、オウンドメディア運用代行、SEO戦略立案、記事制作代行などを実施している。
プロフィールの詳細はこちら

山口耀平(Yamaguchi Yohei)をフォローする
貴社サイトをSEO観点から無料分析いたします!

SEOに悩まれている事業者様へ、弊社のコンサルタントが、通常10万円する課題分析から戦略立案まで無料で行います。

▼申し込み後の流れ
・日程調整
・課題ヒアリング
・弊社によるサイト分析
・分析結果及び資料共有

Googleが提唱するエンティティとは?

エンティティの定義

エンティティとは、「単一で、ユニークで、明確に定義され、区別可能なモノや概念」を指します。具体的には、人、地名、物体、考え方、抽象的な概念など、多様な対象が含まれます。

一般に、エンティティは名詞によって表現されることが多く、たとえば「サンフランシスコ」という都市名や、「ユニコーン」といった空想上の存在も、エンティティに該当します。エンティティそのものは概念や実体を指し、それに対応する文字列――たとえば文章中に登場する「エッフェル塔」など――はエンティティ参照と呼ばれます。

さらに、各エンティティにはその属性や種類を示すエンティティタイプが定められています。代表的なエンティティタイプとしては、以下のようなものが挙げられます。

  • 「人物」
  • 「地名」
  • 「映画」
  • 「音楽家」
  • 「動物」など

たとえば、「Who(誰)?」という問いに対しては、人物(Person)タイプのエンティティが想定されるといったように、問いの種類に応じて求められるエンティティタイプも変化します。

セマンティックSEOへの移行の重要な要素

このエンティティの概念は、Googleが検索の焦点を従来のキーワードベースから「意味」へと移行させている、いわゆるセマンティック検索やセマンティックSEOにおいて、極めて重要な要素となっています。

Googleは、非構造化データ(たとえばウェブページ上のテキストなど)からエンティティ参照を識別し、それに基づいて自然言語による質問に回答する仕組みを構築しています。これは、ユーザーが入力した自然な言葉の背後にある「意味」や「意図」を正確に理解しようとするGoogleの方針と合致しています。

エンティティの理解は、検索システムが単なるキーワードの一致を超えて、実在するモノや概念、そしてそれらの間にある関係性を把握するための基盤となります。

Googleの特許から見るエンティティの仕組み

エンティティの仕組みは、一言で言うと、検索システムが非構造化データ(主にウェブページ)からエンティティを認識し、質問応答に活用する流れといえます。

Googleの特許から見るエンティティの仕組み
  • 仕組み①|既存のネット上の情報との照合
  • 仕組み②|新しいエンティティの特定
  • 仕組み③|周辺情報による曖昧性の解消
  • 仕組み④|エンティティタイプの特定

仕組み①|既存のネット上の情報との照合

Googleは、ウェブページなどのコンテンツ内に含まれるテキストを、あらかじめ保持している「既知のエンティティ参照リスト」と照合します。これは、人名や地名、企業名、映画タイトルなど、すでにデータベースに登録されている語句の一覧です。

システムは、これらのリストと一致する単語やフレーズを見つけることで、それらをエンティティ参照として認識します。このプロセスは、既知の情報と照らし合わせて、すでに把握済みのエンティティを迅速かつ確実に検出するための基本的な手法です。

特にニュース記事やWikipediaなどの構造化されていない情報源において、この照合技術は有効に機能します。

仕組み②|新しいエンティティの特定

既存のリストに含まれていない、新たに出現したエンティティや知名度の低いエンティティを見つけ出すために、Googleはテキスト内の言語的なパターンや、単語間の意味的な関連性を分析します。

たとえば、「苗字+名前」のような語順や、「肩書+氏名」といった文脈上の組み合わせが繰り返し登場する場合、システムはそれを未知の人物エンティティである可能性が高いと判断します。そのうえで、クラスタリングと呼ばれるグループ化技術を用いて、似た出現パターンを持つ語句同士をまとめ、エンティティの候補として抽出します。

この段階では、語句の出現頻度、共起関係、語順の一貫性なども重要な判断材料となります。つまり、言語データの中に潜む繰り返しやルール性を手がかりに、未知の情報を構造化しているのです。

仕組み③|周辺情報による曖昧性の解消

ひとつの語句が複数の意味や対象(=エンティティ)を持つ場合、システムはそのままでは正確な識別ができません。たとえば「フィラデルフィア」という語は、アメリカの都市、映画のタイトル、チーズブランドなど、異なる複数のエンティティを表す可能性があります。このように、単語単体では意味が特定できないケースを「曖昧性」と呼びます。

Googleはこの曖昧性を解消するために、その語句の周辺に登場する他の単語や文脈を参照します。たとえば、「ジョージ・ワシントン」という語が「マーサ・ワシントン」とともに登場していれば人物を指すと判断し、「大学」や「ワシントンD.C.」とセットになっていれば教育機関を意味する可能性が高いとみなします。

また、Googleのナレッジグラフのようなデータ構造では、エンティティ同士の関係性(親子関係、所属、時系列など)も保持しており、こうした構造的な情報も曖昧性の解消に活用されます。

仕組み④|エンティティタイプの特定

Googleは、識別されたエンティティ参照が何に分類されるかを判定します。これは「エンティティタイプ」と呼ばれ、代表的なものには人物(Person)、場所(Location)、日付(Date)、組織(Organization)などがあります。

このタイプは、あらかじめエンティティ参照リストに紐づけられていることもあれば、テキスト中の文脈から推定される場合もあります。たとえば「渋谷駅」は「場所」タイプ、「スティーブ・ジョブズ」は「人物」タイプと判別されます。

また、ユーザーの検索クエリに対して、どのエンティティタイプが関係しているかを特定し、それに対応するタイプのエンティティを優先的に抽出することも行われています。これは、検索意図をより的確に満たすためのフィルタリング処理でもあります。

エンティティ強化のためのGoogleの歴史

Googleが検索アルゴリズムにおいてエンティティを重要視するようになった背景には、検索体験の質を高めるための技術的進化があります。単語の一致だけでは不十分とされる中、Googleは検索意図の理解を目的にアルゴリズムの転換を図ってきました。

この章では、Googleの検索精度向上の歴史を4つのフェーズに分け、エンティティ導入と発展の流れを整理します。

エンティティ強化のためのGoogleの歴史
  • フェーズ①|キーワード検索時代(〜2011年頃)
  • フェーズ②|エンティティ概念の導入(2010〜2014年)
  • フェーズ③|機械学習による文脈理解(2015〜2019年)
  • フェーズ④|エンティティ×E-E-A-Tの時代(2020年〜現在)

フェーズ①|キーワード検索時代(〜2011年頃)

この時期のGoogle検索では、文字列の完全一致や部分一致に基づいたシンプルなアルゴリズムが中心でした。検索結果の順位は、キーワードの出現頻度被リンクの数といった「量的な要素」に強く依存しており、検索クエリの背後にある意味や意図の理解はほとんど行われていませんでした。

このように、語句の意味を理解しないまま、機械的に文書を抽出・並べる手法には限界がありました。その結果、キーワードの過剰詰め込みや被リンクの大量取得といったスパム的なSEO手法が蔓延し、本来の検索意図と関係のないコンテンツが上位表示されるケースも目立つようになります。

こうした背景から、ユーザーが求める情報にうまくアクセスできない状況が続き、Googleは「単語の一致」から「意味の理解」へと検索技術を大きく転換する必要に迫られていきました。

フェーズ②|エンティティ概念の導入(2010〜2014年)

このフェーズにおいてGoogleは、検索クエリに対して「それが何に関する情報か」を正しく理解するための土台を構築し始めました。その象徴的な取り組みが、2012年に導入された「ナレッジグラフ(Knowledge Graph)」*です。

ナレッジグラフの導入により、Googleは人名・地名・企業名などを「エンティティ」として明確に識別・分類し、それぞれの関係性を構造的に管理するようになります。

続く2013年の「Hummingbird」アップデートでは、検索アルゴリズム自体が大きく転換されます。これまでのように「キーワードの一致」だけを重視するのではなく、検索文全体の意味や文脈を読み取ることで、より自然な言語処理が可能となるよう設計されました。

この一連の進化によって、たとえあいまいな語句や抽象的なクエリであっても、文脈に応じて正しいエンティティを推定し、関連性の高い情報を返すことができるようになりました。
つまり、検索エンジンが「単語」ではなく「意味」をベースに動作する、セマンティック検索への本格的な第一歩がここで始まったのです。

フェーズ③|機械学習による文脈理解(2015〜2019年)

この時期、Googleは検索精度の向上とエンティティ理解の深化を目的に、機械学習技術の導入を本格化させました。中でも象徴的なのが、2015年に導入されたアルゴリズム「RankBrain」です。

RankBrainは、これまで検索エンジンがうまく処理できなかった未知の検索クエリ(初めて見る語句や複雑な表現)に対しても、その意味や文脈を推定し、適切なエンティティと関連づけることができる仕組みです。これにより、検索語にキーワードが直接含まれていなくても、ユーザーの意図に合致した検索結果を返せるようになりました。

さらに、RankBrainはユーザーが検索するたびに、実際の検索データから継続的に学習を行い、エンティティ同士の関係性や出現パターンを蓄積・最適化しています。これによって、意味の曖昧なクエリでも高精度なマッチングが可能になり、検索体験の質が飛躍的に向上しました。

そして2018年には、Googleは検索の枠を超えた情報提供のフェーズに進みます。それが、ユーザーの興味関心に基づいて情報を事前に提示する「Google Discover」の登場です。Google Discoverでは、過去の検索履歴や行動データをもとに、ユーザーがまだ検索していないトピックやエンティティに関する情報をレコメンドします。

これにより、Google検索は「質問に対する答え」を返すだけでなく、ユーザーの関心を先回りして提示する、いわば「情報探索のナビゲーター」へと進化しました。検索は単なる受動的な行動ではなく、興味や知識を広げる能動的な体験へと変化していったのです。

フェーズ④|エンティティ×E-E-A-Tの時代(2020年〜現在)

2020年以降、Googleは検索品質のさらなる向上を目指し、E-E-A-T(経験・専門性・権威性・信頼性)の評価基準を強化しています。この中で特に重視されるようになったのが、「誰が書いたのか」というエンティティ情報です。すなわち、著者や企業といった発信者の属性が、コンテンツ評価において非常に大きな意味を持つようになっています。

この方針のもと、Googleはエンティティごとに「評価スコア(Reputation Score)」や「信頼性指標(Entity Signals)」を内部的に構築しており、これらをナレッジパネルや構造化データと照合しながら、検索順位や表示内容を最適化しています。たとえば、著者情報がSchema.orgなどの構造化マークアップで明確に示されているページは、より正確に評価対象として認識されるようになっています。

さらに、検索技術そのものも大きく進化しています。Googleは、MUM(Multitask Unified Model)や生成AIといった大規模言語モデル(LLM)を導入し、検索体験をキーワードベースから対話的・意味理解ベースのものへと転換しつつあります。これらのモデルも、背後で扱う情報単位を「エンティティ」として設計しており、検索精度の基盤としてエンティティ理解がますます重要になっています。

このような背景から、現代のSEOでは単に「良質なコンテンツ」を提供するだけでなく、企業や著者自身が“信頼されるエンティティ”として認識されることが前提条件となっています。今後のSEOにおいては、**コンテンツだけでなく「発信者そのものの評価」**が検索結果に直結する時代へと突入したと言えるでしょう。

エンティティをGoogle認識させる方法

提供された特許文書から示唆されるエンティティ認識の仕組みに基づくと、自身のウェブサイトや情報についてGoogleに正しくエンティティとして認識させるためには、以下の点が重要になります。

エンティティをGoogle認識させる方法
  • 方法①|コンテンツ内での明確な記述
  • 方法②|Wikipediaへの露出
  • 方法③|Googleビジネスプロフィールの登録

方法①|コンテンツ内での明確な記述

既知のエンティティリストとの照合や、テキスト内での出現頻度・言語パターン・周辺語句との関連性をもとに、エンティティ参照を識別する仕組みが記載されています。

“In some implementations, the system generates a collection of entity references appearing in a webpage by comparing the structured or unstructured text to a list of known entity references, for example a list of names.”

引用元:Question answering using entity references in unstructured data|GooglePatent

これを踏まえると、コンテンツ内で特定のエンティティについて記述する際には、以下の点を意識することが効果的であると考えられます。

  • 正式名称や一般名称を使用すること
  • コンテンツ全体で名称を統一して使用すること
  • 他の関連エンティティ(人物名、地名、組織名など)と組み合わせて記述すること

また、自然な文脈の中で適切な頻度で言及することも、Googleがその語句をエンティティとして認識する手がかりになります。ただし、過剰な繰り返しはスパムと判断される可能性があるため注意が必要です。

方法②|Wikipediaへの露出

ナレッジグラフを質問応答システムにおいてエンティティ情報を扱うための「使用され得る」データ構造の一例として説明しています。また、Googleがエンティティを識別する際には、既知のエンティティ参照リストと照合するプロセスが行われ、その際に活用される情報源の一つとして、名前データベースや公開情報リソースが示唆されています。

it will be understood that the data graph implementation of FIG. 4, and the knowledge graph, are merely examples of a data structure that may be used by the system to store entity references and other data, and that any Suitable data format may be used.”
ー図4に示されているデータグラフの実装、およびナレッジグラフは、システムがエンティティ参照やその他のデータを格納するために使用できるデータ構造の単なる例であり、また任意の適切なデータ形式を使用できる、ということが理解されます。

引用元:Question answering using entity references in unstructured data|GooglePatent

この文脈において、Wikipediaのような信頼性の高い公開データベースは、Googleにとって非常に重要な参照先となっている可能性が非常に高いです。

Wikipediaへの掲載が実現すると、Googleはその対象を「既知のエンティティ」として正式に認識しやすくなります。特にWikipediaは、中立性・検証可能性・出典の明記が求められるため、Googleが信頼性を判断する上で非常に有効な指標となるのです。

さらに、あるエンティティを検索した際にナレッジパネルが表示されることは、Googleがそのエンティティを明確に識別し、関連情報を収集・構造化して表示できている証拠といえます。これは、検索エンジンが単なる文字列としてではなく、意味的な存在としてエンティティを理解している状態を示す、最も視覚的なアウトプットのひとつです。

方法③|Googleビジネスプロフィールの登録

実店舗を持つビジネスなどのエンティティであれば、Googleビジネスプロフィールに登録し、正確かつ詳細な情報を提供することが有効です。

これはGoogleに対して、対象がどのようなエンティティであるか(店舗名、住所、電話番号、カテゴリなど)を構造化された形で明確に伝える手段となります。

エンティティを確認する方法〜橋下環奈を通して〜

Googleが特定のエンティティを認識しているかどうかを完全に内部的に確認することは難しいですが、いくつかの外形的な兆候からその度合いを推測することができます。ここではあの有名女優である橋下環奈さんのエンティティから確認方法を推察していきましょう。

エンティティを確認する方法
  • 方法①|ナレッジパネル
  • 方法②|画像検索
  • 方法③|Googleトレンド

方法①|ナレッジパネル

Google検索において、特定の名称を入力した際に、検索結果ページの右側(PC)や上部(モバイル)に表示されるナレッジパネルは、Googleがその名称をエンティティとして明確に認識していることを示す代表的なサインです。

このパネルには、対象の概要や画像、関連情報、出典(Wikipediaなど)が表示され、Googleがそのエンティティに関するデータを構造的に整理・統合していることが視覚的に確認できます。

ナレッジパネルが表示されているという事実自体が、その名称がGoogleのナレッジグラフに登録されている=既知のエンティティと認識されていることを意味します。

方法②|画像検索

特定の名称でGoogle画像検索を行ったとき、その名称に関連する正しい画像が多数表示される場合、Googleがその語句を視覚的な情報と結びつけて理解している可能性が高いと考えられます。

Googleは画像単体だけでなく、画像が掲載されたページのテキスト情報やファイル名、alt属性なども活用し、画像とエンティティとの関連を推定しています。そのため、画像検索の結果は、Googleがそのエンティティをどれだけ視覚的にも把握しているかを測る一つの参考指標となります。

方法③|Googleトレンド

Google Trendからエンティティとしての橋下環奈がどう捉えられているかがわかる

Googleトレンドで特定の名称(=エンティティ)が一定の検索ボリュームを持っているかを確認することは、そのエンティティへのユーザー関心の高さを把握する手段のひとつです。

Googleは、ナレッジグラフに未登録の語句であっても、検索需要が高くなれば、新たなエンティティノードとして追加を検討すると特許文書内で示唆しています。

つまり、検索数が多く関心の高い名称は、将来的にGoogleによるエンティティ登録や情報強化が行われやすくなります。

まとめ

提供された特許文書は、Googleの検索システムが、特に質問応答の文脈で、単なるキーワードではなくエンティティという「モノ」や「概念」を理解し、活用している詳細な仕組みの一端を明らかにしてくれました。ウェブページなどの非構造化データからエンティティ参照を認識する際には、既知のリストとの照合、テキストパターンや関連性の利用、周辺情報による曖昧性の解消、そしてエンティティタイプの特定といったプロセスが用いられています。

Googleの検索がキーワードから意味理解へと進化する中で、エンティティの重要性は増しており、ナレッジグラフの構築や、E-E-A-Tといった評価基準とも関連しながら発展しています。

自身のウェブサイトで特定のエンティティについて扱う場合や、自身のエンティティ(企業、人物、製品など)をGoogleに正しく理解してもらいたい場合は、コンテンツ内で一貫性をもって明確に記述することに加え、WikipediaやGoogleビジネスプロフィールのような信頼性の高い外部の情報源でも情報を提供し、ナレッジパネルの表示を目指すことが有効なアプローチとなります。

これらの取り組みを通じて、Googleは対象を単なる文字列ではなく、世界に存在する明確なエンティティとして認識し、検索結果や質問応答において、より正確でリッチな情報を提供できるようになるのです。

タイトルとURLをコピーしました