重複コンテンツの判定基準と対策方法|SEOへの影響やチェック方法を解説。

コンテンツSEO

重複コンテンツとは、同一あるいは非常に類似したコンテンツが、同一ドメイン内または異なるドメインに複数存在する状態を指します。

重複コンテンツはSEOにおけるランキング低下の大きな要因の一つです。しかし、その判定基準や具体的な対策方法を理解していれば、事前に防ぎ、万が一発生した場合でも適切に対処できます。

この記事では、重複コンテンツの基礎知識から、Googleがなぜ重複コンテンツを嫌うのか、具体的な悪影響、そして発見した場合や事前に予防するための対策方法まで、SEO対策に必要な情報を網羅的に解説します。

具体的な事例や図解も交えながら、分かりやすく解説しているので、初心者の方でも安心して読み進められます。この記事を読むことで、以下の内容を理解できます。

この記事でわかること
  • 重複コンテンツの定義とGoogleの判定基準
  • 重複コンテンツがSEOに与える悪影響
  • 重複コンテンツを発見した場合の具体的な対策方法
  • 重複コンテンツを事前に予防するためのポイント
山口耀平(Yamaguchi Yohei)

株式会社検索順位の海賊CEO。日本マーケティング学会会員。SEO歴5年のSEOコンサルタント。自身のアフィリエイトサイトをグロースさせた経験から、現在は企業のSEM支援を行っている。具体的には、オウンドメディア運用代行、SEO戦略立案、記事制作代行などを実施している。
プロフィールの詳細はこちら

山口耀平(Yamaguchi Yohei)をフォローする

重複コンテンツの前提知識

重複コンテンツとは?

重複コンテンツとは、「ドメイン内または複数ドメインにまたがって存在する、同じ言語の他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロック」のことを指します。

例えば、「xxxxxx.com/aaaa」と「xxxxxx.com/bbbb」の二つのURLにアクセスした先のコンテンツが要は似たようなコンテンツになっている状況のことを指します。これはドメイン内の事例になりますが、ドメイン外の場合でも該当します。

一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、同じ言語の他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。

引用元:rel=”canonical” などを利用して正規ページを指定する方法|Google検索セントラル

ECサイトの商品ページでは、色違いの商品ごとに別々のURLを作成することがよくあります。しかし、商品説明文が同一の場合、重複コンテンツとみなされる可能性があります。また、wwwの有無によってURLが異なるだけで、全く同じコンテンツが生成される場合も同様です。

重複コンテンツは、SEOにおいてドメイン評価やユーザービリティを低下させる原因となるため、発生した場合はSEO担当者が速やかに対応する必要があります。

重複コンテンツの判定基準

重複コンテンツの判定基準はGoogleが公式に定めているものではありませんが、弊社の経験では、以下の点が参考になります。

  • 記事コンテンツの場合、類似率が40%未満であれば、重複コンテンツとみなされない傾向があります。
  • 一般的なサイトページの場合、類似率が20~30%程度でも重複コンテンツとみなされる可能性があります。

上記はあくまで経験則に基づくものであり、絶対的な基準ではありません。コンテンツの種類や質、サイト全体の状況など、様々な要素が重複コンテンツの判定に影響を与える可能性があります。

コンテンツの種類安全圏要注意危険
記事コンテンツ類似率40%未満類似率40%~60%類似率60%以上
通常のサイトページ類似率20~30%未満類似率30%~50%類似率50%以上

Googleが重複コンテンツを嫌う理由

Googleは、ユーザーにとって最も価値のある検索結果を提供することを使命としています。重複コンテンツは、この使命を達成する上で大きな障害となるため、Googleは重複コンテンツを嫌います。なぜならクローラーやユーザーにとって重複コンテンツが発生していることで、どちらが「正しい」のかを認識する妨げになるからです。

Googleが重複コンテンツを嫌う具体的な理由は、主に以下の2つです。

Googleが重複コンテンツを嫌う理由
  • 理由①|ユーザー体験の低下
  • 理由②|検索エンジンの評価低下

理由①|ユーザー体験の低下

重複コンテンツが多いウェブサイトでは、ユーザーは同じような情報ばかりを目にすることになります。これでは、ユーザーが求める情報にたどり着くことが難しくなり、ユーザー体験の低下に繋がります。

ただし、同一のコンテンツが多数の異なる URL からアクセスできるようになっていると、ユーザー エクスペリエンスの悪化につながることがあります(たとえば、どれが正しいページなのか、2 つのページに違いがあるかどうかなどの疑問をユーザーが抱く可能性があります)。また、検索結果でのコンテンツのパフォーマンスを追跡することが難しくなる可能性もあります。

引用元:正規化とは|Google検索セントラル

例えば、あなたが特定の商品について調べているとしましょう。しかし、検索結果に表示された複数のウェブサイトに似たようなコンテンツがあるとユーザーとしてもどちらが正しい情報なのかを判断しにくくなってしまいます。重複コンテンツは、このようなユーザーの不満を生み出し、ウェブサイトの価値を下げてしまいます。

理由②|ドメイン評価低下

Googleの検索エンジンは、膨大な数のウェブサイトの中から、ユーザーの検索意図に最も合致するページを見つけ出す必要があります。しかし、重複コンテンツが存在すると、どのページを検索結果に表示すべきか判断が難しくなります。

例えば、同じ内容のページが2つ存在する場合、Googleはどちらのページを上位に表示すべきか判断しづらくなります。結果として、ページへの評価が分散して、順位が付きにくくなってしまいます。ただ、Google公式が述べているように、重複コンテンツがあるだけでペナルティーの対象にはならないのでそこはご安心ください。

サイト上で重複コンテンツが発生することは通常のことであり、Google のスパムに関するポリシーの違反にはなりません。

引用元:正規化とは|Google検索セントラル

補足|ペナルティーは喰らわない

ただ、大前提として重複コンテンツはGoogle側でも最適なページを正規化して対応してくれるため、Googleの対応を「待つ」という方法もあるので、社内にリソースがなかったり実行できるノウハウを持っていない場合は状況を見て放置しても良いでしょう(ただ、あまりにも重複コンテンツに溢れかえっている場合は別です)。

Google がページをインデックスに登録する際、各ページの主要コンテンツ(センターピース)が決定されます。同一のように見えるか、メイン コンテンツが非常に似通っている複数のページを Google が見つけた場合、インデックス登録プロセスで収集された要素(シグナル)に基づいて、検索ユーザーにとって最も完成度が高く有用であると客観的に判断されるページを選択し、そのページを正規としてマークします。

引用元:正規化とは|Google検索セントラル

重複コンテンツを見つけ出すための方法

ただ、重複コンテンツは実際にどのように見つければ良いのでしょうか?ここでは、サイト内部とサイト外部の重複コンテンツを見つけ出す方法について解説していきます。

重複コンテンツを見つけ出すための方法
  • サイト内部|Google Search Consoleを活用する
  • サイト外部|sujiko.jpで重複度合いを調査する

サイト内部|Google Search Consoleを活用する

重複コンテンツはGoogle Search Consoleで見つけ出すことができます。サーチコンソールでの確認手順としては以下の通りです。

  • ①サーチコンソールを開く
  • ②「ページ」を開く
  • ③「重複しています。ユーザーにより、正規ページとして選択されていません」をクリック

①サーチコンソールを開く

  • サイドバーの「ページ」をクリックする
サーチコンソールの「ページ」をクリックしてください。「ページ」はインデックスされなかった

②「ページ」を開く

  • 「ページがインデックスに登録されなかった理由」の部分までスクロール
  • 「重複しています。ユーザーにより、正規ページとして選択されていません」をクリック

③「重複しています。ユーザーにより、正規ページとして選択されていません」をクリック

  • 「重複しています。ユーザーにより、正規ページとして選択されていません」に遷移する
  • 「例」で対象URLを確認する

サイト外部|sujiko.jpで重複度合いを調査する

続いて、自分のサイト外部で重複コンテンツと推察されるサイトを発見した場合に使えるのがsujiko.jpというツールです。こちらで、一致率を判定することができます。もし仮にコピペサイトだった場合、DMCA申請等を実施して削除対応してもらうようにしましょう。

①sujiko.jpを開く

②URLを入力する

重複コンテンツを発見した時の対策方法

重複コンテンツを発見した場合、放置するとSEOに悪影響を及ぼす可能性があるため、早急に対策を講じる必要があります。ここでは、具体的な対策方法を5つ紹介します。

対策①|noindex処理を施す

noindex処理とは、検索エンジンに対して「このページはインデックスしないでください」と指示するメタタグを設定することです。重複コンテンツだと判断したページにnoindex処理を施すことで、検索結果に表示されないようにすることができます。

ただし、noindex処理は、ページの評価そのものを上げるわけではありません。むしろcanonicalタグ

▼関連記事
noindexタグとは|SEOでの効果と書き方、確認方法について解説。

対策②|canonicalタグの設置←一番おすすめ

canonicalタグとは、重複コンテンツの中で正規ページ(本来検索結果に表示させたいページ)を指定するためのHTMLタグです。重複コンテンツだと判断したページに、正規ページのURLを指定したcanonicalタグを設置することで、検索エンジンに正規ページを正しく認識させることができます。

canonicalタグは、noindex処理とは異なり、ページの評価を正規ページに統合することができます。重複コンテンツ対策として、最も効果的な方法の一つです。

▼関連記事
URLの正規化とは?SEOへの影響や設定とチェック方法について解説。

対策③|301リダイレクト

301リダイレクトとは、あるURLにアクセスがあった際に、別のURLに自動的に転送する仕組みです。重複コンテンツだと判断したページを、正規ページに301リダイレクトすることで、検索エンジンの評価を正規ページに集中させることができます。

301リダイレクトは、canonicalタグと同様に、ページの評価を正規ページに統合することができます。ただし、設定を誤ると、ウェブサイト全体の評価を下げてしまう可能性もあるため、注意が必要です。

▼関連記事
.htaccessリダイレクトの設定方法|基本的な書き方を解説。

対策④|コンテンツの統合・削除

重複コンテンツの原因が、ウェブサイト内に類似した内容のページが複数存在することにある場合は、コンテンツの統合または削除を検討しましょう。

複数のページの内容を統合することで、コンテンツの質を高め、ユーザー体験を向上させることができます。また、不要なページを削除することで、クローラーの効率を高め、ウェブサイト全体のインデックス速度を改善することができます。

対策⑤|コピペサイトに対してDMCA申請

重複コンテンツの原因が、他のウェブサイトによるコンテンツの無断複製にある場合は、DMCA(デジタルミレニアム著作権法)に基づいて、コンテンツの削除を申請することができます。

Googleの場合、「著作権侵害の報告: ウェブ検索」から申請をすることができます。

Google では、法的に有効な著作権侵害による削除通知に対して、適切な対応をとることをポリシーとしています。Google による対応としては、当該コンテンツについてアクセスを制限する、または収益化を無効にするなどがあります。

引用元:Report content on Google|Google

DMCA申請は、著作権侵害への対応として有効な手段です。ただ、競合サイトを潰すために虚偽の申請をしてしまうと、逆に訴訟される事例もありますので絶対に悪用をしないようにしましょう。

重複コンテンツを事前に予防する方法

重複コンテンツは、SEOに悪影響を与えるだけでなく、ユーザー体験を損ない、サイトの評価を下げてしまう可能性があります。重複コンテンツが発生してから対策するのではなく、事前に予防策を講じることが重要です。ここでは、具体的な予防策を3つ紹介します。

予防法①|キーワード選定を徹底して行う

キーワード選定は、コンテンツのテーマを明確化し、重複コンテンツ問題を防ぐために極めて重要なプロセスです。記事制作前に、執筆対象となるキーワードを事前にある程度決めることで、テーマの重複や、検索エンジンから評価の低い重複コンテンツの作成を防止することができます。

具体的には、検索意図が重複する可能性のあるキーワードを洗い出し、適切なキーワードに置き換えたり、別の記事で扱うようにすることで、サイト全体のコンテンツの質を高めることができます。キーワード選定を軽視すると、記事制作の段階で多くの重複コンテンツが生み出され、SEOに悪影響を与える可能性があります。

▼関連記事
【初心者用】SEOでのキーワード選定のやり方とコツをついて解説。

予防法②|内部リンクの一貫性を保つ

内部リンクは、ウェブサイト内のページ同士を繋ぐリンクです。内部リンクの一貫性を保つことで、クローラーがウェブサイト内を効率的に巡回し、正規ページを正しく認識することができます。

例えば内部リンクを設置する際に、「xxx.com/aaa」と「xxx.com/aaa/」というようにスラッシュ(/)をつけているものとそうでないものが、サイト内に複数あることで重複コンテンツとして認定されてしまう可能性があります。

予防法③|コンテンツシンジケーションはcanonical設定をする

コンテンツシンジケーションとは、自身のコンテンツを他のウェブサイトに掲載してもらうことです。コンテンツシンジケーションは、ウェブサイトへのトラフィック増加やブランド認知度向上に効果的ですが、重複コンテンツの問題を引き起こす可能性もあります。

コンテンツシンジケーションを行う際は、必ずcanonicalタグを設定しましょう。canonicalタグを設定することで、検索エンジンはどのページがオリジナルコンテンツであるかを正しく認識し、重複コンテンツの問題を回避できます。

まとめ

重複コンテンツは、SEOに悪影響を与えるだけでなく、ユーザー体験を損ない、サイトの評価を下げてしまう可能性があります。重複コンテンツが発生してから対策するのではなく、事前に予防策を講じることが重要です。

キーワード選定の徹底、内部リンクの一貫性の保持、コンテンツシンジケーション時のcanonical設定など、具体的な予防策を実践することで、重複コンテンツのリスクを軽減し、ウェブサイトの価値を高めることができます。

この記事で紹介した予防策以外にも、様々な方法があります。もし、ご自身のウェブサイトで重複コンテンツの予防についてお悩みでしたら、お気軽にご相談ください。専門家がお客様の状況に合わせて最適な解決策をご提案いたします。

【無料】アクセスに伸び悩んだ時は我々にご相談ください。
無料相談はコチラ
【無料】アクセスに伸び悩んだ時は我々にご相談ください。
無料相談はコチラ
タイトルとURLをコピーしました