SEOの実験やデータ分析など公開

SEOの疑問を実験で解明しブログ配信【SEOラボ】

  • 運営情報

重複コンテンツとは?基準や避ける対策方法など徹底解説!

SEO

重複コンテンツとは、タイトル名やテキスト文章などのページを構成してる内容がほぼ同じコンテンツのことです。別名「コピーコンテンツ」とも呼ばれます。
この重複コンテンツによって、SEOへの悪影響が懸念されます。

\申し込みは簡単!今なら、調査結果資料無料配布中!SEO無料調査を申し込む
\DLは簡単!今なら、SEOの基本丸わかり資料無料GET!イチから学ぶ「SEOの教科書」を無料ダウンロードする

一方、重複コンテンツを避ければ、コピーコンテンツへのユーザーの流入や参照リンクの機会が無くなります。
この場合、被リンクやクローリングなどのリソースを特定のコンテンツに注力できます。
また、ユニークなコンテンツが増えるのでユーザー体験の向上にもつながります。
結果、Googleからより評価されやすくなるというわけです。

こうした良い状況にするために、重複コンテンツを避けて、評価されやすいサイトを運営しましょう。

この点踏まえて今回は、重複コンテンツの適宜や基準、重複コンテンツを避ける対策方法など中心に、初心者にもわかりやすくポイントをまとめて解説したいと思います。

重複コンテンツとは?基準や避ける対策方法など徹底解説!

重複コンテンツとは?

重複コンテンツとは、タイトル名やテキスト文章などのページを構成してる内容がほぼ同じコンテンツのことです。

公式サイトでは、以下のように定義されてます。

重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。

※引用元:重複するコンテンツ – Search Console ヘルプ

重複コンテンツは、別名「コピーコンテンツ」とも呼ばれます。

多くのwebページを作成すれば、似てるページが存在し、タイトルやテキスト文章が定型化する場合が有ります。
定型化してくると、同じようなコンテンツが増えやすく、重複コンテンツが増えやすくなります。

できるだけ、他ページと違うタイトル、テキスト文章内容を記述し、重複しないコンテンツを仕上げることが大切です。

\申し込みは簡単!今なら、調査結果資料無料配布中!SEO無料調査を申し込む
\DLは簡単!今なら、SEOの基本丸わかり資料無料GET!イチから学ぶ「SEOの教科書」を無料ダウンロードする

重複コンテンツの基準

重複コンテンツは、「複数の異なるURLから同じコンテンツにアクセスできるようになってるか否か?」が判断の基準となります。

実際に重複コンテンツが検出された場合、以下のような基準で処理されることが定義されてます。

重複するコンテンツを検出した場合、Google のアルゴリズムが重複 URL を 1 つのクラスタにグループ化し、検索結果においてそのクラスタを代表する URL として最適と判断した URL を選定します(たとえば、コンテンツの量が最も多い URL を選択するなど)。

※引用元:重複する URL の影響について – Search Console ヘルプ

\申し込みは簡単!今なら、調査結果資料無料配布中!SEO無料調査を申し込む
\DLは簡単!今なら、SEOの基本丸わかり資料無料GET!イチから学ぶ「SEOの教科書」を無料ダウンロードする

重複コンテンツの対策方法

重複コンテンツに対して、基本的に以下のような対策方法があります。

  • 301リダイレクトを使用する
  • canonicalを使う
  • 内部リンクの一貫性を保つ
  • トップレベルドメインを使用する
  • インデックスの作成を希望するサイトをGoogleに伝える
  • 定型文の繰り返しをできるだけ少なくする
  • 空のページを公開しないようにする
  • ブログやフォーラムなどのシステムを理解する
  • 類似するコンテンツをできるだけ少なくする
  • ページを削除する
  • URL削除ツールを使う
\申し込みは簡単!今なら、調査結果資料無料配布中!SEO無料調査を申し込む
\DLは簡単!今なら、SEOの基本丸わかり資料無料GET!イチから学ぶ「SEOの教科書」を無料ダウンロードする

301リダイレクトを使用する

サイトの構造を変更した場合は、.htaccessファイルで301リダイレクト(「RedirectPermanent」)を使用して、ユーザー、Googlebot、他のスパイダーを適切にリダイレクトする。

canonicalを使う

rel=”canonical”で重複コンテンツを解消するには、以下のような方法が公式に定義されてます。

重複したすべてのページを rel=”canonical” リンク要素でマークします。rel=”canonical” 属性を指定した <link> 要素を、重複ページの <head> セクションに追加して、正規ページを指すようにします。この例では次のようになります。

<link rel=”canonical” href=”https://example.com/dresses/green-dresses” />

※引用元:重複した URL を統合する – Search Console ヘルプ

内部リンクの一貫性を保つ

リンクURLの文字列を統一し、サイト内の他ページへのリンク(内部リンク)の一貫性を保つようにする。
「http://example.com/seo」や「http://example.com/seo/」など、複数のリンクを使わず、1つのURLに絞ってリンクする。

トップレベルドメインを使用する

国別のコンテンツを扱う場合は可能な限り、トップレベルドメインを使用してGoogleで文書の最も適切なバージョンが表示されるようにする。
ディレクトリ(http://example.com/de)やサブドメイン(http://de.example.com)よりも、トップレベルドメイン(http://example.de)がより認識されやすい。

インデックスの作成を希望するサイトをGoogleに伝える

サーチコンソール(Search Console)を使用して、使用するドメインをGoogleに伝える。

定型文の繰り返しをできるだけ少なくする

たとえば、著作権に関する説明をすべてのページの下部に表示する代わりに、短い要約文を組み込んで詳細情報のページにリンクするようにする。

空のページを公開しないようにする

テストページや空ページなどユーザーにとって利便性の低いインデックス不要なページがインデックスに登録されないようにnoindexメタタグを使用する。
HTMLファイルのheadタグ内にcontent=”noindex”属性をmeta要素で指定し、インデックスさせない(検索結果に表示させない)ように以下のように記述して、重複コンテンツを検索結果から削除する。

ブログやフォーラムなどのシステムを理解する

同じコンテンツが複数のフォーマットで生成されやいワードプレスなどを使ったブログやフォーラムなどのシステムを理解し、コンテンツを管理する。

類似するコンテンツをできるだけ少なくする

各ページに内容を追加するか、もしくは各ページの内容を1ページに統一して、類似するコンテンツをできるだけ少なくする。
また、記事の寄稿などにより、提供先のサイトで公開された類似コンテンツがインデックスに登録されないよう、noindex メタタグで検索エンジンをブロックするように依頼する

ページを削除する

サーバー上に公開されてる類似もしくは同一の内容のWebページを削除し、重複コンテンツを削除する

URL削除ツールを使う

サーバーから削除したり、noindexを入れても、検索結果に残ってWebページが表示されてる場合があります。
このような場合、URL削除ツールを使って該当のURLを申請し、重複コンテンツを削除する

これらの基本的な対策と合わせて、「URL パラメータ処理ツール」なども必要に応じて活用しながら、重複コンテンツの対策を進めましょう。

\申し込みは簡単!今なら、調査結果資料無料配布中!SEO無料調査を申し込む
\DLは簡単!今なら、SEOの基本丸わかり資料無料GET!イチから学ぶ「SEOの教科書」を無料ダウンロードする

重複コンテンツがGoogleペナルティになるケース

重複コンテンツがGoogleペナルティになるのは、基本的にGoogleガイドラインに違反するような、以下のようなケースです。

無断複製されたコンテンツの例としては、次のようなものが挙げられます。

  • 他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト
  • 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト
  • 何らかの独自の体系付けやユーザーへの利便性を提供することなく他のサイトからのコンテンツ フィードをそのまま掲載しているサイト
  • ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだだけのサイト

※引用元:無断複製されたコンテンツ – Search Console ヘルプ

無断複製されたコンテンツは、悪意のある重複コンテンツに該当します。

このようなケースは、ユーザーの利便性を明らかに損ねる行為のため、品質ガイドラインに抵触し、Googleペナルティとなります。

その他に重複コンテンツとして扱われるのは、以下のようなケースです。

多くの場合、偽装を意図したものではありません。悪意のない重複するコンテンツの例には、以下のものがあります。

  • 通常ページと携帯デバイス用の簡易ページの両方を生成するディスカッション フォーラム
  • 複数の異なる URL で表示またはリンクされる商品ページ
  • ウェブページの印刷用バージョン

※引用元:重複するコンテンツ – Search Console ヘルプ

これらの偶発的な重複コンテンツは、品質ガイドラインに明らかに抵触するわけではありませんが、ユーザーの利便性の低下を招く可能性があるため、最悪サイトの評価が下がり、Googleペナルティとなります。

公式で、以下のように言及します。

ごくまれなケースとして、Google でのランキングの操作やユーザーへの偽装を意図した重複コンテンツが表示される可能性が認識された場合も、Google では関係するサイトのインデックス登録とランキングに対して適切な調整を行います。その場合、該当するサイトはランキングが低下するか、Google インデックスから完全に削除されて検索結果に表示されなくなる可能性があります。

※引用元:重複するコンテンツ – Search Console ヘルプ

その他のケースとして、以前問題となったWELQが運営するような度が過ぎたコピーコンテンツ掲載サイトは、重複コンテンツによりペナルティを受けやすくなります。

このような質の低いコンテンツを生み出すサイトに対して、Googleは2017年2月3日に公式にアナウンス「低品質なサイトへの対策」をしており、より厳重な制裁が下るようすでにアルゴリズムが調整されてます。
重複コンテンツによるペナルティを回避するために、現在は、オリジナリティーがより重要視されてます。

\申し込みは簡単!今なら、調査結果資料無料配布中!SEO無料調査を申し込む
\DLは簡単!今なら、SEOの基本丸わかり資料無料GET!イチから学ぶ「SEOの教科書」を無料ダウンロードする

よく見られる重複コンテンツ2パターン

よく見られる重複コンテンツに関して、Gary Illyes氏含めTwitter上で以下のようディスカッションが行われました。

そして、Web上には、以下のようよく見られる2つの重複コンテンツ形式が存在するようです。

(A) Someone who takes a piece content from one site and slightly changes it and posts it on their own site.

(B) They take all the content from one page and puts it on their own page but the boiler plate content in the header, footer, etc is different.

翻訳すると、以下のようになります。
Aパターン:あるサイトからコンテンツを取り出し、わずかに変更して自分のサイトに投稿する人。
Bパターン:1つのページからすべてのコンテンツを取り、それを自分のページに置きますが、ヘッダー、フッターなどのボイラープレートの内容は異なります。

\申し込みは簡単!今なら、調査結果資料無料配布中!SEO無料調査を申し込む
\DLは簡単!今なら、SEOの基本丸わかり資料無料GET!イチから学ぶ「SEOの教科書」を無料ダウンロードする

重複コンテンツのチェック(判定)方法

重複コンテンツをチェックし、自分のwebサイトが問題ないか判定、確認する必要があります。

重複コンテンツのチェック方法は以下です。

  • サーチコンソールの[HTMLの改善]を活用する
  • 重複コンテンツ・ミラーサイト・類似ページ判定ツール「sujiko.jp」を使う
  • グーグル検索で重複コンテンツを調べるコマンドを使う

サーチコンソールの[HTMLの改善]を活用する

サーチコンソールの[HTMLの改善]から、重複するメタデータ(descriptions)、タイトルタグの重複を確認することができます。

サーチコンソールの[HTMLの改善]を活用する

ミラーサイト・類似ページ判定ツール「sujiko.jp」を使う

sujiko.jpでは、2つのページの類似度を判定することが可能です。また、サイト内、サイト外の類似ページを確認することができます。

ミラーサイト・類似ページ判定ツール「sujiko.jp」を使う

グーグル検索で重複コンテンツを調べるコマンドを使う

Google検索結果URLの末尾に「&filter=0」を追加し、再検索することで、重複コンテンツの確認に役立ちます。

グーグル検索で重複コンテンツを調べるコマンドを使う

※参考:グーグル検索で重複コンテンツを調べる隠しコマンドがあった

\申し込みは簡単!今なら、調査結果資料無料配布中!SEO無料調査を申し込む
\DLは簡単!今なら、SEOの基本丸わかり資料無料GET!イチから学ぶ「SEOの教科書」を無料ダウンロードする

まとめ:重複コンテンツを避けて、評価されやすいサイトを運営しよう

重複コンテンツの問題があれば適切に対策し、ユーザーにとって利便性の高いユニークなページにしましょう。

Googleガイドラインに準拠し、評価されやすサイトにしながら、上位化を目指すことが重要です。

SEO対策しても検索順位が上がらない…なぜ?

検索順位の推移

SEO対策しても検索順位が上がらない…なぜ?

検索順位が上がらない理由は、SEO対策の質が低いからです。

例えば、ユーザーの検索意図を無視したり、関連性の低いコンテンツを増やす、内部リンクの最適化など疎かにします。
この場合、SEO対策の質が下がります。
そうなれば、ページやサイト自体の品質が上がらないので、Googleに評価されづらくなります。
結果、検索順位が上がらないというわけです。

こうした悪い状況を回避する為に、サイトの欠点を調査して上位化に必要な対策をご案内します(無料)。

検索順位を上げたり、検索流入を増やすにはSEOが重要!

SEOラボのおすすめ記事がLINEに届く「SEOラボを友だち追加」