複製ページスパム
複製ページスパム(Dupes)
複数ページスパムとは、ほとんど同じ内容のURLを複数作り、検索エンジンに登録するスパム行為です。そのページの任意のキーワードで検索をかけた場合に、同一のコンテンツを有する同じドメイン内のページや異なるURLの複数のページを、検索結果に上位表示させ、検索結果を独占するために行われていました。これはアダルト業者などによって古くから使われていたスパム行為で、現在でも見かける場合があります。
しかし、検索結果リストを特定のサイトが独占し、情報を探しているユーザーの検索結果をゴミに変えてしまうような行為は、たとえ現在検索エンジンに通用する手法だとしても、非常に悪質なスパム行為ですので、絶対に行わないようにしましょう。
ちなみに、現在、検索エンジンは、任意のキーワードに対する検索結果において、同一ドメインに属するページが検索結果を独占しないようにする【クラスタリング】という技術を採用しています。これにより、同一ドメイン内に属するページに関しては、表示件数が制限されます。
ミラーサイトに関して
サーバが落ちた時の為に設置されているようなミラーサイトは、全く別のサーバーに同一のファイルが設置されています。しかし、サーバが落ちた時のため(=ユーザーのため)に設置されているようなミラーサイトは、個々に独立した構造を持っており、お互いのWebサイト内の属する個々のページがお互いにリンクを張り合って不正なリンクポピュラリティの操作をおこなっているなどということはないはずです。そのため、正当な理由で運営されているミラーサイトが複製ページスパムに該当するなどということはないはずなのです。
表記の違いに最適化したページを複数作る場合も注意する
日本語には多数の同義語があるだけではなく「送り仮名の違い」や「漢字と仮名」などの表記の違いによってまったく同じ意味の言葉に複数の表記方法があります。現在の検索エンジンの多くは優秀な辞書機能を搭載していますので、たとえば「引越し」「引っ越し」「引越」などは同一のものとみなされます。ですので各表記法に最適化したページが複数ある場合も複数ページスパムに該当する可能性があります。どうしても表記の違いに最適化したページを作りたければ、内容も大幅に変更するべきです。
ファイル名のつけ方
検索エンジンが複数ページスパムを見分けるための一つとしてHTMLファイル名を利用する場合もあります。「hikosi01」「hikosi02」「hikosi03」などのファイル名は避け、個々に独自の名前をつけたほうがいいです。cgiやphpのリライトでファイルをHTML化する場合には、このようなファイル名のつけ方になってしまうでしょうが、その場合には内容面に十分注意してください。