URL正規化とは
URL正規化とはGoogle検索エンジンに対しウェブサイトがどのURLを正として利用しているか伝える施策。正規化を行う事によりサイトの評価を統一する事が可能になる。
概説
インターネットが普及していく過程において黎明期にはサーバのスペックが低く、メールなどをサブドメイン(例:mail.***.com)として使用する運用が多かった。その上でウェブサイトはwww.***.comのように設定することが多く、現在に至るまでwww.というサブドメインでウェブサイトを表示する事が出来る名残が続いている。
周辺環境が整備されウェブサーバやメールサーバなどが登場し、機能別に管理する事例が増えたことで、現在ではサブドメインを指定する必要が無くなり、多くのウェブサイトは***.com設定するようになった。
但し、前述の通りwww.を残すという設定は続いており、Googleとしても重複コンテンツと認識してしまうことを避けるためにURLの正規化を推奨し続けている。
ちなみに、似た事例で言えばスマホ用のページをサブドメインで作成する(例:m.***.com)事例も多くあったが、レスポンシブサイトが潮流となった事でこの点は解消されつつある。
長らくこれらの設定は検索エンジンだけでは無く、設定を行う事業者も悩みの種であったが、2019年にGoogleがサーチコンソール上でドメインプロパティというドメインに関連すると推察されるサブドメインを含めた情報をまとめてレポートする機能を発表したことにより大きく問題は前進した。
URL正規化を行うための主な方法
URL正規化を行うために以下のような手法が取られる事が多い。
htaccessファイルを使う
htaccessファイルを用いて特定のドメインは自動的に正規のURLに移動させる方法(301リダイレクトして正規化)で是正する。サーバにあるファイルを編集するケースが多いが、ワードプレスなどではこれを簡単に実装できるプラグインがあったりする。
canonicalタグを使う
canonicalタグはGoogleに対して重複コンテンツではない事を知らせるために用いられるタグで、これを利用して是正する。htaccessなどを編集できない環境の場合などに用いられるケースが多い。
主な指定方法としては以下のようにカノニカルの設定を行なったリンクタグをヘッダーの中に挿入して反映させる。