#概要
SEOの勉強をしたいエンジニアが最低限押さえておくべき、SEOの専門用語をまとめました!
色々取り組んでいる僕ですが、次はWebのSEOについて色々やることになりましたので、勉強ついでにまとめてみようと思った次第です。
一応どうすればいいかというのも学んでいる最中ですが、SEOをやって行く上で付き合っていくのが必須になる単語を簡易的にまとめて、また発見が有れば随時更新していきたいです。
僕自身も含め、困ったときはこの記事に戻ってくることでそういえばそうだったなぁ。のような解決ができるようにしたいと思います。
ゆっくりしていってね!!(^ω^)
#僕が思う知っておきたいSEO用語集
##Search Engine Optimization さーち えんじん おぷてぃまいぜーしょん
検索エンジン最適化の意味。所謂「SEO対策してますか?」は「検索エンジン最適化してますか?」ということ。
「googleと仲良いWebサイト作ってますか?」とも言える。
##クローラー・クローラビリティ
googleが様々なWebサイトを評価するときにクローラーと言うwebサイト巡回機械がサイトページを取得(クロール)しに来ます。
取得されたサイトページがgoogleの評価項目を元に評価され、検索順位が決定します。
クローラビリティとは、クローラーに対してどれほど回遊性があるかどうか。
一般的にはクローラビリティが高くすることがSEO対策するということだと思います。
「クローラビリティしっかりしてる?」は、所謂「SEO対策ちゃんとしてる?」の別の言い回しだと思う。
##Page Rank ぺーじらんく
ページランクとは、googleから見たそのページの評価指標です。一般的にこれが優れていれば、SEO的にも優れている。と言えそうです。
Google PageRank Checker
コチラのサービスや、Chromeの拡張機能を用いて、調べることの出来ます。
コチラの記事が参考になるかと重います。
ページランクとは @SEO HACKS
2015/07/29 追記
ページランクは2014年から更新されてない、終わったるくさいサービスなので、参考しないほうがよろしいかと。
というコメントを頂きまして、調べてみました所
Google、ツールバーPageRank 更新を終了か 今後の予定なし
こういった記事が散見されますので、あまり重要度は高くないかもです。
昔にそういう制度が合ったんだなと抑えて頂ければと思います。
##robots.txt
クローラーにクロールしてほしくないサイトページを記載するテキストファイルです。会員専用コンテンツだったり、検索順位を挙げようとも思ってないページを記述しておくことで、余計なページを見させないようするために必要です。
クローラーは
というような感じのURLでテキストファイルをを見に行くので、上記のようなURLでテキストが確認できるようにしておけば大丈夫です。
ちなみにgoogle自身のrobot.txtはこんな感じですね。
googleのrobot.txt
書き方などはコチラが参考になるかと。
robots.txtの書き方と効果的な活用法 @バズ部
##ソフト404
404ページなんだけど、httpステータスコードとしては200。コレは良くない。
404ページなら404を返すようにするのが望ましい所。
##重複コンテンツ
URLが違うのに、ページで表示しているものが全く(もしくは、ほぼ)一緒の際に、webMasterToolから怒られる状態のことです。
URLを統一するか、コンテンツをがらっと変える必要が有りますね....
または、パラメータの有無はあれど表示する物がほぼ変わらない時なども重複コンテンツ扱いになります。
その時はcanonical設定(後述)をすることで回避することが出来ます(後述)
##アノテーション
htmlのHead等に書き込むタグ等で設定しているメタデータ等をさしてアノテーションと言うみたいです。
「SEOでアノテーションの設定きちんとしてますか?」
のように言うかどうかは知りませんが、もし聞かれたとしたら
「タグの設定きちんとしてますか?」という意味だと思います。
とかは非常に有名なタグですけど、広義に言えばコレもアノテーションの一つなのかな。
他にもSEOでよく使われるアノテーションとして、リンクタグのalternate属性とcanonical属性というのがよく出てきます。
他には、noindexとかでしょうか。順に記述します。
<link rel="属性名" href="リンク"/>
<link rel="alternate" href="http://example.com/sp/"/>
<link rel="canonical" href="http://example.com/"/>
この2つは、主にPC用とSP用のURLが違う場合に必要な設定です。
こちらが参考になりました。
canonical属性とalternate属性を使ってモバイルの最適化をしよう @ferret
###alternate属性 おるたーねーと
@上記ferret記事より引用
alternate属性というのは、googlebotにスマホ用サイトの存在を知らせるためのものなります。クローラーがデスクトップ用サイトを訪れたとき、このalternateが設定されていると、スマホ用サイトの存在を知ることができます。
ということで、もしPCで開くページと対応する別URLのSPページが有るなら
<link rel="alternate" href="http://example.com/sp/"/>
のような設定が必要です。
###canonical属性 かのにかる
URLの正規化タグとも言われます。
僕が調べた所二通りほど使い方があります。
####SPページを開いているクローラにPCサイトがあると伝える。
@上記ferret記事より引用
「このスマホ用ページはデスクトップページのスマホページです。」とgooglebotに伝えることになります。
ということで、もしPCで開くページと対応する別URLのSPページが有るなら
<!-- http://example.com/sp/というページを開いている時にPCページのURLを教えるために使う。 -->
<link rel="canonical" href="http://example.com/"/>
のような設定が必要です。
[ -- 追記 -- ]
SPサイトと伝えるというより、今見ているページのオリジナルを指し示すタグ。と言う理解が正しいようです。
例えばアマゾンのように1商品に対して様々なURLで閲覧することが出来ますが、URLは違うので別ページ。なのにコンテンツは同じなので重複ペナルティになります。
それを回避するために、canonicalというタグで、オリジナルの1ページを指し示す。
機械「あ、これ☓☓と同じコンテンツだけど、これは〇〇がオリジナルとcanonicalで明記してるから、重複じゃないな」
という解釈です。
つまり、ここで言うとURLが違うが、コンテンツが同じSP,PCサイトのトップページでは、SPページでcanonical href="pcトップページリンク"と指定すること。重複回避と正しいクロール先を明記出来る。という感じですね。
[ -- 追記終わり -- ]
####コンテンツがパラメータなどで重複してしまった際等
rel=”canonical”の正規化で、重複コンテンツを撃退 @海外SEO情報ブログ
例えば
- http://example.com/product.php
- http://example.com/product.php?item=a
- http://example.com/product.php?item=b
というURLを叩いた際に、ほんの一部だけ表示が変わり、ほかが全く一緒の表示になってしまう場合。多くの場合は重複コンテンツとみなされ、Webマスターツール等でエラーが出てしまいます。
meta title、meta descriptionが一緒というエラーも出てしまいます。
そういう時に
<link rel="canonical" href="http://example.com/product.php"/>
というcanonical設定を行うことで、重複コンテンツの発生を防ぐことが出来ます。
###noindex
<meta name=”robots” content=”noindex” />
という設定をすると、このページはインデックス(ページを取得して評価)しないでくれ!
とクローラーに伝えることが出来ます。隠しキャンペーンとか、googleに見つけられると困るページを短期的に出すときとかに使えそうですね。
robot.txtに記述せずにインデックスさせないようにするためにはこのmetaタグ設定が必要です。
##nofollow
こちらの22pが参考になります。以下、これからの引用です。
リンクのrel属性の値にnofollowを設定すると、Googleに対してこのリンクをたどらないよう、そしてリンク先に自分のサイトのページ評価を渡さないように伝えられます。
<a href="http://www.shadyseo.com/"rel="nofollow">コメントスパム</a>
もう1つのnofollow属性の使い方としては、コンテンツの中で他のサイトについて言及し、リンクは張るけれども、そのウェブサイトに自分のサイトの評価を渡したくない場合です。
<meta name="robots"content="nofollow">
つまり、自身の良質なページ評価でリンク先のページの評価を上げたくない!
という時に使えというものです。
##Vary HTTPヘッダー ばりーhttpへっだー
スマホ向け表示を分けているときはVary HTTPヘッダーを使うこと など10+4記事(海外&国内SEO情報)
この記事によると
「同一URLで端末によって出し分け」「スマホ向けを別URLで作り、リダイレクトする」
「User-Agent(UA、ユーザーエージェント)」の情報に基づいてPCとスマートフォンで異なるHTML(やCSS)を返す。
というWebサイトの時は Vary HTTPヘッダーを使用することをグーグルは強く勧めている らしい。
Varyというのは「変わる、変化する」という意味を持った英単語です。
Vary HTTPヘッダーというのは「キャッシュサーバーやGooglebotがユーザーエージェントやクッキーによって処理が変わります」というのを表す設定になります。
Chromeの要素の検証などで[開発者ツール]を開き[Network]から開いているページのレスポンスを確認すると、今自身のサイトがどんなレスポンスをしているの確認できると思います。
設定は非常に簡単で.htaccessに書き込んでやることで設定できます。
参考記事から引用しますと
#ユーザーエージェントでコンテンツが変わるなら
Header set Vary User-Agent
#言語とクッキーの状態でコンテンツが変わるなら
Header set Vary Accept-Language,Cookie
#ブラウザが対応しているgzipなどの受信形式とクッキーの状態でコンテンツが変わるなら
Header set Vary Accept-Encoding,Cookie
と一番上の部分に書き込むだけで設定完了です。
googleが推奨している物は何でも設定しておくと安心ですね。
##パンダアップデート、ペンギンアップデート
パンダ・アップデート @SEO HACKS
ペンギン・アップデート @SEO HACKS
この単語自体はSEO界隈ではかなり有名ですね。googleの検索エンジンアルゴリズムのアップデートのことです。
###パンダ・アップデート
主に「低品質なコンテンツが検索結果上位に表示されにくくするため」のGoogleの検索アルゴリズム・アップデートの呼称です。
ユーザーに価値がないような情報を大量に持っている(サイトの品質が低い)ようなサイトでも、コンテンツが膨大であることが評価され検索上位に出てくるという状況が有りました。
ワードサラダ(単語単語が大量にあり、文章になってない)をたくさん並べるだけのサイトを検索結果から除外し、結果として優良なサイトを上位に表示させるというアルゴリズムの変更を行ったアップデートです。
###ペンギン・アップデート
ペンギン・アップデートは中でもスパム行為や、ウェブマスター向けガイドラインに著しく違反しているWebページに対して検索結果の順位を下げるとされています。
昔は兎に角大量に被リンクを集める事が検索順位を上げるのに効果的でした。
しかしこのアップデート以降、googleから不自然なサイトから被リンクを大量に集めているサイトにペナルティを与えるという施策を実施。
様々なWebサイト順位を大きく落とす大打撃を食らうと言う事件が起こりました。
これにより、Webサイトはコンテンツ性豊かな質の高さを求められるようになりました。
じゃあ被リンクはもう駄目なの?
というとそういうことではなく、コンテンツ性豊かな良いサイトにリンクしてもらえることは評価の対象になっているらしいです。不正が許されなくなったというだけで、なんだかんだ重要らしいです。
#参考
【google公式】とりあえずコレを見ないと始まらない。
Webマーケティングの情報が詰まっており大変参考になります。
こちらもWebマーケティング情報が沢山あります。
SEOの基礎中の基礎が多少ですが公開されています。本格的に学ぼうと思ったらセミナー等申し込みが必要ですが、無料分でも結構良い情報が落ちています。
#この記事は完成しない予定
他にも用語見つけたら、定期的に更新はしたいと思います。
では。