↑↑これ、めっちゃ面白そうなんですけど。東京かぁ~~。↑↑

悪徳SEO業者に騙され続けるWeb担当者

この記事では図書館情報学の視点からSEOを解説し、業界タブーに切り込みます。やってはいけないSEOと取り組むべきSEOの違いをちゃんと理解し、SEO業者に従った結果、気がついたらブラックハットSEO(スパム行為など悪質な手法で検索上位に表示させるSEO)をやっていた、ということがないようにしましょう。

なぜ図書館情報学なのか

Webの考え方は図書館学(図書館情報学)が基本となっていると言っても過言ではありません。ですから、検索エンジンやSEOについても図書館情報学から知ることができるのです。

ここで重要なのは、図書館情報学は図書の分類と検索の学問であり、図書館情報学から検索について知るということは「検索エンジン側からの視点」で検索を知ることができるという点です。SEOやホワイトハットとブラックハットの違いなどを解説する記事や本のほとんどは「検索される側の視点」で書かれるため理解しにくいのです。なぜなら「検索される側の間違った考え方」を正さない限り、何が本当に正しいのかが理解できないからです。

では、図書館情報学で解説される検索システムとは何かをまず確認してみましょう。

検索精度とは何かを理解する

私たちが検索エンジンを利用する際、知りたい情報が掲載されているWebページのみが多く検索結果に表示され、そこから知りたい情報に一番近そうなWebページ(もしくは複数のWebページ)が選べることを理想とします。もちろ検索エンジン側もできるだけ、その理想に近い検索結果を提供することを望んでいます。
しかし実際には、知りたい情報が掲載されていないWebページが検索結果に表示されたり、逆に知りたい情報が掲載されているWebページが検索結果に表示されていない可能性があります。
こういったことを、日常の会話の中で「検索結果の精度が良い(悪い)」などと言うこともあるのですが、検索精度とはいったいどのようなことなのでしょうか?

検索の仕組みからSEOを考える


上の図を見ながら続きをお読みください(クリックすると拡大します)。
まず、水色の枠内が検索対象となるもので、これを図書館情報学では「情報源」と呼びます。Googleであれば、検索を高速化するためにネット上をロボットがクロールしてGoogleのサーバー内に溜め込んだ情報が情報源となります。実際には違いますが、分かりにくい方はインターネット上のWebサイト(Webページ)が情報源として読み進めてください。
次に紫色の枠内が情報源の内で本来であれば検索で(得られるかどうか別にして)得たいWebページです。これを「適合資料」と呼びます。
そしてピンク色の枠内が検索結果画面に表示されるWebページです。

つまり、水色の情報源に対して検索をかけるとピンクの情報が検索結果に表示されますが、その内実際に求めていた情報は紫色とピンク色が重なる緑色の点線枠内の「マッチ」となります(「マッチ」は図書館情報学では使用しない用語ですが説明の便宜上、私が名前をつけました)。これに対して検索結果には表示されますが求めていなかった情報を「ノイズ」と呼び、検索結果に表示されなかったが求めていた情報を「モレ」と呼びます。

更に、適合資料(紫色の枠全体)に対して検索結果に表示された情報(マッチの部分)の割合を「再現率」と呼び、検索結果全体(ピンク色の枠全体)に対して適合していた情報(マッチの部分)の割合を「精度(もしくは適合率)」と呼びます。

ちなみに「再現」と聞くと「所定の条件や手順で同じ事象が繰り返し起こること」という意味だと思う人も多いと思いますが、「再現」にはもう一つ別の「正確にもしくは意図した通りに表現が実現すること」という意味があります。ここでは後者の意味となります。

私たちが「検索精度」と思っているものは、実際には再現率適合率(精度)の2つに分けられることが分かります。

検索結果の再現率と適合率をあげるには

再現率と適合率の両方が高い(モレとノイズが少ない)のが理想的な検索結果になるわけですが、それがなぜ難しいかを具体的な例で考えてみましょう。

知りたい情報を「日本の歴史」とし、検索は「日本」と「歴史」の2つキーワードで行ったとします。この時に当然「日本の歴史」の情報が「マッチ」として検索結果に表示されますが、同時に「日本」という言葉を含む「日本酒の歴史」が「ノイズ」として表示されます(実際には表示されませんが例え話として)。また「昭和の歴史」や「JAPANの歴史」は検索結果には表示されず「モレ」となります。

そこで図書館情報学では「ファセット」という手法が持ち入れられます。細かくは触れませんが「日本」というものに対して「時代属性」として「平成、昭和、大正・・・」、「言語属性」として「JAPAN、JAPON・・・」などと参照できるようにしておき、より多くの「適合資料」を検索結果に出そうというものです。
これは書籍の著者が複数のペンネームを持っていたりする時に便利です。

検索の仕組みからSEOを考える


しかし、上記の図のように再現率をあげると同時に「ノイズ」が増え「適合率(精度)」を低下させてしまいます。そこで「適合率」をあげるために「日本と日本酒は別の単語である」といった「統制語彙表」を用いることでノイズを減らしていきます。

実際の検索エンジンはここに書いたものよりもっと高度な技術で検索再現率と適合率を高めていますが、ここではあくまでも概念の理解を優先します。

(上記は理解しやすくするための説明で、ファセットも統制語彙表も再現率、適合率の向上に役立てられます。)

SEOとはどういうものなのか

このように検索エンジンが検索再現率と適合率を高めていくなかで、SEOという考え方が生まれたのかを考えてみましょう。

もしあたなが「JAPANの歴史」というWebサイトを運用していたとします。先の例で考えると検索エンジンが
「日本=JAPAN」と対応してくれなければ「日本 歴史」で検索した人にあなたのサイトは検索結果に表示されません。しかし、いつ「日本=JAPAN」と対応されるかわからないので、「日本 歴史」で検索した人の検索結果にも表示されるように、あなたのサイトに「日本」というキーワードを足したりタイトルを「日本の歴史」に変えたりするわけです。つまり、「モレ」のところにあった情報を「マッチ」へ移動させるわけです。これが下の図での「ホワイトハットSEO」の部分になります。

検索の仕組みからSEOを考える


逆にあなたが「旅行会社」のWebサイトを運営していたとします。「日本の歴史に興味がある人は縁(ゆかり)の地を訪ねるために旅行をするかもしれない」と思い「日本 歴史」というキーワードをサイト内に埋め込み検索結果に表示させたとします。これは「適合資料」でない領域から「ノイズ」に移動させたことになります。つまり「ブラックハットSEO」というわけです。

なぜブラックハットが「悪質」とまで言われるのかは、「精度」を落として検索者(ユーザー)に迷惑をかけるだけでなく検索エンジン側が「ノイズ」を減らすための膨大な作業が発生するからです。そしてWeb全体の取り組みとしてみんながルールを守って検索の精度と再現率の向上を目指しているところに、非常に卑怯な方法で迷惑をかけていることが最大の問題なのです。(なによりもセマンティック・ウェブの実現を遅らせる罪人なのです。)

Web標準の教科書【電子書籍】[ 益子貴寛 ]

価格:2,333円
(2016/10/6 12:00時点)


まじめに取り組んできた企業や人からすれば、「ペナルティを受けたサイトなんて二度と検索結果に出て欲しくない」くらいの気持ちになっても不思議ではありません。

ですから、あなたの担当するWebサイトがペナルティを受けた時に「知らなかった」では済まされないので、しっかりと理解し管理する必要があります。

あなたは騙されていないだろうか?

WebにはW3Cが規格化(標準化)するルールがあります。大原則は検索される側とする側がそのルールの上にいることです。そしてセマンティックを見据えた取り組みをしっかりと行っていれば問題はないはずです。

「当社はGoogleの最新アルゴリズムを理解しています」という売り文句で迫ってくるSEO会社の多く(もちろん全てではありません)は、たった今の検索システムで検索結果に表示せることを目指しており、それがマッチの領域なのかノイズの領域なのかは関係ありません。検索結果に表示されなくなってはじめてノイズの領域であったことに気づけますが、恐らく業者は「アルゴリズムが変わったから」としか説明しないでしょう。そして新しい対策が必要だと言って見積書を持ってくるのです。

Googleのパンダ/ペンギンアップデートにより、「ノイズ」の多くは取り除かれ悪質なSEO業者が活動できる領域はかなり狭まりました。そのような状況下で新たなSEOとして注目を浴びたのがコンテンツマーケティングです。
悪徳SEO業者は今、このコンテンツマーケティングをサポートする会社の群れに身を潜めています。コンテンツマーケティングはユーザーとのコミュニケーション戦略の一つであってSEOがメインの目的ではありません。そのことをしっかり理解して話を聞いていれば、信頼できるパートナーか判断できるはずです。(コンテンツマーケティングをサービスとする会社さんの中にはステキな会社がいくつもありますので誤解しないでください。)

今一度、サイト訪問者、検索エンジン、Webサイト(Webページ)の三者の関係性を整理・理解し、正しいWeb運営を心がけましょう。

もし、もっとしっかりした判断ができるようになりたいのであれば、セマンティック・ウェブについても学習しておくことをおすすめします。
価格:3,132円
(2016/10/6 11:05時点)


図書館情報学に興味を持った方は下記がおすすめです。

情報資源組織論改訂 [ 田窪直規 ]

価格:2,160円
(2016/10/6 11:08時点)


余談

数ヶ月前に、私の会社に訪問してきたとある会社の営業さんは「情報量の少ないページはGoogleのペナルティを受けるので改善が必要です」と言いました。
この記事の内容を理解していれば「情報量が少ない」という理由でWebページが「ノイズ」になるわけがないことは簡単に分かりますよね。現に過去のGoogleのフォーラムや関連記事などを調べましたが、情報量の少ないページについては検索結果に表示されにくいかもしれないがペナルティを与えることはないと2度3度と明言されていました。
このことについて後日メールで営業さんに訪ねると、「今週中にはお返事します」、お返事がないので状況を確認すると「本日中にはお返事します」、その後は連絡がくることはありませんでした(心当たりがある方、ご連絡お待ちしております)。
ちなみにその会社はもともとSEO会社で現在はディスプレイ広告などを中心に行っている会社です。
その会社の実績には大手通信キャリアさんや大手カタログ通販会社さんの名前とかが並んでいるわけで、悲しい現実なのです。
みんなで協力しあい作り上げてきたものを踏みにじり、「自分たちさえよければ良い」という考えで業務を行ってきたのが悪徳SEO業者なのです。

私自身が多くの会社さんを知っているわけではありませんが、どの会社が悪くてどの会社がおすすめか、興味がある方はお会いする機会があればお聞きください。

↓頭を使った後は脳に糖分補給!!

0 件のコメント :

コメントを投稿