えむもじらさんのところから引用


追記:しかし、彼らはなぜ自身の素性を UA 内に表示しないのでしょうか? 例えば、DoCoMo の名を騙るボットには以下のようなものがありますが、いずれも身元を明らかにし、容易に区別できるようになっています。
DoCoMo/2.0/SO502i (compatible; Y!J-SRD/1.0; http://help.yahoo.co.jp/help/jp/search/indexing/indexing-27.html)
DoCoMo/1.0/N505i/c20/TB/W20H10 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html)
DoCoMo/2.0 D903i(c100;TB;W28H20) (compatible; Hatena-Mobile-Gateway/1.2; +http://mgw.hatena.ne.jp/help)

やはり、後ろめたい気持ちがあるのでしょうか?

Webサイトを PC用・携帯用に、しかも携帯用でもドコモ・au・ソフトバンクと分類するのに UserAgent を使っているところが多々あるわけで。 例えば http://www.yahoo.co.jp/ を見るときに UserAgent を替えながら見ると、PC用・各キャリアの携帯電話用に分類されて見えるという具合になっているんです。 で、携帯電話向け検索サービスに必要な各キャリア用サイトを収集するために、UserAgentをそのキャリア独特な文字列を入れて取得して、各キャリアごとに検索インデックス作っているんですな。 騙しているといえばだましているのかもしれないですが、特に後ろめたいものがあったりはしませんよ。


最近の携帯のサイトで、携帯電話 or PC の判定や、各キャリアの判定を行うのに、よく知られた判定方法・振り分け方法として、UserAgentを使う場合と、接続元IPアドレスを使う場合がある。 UserAgentの場合、例えば DoCoMo から始まる UserAgent 名の場合はドコモで、UpBrowserから始まる UserAgent が au/TuKa の EZWeb 端末で、J-Phone , Vodafone , SoftBank から始まる UserAgent が現ソフトバンクで、といった切り分けをする方法。 IPアドレスからの判定では、ドコモ・EZWeb・ソフトバンクの携帯電話からアクセスするときのゲートウェイのIPアドレスを登録しておいて、それを見て切り分ける方法。 ヤフーの場合はUserAgentを、楽天はIPアドレスを使って振り分けしているようです。


最近、携帯電話向け検索サービスがいくつか立ち上がっているのですが、携帯電話の振り分けにUserAgentを使っているサイトをクロールするにはそのUserAgentを名乗ればクロールできるのですが、IPアドレスで判定している場合にはそのように行かないと。 ここで携帯電話用サイトのSEOとか考えると、UserAgent判定しているほうが、検索エンジンのクロール対象になって検索サイトから誘導される可能性が高くなるといえるのでしょう。 さっきのヤフーと楽天の話でいうと、楽天はSEO対策していないってことが言えるのか。(笑)


単なる携帯電話のキャリアの振り分け程度ならばそのぐらいでいいのですが、ここからQVGA端末とそうでない端末の振り分け…とか始めると、深みにはまりますわな。

コメント

人気の投稿