Google trends
2004年からのワードの検索された回数をグラフ化する Google trendsが出ています。 たとえばこんなことがわかるかと。
Windows Longhorn と Windows Vista で比較してみると Windows Vista の名称が発表されてから Longhorn が落ちていたり。
SMAP と KAT-TUN を比較すると2006年のQ1でKAT-TUNがSMAPより上にいったり。
日本のLinuxディストリビューションの Turbolinux, Vine Linux, Knopix で調べると、Turbo, Vine が2004年をピークに下降して knopix は少しだけ下降して、2004年には3位だったknopixが最近では1位になっていたりしている。 Linux, RedHat, Fedora のボリュームも2004年が多く下降気味なので、それにつられているのかなぁ。 おっとRichard Stallman も2004年がピークだ。 LinuxとStallmanは連動するのかなぁ。(Richard Stallman については 2004年のサンプル数が少ないので、無理やり論じています。)- 日本の三大美人だと勝手に思い込んでいる長谷川京子, 蛯原友里, 押切もえ を見ると、ハセキョー人気は下降気味で、現在ではエビちゃん→もえちゃん→ハセキョーな順番だ。(ある意味予想どおりだ) ちなみに私はもえちゃんが好きです。
で、こんな機能どうやって作っているんだとか思うんだろうけど、GoogleってSawzallという環境を持っていて、Webページだけでなく log の情報もあさることができるらしい。 Webページのインデックス作ってガッチャンコして適度に分散させる、みたいな順番で、MapReduce で Log あさって 結果にインデックス作ってガッチャンコして適度に分散させるっていう手法使えばいけそうだ。 まさに Sawzall の活用事例だろう。
コメント
コメントを投稿