理系じゃなくてもデータの魅力が伝わる「Yahoo! JAPANビッグデータレポート」
2016年9月12日
「ビッグデータ」と言われたら、なんとなく「難しそう」「数字は苦手」と思う文系の方もいらっしゃるのではないでしょうか。
でも、世の中にある巨大なデータを有効に分析し、活用することができれば、ビジネスはもちろん、医療や防災、文化活動での活用など、私たちの生活をより豊かにすることに役立ちます。
そんなビッグデータを活用して、Yahoo! JAPANが「アーティストクラスタリングチャート」という面白いレポートを発表しました。
好きなアーティストの歌詞の傾向を知る
この「アーティストクラスタリングチャート」とは、日本のミュージシャンの16万曲分の日本語歌詞データを解析して、名詞や形容詞、動詞と分類と出現個数や出現頻度などを洗い出し、その類似性を可視化したWebサービスです。
サイトにアクセスをすると、トーナメント表のような図が表示されます。 その1つ1つに日本のアーティスト名が羅列され、選択できるようになっています。 そのリストからクリックするか、もしくは画面右下の「アーティスト検索」という検索窓から目的のアーティスト名を入力すると、右側にそのアーティストらしい「歌詞ワード上位10件(特徴語)」が表示されます。
たとえば、SMAPだったら「君」「僕」「誰」「気持ち」がならび、TUBEだったら「夏」「胸」「恋」「心」などが歌詞ワード上位に入ります。
うーん、なんとなくイメージどおりですね。
また、「特徴語が似ているアーティスト」という項目では、特徴語が似ている、つまり歌詞に頻出する言葉が良く似ているアーティストを見ることができます。
たとえば、「河村隆一」「LUNASEA」、「YUKI」と「JUDY AND MARY」が特徴語が似ているアーティストに並んでいて、納得いくようなデータが出ていたり、「矢沢永吉」と「郷ひろみ」のような興味深い組み合わせが出ていたりします。
それを眺めるだけでも面白いですよね。
「Yahoo! JAPANビッグデータレポート」の調査結果
他にも、「Yahoo! JAPANビッグデータレポート」には過去に大変興味深いレポートが公開されています。 お勧めは「日本は2つの国からできている!?~データで見る東京の特異性~」。
いかに「東京」という都市が日本国内においても特異な存在なのかということが、データを通じて知ることができます。
また、今年もそろそろ予防接種を考えなければならないインフルエンザの流行について調べた「ビッグデータ分析でみるインフルエンザ感染状況:2015-2016」も大変興味深いデータが出ています。
こういったデータを見ると、膨大なデータをまとめ、分析することで、新しく見えてくる世の中の「常識」があるような気がしてきます。
ぜひ、ビッグデータって面白そう、と感じた方は、プログラミングやサーバの体験レッスンや受講相談を受けてみてください。きっと、新しい可能性をたくさん感じることができるはずですよ!
関連サイト
本ブログは、日本初Web専門スクールのインターネット・アカデミーの講師が運営するWebメディアです。 スクールの情報はもちろん、最新のWebデザイン・プログラミング・Webマーケティングについて役立つ情報をご紹介しています。