0120-746-555お電話での無料体験レッスンのご予約・ご質問は
無料体験レッスン
IT業界まるわかりガイド

良く分かるデータマイニングの手法と分析ツールの選び方

良く分かるデータマイニングの手法と分析ツールの選び方

良いモノを作ってもなかなか売れない今日、顧客のニーズを正確に把握することが重要です。「データマイニング」(Data Mining)という言葉を聞いたことがあるでしょうか。「マイニング」とは「採鉱」(mining)のことです。つまり、データマイニングとは、膨大なデータから金脈のような貴重で価値ある情報を見つけ出すことを意味します。例えば、顧客の販売データを分析することにより、顧客のニーズをつかむことが可能です。今回はデータマイニングの基礎や手法、分析ツールの選び方についてご紹介します。

データマイニングとは

データマイニングとは

以前から顧客のニーズを把握する際は、統計解析が用いられてきました。

統計解析とは、あらかじめ仮説を立て、それを解析することにより検証する「仮説検証型」分析手法です。一方、データマイニングは、膨大なデータから仮説を立てる「仮説発見型」分析手法のことを指します。

おむつとビール

データマイニングの考え方が有名になったきっかけは、「おむつとビール」の事例が米紙「ウォール・ストリート・ジャーナル」に取り上げられたことです。

1992年12月23日の「Supercomputers manage holiday stock」と題する記事において、米国のスーパーマーケットチェーンが顧客の販売データを分析したところ、子供を持つ母親は父親にかさばるおむつを購入させ、父親はおむつと一緒にビールを購入する傾向があることを発見し、スーパーはおむつとビールを並べて置くことにより売り上げアップできたと報じました。

データマイニングの分析手法

データマイニングの分析手法

データマイニングにはさまざまな分析手法がありますが、ここでは4つの分析手法を取り上げます。

マーケットバスケット分析

「バスケット」(basket)とは、買い物かごを意味します。マーケットバスケット分析は、顧客の取引データをもとに何が一緒に購入されるか分析する手法です。 先ほどご紹介した「おむつとビール」の関係性もマーケットバスケット分析によって明らかになりました。 会員カードに記録された購入時間帯や季節を含めたデータ分析を行うことによって、商品がよく購入される時間帯・シーズン、商品を購入する客層を調べることができます。

ABC分析

在庫管理をする際、どの商品を重点的に管理すべきか分かると便利です。ABC分析では、商品の売り上げが高い順に商品を並べ、総売り上げに対する累積構成比を計算し、A・B・Cの3つのクラスに分けます

累積構成比上位70~80%をAクラス、80~90%をBクラス、90~100%をCクラスと分類することが一般的ですが、何%に分けるかは必要に応じて変更しても構いません。 品目ごとに売上、構成比、累積売上、累積構成比を基に作成した表をABC分析表、視覚化したグラフをパレート図(ABC分析図)と呼びます。

クラスター分析

クラスター(cluster)とは、「集団」を意味します。クラスター分析は異なる性質のものが混在する中から似た性質のものを集め、クラスターを作る手法です。 サンプル間の類似性(サンプル間の距離)を測る指標として、ユークリッド距離、マラノビス距離、マンハッタン距離、チェビシェフ距離、ミンコフスキー距離などがあります。

クレジットカードなどの顧客データをもとにクラスター分析を行い、クラスターのニーズに適した内容のダイレクトメールを送付するなどの利用法が考えられます。

ロジスティック回帰分析

YesまたはNoの形式で回答されているデータに向いている分析手法が、ロジスティック回帰分析です。例えば、顧客が特定のマーケティング・キャンペーンに反応する場合をYes、反応しない場合をNoとし、Yesの場合は1、Noの場合は0を付与します。

キャンペーンに反応する確率は0~1の数値で表されます。キャンペーンに反応する確率が高い顧客にダイレクトメールを送付することによって、キャンペーンの費用対効果を高めることが可能です。

分析ツールの選び方

User-Agent Switcher:ユーザーエージェント切り替え

データマイニングツールには大きく分けて、統計解析ツールや可視化ツールなどの特定の用途に向いた分析ツールと汎用データマイニングツールがあります。分析したいデータに合わせて、適切な分析ツールを選択してください。

大量のデータを扱うデータマイニングを行う際は、一部のデータでテスト分析を行い、ある程度仮説が立てられたときに大規模データで仮説を立証するための分析を開始します。そのため、
直観的に操作できる操作性が高いツールや、分析の自動処理が可能なツールがおすすめです。

また、データマイニングツールは、有料ソフトだけでなくフリーソフトもあります。目的・予算に応じた分析ツールを選びましょう

おわりに

今回はデータマイニングの基礎や手法、分析ツールの選び方についてご紹介しました。データマイニング成功のためには分析手法だけでなく、データ分析前の「データクレンジング」(Data Cleansing)も重要です。データクレンジングとは生データにおけるデータの抜け(欠損値)などの不備を修正し、データの品質を高めることを言います。

データクレンジングの作業が煩雑である場合は、データクレンジング機能を持つ分析ツールを利用すると良いでしょう。

Web業界のトレンドを学びたい方へあなたにぴったりのコースをご提案いたします

無料体験レッスン

無料体験レッスン実施中

最先端のWeb技術や、業界のトレンドについてご紹介をする無料体験レッスンをインターネット・アカデミーでは毎日開催しています。インターネット・アカデミーは日本初そして唯一のIT・Web専門スクールなので、その専門的なノウハウを活かした転身についてのご相談も承っています。ぜひお気軽にご参加ください。

このページの上へ

お電話での無料体験レッスンのお申込み・お問い合わせはこちら(受付時間10時-21時)