収入UPの転職を目指す方へ

データマイニングの基礎や手法と分析ツールの選び方

  • 2023/01/04
良く分かるデータマイニングの手法と分析ツールの選び方

「データマイニング」(Data Mining)という言葉を聞いたことがあるでしょうか。「マイニング」とは「採鉱」(mining)のことで、すなわちデータマイニングとは膨大なデータから金脈のような貴重で価値ある情報を見つけ出すことを意味します。例えば、顧客の販売データを分析することにより、顧客のニーズをつかむことが可能です。良いモノを作ってもなかなか売れない今日、顧客のニーズを把握できたらうれしいですよね。今回はデータマイニングの基礎や手法、分析ツールの選び方についてご紹介します。

AIちゃん
AIちゃん

データマイニングで顧客ニーズがわかるなんて、マーケティング担当者にとってはすごく知りたい知識ですね!

有村先生

データマイニングは、主に情報(データ)から有益なものを採掘(マイニング)するために使われます。具体的な分析ツールとともに見ていきましょう。

目次

データマイニングとは

データマイニングとは

長らく顧客のニーズを把握する際は、統計解析が用いられてきました。

統計解析とは、あらかじめ仮説を立て、それを解析することにより検証する「仮説検証型」分析手法です。一方、データマイニングは、膨大なデータから仮説を立てる「仮説発見型」分析手法のことを指します。

おむつとビール

データマイニングの考え方が有名になったきっかけは、「おむつとビール」の事例が米紙「ウォール・ストリート・ジャーナル」に取り上げられたことです。

1992年12月23日の「Supercomputers manage holiday stock」と題する記事において、米国のスーパーマーケットチェーンが顧客の販売データを分析したところ、子供を持つ母親は父親にかさばるおむつを購入させ、父親はおむつと一緒にビールを購入する傾向があることを発見し、スーパーはおむつとビールを並べて置くことにより売り上げアップできたと報じました。

データマイニングの分析手法

データマイニングの分析手法

データマイニングにはさまざまな分析手法がありますが、ここでは4つの分析手法を取り上げます。

マーケットバスケット分析

「バスケット」(basket)とは、買い物かごを意味します。マーケットバスケット分析は、顧客の取引データをもとに何が一緒に購入されるか分析する手法です。 先ほどご紹介した「おむつとビール」の関係性もマーケットバスケット分析によって明らかになりました。 会員カードに記録された購入時間帯や季節を含めたデータ分析を行うことによって、商品がよく購入される時間帯・シーズン、商品を購入する客層を調べることができます。

ABC分析

在庫管理をする際、どの商品を重点的に管理すべきか分かると便利です。ABC分析では、商品の売り上げが高い順に商品を並べ、総売り上げに対する累積構成比を計算し、A・B・Cの3つのクラスに分けます

累積構成比上位70~80%をAクラス、80~90%をBクラス、90~100%をCクラスと分類することが一般的ですが、何%に分けるかは必要に応じて変更しても構いません。 品目ごとに売上、構成比、累積売上、累積構成比を基に作成した表をABC分析表、視覚化したグラフをパレート図(ABC分析図)と呼びます。

クラスター分析

クラスター(cluster)とは、「集団」を意味します。クラスター分析は異なる性質のものが混在する中から似た性質のものを集め、クラスターを作る手法です。 サンプル間の類似性(サンプル間の距離)を測る指標として、ユークリッド距離、マラノビス距離、マンハッタン距離、チェビシェフ距離、ミンコフスキー距離などがあります。

クレジットカードなどの顧客データをもとにクラスター分析を行い、クラスターのニーズに適した内容のダイレクトメールを送付するなどの利用法が考えられます。

ロジスティック回帰分析

YesまたはNoの形式で回答されているデータに向いている分析手法が、ロジスティック回帰分析です。例えば、顧客が特定のマーケティング・キャンペーンに反応する場合をYes、反応しない場合をNoとし、Yesの場合は1、Noの場合は0を付与します。

キャンペーンに反応する確率は0~1の数値で表されます。キャンペーンに反応する確率が高い顧客にダイレクトメールを送付することによって、キャンペーンの費用対効果を高めることが可能です。

分析ツールの選び方

User-Agent Switcher:ユーザーエージェント切り替え

データマイニングをツールとして利用する「マイニングツール」、それと昨今のビジネス環境に欠かせない分析ソリューションの「BIツール」は何が違うのでしょうか?

マイニングツールとは

マイニングツールとは文字通り「データマイニングを行うためのツール」です。分析したいデータを取り込み、分析手法を選択することでデータ間に隠れている関係性を明らかにしたり、事象の発生確率を計算したりと色々な機能で日々のデータ分析をサポートしてくれます。

データマイニングツールには大きく分けて、統計解析ツールや可視化ツールなどの特定の用途に向いた分析ツールと汎用データマイニングツールがあります。分析したいデータに合わせて、適切な分析ツールを選択してください。大量のデータを扱うデータマイニングを行う際は、一部のデータでテスト分析を行い、ある程度仮説が立てられたときに大規模データで仮説を立証するための分析を開始します。そのため、直観的に操作できる操作性が高いツールや、分析の自動処理が可能なツールがおすすめです。

また、データマイニングツールは、有料ソフトだけでなくフリーソフトもあります。目的・予算に応じた分析ツールを選びましょう。

BIツールとは

一方、BIツールとは「BI(Business Intelligence)」という概念にもとづきデータの可視化・分析を提供するツールです。BI(Business Intelligence)とは、「誰もがデータサイエンティストのようにデータ分析できる環境を整え、経営や業務における意思決定を早める」という概念であり、これをツールとして落とし込んだのがBIツールです。

具体的なBIツールの機能としては、OLAP分析やシミュレーション解析といった複数の分析機能が備わっており、マイニングツールのような分析機能も含まれているものが一般的です。そのため、必要なデータを取り込んで分析手法さえ選択すれば、様々な角度からビジネスに有用な知見を導き出したり、リスクの発生確率を計算したりと、いろいろな活用方法があります。

マイニングツールとBIツールの違いまとめ

マイニングツール=データマイニングを実施するための機能だけが備わっているもの、BIツール=データマイニングに加えて様々なデータ分析が実現できるものとお考えください。

ただし、昨今のこの領域はツールという観点で言うとどちらも同じような機能が搭載されてきており、その垣根はなくなりつつあることも事実です。

おわりに

今回はデータマイニングの基礎や手法、分析ツールの選び方についてご紹介しました。データマイニング成功のためには分析手法だけでなく、データ分析前の「データクレンジング」(Data Cleansing)も重要です。データクレンジングとは生データにおけるデータの抜け(欠損値)などの不備を修正し、データの品質を高めることを言います。データクレンジングの作業が煩雑である場合は、データクレンジング機能を持つ分析ツールを利用すると良いでしょう。

インターネット・アカデミーでは、Webスクレイピング講座やBIツールの使い方を学ぶ「Power BI研修」を筆頭に、データ分析に役立つ講座や企業向け研修を提供しています。ご興味がある方は「無料カウンセリング」でぜひお気軽にご質問ください。

自動で情報収集しあなたのビジネスへ利活用

Webスクレイピング講座

Webスクレイピング講座では、Pythonを用いてWebページの情報を自動で収集する技術であるWebスクレイピングを学習します。人間が手作業で行うよりも、正確かつ短時間でWebサイトから情報収集をすることができます。ログイン処理を伴うブラウザ操作を習得するため、あらゆるWebサイトの情報収集が可能に。

相談してコースを選びたい方はカウンセラーに無料で相談

カウンセラーに無料で相談

※無理な勧誘は一切ありません

無料で相談してみる