はじめまして、昨年10月に入社した林です。
medeluでは主にマーケティングに関わるデータ分析の業務を行っています。
本日はマーケティングでよく使われる、バスケット分析について簡単に説明します。

1. バスケット分析とは
2. 分析の仕方
3. 注意点
4. まとめ

例えば、スーパーマーケットでジャムとよく一緒に購入されそうな、併買されそうな商品と言われて、何が思い浮かびますか?
食パンはよく併買されていそうですよね。
一方で、惣菜パンはあまり併買されないかもしれません。
そういったことをデータで視覚化する分析が、バスケット分析です。
バスケットというのは買い物かごのことなので、「どんな商品が一緒に買い物かごに入れられているか」の分析、ということですね。

バスケット分析について語られるときに頻繁に登場する話が、「おむつとビール」の話です。
アメリカのあるスーパーでバスケット分析を行ったところ、おむつと併買されやすい商品としてビールがあった、というのです。
一見何も関連性のなさそうな商品ですが、このことからある仮説が浮かび上がりました。
それは、「そのスーパーでは、仕事帰りに赤ちゃんのためにおむつを買って帰る人が、ついでに自分用にビールを買っている」ということです。
この分析結果を活用して、おむつの隣にビールを陳列するようにしたところ、売上が上昇したそうです。
これは作り話なのではないかとも言われているそうですが、先ほどのジャムと食パンのようにある程度想像できる併買の傾向だけでなく、意外な関連性を見つけ出せるときもあるということですね。

実際の分析手順などはインターネットでも詳しく書かれている記事が多く見つかるのでここでは割愛しますが、分析に使用する指標は以下の4つです。
・支持度
・信頼度
・期待信頼度
・リフト値
最終的にはリフト値が大きい商品が併買されやすいということになるため、最も重要な指標です。

支持度
支持度は以下の計算式で求められます。
支持度=商品Aと商品Bの同時購入者数/全購入者数

これが大きい組み合わせは、同時購入されやすいのではないか、と当たりをつけられることになります。
ただ、前述の通り、結局はリフト値が重要になるので、こちらはあくまでも目安程度と考えてください。
リフト値は計算の手間が大きいため、全商品の組み合わせで計算するのは大変な労力になります。
そのため、いったん支持度を計算してみて、いくつかの商品の組み合わせに絞り込み、その組み合わせだけ②の信頼度以降の分析に進める、というのが効率的です。
また、初めからどの商品の組み合わせの併買傾向を調べたいかどうかが決まっている場合は、支持度の計算はスキップしてもかまわないでしょう。

信頼度
信頼度は以下の計算式で求められます。
信頼度=商品Aと商品Bの同時購入者数/商品Aの購入者数

商品Aを購入した人のうち、商品Bも購入した人の割合ということになります。
これが大きいと併買されやすい感じがしますが、具体的にどの程度の数値なら併買されやすいと言えるのか、判断が難しい気がしますね。
信頼度と下記の期待信頼度は、主にリフト値の計算に使用するために算出するものなので、この数値そのものにはあまり執着する必要はありません。

期待信頼度
計算式は以下です。
期待信頼度=商品Bの購入者数/全購入者数

商品Bの人気度、という言葉で置き換えられます。これが高い商品は、そもそも人気があって買われやすいということですね。
例えばこれが1/3という結果になった場合、そもそもこのお店に来る人の1/3の人は商品Bを購入している、ということになりますね。

リフト値
計算式は以下です。
リフト値=信頼度/期待信頼度

さて、信頼度と期待信頼度単体ではあまり意味がありませんでしたが、このリフト値を計算することで見えてくるものがあります。
信頼度は「商品Aを買った人のうち、商品Bも買った人の割合」で、期待信頼度は「商品Bの元々の買われやすさ」でした。
2つの指標を比べやすいように言い換えるなら、信頼度は「『商品Aを買った人の中の』商品Bを買った人の割合」、期待信頼度は「『全ての人の中の』商品Bを買った人の割合」です。
リフト値の基準は1です。
期待信頼度よりも信頼度のほうが高いと、計算結果は1を上回る数値になります。
その場合、商品Aを買った人の中での商品Bの人気度は、商品Bのそもそもの人気度よりも高い、ということになるので、商品Aと商品Bは併買されやすい、ということになりますよね。
逆にリフト値が1を下回る場合はどうでしょうか。
商品Aを買った人の中での商品Bの人気度は、商品Bのそもそもの人気度より低い、ということになりますね。
となると、商品Aを買う人にとって商品Bは不要なことが多い、ということになり、併買されにくい組み合わせであるということになります。

このようにリフト値を計算して、併買されやすい、あるいはされにくい商品の組み合わせを見つけていきます。
商品Aを購入している人は商品Bも購入したいと思う可能性が高い、ということがわかったら、商品Aと商品Bの陳列棚を近くすることで、商品Aを買いに来た人の視界に商品Bが入りやすくなり、売上の向上が見込めるでしょう。

このように便利なバスケット分析ですが、分析を行う際にはいくつかの注意点があります。
特に注意しなければならないのは、対象商品の購入者が極端に少ない場合です。
例えば全購入者を100としたとき、商品A、Bの購入者がそれぞれ1と20だったらどうでしょうか。
商品Bの人気度(期待信頼度)は20%ですが、商品Aを購入した1人の人が商品Bも購入していた場合、信頼度は100%になるので、リフト値は5になります。
数値上はとても併買されやすいということになりますが、実際には、商品Aを購入した人がたまたまBも購入しただけ、という感じがしますよね。

このように、ただ数値上の意味だけを捉えて分析するのではなく、そもそもの購入者数や商品特性など、様々な側面からデータを見た上で、バスケット分析を活用することとなります。

今回はバスケット分析の概要について記事にしてみましたが、いかがでしたか。

弊社medeluでは、コンサルティングをする中で、バスケット分析含む様々な分析手法を活用しています。
通販サイトの分析から戦略立案サポートまで、どうぞお気軽にご相談ください。

(過去の関連記事)
移動平均と季節調整~データ分析手法~
ビニングでデータの特徴を捉えよう~データ分析手法~

最終更新日:2024年6月28日