第39問
ある小売店の一定期間における ID-POS データを用いて、100 人のある顧客セグメントに対するマーケットバスケット分析を行ったところ、商品 a と商品 b の購買に関して、下表のような結果が得られたとする。
このとき、以下の設問に答えよ。
設問1 支持度(サポート)に関係する記述として、最も不適切なものはどれか。
ア 商品 a のみを購買した顧客数は 10 人である。
イ 商品 b のみを購買した顧客数は 30 人である。
ウ 商品 a と商品 b を共に購買した顧客数は 10 人である。
エ 商品 a も商品 b も購買していない顧客数は 40 人である。
オ 商品 a も商品 b も購買していない顧客数は、商品 b のみを購買した顧客数より多い。
設問2
リフト値(lift(商品 a ⇒ 商品 b))の値として、最も適切なものはどれか。
ア 0.25
イ 0.50
ウ 1.00
エ 1.25
オ 2.50
マーケットバスケット分析とは?
データ分析の手法の1つで、同時に購入されやすい商品の組み合わせを見つけ出す分析方法です。
アメリカの例では、オムツを買う顧客は一緒にビールを買う、という傾向が強い事が判明した事で有名となった分析手法です。
POSデータ分析などで良く利用されます。
一緒に買われやすい商品を近くに配置して新たな提案をすることで売上貢献につなげたり、ABC分析では見えない繋がりを見つけ、不必要な売上定価を防ぐ効果などがあります。

信頼度
「信頼度」は、一方を購入した人を母数として、もう一方と両方を購入した人の割合を調べます。
(AB両方購入者数)/(Aの購入者数)=信頼度

支持度

「支持度」は、全体を母数とした時に、AB両方を購入する人がどの程度割合いるのかを調べます。
今回で言えば、100人いる中で、aもbも両方購入した人の数は10人です。
10/100で10%の支持度ということになります。
また、a+b両方を購入した人が10人なので、それぞれ単品で購入した人の数は10を引けば判明します。
aは10人
bは30人
という事になります。
aとbの単体購入者数の合計は40人で、両方購入した人が10人ですから、aかbいずれかを購入している人は合計50人。購入していない人の数も50人ということになります。
このことから不適切となるのは エ となります。
lift値
liftというものも聞きなれない言葉ですね。
式中の 「→」、これは左側が起きる時に右側になる、という「条件→結論」を表しています。つまり、商品aが購入されたら→商品bも購入される、という意味です。

lift(a→b)=信頼度(a→b)/全体の中でのbの購入者の割合 という式で出ます。
リフト値が高いほど、AとBは関係性が強いという事になります。
何もしなくても2人に1人が買ってくれるネギがあるのに、卵を買う人の10人に1人がネギを買うからと、卵のそばでネギを売っても、そもそもそんな労力をかけなくても買ってくれる人がいるのだから十分ですよね、ということになります。
これが例えば、何もしなければ10人に1人しかネギを買わないけれど、卵と一緒の場合は2人に1人がネギを買っている、ということであれば、一緒に販売しておすすめするほうが効果が期待できるよね、という考えになります。
さて、今回の問題を見てみましょう。
100人の来店客のうち、商品bを購入した人の数が40人でした。liftの分母は40/100(=0.4)になります。さらに、商品aを購入した20人のうち、aもbも購入したのが10人でした。liftの分子は10/20(=0.5)になります。
計算すると、0.5/0.4 = 1.25 なので答えはエです。