POS データ 見える化 (エクセル編)
販売系の根本データ、POSデータを活用してさまざまな分析を行います。
目次
データ

データ期間=2020年11月
行数=約15万行
データは完全なダミーです。
・バスケットコードを作成します。(統計解析で使用します)
レジの1会計 (合計現計) ごとに個別の値 (ユニーク) になるように作成します。具体的には、「日付」+「例番号」+「時刻」のような組み合わせで作成できます。
・カテゴリ名や商品名
概ねPOSデータのカテゴリや商品は、それらのコードのみ記載されています。カテゴリマスタや商品マスタとマージ (結合) してカテゴリ名、商品名を表示しておくと結果がみやすくなります。
・会員の属性
会員マスタとマージ (結合) して会員の属性をくっつけます。
会員別売上データとの違い
・POSデータには取引時刻があります。
・POSデータには商品コードがあります。
誰が、いつ、何を、何個、いくらの売価で購入したのかを知ることができます。
分析例

ピボットを組み合わせます。

・果物を選択します。
・「バナナ」を選択します。
バナナを購入した会員コードの来店パタンを見える化できます。

ピボットを組み合わせます。

・時間帯、年代でフィルターします。
住所マスタとリレーションシップ

住所マスタとリレーションシップします。

住所をフィルターします。
マッピング
クラスター

集計粒度 | 会員コード |
値 | カテゴリの売上高の割合 |
クラスター形成方法 | 階層的 |
クラスター数 | デンドログラムの8でカット |

各会員がどのカテゴリをより多く購入しているかによるクラスターを形成しています。
飲食データでいうと、ビール党、ワイン党、ハイボール党、しょうちゅう党のようなクラスター化です。
>クラスター分析(第1回) 好きと苦手の境界線 (data-analyzer.net)

・フィルターで「乳製品」の売上高構成比が高いクラスターを選択します。

クラスター2、各カテゴリーをバランスよく購入するクラスターの売上高、会員単価が高い。
Pearson 相関

集計粒度 | バスケットコード |
相関 | カテゴリ |
カテゴリどうしの組み合わせの良さをバスケットコードを粒度に計算します。
>Pearson 相関 エクセル編 (data-analyzer.net)