零售業商業智慧-顧客關係分析(中篇)

資策會數位教育研究所資深工程師 劉德泰

 

邏輯資料模型設計緒論
         彙整零售業顧客關係分析與需求之後,繼續要規劃零售業顧客關係商業智慧解決方案的架構,依據顧客關係分析功能(上篇第四節)與企業資訊系統資料庫比對,設計與彙整可符合企業需要的邏輯資料模型與實體資料模型,整合之後的資料方可以存入資料倉儲的資料庫,以供線上分析處理分析及資料挖礦。
 

零售業商業智慧-顧客關係解決方案架構圖

顧客關係分析功能

邏輯資料模型設計

實體資料模型設計

資料倉儲

資料挖礦

資料超市

線上分析處理

資訊應用

知識挖掘


         彙整零售商顧客關係分析功能(上篇已經說明)之後,下一步驟的系統發展程序-「邏輯資料模型設計」。邏輯資料模型設計主要的工作是從已經上線的資訊系統中,找尋可從事資料分析的相關資料檔案,並且與顧客關係各項分析需求功能一起比對,設計符合零售業顧客關係的邏輯資料模型。本文所設計邏輯資料模型包含資料來源探索、分析功能的解析、設計邏輯資料E-R圖、設計資料倉儲中的資料模型、設計資料挖礦中的資料模型等五項程序:
 

一、資料來源探索
         資料來源探索:零售業者要發展顧客關係商業智慧,企業必須先有完整POS、EOS系統或ERP系統,蒐集這些資訊系統的資料庫當成商業智慧分析的資料來源。依據顧客關係管理分析的功能需求,資料來源可從顧客服務系統資料庫,銷售管理資料庫,推廣活動記錄資料庫等相關系統蒐集。需要達到顧客關係分析(上篇)的分析功能,所需彙整的檔案與屬性如下:

 

顧客檔
{顧客代號、顧客姓名、生日、性別、地址1、地址2、電話、教育程度、郵遞區號、國別、城市、家庭成員、職業、年齡區間、婚姻、開戶日期、年收入、會員卡別、統一編號}

商店檔
{商店代號、商店型態、地區代號、商店名稱、國別、城市、郵遞區號、主管姓名、電話、傳真、營業起始日期、最近整修日期、商店品類數量、雜貨品類數量、食品品類數量、冷凍品類數量}

商品檔
{商品群組代號、商品代號、商標名稱、商品名稱、條碼、單價、總重、淨重、可回收、組合單位、架位、架位高度、架位寬度、架位深度}

商品群組檔
{商品群組代號、小分類、大分類、商品部門分類、商品家組分類}

銷售檔
{商品代號、時間代號、顧客代號、推廣代號、商店代號、銷售金額、成本、單位數量}

推廣檔
{推廣代號、推廣地區代號、推廣名稱、媒體型態、成本、開始日期、結束日期}

時間_日期對應檔
{時間代號、日期、星期、月份、年度、月份天數、年度週數、年度月份數、季別}
 

二、分析功能的解析
         企業希望能有一份完整的顧客關係商業智慧分析報告,是需要從原來資訊系統的資料庫的檔案與欄位找尋。利用現有檔案的欄位與顧客關係分析功能比對,找出各項分析功能維度與量度之間關係,接著定義出Cube的結構,若是分析功能需要採用資料挖礦,則直接採用經過整理後資料倉儲的檔案。

         在顧客關係分析(上篇)第四節所列的分析功能,依據各分析編號需要使用哪些維度與量度,在二維表格相對位置打「V」,代表這項分析功能會用到的維度或量度,彙整二維表格的資料,找出事實資料表(Fact Table)與多維資料表(Dimension Table),作為設計Cube結構之用。

顧客關係管理分析功能與維度、量度分析表

顧客關係管理分析功能與維度、量度分析

功能編號

3

6

7

8

9

10

11

12

13

14

15

16

17

18

19

22

23

24

25

26

27

28






時間

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

 

 

 

 

 

V

V

顧客

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

商店

 

 

 

 

 

 

V

 

 

 

 

 

V

 

 

 

 

 

 

 

 

 

商店型態

 

 

 

 

 

 

 

 

 

 

 

 

V

 

 

 

 

 

 

 

 

 

商品

 

 

 

 

 

 

 

V

V

V

V

V

V

 

 

 

V

V

V

V

 

 

推廣

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

V

V

V

V

 

 

推廣型態

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

V

V

V

 

 

 

教育

 

 

V

 

 

V

 

 

 

 

V

 

 

 

V

V

V

V

V

V

 

 

性別

 

 

V

 

 

V

 

 

 

 

V

 

 

 

V

V

V

V

V

V

 

 

婚姻

 

 

V

 

 

V

 

 

 

 

V

 

 

 

V

V

V

V

V

V

 

 

郵遞區號

 

 

V

 

 

V

 

 

 

 

V

 

 

 

V

V

V

V

V

V

 

 

年收入

 

 

 

 

 

V

 

 

 

 

V

 

 

 

 

V

V

V

 

V

 

 

持卡

 

 

 

 

V

 

 

 

 

 

 

 

 

V

 

 

 

 

 

 

 

 





營業數量

 

 

 

V

 

V

 

 

 

 

 

 

 

 

 

 

 

 

V

V

 

 

營業金額

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

 

 

成本

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

 

 

毛利

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

V

 

 

交易頻率

 

 

 

V

 

V

 

 

 

 

 

 

 

 

 

V

 

 

V

V

V

V

平均價格

 

 

 

V

 

V

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

營收百分比

 

 

 

 

V

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


三、設計邏輯資料E-R圖
         整理零售業顧客關係各項分析功能的邏輯資料E-R圖,規劃資料檔案彼此間一致關係的模型。在實體資料模型建立資料倉儲資料庫時,可依此E-R圖建立資料庫的實體完整性與參考完整性。

         顧客分析在資料倉儲資料庫需求檔:採用銷售檔(事實資料表)、推廣檔、時間_日期檔、顧客檔、商店檔、商品檔、商品群組檔。


四、設計資料倉儲的資料模型
         資料倉儲的資料模型是星狀,一般稱為「Cube」,可從各個角度來檢視資料的檔案稱為「維度」,而當成統計事實表的資料欄位稱為「量度」,線上即時分析處理工具(OLAP),便是採用星狀模式的檔案做統計分析。
 

 

顧客關係管理分析Cube的維度與量度

維度包括的部份:時間(年、季、月)、顧客(國家、城市、顧客編號)、商店(國家、城市、名稱)、商店型態(商店型態)、商品(商品家組分類、商品部門分類、大分類、小分類、商標名稱、商品名稱)、推廣(推廣名稱)、推廣型態(媒體型態)、教育(教育程度)、性別(性別)、婚姻(婚姻)、郵遞區號(郵遞區號)、年收入(年收入)、持卡(會員卡別)。

量度包括的部份:營業數量(單位數量總合)、營業金額(銷售金額總計)、成本(單位成本總合)、毛利(營業金額 – 成本)、交易頻率(計算筆數)、平均價格(營業金額 / 單位數量)、營收百分比(毛利 / 營業收入)


五、設計資料挖礦的資料模型
         資料挖礦所使用的資料來源,以資料倉儲的資料庫為主,因為資料倉儲在規劃資料庫時,會把未定義的檔案資料經過洗滌後才存入資料倉儲的資料庫中,資料庫的內容適合分析,本研究以資料倉儲的資料庫為資料挖礦的資料來源。
         依據顧客關係管理(上篇)分析功能,可做顧客特性描述的資料挖礦,包括顧客人口統計、RFM、顧客區段購物偏好等。資料來源也是顧客檔、商店檔、商品檔、商品群阻擋、銷售檔。

         顧客統計人口的資料挖礦可採用顧客檔中的{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}等欄位當變數,進行分群、分類資料挖礦技術。

         RFM的資料挖礦可採用顧客檔中的{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}等欄位,銷售檔中的{銷售金額},時間_日期檔中的{年度週數、季別}等欄位當變數,進行分類資料挖礦技術。

         客戶區段購物偏好可採用顧客檔中的{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}等欄位,銷售檔中的{銷售金額},商品檔中的{商標名稱、商品名稱},商品群組檔中的{小分類、大分類、商品部門分類、商品家組分類}等欄位當變數,進行分群、分類資料挖礦技術。

顧客關係資料挖礦分析表

分析功能編號

欄位變數

資料挖礦方法

1

顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}欄位,銷售檔{銷售金額},商品檔{商標名稱、商品名稱},商品群組檔{小分類、大分類、商品部門分類、商品家組分類}

分群、分類

2

顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別},銷售檔{銷售金額},時間_日期檔{年度週數、季別}

分類

4

顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}

分群、分類

5

顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別},銷售檔{銷售金額},時間_日期檔{年度週數、季別}

分類

20

顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別},銷售檔{銷售金額},時間_日期檔{年度週數、季別}

分類

21

顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}欄位,銷售檔{銷售金額},商品檔{商標名稱、商品名稱},商品群組檔{小分類、大分類、商品部門分類、商品家組分類}

分群、分類


六、結語
         因為商業智慧資料模型設計相當的複雜,又可以分為邏輯資料模型設計與實體資料模型設計,因資料眾多我將其分為中篇與下篇。本篇「零售業商業智慧-顧客關係分析」(中篇)主要探討商業智慧-顧客關係分析邏輯資料模型設計方法,到此告一段落,在「零售業商業智慧-顧客關係分析」(下篇)繼續討論實體資料模型設計,商業智慧建置方法。