|
邏輯資料模型設計緒論
彙整零售業顧客關係分析與需求之後,繼續要規劃零售業顧客關係商業智慧解決方案的架構,依據顧客關係分析功能(上篇第四節)與企業資訊系統資料庫比對,設計與彙整可符合企業需要的邏輯資料模型與實體資料模型,整合之後的資料方可以存入資料倉儲的資料庫,以供線上分析處理分析及資料挖礦。
|
|
零售業商業智慧-顧客關係解決方案架構圖
|
顧客關係分析功能 |
|
邏輯資料模型設計 |
|
實體資料模型設計 |
|
資料倉儲 |
資料挖礦 |
|
資料超市 |
線上分析處理 |
資訊應用 |
知識挖掘 |
|
|
彙整零售商顧客關係分析功能(上篇已經說明)之後,下一步驟的系統發展程序-「邏輯資料模型設計」。邏輯資料模型設計主要的工作是從已經上線的資訊系統中,找尋可從事資料分析的相關資料檔案,並且與顧客關係各項分析需求功能一起比對,設計符合零售業顧客關係的邏輯資料模型。本文所設計邏輯資料模型包含資料來源探索、分析功能的解析、設計邏輯資料E-R圖、設計資料倉儲中的資料模型、設計資料挖礦中的資料模型等五項程序:
|
|
一、資料來源探索
資料來源探索:零售業者要發展顧客關係商業智慧,企業必須先有完整POS、EOS系統或ERP系統,蒐集這些資訊系統的資料庫當成商業智慧分析的資料來源。依據顧客關係管理分析的功能需求,資料來源可從顧客服務系統資料庫,銷售管理資料庫,推廣活動記錄資料庫等相關系統蒐集。需要達到顧客關係分析(上篇)的分析功能,所需彙整的檔案與屬性如下: |
|
|
顧客檔
{顧客代號、顧客姓名、生日、性別、地址1、地址2、電話、教育程度、郵遞區號、國別、城市、家庭成員、職業、年齡區間、婚姻、開戶日期、年收入、會員卡別、統一編號}
商店檔
{商店代號、商店型態、地區代號、商店名稱、國別、城市、郵遞區號、主管姓名、電話、傳真、營業起始日期、最近整修日期、商店品類數量、雜貨品類數量、食品品類數量、冷凍品類數量}
商品檔
{商品群組代號、商品代號、商標名稱、商品名稱、條碼、單價、總重、淨重、可回收、組合單位、架位、架位高度、架位寬度、架位深度}
商品群組檔
{商品群組代號、小分類、大分類、商品部門分類、商品家組分類}
銷售檔
{商品代號、時間代號、顧客代號、推廣代號、商店代號、銷售金額、成本、單位數量}
推廣檔
{推廣代號、推廣地區代號、推廣名稱、媒體型態、成本、開始日期、結束日期}
時間_日期對應檔
{時間代號、日期、星期、月份、年度、月份天數、年度週數、年度月份數、季別}
|
|
|
二、分析功能的解析
企業希望能有一份完整的顧客關係商業智慧分析報告,是需要從原來資訊系統的資料庫的檔案與欄位找尋。利用現有檔案的欄位與顧客關係分析功能比對,找出各項分析功能維度與量度之間關係,接著定義出Cube的結構,若是分析功能需要採用資料挖礦,則直接採用經過整理後資料倉儲的檔案。
在顧客關係分析(上篇)第四節所列的分析功能,依據各分析編號需要使用哪些維度與量度,在二維表格相對位置打「V」,代表這項分析功能會用到的維度或量度,彙整二維表格的資料,找出事實資料表(Fact
Table)與多維資料表(Dimension Table),作為設計Cube結構之用。 |
|
顧客關係管理分析功能與維度、量度分析表
|
顧客關係管理分析功能與維度、量度分析 |
|
功能編號 |
3 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
|
維
度 |
時間 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
V |
V |
|
顧客 |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
|
商店 |
|
|
|
|
|
|
V |
|
|
|
|
|
V |
|
|
|
|
|
|
|
|
|
|
商店型態 |
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
|
|
|
|
|
商品 |
|
|
|
|
|
|
|
V |
V |
V |
V |
V |
V |
|
|
|
V |
V |
V |
V |
|
|
|
推廣 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
V |
V |
V |
V |
|
|
|
推廣型態 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
V |
V |
V |
|
|
|
|
教育 |
|
|
V |
|
|
V |
|
|
|
|
V |
|
|
|
V |
V |
V |
V |
V |
V |
|
|
|
性別 |
|
|
V |
|
|
V |
|
|
|
|
V |
|
|
|
V |
V |
V |
V |
V |
V |
|
|
|
婚姻 |
|
|
V |
|
|
V |
|
|
|
|
V |
|
|
|
V |
V |
V |
V |
V |
V |
|
|
|
郵遞區號 |
|
|
V |
|
|
V |
|
|
|
|
V |
|
|
|
V |
V |
V |
V |
V |
V |
|
|
|
年收入 |
|
|
|
|
|
V |
|
|
|
|
V |
|
|
|
|
V |
V |
V |
|
V |
|
|
|
持卡 |
|
|
|
|
V |
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
|
|
|
|
量
度 |
營業數量 |
|
|
|
V |
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
V |
V |
|
|
|
營業金額 |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
|
|
|
成本 |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
|
|
|
毛利 |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
V |
|
|
|
交易頻率 |
|
|
|
V |
|
V |
|
|
|
|
|
|
|
|
|
V |
|
|
V |
V |
V |
V |
|
平均價格 |
|
|
|
V |
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
營收百分比 |
|
|
|
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
三、設計邏輯資料E-R圖
整理零售業顧客關係各項分析功能的邏輯資料E-R圖,規劃資料檔案彼此間一致關係的模型。在實體資料模型建立資料倉儲資料庫時,可依此E-R圖建立資料庫的實體完整性與參考完整性。
顧客分析在資料倉儲資料庫需求檔:採用銷售檔(事實資料表)、推廣檔、時間_日期檔、顧客檔、商店檔、商品檔、商品群組檔。 |
|
 |
|
四、設計資料倉儲的資料模型
資料倉儲的資料模型是星狀,一般稱為「Cube」,可從各個角度來檢視資料的檔案稱為「維度」,而當成統計事實表的資料欄位稱為「量度」,線上即時分析處理工具(OLAP),便是採用星狀模式的檔案做統計分析。
|
|
顧客關係管理分析Cube的維度與量度
維度包括的部份:時間(年、季、月)、顧客(國家、城市、顧客編號)、商店(國家、城市、名稱)、商店型態(商店型態)、商品(商品家組分類、商品部門分類、大分類、小分類、商標名稱、商品名稱)、推廣(推廣名稱)、推廣型態(媒體型態)、教育(教育程度)、性別(性別)、婚姻(婚姻)、郵遞區號(郵遞區號)、年收入(年收入)、持卡(會員卡別)。
量度包括的部份:營業數量(單位數量總合)、營業金額(銷售金額總計)、成本(單位成本總合)、毛利(營業金額 –
成本)、交易頻率(計算筆數)、平均價格(營業金額 / 單位數量)、營收百分比(毛利 / 營業收入) |
|
|
五、設計資料挖礦的資料模型
資料挖礦所使用的資料來源,以資料倉儲的資料庫為主,因為資料倉儲在規劃資料庫時,會把未定義的檔案資料經過洗滌後才存入資料倉儲的資料庫中,資料庫的內容適合分析,本研究以資料倉儲的資料庫為資料挖礦的資料來源。
依據顧客關係管理(上篇)分析功能,可做顧客特性描述的資料挖礦,包括顧客人口統計、RFM、顧客區段購物偏好等。資料來源也是顧客檔、商店檔、商品檔、商品群阻擋、銷售檔。
顧客統計人口的資料挖礦可採用顧客檔中的{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}等欄位當變數,進行分群、分類資料挖礦技術。
RFM的資料挖礦可採用顧客檔中的{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}等欄位,銷售檔中的{銷售金額},時間_日期檔中的{年度週數、季別}等欄位當變數,進行分類資料挖礦技術。
客戶區段購物偏好可採用顧客檔中的{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}等欄位,銷售檔中的{銷售金額},商品檔中的{商標名稱、商品名稱},商品群組檔中的{小分類、大分類、商品部門分類、商品家組分類}等欄位當變數,進行分群、分類資料挖礦技術。 |
|
顧客關係資料挖礦分析表
|
分析功能編號 |
欄位變數 |
資料挖礦方法 |
|
1 |
顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}欄位,銷售檔{銷售金額},商品檔{商標名稱、商品名稱},商品群組檔{小分類、大分類、商品部門分類、商品家組分類} |
分群、分類 |
|
2 |
顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別},銷售檔{銷售金額},時間_日期檔{年度週數、季別} |
分類 |
|
4 |
顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別} |
分群、分類 |
|
5 |
顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別},銷售檔{銷售金額},時間_日期檔{年度週數、季別} |
分類 |
|
20 |
顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別},銷售檔{銷售金額},時間_日期檔{年度週數、季別} |
分類 |
|
21 |
顧客檔{教育程度、城市、家庭成員、年齡區間、婚姻、年收入、會員卡別}欄位,銷售檔{銷售金額},商品檔{商標名稱、商品名稱},商品群組檔{小分類、大分類、商品部門分類、商品家組分類} |
分群、分類 |
|
|
六、結語
因為商業智慧資料模型設計相當的複雜,又可以分為邏輯資料模型設計與實體資料模型設計,因資料眾多我將其分為中篇與下篇。本篇「零售業商業智慧-顧客關係分析」(中篇)主要探討商業智慧-顧客關係分析邏輯資料模型設計方法,到此告一段落,在「零售業商業智慧-顧客關係分析」(下篇)繼續討論實體資料模型設計,商業智慧建置方法。 |