使用數據挖掘獲取商業智能
.6 使用數據挖掘獲取商業智能 數據挖掘對查找和描述特定多維數據集中的隱藏模式非常有用。因為多維數據集中的數據增長很快,所以手動查找信息可能非常困難。數據挖掘提供的算法允許自動模式查找及交互式分析。按照第1章對商業智能的認識和對其體系結構的理解
.6 使用數據挖掘獲取商業智能
數據挖掘對查找和描述特定多維數據集中的隱藏模式非常有用。因為多維數據集中的數據增長很快,所以手動查找信息可能非常困難。數據挖掘提供的算法允許自動模式查找及交互式分析。按照第1章對商業智能的認識和對其體系結構的理解,數據挖掘是一個商業智能系統的高層應用,也是不可或缺的一部分。本節使用數據挖掘技術從福馬特商店的營業數據中發現影響客戶會員卡級別的因素。
2.6.1 商務
需求分析
福馬特商店的市場部想提高客戶滿意度和客戶保有率。于是希望通過實行相關的市場手段來達到這些目標。其中一個方法就是對原有的會員卡方案重新進行定義,以便更好地為客戶提供服務并且使所提供的服務能夠更加密切地滿足客戶的期望。為了在重新定義新的會員卡方案前能夠對以前的方案中卡的類型和客戶的關系有充分認識,市場部想分析當前銷售事務并找出客戶人口統計信息(婚姻狀況、年收入和在家子女數等等)和所申請卡之間的模式。然后根據這些信息和申請會員卡的客戶的特征重新定義會員卡。
以前的會員卡有4種,分別是普通卡、銅卡、銀卡和金卡,還有一些客戶沒有辦會員卡,在銷售業務數據中,每一個客戶的私人信息和其所擁有的卡的級別都存儲在customer表中,圖2-46所示即為customer表的局部數據,從中可以看出,整個表有10 281條記錄,表中除了“member_card”字段代表擁有會員卡的類型外,還有分別表示“性別”、有孩子的數量、教育程度和是否有房等一系列信息,那么這些信息中哪個與客戶擁有會員卡的類型關聯最大,以及影響客戶會員級別的因素有哪些,這是市場部經理迫切需要知道的。

本節將創建一個數據挖掘模型以訓練銷售數據,并使用“決策樹”算法在客戶群中找出會員卡選擇模式。
2.6.2 創建挖掘結構
數據挖掘是繼OLAP之后的SSAS服務的另一大功能。因此,一般實現數據挖掘也要在一個Analysis Services
解決方案的基礎上進行。數據挖掘所依賴的數據可以來源于業務
數據庫和數據倉庫,也可以來源于數據立方。本例中構建數據挖掘功能是基于本章2.3節所創建的foodmartsale AS項目和相應的數據源,其步驟如下。
(1)雙擊foodmartsale AS.sln解決方案文件,打開前面創建的SSAS項目在“數據挖掘”文件夾對象上右擊,在彈出的快捷菜單中選擇【

】命令,打開數據挖掘向導。
(2)在“歡迎使用數據挖掘向導”窗口中,單擊【下一步】按鈕。
(3)在彈出的“選擇定義方法”窗口中,選擇“從現有關系數據庫或數據倉庫”選項,再單擊【下一步】按鈕。
(4)在“選擇數據挖掘技術”窗口中的“您要使用何種數據挖掘技術?”選項組中,選擇“Microsoft決策樹”選項。如圖2-47所示??梢钥吹?,這里系統為我們提供了8種可用的挖掘算法,這些算法的具體細節將在第9章學習。此處選擇的Microsoft決策樹算法是一種適合預測性建模的分類算法,該算法支持離散屬性和連續屬性的預測。本例中需要用這種算法對客戶進行分析。設置好后單擊【下一步】按鈕。
(5)系統彈出“選擇數據源視圖”窗口。默認情況下,“可用數據源視圖”選項組中的“foodmartsale DW”選項為選中狀態,確認后單擊【下一步】按鈕繼續操作。
(6)在彈出的“指定表類型”窗口中,選擇“customer”表旁的“事例”復選框,再單擊【下一步】按鈕。
(7)在彈出的“指定定型數據”窗口中,選擇“member_card”列旁邊的“輸入”和“可預測”復選框。單擊【建議】按鈕,如圖2-48所示,系統彈出“提供相關列建議”對話框,該對話框列出與可預測的列關系最密切的列?!疤峁┫嚓P列建議”對話框按照各屬性與可預測屬性的相關性對其進行排序。值大于0.05的列將被自動選中,以包括在模型中,如圖2-49所示。單擊【確定】按鈕,在向導中將所選列標記為輸入列并且返回“指定定型數據”窗口,單擊【下一步】按鈕繼續操作。



(8)在彈出的“指定列的內容和數據類型”窗口中使用默認的設置,單擊【下一步】按鈕,在彈出的“完成向導” 窗口的“挖掘結構名稱”文本框中,鍵入“Customer_card”,再單擊【完成】按鈕。系統將打開數據挖掘設計器,顯示剛剛創建的 “Customer_card”挖掘結構。
2.6.3 從數據挖掘中獲取有價值的信息
挖掘結構創建完畢后,可以直接單擊“數據挖掘設計器”窗口中的“挖掘模型查看器”選項卡,如圖2-50所示。由于在查看挖掘結果之前,需要對模型進行處理和部署,因此切換到此選項卡時會彈出一些窗口來確認對模型的處理和部署,單擊“確定”按鈕即可。成功處理挖掘模型后,挖掘模型查看器即會顯示出圖2-50所示的設置項。設置其背景為“golden”,顯示級別為2,則在決策樹顯示窗格中會顯示如圖2-51所示的決策樹,這就是用決策樹這種算法對福馬特商店的客戶數據進行挖掘的結果。

同時,在整個工作窗口的右下角有如圖2-52所示的“挖掘圖例”窗格,單擊決策樹上的不同分支,不同類型的卡在這個分支上出現的概率和相應的顏色都在此窗格中標識出來了。
下面分析從這個挖掘結果中能得到的商業信息。
