資料建模實戰,Smartbi帶你玩轉購物籃分析

購物籃分析

是一個非常重要的模型,關於啤酒與尿布的故事,這個故事很好地解釋了商品關聯性的作用,時至今日,仍有很強的現實指導意義。這種資料,將不同商品關聯起來,並挖掘二者之間聯絡的分析方法,就叫作“購物籃分析”。購物籃分析的實現方法有很多,下面教一下大家如何去製作一個完整的購物籃分析模型。

一、前言:

在開始製作前,先來理解一下它的價值在哪。購物籃分析的本質是研究商品與商品間的關聯關係,比如分析A商品和哪個商品搭配會賣的更好,或者分析客戶在購買了A商品之後,對B商品會產生什麼影響等等。透過這種交叉分析,我們便可以對客戶感興趣的商品組合去做出相應的調整,或者據此去深入研究更高層次的推薦演算法。

資料建模實戰,Smartbi帶你玩轉購物籃分析

先來理解以下三個概念,支援度指同時被購買的機率,用公式則表示支援度=同時購買A和B訂單數/總購買訂單數;置信度是指購買A之後又購買B的條件機率,用公式表示就是置信度;提升度指的是先購買A對購買B的提升作用,用公式表示就是提升度((購買A次數)*(購買B次數))。可看下圖說明,加深理解:

資料建模實戰,Smartbi帶你玩轉購物籃分析

二、購物籃分析步驟:

需先準備關於零售行業的資料來源,包含單據編碼、商品名稱等資訊,可以在文末進行獲取。如果用Excel做購物籃分析,難度會很大,建議用其他工具進行製作,本文選擇用SQL語句的方式去製作:

資料建模實戰,Smartbi帶你玩轉購物籃分析

第一步,新建臨時表,進行交叉關聯,為每一組交叉商品增加一列總訂單數的欄位,表命名為t1:

資料建模實戰,Smartbi帶你玩轉購物籃分析

執行語句後,可得出以下4個欄位:

資料建模實戰,Smartbi帶你玩轉購物籃分析

第二步,新建臨時表t2,再次進行交叉關聯,算出同時購買A商品與B商品的訂單數:

資料建模實戰,Smartbi帶你玩轉購物籃分析

執行後,可得出:

資料建模實戰,Smartbi帶你玩轉購物籃分析

第三步,把t1與t2兩個臨時表的欄位進行關聯:

資料建模實戰,Smartbi帶你玩轉購物籃分析

執行語句後,可得出以下4個欄位:

資料建模實戰,Smartbi帶你玩轉購物籃分析

第四步,新建t4,算出A訂單數:

資料建模實戰,Smartbi帶你玩轉購物籃分析

執行語句後,可得出以下2個欄位:

資料建模實戰,Smartbi帶你玩轉購物籃分析

第五步,新建臨時表t5,算出B訂單數:

資料建模實戰,Smartbi帶你玩轉購物籃分析

執行語句後,可得出以下2個欄位:

資料建模實戰,Smartbi帶你玩轉購物籃分析

最後一步,根據支援度、置信度與提升度的公式,以及我們得出的資料,便可運算了。根據t3表裡‘’同時購買A和B訂單數‘’與‘’總訂單數‘’這兩個欄位,我們可以算出支援度的資料。根據t3表裡‘’同時購買A和B訂單數‘’與t4表裡‘’A商品訂單數‘’這兩個欄位,我們可以算出置信度的資料。同理,利用‘’同時購買A和B訂單數‘’、‘’購買A訂單數‘’、‘’購買B訂單數‘’與‘’總訂單數‘’這幾個欄位,我們最後就可以得出提升度的資料了。

資料建模實戰,Smartbi帶你玩轉購物籃分析

最後得出的結果如下:

資料建模實戰,Smartbi帶你玩轉購物籃分析

三、後續建議:

從上面的過程來看,我們可得出製作購物籃的過程很複雜。為了對資料建模以及多維分析有更深的認識,小編推薦大家利用智分析的資料模型去製作購物籃分析,智分析的資料模型具有非常強大的多維分析能力,不僅支援自助取數,還支援SQL、MDX等高階的查詢語法。智分析的資料來源介面同樣也很豐富,可以連線各種資料庫,也可以以Excel檔案匯入的方式進行匯入:

資料建模實戰,Smartbi帶你玩轉購物籃分析

進入資料模型的介面後,便可以開始搭建購物籃分析的資料模型了,這裡依然是選擇舊方法,新建一個SQL查詢,按照步驟便可得出資料:

資料建模實戰,Smartbi帶你玩轉購物籃分析

資料模型搭建後,便可對購物籃分析的資料更為清晰地呈現出來,儀表盤便可進行高階操作,非常適合展示購物籃分析、RFM分析、ABC分析等資料模型:

資料建模實戰,Smartbi帶你玩轉購物籃分析

PS:上方提及的資料,關注公眾號【思邁特Smartbi】後私信便可獲取。