利用關(guān)聯(lián)規(guī)則進(jìn)行序列分析(sequenceanalysis)_第1頁(yè)
已閱讀1頁(yè),還剩51頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、CHAPTER 9 Market Basket Analysis and Association Rules購(gòu)物籃分析與關(guān)聯(lián)規(guī)則,吳欣潔 張啟帆 國(guó)立中興大學(xué)行銷(xiāo)研究所,2,前言,圖9.1,一公升的柳橙汁、一些香蕉、洗碗精、窗戶(hù)清潔劑、6包裝的蘇打水,蘇打水是否會(huì)和香蕉一起買(mǎi)?品牌是否會(huì)造成蘇打水銷(xiāo)售的差異?,有什麼是應(yīng)該在購(gòu)物籃裡卻沒(méi)有的?,洗碗精和柳橙汁一起被買(mǎi)時(shí),窗戶(hù)清潔劑是否也一起買(mǎi)了?,不同的人口特質(zhì)會(huì)如何影響顧客的

2、消費(fèi)?,3,前言,購(gòu)物籃分析的主要資料來(lái)源是零售業(yè),藉由分析銷(xiāo)售點(diǎn)(Point-of-Sale)的資料,以找出哪些商品會(huì)一起售出的規(guī)則。其中最常使用的方法是關(guān)聯(lián)規(guī)則(Association Rules)。除了零售業(yè)外,購(gòu)物籃分析也可以應(yīng)用在其他領(lǐng)域:信用卡消費(fèi)電話使用者的附加功能消費(fèi)者的常用銀行服務(wù)保險(xiǎn)配套方式醫(yī)院病患的歷史資料,4,購(gòu)物籃分析資料架構(gòu),圖9.2,5,訂單(orders)的基本衡量方式,每個(gè)顧客的平均有多少o

3、rder每一個(gè)order的平均有多少品項(xiàng)每一個(gè)order的平均有多少特殊品項(xiàng)針對(duì)某產(chǎn)品,曾購(gòu)買(mǎi)這項(xiàng)產(chǎn)品的顧客佔(zhàn)多少比例針對(duì)某產(chǎn)品,曾購(gòu)買(mǎi)這項(xiàng)產(chǎn)品的顧客平均會(huì)購(gòu)買(mǎi)幾次針對(duì)某產(chǎn)品,這項(xiàng)產(chǎn)品被購(gòu)買(mǎi)時(shí)的平均數(shù)量,購(gòu)物籃分析資料架構(gòu)(2),6,圖 9.3,購(gòu)物籃分析資料架構(gòu)(3),7,訂單特性,購(gòu)物籃分析資料架構(gòu)(4),8,品項(xiàng)的受歡迎程度,要用存貨曲線來(lái)找出最受歡迎的商品並不難,不過(guò),只知道商品的銷(xiāo)售量是不夠的,下面還有幾個(gè)相關(guān)的問(wèn)題

4、:在one-item order中,最受歡迎的品項(xiàng)是什麼?在multi-item order中,最受歡迎的品項(xiàng)是什麼?在重覆購(gòu)買(mǎi)的顧客心中,最受歡迎的品項(xiàng)是什麼?特定品項(xiàng)的受歡迎程度如何隨時(shí)間改變?某一品項(xiàng)的受歡迎程度如何隨區(qū)域改變?,購(gòu)物籃分析資料架構(gòu)(5),9,追蹤行銷(xiāo)干擾事件,Mail drop,購(gòu)物籃分析資料架構(gòu)(6),10,利用用途將產(chǎn)品分群,通常還有很多關(guān)於產(chǎn)品的敘述性的資料,例如衣服的顏色等,這些資料可以幫助產(chǎn)品

5、的分級(jí),還能類(lèi)似解決以下的問(wèn)題瘦身產(chǎn)品是否傾向一起賣(mài)出?消費(fèi)者是否同時(shí)會(huì)買(mǎi)類(lèi)似顏色的衣服?買(mǎi)有框的明信片的消費(fèi)者是否會(huì)同時(shí)買(mǎi)其他產(chǎn)品?,購(gòu)物籃分析資料架構(gòu)(7),11,利用用途將產(chǎn)品分群(圖 9.6),購(gòu)物籃分析資料架構(gòu)(8),12,關(guān)聯(lián)規(guī)則(Association Rule),購(gòu)物籃分析會(huì)找出應(yīng)該放在一起的產(chǎn)品或服務(wù)。利用關(guān)聯(lián)規(guī)則找到的結(jié)果很清楚,但卻未必有用。以下是關(guān)聯(lián)規(guī)則的三種典型例子??尚械囊?guī)則(Actionable R

6、ule) 明顯的規(guī)則(Trivial Rule)無(wú)法解釋的規(guī)則(Inexplicable Rule),13,可行的規(guī)則(Actionable Rules),有用的規(guī)則必須包含高品質(zhì)的,可行的資訊。業(yè)者一旦找到模式,必須要能夠配合這個(gè)模式來(lái)調(diào)整。 Ex1.芭比娃娃與糖果條Ex2.尿布與啤酒,關(guān)聯(lián)規(guī)則(2),14,明顯的規(guī)則(Trivial Rules),明顯的規(guī)則可能在該行業(yè)中都已經(jīng)知道了,在行銷(xiāo)上沒(méi)有太大的價(jià)值。Ex.維修協(xié)

7、定與大型家電用品Ex.油漆與油漆刷,關(guān)聯(lián)規(guī)則(3),15,無(wú)法解釋的規(guī)則(Inexplicable Rule),這種規(guī)則似乎沒(méi)有任何原因,也無(wú)法作為行銷(xiāo)活動(dòng)的參考,可以只是某個(gè)時(shí)空下的一種巧合。Ex.五金賣(mài)場(chǎng)開(kāi)幕時(shí),銷(xiāo)售最好的是馬桶清潔劑,關(guān)聯(lián)規(guī)則(4),16,關(guān)聯(lián)規(guī)則的運(yùn)作方式,表9.1 雜貨銷(xiāo)售點(diǎn)交易狀況,17,表9.2 Co-occurrence Table,關(guān)聯(lián)規(guī)則的運(yùn)作方式(2),18,信心水準(zhǔn)(Degree of Co

8、nfidence),「if蘇打飲料,then柳橙汁」 信心水準(zhǔn)=67%(2/3)「if柳橙汁,then蘇打飲料」 信心水準(zhǔn)=50%(2/4),,,關(guān)聯(lián)規(guī)則的運(yùn)作方式(3),19,增益(Improvement/Lift),「if蘇打飲料,then柳橙汁」 lift=0.83 (0.67/0.8)「if柳橙汁,then蘇打飲料」 lift=0

9、.83 (0.5/0.6)一般來(lái)說(shuō),lift> 1的模式才有行銷(xiāo)上的價(jià)值。,,,關(guān)聯(lián)規(guī)則的運(yùn)作方式(4),20,建立關(guān)聯(lián)規(guī)則,基本步驟(圖9.9)決定商品的集合與等級(jí) 例:pizza是一個(gè)商品還是配料商品?計(jì)算商品的機(jī)率和聯(lián)合機(jī)率,也許限制在交易佔(zhàn)有率超過(guò)某一門(mén)檻的商品分析機(jī)率來(lái)決定規(guī)則例:如果蘑菇,則義大利辣味香腸,21,圖9.9,,決定商品的集合與等級(jí),計(jì)算商品的機(jī)率和聯(lián)合機(jī)率,分析機(jī)率來(lái)決定規(guī)則,2

10、2,建立關(guān)聯(lián)規(guī)則,注意事項(xiàng)選擇正確的項(xiàng)目組合從矩陣中的數(shù)字產(chǎn)生規(guī)則克服龐大資料帶來(lái)的現(xiàn)實(shí)限制,23,選擇正確的項(xiàng)目組合(1),用來(lái)找出關(guān)聯(lián)規(guī)則的資料,通常來(lái)自銷(xiāo)售點(diǎn)(point of sale)中的詳細(xì)交易資料選什麼資料、蒐集和運(yùn)用這些資料,對(duì)購(gòu)物籃分析是很重要的部份特殊的物件由什麼組成,是視各行業(yè)的需要而定例:雜貨店 VS. 披薩店,建立關(guān)聯(lián)法則(3),24,表9.3,25,表9.4,26,選擇正確的項(xiàng)目組合(2),我們感

11、興趣的商品是會(huì)隨時(shí)間而改變的問(wèn)題:想用過(guò)去的資料分析時(shí),不同的層級(jí)無(wú)法一起分析選擇適當(dāng)?shù)木?xì)程度是這個(gè)分析的關(guān)鍵,建立關(guān)聯(lián)規(guī)則(4),27,選擇正確的項(xiàng)目組合(3),產(chǎn)品階層(Product Hierarchies)可幫助歸納商品在現(xiàn)實(shí)生活中,每件產(chǎn)品都有自己的生產(chǎn)和倉(cāng)儲(chǔ)序號(hào)(stock-keeping unit, SKUs),也就是產(chǎn)品階層或分類(lèi)學(xué)(taxonomy)《圖9.10》要用怎樣的分類(lèi)階層才最適合?,建立關(guān)聯(lián)規(guī)則(5

12、),28,圖9.10,,,,,,品牌、尺寸、倉(cāng)儲(chǔ)序號(hào),冷凍食品,冷凍晚餐,冷凍蔬菜,冷凍甜點(diǎn),其他,混合,胡蘿蔔,豌豆,水果吧,冰淇淋,冷凍優(yōu)格,其他,櫻桃,核桃,香草,草莓,巧克力,,,,,,,,,,,,,,,,,,,更籠統(tǒng),更詳細(xì),部份產(chǎn)品分類(lèi)法,29,選擇正確的項(xiàng)目組合(4),產(chǎn)品階層可幫助歸納商品要考慮的組合隨著分析商品數(shù)量的增加而快速成長(zhǎng)項(xiàng)目分得越精細(xì),分析的結(jié)果越實(shí)用一項(xiàng)規(guī)則的複雜度,取決於它包含了多少項(xiàng)商品分類(lèi)階層

13、越上層,所列出的項(xiàng)目越少適合的層級(jí)應(yīng)該由商品本身來(lái)決定,建立關(guān)聯(lián)規(guī)則(6),30,選擇正確的項(xiàng)目組合(5),小秘訣在含有特定目標(biāo)的交易數(shù)量約等於分析母體資料數(shù)時(shí),購(gòu)物籃分析可發(fā)揮到最大效果這可以避免讓最常見(jiàn)的物品支配大多數(shù)的規(guī)則將少見(jiàn)的商品用高階的階層,這樣出現(xiàn)的頻率比較高,建立關(guān)聯(lián)規(guī)則(7),31,選擇正確的項(xiàng)目組合(6),跨越產(chǎn)品階層的虛擬項(xiàng)目虛擬項(xiàng)目的目的在於從跨越產(chǎn)品階層的訊息中得到好處虛擬項(xiàng)目不會(huì)出現(xiàn)在原始的產(chǎn)品階

14、層虛擬項(xiàng)目有時(shí)甚至?xí)灰椎馁Y訊不一定要加入虛擬項(xiàng)目虛擬項(xiàng)目可能造成明顯的規(guī)則,建立關(guān)聯(lián)規(guī)則(8),32,選擇正確的項(xiàng)目組合(7),資料品質(zhì)購(gòu)物籃分析所用的資料,品質(zhì)通常不高通常都在與顧客直接接觸時(shí)獲得,且主要用途是在運(yùn)作目的上(例:倉(cāng)儲(chǔ)管理)資料需要額外處理後,才能拿來(lái)分析,建立關(guān)聯(lián)規(guī)則(9),33,選擇正確的項(xiàng)目組合(8),具名或匿名零售業(yè)--現(xiàn)金交易—匿名網(wǎng)路交易、信用卡、消費(fèi)者俱樂(lè)部—具名,建立關(guān)聯(lián)規(guī)則(1

15、0),34,從這些資料中產(chǎn)生規(guī)則(1),項(xiàng)目的組合並非規(guī)則規(guī)則:如果「條件句」,則「結(jié)論句」。 例:如果「芭比娃娃」,則「糖果條」。具實(shí)用性的規(guī)則,在結(jié)論句只包含一項(xiàng)商品,建立關(guān)聯(lián)規(guī)則(11),35,從這些資料中產(chǎn)生規(guī)則(2),計(jì)算信心水準(zhǔn)(confidence)信心水準(zhǔn)= P(條件句與結(jié)論句)/ P(條件句)以三種商品、結(jié)論句只有一種商品的組合為例:如果A和B,則C如果A和C,則B如果B和C,則A,建立關(guān)聯(lián)規(guī)則(12

16、),36,表9.5,37,表9.6,38,從這些資料中產(chǎn)生規(guī)則(3),計(jì)算LiftLift = (P(條件句與結(jié)論句)/ P(條件句))/ P(結(jié)論句) = 信心水準(zhǔn)/ P(結(jié)論句) = (P(條件句與結(jié)論句)/ P(條件句)* P(結(jié)論句)當(dāng)Lift大於1時(shí),最後的結(jié)果會(huì)比單純亂數(shù)好當(dāng)Lift小於1時(shí),效果則比較差否定規(guī)則,建立關(guān)聯(lián)規(guī)則(13),39,表9.7,40,圖9.1

17、1(1),41,圖9.11(2),42,克服現(xiàn)實(shí)的限制(1),產(chǎn)生關(guān)聯(lián)規(guī)則是一個(gè)多步驟的過(guò)程隨著商品數(shù)的增加,計(jì)算的複雜度會(huì)成幾何級(jí)數(shù)增加解決方法:修剪(pruning) 例:最低交易佔(zhàn)有率修剪(minimum support pruning)門(mén)檻數(shù)也可以根據(jù)運(yùn)算過(guò)程修正,建立關(guān)聯(lián)規(guī)則(14),43,克服現(xiàn)實(shí)的限制(2),龐大資料的問(wèn)題:假設(shè)某店有100種商品,建立關(guān)聯(lián)法則(15),44,觀念延伸(1),用關(guān)聯(lián)規(guī)則比較各分店

18、購(gòu)物籃分析常用來(lái)比較連鎖店中的各分店用虛擬項(xiàng)目協(xié)助分析,一把榔頭一盒釘子超細(xì)砂紙,,一把榔頭一盒釘子超細(xì)砂紙「在一家舊分店買(mǎi)的」,45,觀念延伸(2),比較兩家分店的程序蒐集開(kāi)幕後特定期間的資料,用虛擬項(xiàng)目說(shuō)明這是新店的資料自舊分店蒐集相同數(shù)目的資料,也用虛擬項(xiàng)目標(biāo)是這是舊分店的資料找出各組的關(guān)聯(lián)規(guī)則特別注意有虛擬項(xiàng)目的規(guī)則其它應(yīng)用:促銷(xiāo)期間vs.平時(shí)、都會(huì)區(qū)vs.郊區(qū)、不同季節(jié)、不同地理區(qū),46,觀念延伸(3),

19、無(wú)關(guān)規(guī)則(Dissociation Rules)條件句中可以包含「且非」的陳述加入一個(gè)「逆轉(zhuǎn)商品」(Inverse Items),,,47,觀念延伸(4),無(wú)關(guān)規(guī)則的缺點(diǎn)分析對(duì)象增加一倍交易數(shù)量增加逆轉(zhuǎn)商品出現(xiàn)頻率比原始商品高實(shí)用性不高 例:如果沒(méi)有A也沒(méi)有B,則沒(méi)有C,48,利用關(guān)聯(lián)規(guī)則進(jìn)行序列分析(sequence analysis),相對(duì)於購(gòu)物籃分析,序列分析希望找到某段時(shí)間內(nèi)特定的消費(fèi)者的消費(fèi)行為。Ex1.

20、割草機(jī)→水管Ex2.清點(diǎn)(和解)帳戶(hù)→取消帳戶(hù),49,序列分析的附加條件,時(shí)間序列資料(time-series data)必定建立在顧客的基本資料上。如果無(wú)法追蹤顧客的長(zhǎng)期行為,便無(wú)法建立序列分析。每筆交易記錄都必須有註記或序號(hào)決定交易順序。Ex.信用卡交易、銀行服務(wù)、醫(yī)療服務(wù),50,購(gòu)物籃分析的優(yōu)點(diǎn),能產(chǎn)生簡(jiǎn)單明瞭的結(jié)論能運(yùn)用在非監(jiān)督式資料採(cǎi)礦上能分析不同形式的原始資料所採(cǎi)用的計(jì)算模式簡(jiǎn)單易懂,51,購(gòu)物籃分析的缺點(diǎn),當(dāng)商

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論