基于最大熵方法面向零售業(yè)的數(shù)據(jù)挖掘.pdf_第1頁
已閱讀1頁,還剩63頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、零售業(yè)從其誕生之日起,就一直伴隨著激烈的競爭。尤其是隨著中國加入WTO以來,零售業(yè)的日益開放已是不可阻擋的即成事實。世界上大型的零售企業(yè)如沃爾瑪,麥德龍等也已經(jīng)開展了其在國內(nèi)的搶灘之路,國內(nèi)零售企業(yè)必須采取有效的應對之策。
   國內(nèi)零售企業(yè)在日常的業(yè)務活動中積累了大量的歷史數(shù)據(jù),但由于分析手段的缺乏,使得決定企業(yè)的決策不是基于數(shù)據(jù)庫中豐富的數(shù)據(jù)和對市場的廣泛調(diào)查,而是基于企業(yè)管理者的直覺,或想當然。因此提高企業(yè)的數(shù)據(jù)分析能力,

2、同時建立一個基于相關(guān)數(shù)據(jù)的決策支持系統(tǒng)就變的十分重要。而數(shù)據(jù)挖掘技術(shù)作為近幾年發(fā)展起來的數(shù)據(jù)組織和分析技術(shù),在這一過程中無疑將發(fā)揮重要作用。
   文章根據(jù)帕累托的“20—80”規(guī)律,即企業(yè)收入的80%通常是來自于20%的顧客。提出了并非所有的客戶對企業(yè)來說都是有價值的,優(yōu)質(zhì)客戶給企業(yè)帶來的利潤遠遠超過一般客戶。企業(yè)對客戶購物行為進行分析,然后區(qū)別對待,有助于企業(yè)把有限精力集中在最有價值的客戶上,提高企業(yè)競爭力。本文的目的和意義

3、就是迅速準確地對客戶信息進行分析和分類。現(xiàn)在使用的數(shù)據(jù)挖掘技術(shù)對優(yōu)質(zhì)客戶的過濾還不夠深入,準確率不高,無法分辨客戶數(shù)據(jù)變化的意義,本文為此提出了利用最大熵方法來建立模型以過濾優(yōu)質(zhì)客戶。
   最大熵模型作為一個比較成熟的統(tǒng)計模型,具有計算模型獨立于特定的任務的特點,具有簡潔、通用和易于移植等優(yōu)點。但在最近幾年的研究中只是被應用在關(guān)于自然語言處理的領(lǐng)域。如何將最大熵模型應用在零售業(yè)領(lǐng)域的數(shù)據(jù)挖掘中正是本文研究的重點問題。
 

4、  本文首先介紹了目前數(shù)據(jù)挖掘技術(shù)的研究背景,重點對OLAP和分類規(guī)則進行了介紹。在此基礎(chǔ)上,介紹了最大熵模型的理論基礎(chǔ)和算法。再通過零售業(yè)企業(yè)數(shù)據(jù)倉庫的建立過程分析了零售業(yè)對數(shù)據(jù)挖掘的需求。本文的重點工作是將最大熵方法應用于零售業(yè)企業(yè)優(yōu)質(zhì)客戶過濾中,提出了基于最大熵的優(yōu)質(zhì)客戶過濾系統(tǒng)的基本框架;通過客戶數(shù)據(jù)的不同特征相結(jié)合的方法,將客戶數(shù)據(jù)表示成特征向量,并對使用不同特征集情況下的過濾性能進行了對比實驗;提出了過濾模型的自適應調(diào)整和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論