基于張量分解的實時競價廣告響應(yīng)預(yù)測方法.pdf_第1頁
已閱讀1頁,還剩159頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、迅速崛起的實時競價廣告實現(xiàn)了需求方由“媒體”購買轉(zhuǎn)向“受眾”購買,實現(xiàn)了更精準(zhǔn)的廣告投放,成為數(shù)字廣告未來發(fā)展的大趨勢。需求方平臺是實時競價交易系統(tǒng)的核心,為了實現(xiàn)精準(zhǔn)廣告投放,需求方平臺必須具有極高的流量評價、流量選擇和自主控制能力,因此需求方平臺的技術(shù)和算法的難度最大。需求方平臺最主要的差別是出價策略,出價直接決定著需求方平臺的流量基本單位成本,決定著利潤。點擊率和轉(zhuǎn)化率預(yù)測是直接影響出價質(zhì)量的重要方面,如何準(zhǔn)確地估計點擊率和轉(zhuǎn)化率

2、成為實時競價廣告中需要解決的核心問題。本文重點研究實時競價系統(tǒng)中,面向需求方平臺如何提升廣告點擊率和轉(zhuǎn)化率的預(yù)測性能,以提升需求方的投資回報率。需求方進行廣告響應(yīng)預(yù)測主要面臨著四個方面的嚴酷挑戰(zhàn)。第一,數(shù)據(jù)的稀疏性太高導(dǎo)致預(yù)測結(jié)果不可靠;第二,實時競價過程對點擊率和轉(zhuǎn)化率預(yù)測算法的時間效率要求高;第三,用戶、上下文和廣告三者之間的交互作用特別復(fù)雜導(dǎo)致預(yù)測難度大;第四,訓(xùn)練數(shù)據(jù)集類別嚴重不平衡導(dǎo)致預(yù)測準(zhǔn)確率低。本文基于張量分解模型研究各種

3、挑戰(zhàn)的解決策略并尋求有效地綜合解決方案。具體來說,本文的主要工作包括以下四個方面:
  第一,為了解決實時競價廣告響應(yīng)預(yù)測面臨的嚴峻的數(shù)據(jù)稀疏問題,進行了基于異構(gòu)信息融合的廣告響應(yīng)預(yù)測方法研究。首先嘗試從用戶生成標(biāo)簽中挖掘新特征來擴展用戶特征,然后分析了基于特征的矩陣分解模型集成附加信息的常用策略,面向張量分解模型進行借鑒和改進,針對實時競價中不同類型異構(gòu)信息的性質(zhì)和特點研究了不同的融合策略,提出了基于張量分解模型的異構(gòu)信息融合綜

4、合解決方案和具體實現(xiàn)方法。最后,本文在三個不同的數(shù)據(jù)集上通過實驗對比了在不同級別的特征融合情況下,結(jié)果顯示我們的融合策略能夠較好地提升矩陣分解模型和傳統(tǒng)張量分解模型進行廣告響應(yīng)預(yù)測的性能。
  第二,傳統(tǒng)的基于Tucker分解和CP分解的模型很難在預(yù)測性能和預(yù)測時間效率上同時滿足實時競價廣告響應(yīng)預(yù)測的需要,為了改進傳統(tǒng)張量分解模型的預(yù)測時間效率,進行了基于隱語義立方分解模型的廣告點擊率預(yù)測方法的研究。首先深入剖析了隱語義矩陣分解模

5、型與矩陣奇異值分解的內(nèi)在關(guān)系,然后基于高階奇異值分解是矩陣奇異值分解向高階張量的擴展的思想,借鑒隱語義矩陣分解模型的建模原理,使用截斷的高階奇異值分解,采用直接在觀測數(shù)據(jù)上建模的方法,提出了隱語義立方分解模型。隱語義立方分解模型具有較少的模型參數(shù),實現(xiàn)簡單,訓(xùn)練速度快。本文通過實驗分析了隱語義立方分解模型的訓(xùn)練和預(yù)測時間效率,并和常用的張量分解模型進行了預(yù)測性能對比,實驗結(jié)果表明隱語義立方分解模型既保證了較低的預(yù)測時間復(fù)雜度又保證了較好

6、的預(yù)測性能。
  第三,針對用戶、上下文和廣告之間復(fù)雜的交互關(guān)系,為了同時獲得三者之間全交互作用下的最佳特征表示,進行了基于全交互張量分解模型的點擊率預(yù)測方法研究。首先分析了兩對交互張量分解模型的基本思想,深入剖析了它與傳統(tǒng)張量分解模型之間的關(guān)系,并分析了它解決廣告響應(yīng)預(yù)測問題的局限性。然后,提出了能夠克服這種局限性的全交互張量分解模型,這種模型具有全交互關(guān)系表示能力,充分挖掘了用戶、上下文和廣告三者之間復(fù)雜的兩兩全交互關(guān)系。最后

7、,通過實驗對比了基于異構(gòu)信息融合的傳統(tǒng)張量分解模型、隱語義立方分解模型和全交互張量分解模型的預(yù)測性能,實驗結(jié)果表明本文提出的新模型在保證較低的時間代價情況下取得了最優(yōu)越的預(yù)測性能。
  第四,為了解決訓(xùn)練樣本類別不平衡問題,同時利用點擊和轉(zhuǎn)化反饋信息進行了基于三元組排序優(yōu)化學(xué)習(xí)的廣告響應(yīng)預(yù)測方法的研究。首先將廣告響應(yīng)預(yù)測問題形式化為排序問題,將廣告展示按照響應(yīng)類別的正確排序作為優(yōu)化目標(biāo),提出了基于轉(zhuǎn)化、僅點擊和未點擊的三元組排序優(yōu)

8、化學(xué)習(xí)策略。然后分析了三元組排序優(yōu)化和成對比較排序優(yōu)化的關(guān)系。接著,給出了基于隨機梯度下降的三元組排序優(yōu)化學(xué)習(xí)算法以及使用該算法實現(xiàn)邏輯回歸、矩陣分解和全交互張量分解模型訓(xùn)練的方法。最后通過實驗對比和分析了三元組排序優(yōu)化學(xué)習(xí)、成對比較優(yōu)化學(xué)習(xí)和逐點回歸優(yōu)化學(xué)習(xí)策略的預(yù)測性能。實驗結(jié)果表明本文提出的基于三元組排序優(yōu)化學(xué)習(xí)策略不僅同時提升了點擊和轉(zhuǎn)化預(yù)測的性能,而且能夠有效地解決轉(zhuǎn)化、僅點擊和未點擊廣告展示的三分類排序問題。
  總之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論