-->
請(qǐng)您遵循相關(guān)法律法規(guī),避免再次出現(xiàn)類似問(wèn)題
如有任何疑問(wèn),請(qǐng)聯(lián)系support@tmtpost.com
關(guān)閉
第四課:如何從模型角度提高VC維?
小欣:這節(jié)課,陳雨強(qiáng)老師會(huì)為我們講解如何從模型角度提高VC維。
陳雨強(qiáng):主要的思路是:先觀察問(wèn)題,得到一些思考和假設(shè)后我們把思考和假設(shè)通過(guò)建模的方式加入新的結(jié)構(gòu)和參數(shù),重新擬合我們的數(shù)據(jù),最后得到一個(gè)新的模型和新的驗(yàn)證。
以時(shí)序動(dòng)態(tài)的協(xié)同過(guò)濾為例,我們這里引用的是Koren、Yehuda發(fā)表的論文‘Collaborative filtering with temporal dynamics’,這是這個(gè)領(lǐng)域被引用最多的一篇經(jīng)典論文。在這篇論文里面我們首先有一個(gè)低秩的假設(shè):我們認(rèn)為一個(gè)矩陣是被分解成兩個(gè)更低維的矩陣相乘的結(jié)果。就比方說(shuō)4×4的矩陣就被分解為了兩個(gè):一個(gè)4×2的矩陣,一個(gè)2×4的矩陣。這兩個(gè)低維的矩陣一個(gè)是user的隱變量,一個(gè)是Item的隱變量。
另一個(gè)作者發(fā)現(xiàn)的打分問(wèn)題,比如MDB電影的打分會(huì)隨著時(shí)間的推移而不斷地上升,所以他設(shè)計(jì)了一系列的線性模型來(lái)擬合這樣的趨勢(shì)。他會(huì)設(shè)計(jì)一個(gè)User打分的時(shí)間,第一次打分的時(shí)間的偏置乘一個(gè)斜率是他打分的偏置,同時(shí)他對(duì)每一個(gè)電影設(shè)計(jì)的打分偏置,考慮到每個(gè)Item隨著時(shí)間的影響受到的打分的波動(dòng)。
時(shí)間的波動(dòng)不會(huì)是一個(gè)純的線性關(guān)系,所以作者用非線性的方式進(jìn)行分段的擬合。但是不管怎么說(shuō),這樣一個(gè)模式是比較清晰的,也就是說(shuō)我們首先觀察數(shù)據(jù),從數(shù)據(jù)中得到一些假設(shè)然后根據(jù)假設(shè)設(shè)計(jì)一個(gè)模型。這個(gè)模型會(huì)有幾個(gè)未知的參數(shù),我們通過(guò)機(jī)器學(xué)習(xí)的方式擬合這樣的參數(shù),最后得到一個(gè)模型,在新的數(shù)據(jù)上進(jìn)行驗(yàn)證看它的效果如何。
小欣:下節(jié)課,陳雨強(qiáng)老師會(huì)為我們講解可以提高VC維的另一角度。
【版權(quán)歸鈦媒體所有,未經(jīng)許可不得轉(zhuǎn)載】

注冊(cè)郵箱未驗(yàn)證
我們已向下方郵箱發(fā)送了驗(yàn)證郵件,請(qǐng)查收并按提示驗(yàn)證您的郵箱。
如果您沒(méi)有收到郵件,請(qǐng)留意垃圾郵件箱。
賬號(hào)合并
經(jīng)檢測(cè),你是“鈦媒體”和“商業(yè)價(jià)值”的注冊(cè)用戶。現(xiàn)在,我們對(duì)兩個(gè)產(chǎn)品因進(jìn)行整合,需要您選擇一個(gè)賬號(hào)用來(lái)登錄。無(wú)論您選擇哪個(gè)賬號(hào),兩個(gè)賬號(hào)的原有信息都會(huì)合并在一起。對(duì)于給您造成的不便,我們深感歉意。
Oh! no
您是否確認(rèn)要?jiǎng)h除該條評(píng)論嗎?