更新時(shí)間:2021年05月13日16時(shí)41分 來(lái)源:傳智教育 瀏覽次數(shù):
1.獨(dú)立同分布(i.i.d.)
在概率統(tǒng)計(jì)理論中,如果變量序列或者其他隨機(jī)變量有相同的概率分布,并且互相獨(dú)立,那么這些隨機(jī)變量是獨(dú)立同分布。
在西瓜書(shū)中解釋是:輸入空間中的所有樣本服從一個(gè)隱含未知的分布,訓(xùn)練數(shù)據(jù)所有樣本都是獨(dú)立地從這個(gè)分布上采樣而得。
2.簡(jiǎn)單解釋 — 獨(dú)立、同分布、獨(dú)立同分布
(1)獨(dú)立:每次抽樣之間沒(méi)有關(guān)系,不會(huì)相互影響
舉例:給一個(gè)骰子,每次拋骰子拋到幾就是幾,這是獨(dú)立;如果我要拋骰子兩次之和大于8,那么第一次和第二次拋就不獨(dú)立,因?yàn)榈诙螔伒慕Y(jié)果和第一次相關(guān)。
(2)同分布:每次抽樣,樣本服從同一個(gè)分布
舉例:給一個(gè)骰子,每次拋骰子得到任意點(diǎn)數(shù)的概率都是六分之一,這個(gè)就是同分布
(3)獨(dú)立同分布:i.i.d.,每次抽樣之間獨(dú)立而且同分布
3.機(jī)器學(xué)習(xí)領(lǐng)域的重要假設(shè)
IID獨(dú)立同分布即假設(shè)訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)是滿足相同分布的,它是通過(guò)訓(xùn)練數(shù)據(jù)獲得的模型能夠在測(cè)試集獲得好的效果的一個(gè)基本保障。
4.目前發(fā)展
機(jī)器學(xué)習(xí)并不總要求獨(dú)立同分布,在不少問(wèn)題中要求樣本數(shù)據(jù)采樣自同一個(gè)分布是因?yàn)橄M糜?xùn)練數(shù)據(jù)集得到的模型可以合理的用于測(cè)試數(shù)據(jù)集,使用獨(dú)立同分布假設(shè)能夠解釋得通。
目前一些機(jī)器學(xué)習(xí)內(nèi)容已經(jīng)不再囿于獨(dú)立同分布假設(shè)下,一些問(wèn)題會(huì)假設(shè)樣本沒(méi)有同分布。
猜你喜歡:
北京校區(qū)