更新時間:2020年09月21日15時00分 來源:傳智播客 瀏覽次數(shù):
首先,要明確它在說的fasttext是什么?我們學(xué)的fasttext工具有兩個作用,也就是兩個主要接口,文本分類和訓(xùn)練詞向量,而我們學(xué)習(xí)的word2vec是什么,是如何進行詞向量訓(xùn)練的理論。
但大家要知道,word2vec是有這個工具的,同樣實現(xiàn)word2vec還有g(shù)ensim這樣的工具包。所以更進一步,問的是原生的word2vec和fasttext在實現(xiàn)時的差異,到底加了哪些工程技巧呢?為了避免出現(xiàn)OoV(out of vocab)現(xiàn)象,設(shè)計了允許加入子詞(subword)特征,同時對subword可以進行n-gram,以拓展詞表。當然,我們知道,word2vec提供兩種模式訓(xùn)練cbow和skipgram,他們的結(jié)構(gòu)都是輸出層,隱層和輸出層,這些都屬于全連接層,輸出層就是全連接層+softmax,全連接層+softmax如果計算非常大,那可以怎么辦呢?就是允許使用層次softmax。
下面是傳智播客公開的幾套人工智能視頻教程,如果感興趣可以下載學(xué)習(xí)。