每天一個(gè)數(shù)據(jù)分析題(五百二十四)- 向量空間模型
向量空間模型是信息檢索技術(shù),下面有關(guān)向量空間模型(VSM)的描述中,錯(cuò)誤的是:
A. 以向量來(lái)表示文檔后,兩者的夾角越小說(shuō)明相似度越高
B. 文本特征詞的向量權(quán)重可通過TF-IDF實(shí)現(xiàn),從而保留文本詞序結(jié)構(gòu)信息
C. 在向量空間模型中,當(dāng)有新文檔加入時(shí),需要重新計(jì)算特征詞的權(quán)重
D. 基于向量的文本相似度計(jì)算中,除了內(nèi)積、Dice系數(shù)、夾角余弦,還可用Jaccard方法
數(shù)據(jù)分析認(rèn)證考試介紹:點(diǎn)擊進(jìn)入
數(shù)據(jù)分析考試大綱下載
題目來(lái)源于