每天一個數(shù)據(jù)分析題(五百二十四)- 向量空間模型
向量空間模型是信息檢索技術,下面有關向量空間模型(VSM)的描述中,錯誤的是:
A. 以向量來表示文檔后,兩者的夾角越小說明相似度越高
B. 文本特征詞的向量權重可通過TF-IDF實現(xiàn),從而保留文本詞序結(jié)構(gòu)信息
C. 在向量空間模型中,當有新文檔加入時,需要重新計算特征詞的權重
D. 基于向量的文本相似度計算中,除了內(nèi)積、Dice系數(shù)、夾角余弦,還可用Jaccard方法
數(shù)據(jù)分析認證考試介紹:點擊進入
數(shù)據(jù)分析考試大綱下載
題目來源于