2018-10-19
閱讀量:
1200
jieba分詞貼加自定義詞典
使用一個函數(shù):jieba.load_userdict()
只含有一個參數(shù)。參數(shù)為一個文件,文件的的編碼必須為utf-8.
自定義的字典的結(jié)構(gòu)要求如下:
Structure of dict file: word1 freq1 word_type1; word2 freq2 word_type2; ... ;Word type may be ignored。例如:

然后在使用之前的函數(shù)將新建的詞典加入到j(luò)ieba里面去。

jieba能把‘速覽’一詞運(yùn)用到分詞去。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論