2018-11-26
閱讀量:
1182
實體識別
實體識別是從不同數(shù)據(jù)源識別出現(xiàn)實世界的實體, 它的任務(wù)是統(tǒng)一不同
源數(shù)據(jù)的矛盾之處, 常見的矛盾有如下幾個。
(1) 同名異義
數(shù)據(jù)源A中的屬性ID和數(shù)據(jù)源B中的屬性ID分別描述的是菜品編號和訂
單編號, 即描述的是不同的實體。
(2) 異名同義
數(shù)據(jù)源A中的sales_dt和數(shù)據(jù)源B中的sales_date都是描述銷售日期的, 即
A.sales_dt=B.sales_date。
(3) 單位不統(tǒng)一
描述同一個實體分別用的是國際單位和中國傳統(tǒng)的計量單位。
檢測和解決這些沖突就是實體識別的任務(wù)。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論