
大數(shù)據(jù)如何保障舌尖安全
近日,全國食品安全示范城市創(chuàng)建和農(nóng)產(chǎn)品質(zhì)量安全縣創(chuàng)建工作現(xiàn)場會在四川成都召開。在互聯(lián)網(wǎng)時代,怎樣吃得更安全?與會專家建言獻策,提出要重視利用現(xiàn)代信息技術(shù)手段創(chuàng)新監(jiān)管辦法,提高監(jiān)管效能。
作為近年來最熱門的信息技術(shù)之一,大數(shù)據(jù)技術(shù)如何提高食品安全的監(jiān)管效能?在正在創(chuàng)建食品安全示范城市的成都,我們看到了一種可能。
打通信息孤島
與很多食品安全監(jiān)管人員不同,王立山不需要去農(nóng)貿(mào)市場、超市、餐館,他多數(shù)時候都坐在桌前,他的“檢查”對象是一堆數(shù)據(jù)?!皵?shù)據(jù)分析可以提升食品安全監(jiān)管的效率?!彼f。
王立山是成都市食品安全風險監(jiān)測數(shù)據(jù)中心的主任,該中心正在創(chuàng)建“智慧食安”的核心技術(shù)支持系統(tǒng)。“智慧監(jiān)管,數(shù)據(jù)先行”,這是他們的口號。
走進數(shù)據(jù)中心,最引人注目的是一塊黑色電子屏幕,上面的數(shù)據(jù)不斷刷新。此刻,屏幕上的數(shù)據(jù)顯示,檢測批次總數(shù)674136,檢測項次總數(shù)8469618,不合格樣品總數(shù)15619,不合格樣品待處理數(shù)4、正在處理數(shù)3……
這些數(shù)據(jù)并非全部。王立山和同事們面對的數(shù)據(jù)不僅來自各類食品檢測機構(gòu),還來自當?shù)剞r(nóng)業(yè)、質(zhì)檢、衛(wèi)生、工商等部門。數(shù)據(jù)內(nèi)容包括食品檢測信息、食品安全輿情信息、企業(yè)工商登記和信用數(shù)據(jù)、食源性疾病病例數(shù)據(jù)以及環(huán)境數(shù)據(jù)等。
“成都有食品生產(chǎn)經(jīng)營主體近20萬戶。從農(nóng)田到餐桌,每個環(huán)節(jié)都分散著海量數(shù)據(jù),碎片化嚴重?!蓖趿⑸秸f,他們要做的就是整合這些數(shù)據(jù),建立基礎數(shù)據(jù)庫,打通信息孤島,實現(xiàn)數(shù)據(jù)互通、資源共享。
目前,數(shù)據(jù)庫已積累7萬條政府部門共享數(shù)據(jù)、860萬條檢驗檢測數(shù)據(jù),接入30萬條生產(chǎn)商基礎數(shù)據(jù)和7000萬條全球商品數(shù)據(jù),同步監(jiān)測多家網(wǎng)媒輿情數(shù)據(jù),并保持月均20萬條的增長幅度。
“但大數(shù)據(jù)不等于數(shù)據(jù)量大,而是要產(chǎn)生1加1遠大于2的價值?!蓖趿⑸秸f。
他們做到了。今年1月到8月,通過大數(shù)據(jù)挖掘和分析,成都市食品安全監(jiān)督性抽檢問題發(fā)現(xiàn)率從2.36%提高到了10.71%,監(jiān)管效能大幅提高。
那么,他們到底是怎么做的呢?
實現(xiàn)靶向打擊
凌晨四點,成都農(nóng)產(chǎn)品中心批發(fā)市場就開始忙碌了。滿載各類蔬菜的貨車駛?cè)胧袌?,分成兩列。一列貨車上裝有磁卡,一列則沒有。磁卡里有蔬菜商的來貨備案登記信息和安全證明。沒有磁卡的貨車,貨品被送入快篩檢測實驗室,檢測合格方能入場,檢測數(shù)據(jù)則自動上傳至幾十公里外的成都市食品安全風險監(jiān)測數(shù)據(jù)中心。
在這里,快檢24分鐘就可以出結(jié)果,每天快檢量600批次以上。檢測信息上傳到數(shù)據(jù)中心后,作用在下一個環(huán)節(jié)很快得到體現(xiàn)。
那些裝有磁卡的貨車,盡管有安全證明,但按規(guī)定仍然需要做一定比例的抽檢。于是遇到一個難題,具體該抽檢哪些蔬菜才最有可能發(fā)現(xiàn)問題?
王立山說,他們通過數(shù)據(jù)分析發(fā)現(xiàn),不合格食品在地域上、季節(jié)上分布高度不均勻,在不同季節(jié)和不同氣候條件下,容易出現(xiàn)安全問題的食品都不一樣。而且,股東結(jié)構(gòu)單一且沒有法人股東、實繳資本較低的企業(yè)更容易被檢出不合格食品。這啟發(fā)他們綜合各類檢驗數(shù)據(jù)、企業(yè)登記信息和信用數(shù)據(jù)等,建立了一種機器學習模型。這些工作是他們與電子科技大學的團隊共同完成的。
“機器學習模型通過一定的算法,可定量評估待檢品出現(xiàn)檢驗不合格的可能性,從而實現(xiàn)針對高風險食品的靶向抽檢?!睌?shù)據(jù)中心首席專家、電子科技大學教授周濤說。批發(fā)市場的信息平臺與數(shù)據(jù)中心聯(lián)通,數(shù)據(jù)分析得出的高危食品信息直接傳送給批發(fā)市場。
“我們每天都將接收來自他們的高危產(chǎn)品數(shù)據(jù),數(shù)據(jù)將使我們的安全監(jiān)管更具效力。”批發(fā)市場副總經(jīng)理鄭克克告訴記者。
數(shù)據(jù)中心還整合了衛(wèi)生部門所有食源性腸胃病的病例數(shù)據(jù)。王立山說,通過監(jiān)測不同菌種感染病例數(shù)隨季節(jié)和天氣的變化,并分析860萬條檢驗數(shù)據(jù),他們獲得了食品和檢出菌種之間的關聯(lián)性,由此建立了從相關病例上升到有針對性抽檢之間的自動決策通道。
這種依靠大數(shù)據(jù)分析作出的針對性抽檢,最終使他們獲得了上文所述的監(jiān)管效率,對不合格食品實現(xiàn)更精準的打擊。
提前終止謠言
更有效率地發(fā)現(xiàn)食品安全問題,只是大數(shù)據(jù)的“魔力”之一。周濤和王立山等一度困惑的是,對于網(wǎng)絡上每天流傳的各種食品安全謠言及其給公眾帶來的恐慌情緒,是否也可以及時監(jiān)測,甚至提前終止呢?
他們監(jiān)控了上百家知名網(wǎng)站、論壇、貼吧等累計30多億條輿情數(shù)據(jù),其中與食品安全有關的輿情近800萬條?!矮@取輿情信息后,通過后臺算法,對輿情事件按照關鍵語義提取和自動聚類,我們可以判斷輿情傳播的趨勢。”周濤說。
接下來,是更關鍵的一步:把挖掘出來的所有輿情數(shù)據(jù)分為正面情緒和負面情緒,分析正負情緒的激烈程度?!巴ㄟ^這種分析可以評估某個食品安全輿情的風險程度,監(jiān)管部門是否應該主動介入,通過及時檢驗或嚴厲執(zhí)法,破除謠言和消除安全隱患。”周濤介紹。
不久前,他們第一時間監(jiān)測發(fā)現(xiàn)成都地區(qū)網(wǎng)傳“白菜蘸甲醛來保鮮”。當時,這個輿情尚未大面積傳播,但他們分析后認為風險程度很高,及時通知監(jiān)管部門去市場上大面積抽檢白菜?!白罱K并沒有發(fā)現(xiàn)甲醛白菜,還向公證機構(gòu)公示了權(quán)威的檢驗報告,提前終止謠言?!蓖趿⑸秸f,他們還通過數(shù)據(jù)分析及時發(fā)現(xiàn)了面制品鋁、水產(chǎn)品孔雀石綠等食品安全隱患30項,及時開展有針對性的整治,消除了安全風險。
其實,從苗頭里掌握風險,這種“關口前移”的做法很多監(jiān)管部門并不陌生?!暗侄未蠖急容^落后,數(shù)據(jù)量少,依靠人去特意關注一些網(wǎng)站,定期做匯報?,F(xiàn)在數(shù)據(jù)信息越來越大,單純靠人不太現(xiàn)實?!敝軡f。
數(shù)據(jù)是一種重要資源
更讓王立山興奮的是,數(shù)據(jù)分析還可以主動發(fā)現(xiàn)現(xiàn)行標準中可能存在的缺陷,優(yōu)化檢驗檢測標準。
他們的數(shù)據(jù)庫中有大量關于注水肉的檢測信息,分析后發(fā)現(xiàn),豬肉含水量的檢驗數(shù)據(jù)集中在63%附近和73%~77%之間,而國家標準是77%。“很多商家正好將豬肉注水到標準線附近,通過檢測。但實際上,含水量76%的豬肉已經(jīng)是嚴重的注水肉了。”王立山說。
基于此,他們向上級農(nóng)業(yè)主管部門建議,提高標準的要求,將注水肉國家標準中含水量指標由77%降低到73%左右。目前,農(nóng)業(yè)部正在修訂該標準。
大數(shù)據(jù)的應用使他們對食品安全監(jiān)管有了更大的信心,也有了更多期待。王立山對記者說:“如果實現(xiàn)了大部分政務數(shù)據(jù)的共享,并且打通了內(nèi)外部數(shù)據(jù),整個社會因為決策效率和決策效果的提升可以獲得可觀的價值增量?!?
目前,他們在進一步探索大數(shù)據(jù)在政府管理上的革新。“我們現(xiàn)在能夠?qū)崟r知道每一個食品抽檢和執(zhí)法人員的位置和處理的業(yè)務,能夠回溯每一個處置指令的發(fā)出和執(zhí)行情況。在這種完全透明的環(huán)境下,工作人員的效率會大幅提高,權(quán)力尋租的空間也會消失。”王立山說。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10