
大數(shù)據(jù)背后的價值和隱憂_數(shù)據(jù)分析師考試
有人曾調(diào)侃,人活幾十年,用一張表格竟然就能概括。這話雖然不完全中肯,但也道出了信息數(shù)據(jù)的奧秘。最近在2015年夏季世界O2O 博覽會上,騰訊宣布QQ錢包下一步要將服務延伸至線下支付場景,如洗衣、洗車、美甲等。而這一招棋,騰訊其實要挖掘的正是消費者每一筆支付背后的數(shù)據(jù)信息價值?;ヂ?lián)網(wǎng)的飛速發(fā)展,加速了各類數(shù)據(jù)、信息的匯集融合,大數(shù)據(jù)時代撲面而來。刷臉記考勤、數(shù)據(jù)找商機、數(shù)據(jù)保健康……這些變革如今都已現(xiàn)端倪。但同時,大數(shù)據(jù)時代也給個人信息保護帶來了莫大挑戰(zhàn)。
大數(shù)據(jù)構建的未來
你的一天可能是這樣子
在強大數(shù)據(jù)的構建下,你未來的一天可能是這樣子:早晨7點,你被身下的智能床溫柔叫醒,“主人主人起床啦”;如果還想賴床,它可能會動粗,左右搖晃或者上下顛簸,直到你揉著惺忪睡眼離開臥室。洗漱完畢之后,你的某一樣穿戴設備,比如手表、項鏈、眼鏡等,會將昨晚記錄的睡眠、心跳、血壓等數(shù)據(jù)報告給你,并給出科學的早餐建議。接下來該準備上班了,今天周一,下雨,早上8點路況怎么樣?問問手機APP就知道了,包括接下來幾小時方圓2公里內(nèi)的天氣、中午吃什么營養(yǎng)又美味,你都可以咨詢它。下班回家路上,順便逛逛超市,最近皮膚干燥該用什么洗浴用品呢?只要在機器上輸入會員號,設備便會根據(jù)你所在城市的氣候、會員年齡性別消費歷史等信息,給出合理的商品類型和導購位置,下單支付,就有專人配送到家……
是不是很神奇?而這還僅僅是個人生活中的一個小碎片,可以想見,在醫(yī)療、交通、科技、社會治安、政府管理等各行各業(yè),數(shù)據(jù)都將發(fā)揮出神奇的點化功能。
如醫(yī)生可以通過參考平臺數(shù)據(jù)庫,調(diào)取相似基因、年齡、人種、身體狀況相同的有效治療方案,快速制定出適合病人的治療方案;科學家將數(shù)據(jù)技術應用于基因分析上,讓父母對未出生寶寶的健康狀況了如指掌,幫助人類預測和戰(zhàn)勝未來疾病等;政府機構甚至能夠利用數(shù)據(jù)來更準確地了解各地經(jīng)濟發(fā)展狀況,實現(xiàn)科學決策、數(shù)據(jù)治國。
“水這個東西大家都見過。當你有一杯水的時候,你可以喝它。當你有一盆水的時候,你可以用它洗臉。當你有一浴缸水的時候,你可以用它泡澡。當你有一游泳池水的時候,你可以用它游泳。當你有一西湖水的時候,你可以用它劃船泡妹子。當你有一運河水的時候,你可以用它運糧食。當你有一長江水的時候,你可以來往于中國的西部和東部。當你有一大西洋水的時候,你就可以發(fā)現(xiàn)新大陸了!”
明道副總裁許維曾用水來比喻數(shù)據(jù)能夠帶來的效應,這段評論亦得到了廣泛認同。輿論公認,隨著互聯(lián)網(wǎng)云時代的到來,數(shù)據(jù)將更深入地浸透生活的方方面面,數(shù)據(jù)之上的生活必將更加私人、個性、智能。
考勤刷個臉就可以搞定
今年三月,馬云在德國的一場“刷臉支付”秀讓人臉識別著實火熱了一把,不過,一些業(yè)內(nèi)人士告訴記者,其實“看臉的時代”早就來了。而這背后所依托的正是神奇的數(shù)據(jù)采集與建模。
在蘇州某家專門從事生物智能分析與識別技術研發(fā)生產(chǎn)的企業(yè)門口,右側(cè)約1米高的位置,安裝著一臺黑色機器,運營總監(jiān)湯嘯峰走到離機器約50厘米的地方站定,微微俯下上身,讓臉龐出現(xiàn)在機器平面正中3.5英寸的顯示屏上,很快屏幕上就亮起綠燈,并跳出幾個字“識別結(jié)束”,與此同時,可以聽到噠的一聲輕響,門鎖已經(jīng)打開。整個過程前后不到一秒。
湯嘯峰所演示的就是一臺智能三維人臉識別門禁考勤機。每天早晨和下午,他所在公司的員工都要向這臺機器“報到”。在這里,刷臉早就取代了一般的打卡簽到。
“當員工選擇人臉識別進入大門的方式時,站在人臉識別門禁終端機前,采集盒開始對人的臉部及特定骨骼曲率差進行臉部特征數(shù)據(jù)采集,采集成功則建模完畢。下次同一員工站在識別儀前時,系統(tǒng)就會自動核實當前人臉特征是否存在數(shù)據(jù)庫中。若存在,則識別成功,觸發(fā)現(xiàn)場控制器,門將自動打開。若有陌生人強行進入裝有人臉識別門禁系統(tǒng)的大門時,現(xiàn)場控制器可觸發(fā)人臉識別安防系統(tǒng)自動報警。”
湯嘯峰介紹,因為產(chǎn)品采集的是人臉和骨骼輪廓的主要參數(shù),形成三維立體模型,不受膚色、性別影響,一般的面部表情、發(fā)型、胡須、化妝等變化也不會影響識別精度,除非是削骨;相反,這套系統(tǒng)具有智能自學功能,能隨著發(fā)型、膚色、年齡等變化動態(tài)更新人臉數(shù)據(jù)庫存,保證數(shù)據(jù)庫的模板始終為用戶最近信息資料。
“一般人在成年前后臉部骨骼可能會逐步發(fā)生變化,這時儀器在捕捉你的臉部特征,比對認證為同一個人后更新為新的模板,這樣數(shù)據(jù)庫就會一點點地進行微調(diào)。另外,如果你刷臉的次數(shù)越多,系統(tǒng)就會對你越熟悉,識別的速度也就越快”。當然,拿著照片或視頻等二維圖像企圖蒙混過關,也是會被系統(tǒng)拒之門外的。
據(jù)了解,這套系統(tǒng)采用近紅外線雙攝像頭捕獲人臉,應用最新的“Face Image+V4.0”人臉識別算法,用戶容量最高達到5000人,記錄容量25萬條,驗證速度小于1秒,其價格也相對較高,約在4000多元。
在湯看來,輿論熱烈關注的掃臉支付僅僅是小試牛刀,人臉識別技術真正的應用范圍非常之廣,諸如公安刑偵、門禁考勤、網(wǎng)絡應用都在其中。僅就該公司而言,除這套門禁考勤系統(tǒng)外,公司研發(fā)的“人臉”系列還包括有人臉二代身份證識別認證系統(tǒng)、智能樓宇人臉識別對講系統(tǒng)、學生人臉識別宿管系統(tǒng)等等。而不管哪個系統(tǒng),其核心原理都是一致的,那就是數(shù)據(jù)采集、建模與分析比對。
大數(shù)據(jù)的背后
創(chuàng)業(yè)商機就看你能否抓住
對于在互聯(lián)網(wǎng)電商平臺摸爬滾打的大小店主來說,數(shù)據(jù)是他們窺探商機、賺取利益的基本法寶。
余洛,是吳江一家廣告設計公司的員工,年收入約八九萬。去年,在朋友的攛掇下,在阿里旗下的速賣通平臺開了一家網(wǎng)店,小生意做得紅紅火火,每個月都有三四千的收益?!八儋u通是專門面向海外客戶的,全英文界面?!庇嗦甯嬖V記者,“我做的主要是‘倒’活,客戶下了單,我再去淘寶上訂貨、發(fā)貨,賺個差價,所以基本無虧損?!?/span>
每天空余時看看網(wǎng)店,下下單發(fā)發(fā)貨,一個月還穩(wěn)賺三四千,這樣的好事誰都想摻乎。當記者詢問余洛的商機訣竅時,他顯得很大方,“其實,只要多關注下平臺提供的數(shù)據(jù),自己好好分析下,就能有收獲?!?/span>
談起他如何發(fā)現(xiàn)商機創(chuàng)業(yè),余洛打開了話匣子?!霸S多電商平臺都有搜索關鍵詞,關鍵詞后面的搜索數(shù)據(jù)可以關注下?!庇嗦逭f。在速賣通平臺上,只要輸入關鍵詞,就會出現(xiàn)一系列的數(shù)據(jù),店家可以檢測有意愿售賣的產(chǎn)品搜索率是否高,產(chǎn)品銷售競爭是否激烈,市場空間是否還存在。甚至是某種產(chǎn)品的某個款式,用關鍵詞搜索也能獲得相關數(shù)據(jù)信息,從而判斷流行趨勢。
而這只是入門級別的商機判斷,平臺后臺提供的各類商機數(shù)據(jù)更詳盡。利用余洛的賬號,記者在其指導下打開了速賣通后臺。在“數(shù)據(jù)縱橫”下,后臺提供了“商機發(fā)現(xiàn)”的數(shù)據(jù)。據(jù)余洛介紹,只要店家選擇搜索某個行業(yè),該行業(yè)的訪客數(shù)量、瀏覽量、成交額、成交訂單等占比以及供需指數(shù)立馬會有圖表伴隨著趨勢圖清晰顯示。而該行業(yè)的客戶群體主要來自哪些國家,后臺也會給予圖表分析以供參考?!跋冉Y(jié)合自己情況選擇行業(yè),然后再利用平臺提供的數(shù)據(jù)精細選品類。”余洛說。
記者發(fā)現(xiàn),對于某個行業(yè)中的大小品類,后臺也給予了充足精細的數(shù)據(jù)。拿家居用品行業(yè)為例,不論是棉的、天鵝絨的、絲綢的,還是枕頭、靠墊或四件套。平臺數(shù)據(jù)都清晰地用圓圈大小及不同的顏色,顯示該品類的銷售量大小以及競爭激烈程度。“選擇哪個品類,往往都要在銷售熱度和競爭激烈度中取一個平衡?!庇嗦逭f?!坝袝r候平臺還會發(fā)布些其他數(shù)據(jù)供參考,比如哪個國家的注冊人數(shù)上升迅猛,比如夏天到了,某些產(chǎn)品的需求量上升等?!?/span>
“其實,網(wǎng)店看著很光鮮,但那么多賣家,能真正賺錢的有幾個?要想店鋪保證不虧還能賺錢,需要用好后臺幫你統(tǒng)計好的相關數(shù)據(jù),查缺補漏,好好經(jīng)營店鋪。”余洛說。他指向了后臺的“經(jīng)營分析”一項。據(jù)介紹,該模塊的數(shù)據(jù)分為“實時風暴”、“商鋪概況”、“商鋪流量來源”、“商鋪裝修”及“商品分析”五大類。記者既能從數(shù)據(jù)中發(fā)現(xiàn)每天店鋪的訪客數(shù)、瀏覽量、店鋪排名等,還可以精確鎖定商鋪流量的來源,是直接訪問、站內(nèi)搜索、收藏夾還是直通車等廣告。
“‘商品分析’是最重要的?!庇嗦灞硎?。記者驚奇發(fā)現(xiàn),在該項數(shù)據(jù)下,該店鋪內(nèi)的每一件產(chǎn)品都有專屬的數(shù)據(jù)分析。搜索曝光量多少、瀏覽量多少、訪客數(shù)多少、支付訂單數(shù)多少、成交轉(zhuǎn)化率多少以及流量的來源都有數(shù)據(jù)及圖表顯示?!耙粋€商品賣的不好,是在哪個環(huán)節(jié)出了問題,這些數(shù)據(jù)都能告訴你。是商品搜索圖片不夠醒目還是內(nèi)部信息完善度不夠,哪些方面需要改進,通過數(shù)據(jù)也許就能看出端倪?!庇嗦逭f。
警惕大數(shù)據(jù)泄露
個人隱私保護更要注意
互聯(lián)網(wǎng)時代下,數(shù)據(jù)信息爆炸式地膨脹,每個人都能享受數(shù)據(jù)富足帶來的紅利。可是,在歆享數(shù)據(jù)帶來利益的同時,每一個體的信息也無疑被曝露。
晨玉是一位新媽媽,剛出院沒幾天,正在娘家坐月子。可是這些天接連收到短信電話,不是問她寶寶是否要拍滿月照,就是邀請她來體驗寶寶游泳與撫觸?!斑B我叫什么名字,寶寶什么時候哪家醫(yī)院出生的,出生時幾斤幾兩都清清楚楚?!背坑裼悬c無奈。而這樣由于信息泄露造成的困擾,相信絕大多數(shù)的人都碰到過。如今的詐騙越來越難防范,也與個人信息的泄露相關。一個詐騙電話,往往那頭能準確叫出你的名字,說出你的信息以及現(xiàn)階段的需求,當你頭腦一熱,放松警惕后,上鉤便不再是難事。如果說以上這些都已見怪不怪,那你是否知道,只要有人愿意搜集與分析,識別一個人只需要33個字節(jié)的信息量。
如果有專業(yè)公司搜集,那淘寶網(wǎng)就能曝露人們的購物習慣,百度、360可能會曝露人們的網(wǎng)頁瀏覽習慣,微信、陌陌、微博似乎都能窺見我們的社交關系,直指我們內(nèi)心。比如你的搜索引擎中的瀏覽記錄,就會記錄下連自己都已忘掉的過往。你曾經(jīng)在什么時間去過哪個地方,你某段時間最為關心的事情是什么,這些記錄將展露無遺。即使是不涉及內(nèi)容的元數(shù)據(jù)也可能會辨識定位到個人。以電話元數(shù)據(jù)為例,甚至不需要監(jiān)聽到個人打電話時說的具體內(nèi)容,只需要根據(jù)談話的時機、長度、頻率與對象,就能推算出談話人之間的密切程度以及個人信息。
在互聯(lián)網(wǎng)發(fā)展迅速,不小心就會泄密的時代,我們能如何保護自己的隱私少泄露呢?據(jù)了解,目前我國針對個人信息安全保護的立法和修法進程進展緩慢,而在監(jiān)管層面也缺少相應的專門監(jiān)管機構,即使有市民的個人隱私被扭曲、惡化,嚴重影響生活,實施者一方也很難受到嚴厲懲罰。
那么作為市民個人,應該怎樣保護自己的隱私呢。專業(yè)人士提醒:個人信息被泄露、盜用與濫用,往往和個人信息保護意識不強有關。市民在辦理一些必須提供自己信息的事務時,應盡量與對方約定保密責任。而在網(wǎng)絡上,個人更是不應該隨意輸入自己的關鍵信息,注意保護和刪除。一旦發(fā)現(xiàn)自己的隱私泄露造成不良后果時,應當積極維權,作出反擊。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04