
12.12中關村大數據日暨CDA數據數據分析人才培養(yǎng)分論壇演講嘉賓——SenzC創(chuàng)始人 馮小平
演講實錄如下:
大家好,各位領導、各位專家數據分析師們下午好。
這是我個人的簡歷,我叫馮小平,之前做信息安全,做一些工程、搜索,后來去了一家NGO,也是做技術,現(xiàn)在我們做的產品叫做情境感知技術,在國內是第一家,在國際上也差不多是兩三年,即使在硅谷也是。
我請問大家有沒有看過這個美劇,中文叫《疑犯追蹤》,強烈推薦,不光是它評分特別高,它講的就是大數據時代的社會的情況。我喜歡它的幾點,我認為它真的是現(xiàn)實板的Matrix,我覺得這是非?,F(xiàn)實,甚至有可能在當下發(fā)生的大數據故事。大家都說有些集表現(xiàn)上來說已經在日常生活中發(fā)生了,有人成立了POI教。它基本的故事是有一個AI通過收集大量的數據來控制整個社會發(fā)展,比如誰競選、社會往哪邊發(fā)展的故事。
里面有一句話講,對于AI來說,人類社會最大的一個弱點就是人跟人之間的關系。這個趨勢不可避免,大家想不到,我們先把自己煉化下來,看我能分析出什么,這是我當時的一個很小的想法,之后我創(chuàng)業(yè)的時候也是它的本源和初心就是這樣。
剛才曹老師說Hadoop是這個數據的關鍵,我認為這都是工程師造出一堆堆的工具,反而不是數據分析師應該掌握的核心技能,數據分析師應該是用工具幫助你越來越高層地訪問到這些數據、操作這些數據,不用管底層數據怎么存儲、怎么擴展,所以你以后拿到的數據會越來越高層,你不知道從哪拿到,你輸入一句話就可以拿到這樣的數據了,我覺得數據分析師應該更多地了解工業(yè)界對數據分析的需求,就像剛才說造面包,數據分析師需要知道人類需要造什么,這些人需要買什么,除了面包之外,是不是我還要買起司、蛋撻之類的。我第一個方向的就是多玩Gadget,大家看到京東智能的一些小玩意,我覺得這是數據分析師的玩具。
這是我平時會隨身攜帶收集數據用的東西,包括Kinect大家都很熟悉,Kinect windows你可以用的系統(tǒng),包括iBeacon都是寫幾個代碼就可以拿到數據;EyeX是一個民用級別的眼動移,這兩個MotoX是我平時都會帶的,錄音記錄,還有Nexus7是每天帶在包里,你可以搜周圍的信息。
Kinect for windows
比如說Kinect windows,這個是我擺在客廳、辦公室里說這里什么時候有一個人在這邊,這個東西持續(xù)記下來了,我們現(xiàn)在還不知道能分析什么,一旦有一天我們的算法更牛了,就可以算出來東西了。但是如果算法牛了,你沒有這些數據就完了。
iBeacon
這是iBeacon,這個東西造價很便宜,如果你想知道你跟哪個東西距離多遠,你就可以把這個貼到那個里面,你的手機如果接近這個東西,你就可以持續(xù)知道我離它1米、我離它3米,它是可以記錄很多數據,比如你跟你的書包一天接觸多久,當然你也可以做室內定位,比如說你在這個屋子里哪個位置待了多久。
MYO
MYO是一個綁在你手臂的機器,你通過幾個代碼就可以知道每一天手臂肌肉的數據。
Mindwave
這個是一個記錄腦波的數據,它可以簡單地記錄出你一天的注意力的值,當然可能學過大腦神經的人知道各種波對人的精神狀態(tài)是什么作用,它又做了一層,你可以知道這個人注意力多高,你有沒有眨眼,你有沒有很冷靜。這個東西可以用來干嘛呢,我們后面會講到。
NarrativeClip
這個NarrativeClip,這個是我戴在胸前的,它每隔幾秒會拍一張照片,大家可能會說會不會侵犯隱私,如果數據分析師考慮隱私的話就沒法做了。這個想象空間非常大,比如說前兩天就是一個人記錄了6個月的數據可以分析出這個人每一分鐘在干什么。當然我戴這個也戴了一年半了,硬盤都堆了幾個硬盤的數據,我也就是分析分析我每天接觸什么東西。最后我分析的結果是我一天40%的時間都在看消息,我那一天只有5%的時間視角里有人。
EyeX
EyeX這個是放在筆記本上就可以看屏幕的區(qū)域,你什么時候在看哪,基本上每秒鐘幾十赫茲。
剛才那些設備都是市面上能買到的,你從中能拿到的數據,如果你自己做是基本上你要花幾年,甚至十幾年才可以做出的東西,這些Gadget給我們帶來的好處就是我們可以站在它的肩膀上拿到很高級的數據,做深度的數據。
另外分享多去hackathon,我認為hackathon是一個線下同性交友社區(qū),當然不一定同性。在hackathon一般大家花兩天周末的時間一塊去琢磨出一個小點子,然后把這個點子用兩天的時間,有程序員,有設計師,能夠實現(xiàn)出來,并且給大家展示出來。
比如說之前我們參加hackathon的時候,像MYO可以檢測電流,后面紫色的燈也是可以通過API訪問的,我們通過擺手的動作改變燈的顏色,我邊擺手邊聽歌這個燈就可以變顏色,這個就是hackathon做的東西。
另外一個hackathon就是我們做了一個人到哪個屏幕旁邊,內容就顯示在那個屏幕旁邊的一個簡單的模式。我錄了我寫代碼時候的腦波的情況,我注意力的值,我可以拿我注意力的值來評估我不同區(qū)域代碼出BUG的幾率,概率低的我就可以過去,高概率的地方我就仔細檢查一下。
第三個分享就是多用API。
Mashup這個概念很早就提出來了,大家認為以后各種的技術都是堆占型的,大家都要基于別人的API做出自己的產品,其實現(xiàn)在已經這樣了,你創(chuàng)業(yè)服務器肯定不用自己的,都用阿里云,都不用搭自己的后端服務,圖象識別有,聲音識別有迅飛,都有各種各樣的服務。當時有一段時間很疏于技術,我花三十天時間去接觸一些API,這些API都是我搜的最新的美國的創(chuàng)業(yè)項目他在用什么樣的API做。
比如爬蟲、圖象識別、情緒識別,像剛才說的物體的其實都有在線的獨立第三方提供API,如果你不知道這些API的話,你需要想我需要這樣一個功能來實現(xiàn)我的想法的時候,你就不知道到底應該怎么做,難道圖象識別、人臉識別我要重新做嗎?那不可能的,去了解這些可以幫助你的API能夠提升你效率和開拓眼界。我不知道大家在這里面能看到幾個眼熟的東西。
最后一個分享就是多開腦洞。
因為記憶、情緒,大家現(xiàn)在越來越多地被證明是可以被機器替代的。我們就想到底人有什么可以不被機器替代的。谷歌有一個人說2020年可以實現(xiàn)人腦連入互聯(lián)網,我覺得腦洞是人類殘留的不可解的核心價值,我歡迎大家來我們私下組織的小團體搞了一個小節(jié)目,《說好的腦洞呢》,基于現(xiàn)在基礎的技術,未來能夠實現(xiàn)什么樣很好的想法。比如說發(fā)光二維碼,如果我們墓地放二維碼,就可以看到死去的這些人的情況。這些都是腦洞,但是這些腦洞本身就代表著你思維的邊界和你對現(xiàn)在技術的一些了解的體現(xiàn)。
精彩問答
我想問一下像這一類設備技術下一步會有哪些新的突破。
馮小平:這些設備肯定是越來越小型化,越來越接近人的穿戴,比如說腦波有人說拿腦波做環(huán)境的改善,比如說智能大廈會根據你身體的情況自動調節(jié)你所處的環(huán)境的溫度、光照,更往前就是這些東西足夠小型化,可以看到很多會越來越小,越來越讓你感知不到它的存在,包括各種可穿戴設備也是這個趨勢,就是不斷地把你各種維度的數據以你舒適的方式收集下來,收集下來以后,就是他們怎么賣錢的問題了。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
如何考取數據分析師證書:以 CDA 為例? ? 在數字化浪潮席卷各行各業(yè)的當下,數據分析師已然成為企業(yè)挖掘數據價值、驅動決策的 ...
2025-07-15CDA 精益業(yè)務數據分析:驅動企業(yè)高效決策的核心引擎? 在數字經濟時代,企業(yè)面臨著前所未有的數據洪流,如何從海量數據中提取有 ...
2025-07-15MySQL 無外鍵關聯(lián)表的 JOIN 實戰(zhàn):數據整合的靈活之道? 在 MySQL 數據庫的日常操作中,我們經常會遇到需要整合多張表數據的場景 ...
2025-07-15Python Pandas:數據科學的瑞士軍刀? ? 在數據驅動的時代,面對海量、復雜的數據,如何高效地進行處理、分析和挖掘成為關鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數據操作的 “后悔藥” 指南? 在數據庫操作中,誤刪數據、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數據分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數據科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08