
作者 | 李軍來源 | FT中文網(wǎng)
2019年,是人工智能技術(shù)(以下簡稱AI)逐漸開始降溫的年份。在Gartner 8月份發(fā)布的技術(shù)成熟度曲線上,所有的AI應(yīng)用都還沒有越過第二階段的泡沫頂峰。
盡管AI技術(shù)還處于發(fā)展的初級階段,離大規(guī)模商用還有相當(dāng)遠的距離,但這一點也不妨礙AI技術(shù)給人類社會帶來各種麻煩和爭議。2019年AI給人類帶來的麻煩和潛在的風(fēng)險,包括了其中以下方面:
使用AI技術(shù)進行圖像和視頻編輯是AI應(yīng)用最廣泛和最成熟的領(lǐng)域之一。隨著越來越多的開源軟件可以自動化完成相關(guān)的視頻圖像編輯操作,有一天這個技術(shù)門檻終于被徹底推倒了。
2017年底,一個名叫“deepfakes”的用戶匿名在社交平臺Reddit上傳了基于對抗式神經(jīng)網(wǎng)絡(luò)開發(fā)的程序包,提供視頻編輯“換臉”操作的功能。2018年1月,一款名為FakeApp的手機應(yīng)用在應(yīng)用商店上架,進一步提供傻瓜操作視頻“換臉”。短時間內(nèi),從名人視頻“換臉”到成人視頻“換臉”,各種“成果”蜂擁而出。但總的來說,2018年時的AI“換臉”視頻的細節(jié)處理還比較粗糙,很容易被識破。
讓公眾震驚的時刻終于到來。2019年5月,一個名為“Ctrl Shift Face”的賬號在YouTube上傳了一段比爾?哈德爾的高清訪談視頻。在視頻過程中,比爾?哈德爾的面部逐漸演變?yōu)榘⒅Z德?施瓦辛格的面部,中間的“換臉”過渡幾乎是天衣無縫,而且是漸變式完成的。這段三分鐘的視頻最終被觀看1200萬次,并得到了15萬次的點贊。
AI的視頻偽造技術(shù)終于達到了以假亂真的水平。并且由于模型開源的緣故,AI偽造技術(shù)目前對使用者的要求極低,只要有基本的編程常識,按圖索驥就可以搭建類似的AI運行環(huán)境。
互聯(lián)網(wǎng)巨頭們坐不住了。這種能夠輕易污染信息源,生成虛假信息的“核武器”目前已經(jīng)開始散落在民間?;ヂ?lián)網(wǎng)巨頭們必須重新掌握篩選甄別虛假信息的能力,否則就無法抵抗來自民間的海量虛假內(nèi)容的“攻擊”。
2019年9月,F(xiàn)acebook 宣布將投資 1000 萬美元發(fā)起 Deepfake 檢測挑戰(zhàn)賽(Deepfake Detection Challenge)。這并不是鼓勵Deepfake技術(shù)的進一步發(fā)展,而是希望借助挑戰(zhàn)賽全面了解Deepfake的技術(shù)特點,以便有針對性的尋找快速甄別的手段。
Facebook、微軟以及牛津大學(xué)、加州大學(xué)伯克利分校、麻省理工等企業(yè)和大學(xué)組建了 Partnership On AI。作為這個聯(lián)盟的一份子,F(xiàn)acebook 正在致力于通過更好的檢測技術(shù)來打擊對 Deepfake 的濫用。
2019年8月,德國和意大利的高校研究人員建立了FaceForensics技術(shù)標(biāo)準(zhǔn),用于判別AI生成的虛假視頻。Google作為共同發(fā)起人,也參與了FaceForensics技術(shù)標(biāo)準(zhǔn)的制定。
在中國,一款名為“ZAO”的手機應(yīng)用也因為提供視頻“換臉”功能而大火,同樣引起了有關(guān)部門的注意。2019年12月,國家互聯(lián)網(wǎng)信息辦公室、文化和旅游部、國家廣播電視總局聯(lián)合印發(fā)了《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》,其中規(guī)定網(wǎng)絡(luò)音視頻信息服務(wù)提供者和網(wǎng)絡(luò)音視頻信息服務(wù)使用者利用基于深度學(xué)習(xí)、虛擬現(xiàn)實等的新技術(shù)新應(yīng)用制作、發(fā)布、傳播非真實音視頻信息的,應(yīng)當(dāng)以顯著方式予以標(biāo)識,不得利用基于深度學(xué)習(xí)、虛擬現(xiàn)實等的新技術(shù)新應(yīng)用制作、發(fā)布、傳播虛假新聞信息。
視頻信息偽造只是AI信息偽造的一種形式。2019年算是AI偽造信息技術(shù)大規(guī)模普及的一年。今后偽造與反偽造這種貓鼠游戲還會持續(xù)下去,AI在偽造信息給我們帶來的麻煩才剛剛開始。
使用AI技術(shù)進行圖像和視頻編輯是AI應(yīng)用最廣泛和最成熟的領(lǐng)域之一。隨著越來越多的開源軟件可以自動化完成相關(guān)的視頻圖像編輯操作,有一天這個技術(shù)門檻終于被徹底推倒了。
1、崗位的替代
使用AI技術(shù)進行圖像和視頻編輯是AI應(yīng)用最廣泛和最成熟的領(lǐng)域之一。隨著越來越多的開源軟件可以自動化完成相關(guān)的視頻圖像編輯操作,有一天這個技術(shù)門檻終于被徹底推倒了。
2、模型的錯誤與歧視(bias)
盡管現(xiàn)在AI技術(shù)已經(jīng)很強大,但在很多方面還沒有成熟到能夠普遍應(yīng)用于商業(yè)環(huán)境。這里談到的成熟,一方面是算法適應(yīng)性和技術(shù)應(yīng)用本身的可靠性,另一方面也包括產(chǎn)業(yè)環(huán)境中各方對于AI系統(tǒng)的接受度。
其中一種眾所周知的應(yīng)用類型就是自動駕駛。在AI系統(tǒng)全權(quán)控制車輛時,錯誤的判斷與操作帶來的損失應(yīng)該由哪一方來承擔(dān),目前并沒有一個各方均可接受的解決方案。直到現(xiàn)在,自動駕駛技術(shù)一直在提高系統(tǒng)可靠性和系統(tǒng)失誤的責(zé)任分擔(dān)這兩條線上糾結(jié)不前。
類似的問題是具有普遍意義的。今年5月,媒體披露香港某李姓億萬富豪因為接受投資顧問的建議,采用基金公司提供的AI策略交易系統(tǒng)進行對沖交易,最終導(dǎo)致了超過兩千萬美元的損失。目前該案已經(jīng)被提交到倫敦商業(yè)法庭,并預(yù)計于2020年4月進行審判。
最終的焦點還是回到了“黑匣子”問題上:如果人們不知道AI系統(tǒng)如何做出決策,那么出現(xiàn)問題的話,誰該承擔(dān)責(zé)任?
傳統(tǒng)上來說,任何商業(yè)行為(商業(yè)建議)都可以追根溯源找到行為人。但在由AI系統(tǒng)掌控的商業(yè)行為中,往往很難找到明確的個人為結(jié)果負責(zé)。客戶在接受聊天機器人推薦的產(chǎn)品時甚至無法投訴其提供誤導(dǎo)信息,因為AI系統(tǒng)本身不存在故意誤導(dǎo)(misrepresenation)的可能性。
2019年來臨的這場億萬富翁與AI系統(tǒng)的法律爭斗預(yù)示著人工智能在融入人類生活的方方面面之前,將要面臨什么樣的挑戰(zhàn)。
類似的AI錯誤在2019年還有一些。今年4月份發(fā)生的巴黎圣母院大火期間,YouTube平臺上部分新聞直播下方的信息欄內(nèi),出現(xiàn)了有關(guān)“911恐怖襲擊”事件的說明,但此次大火的原因和恐怖襲擊并無關(guān)聯(lián)。事后,Google 承認(rèn)信息欄的內(nèi)容是由AI算法自動生成的,并表示已經(jīng)第一時間關(guān)閉了這些直播視頻下方的信息欄。
引起AI系統(tǒng)錯誤的原因除了算法模型不夠精確之外,還有一個重要的因素就是建模數(shù)據(jù)本身的偏差導(dǎo)致的模型歧視(bias)。
2018年10月路透社就報道亞馬遜公司開發(fā)的AI智能招聘系統(tǒng)在進行簡歷篩選時存在明顯的性別歧視。AI算法在依據(jù)候選人簡歷時對包括“婦女”等詞的簡歷降權(quán)處理,例如包含“女子國際象棋俱樂部隊長”這樣經(jīng)歷的簡歷。AI算法甚至還系統(tǒng)地降低了兩所女子大學(xué)的畢業(yè)生的等級。所有這些處理方式的原因就是目前科技行業(yè)男性占主導(dǎo)地位的事實強化了系統(tǒng)在構(gòu)建AI算法模型時的偏見。
類似的偏見無處不在。今年5月份皮尤研究中心發(fā)布的報告顯示,F(xiàn)acebook的新聞配發(fā)的照片中,男性出現(xiàn)的次數(shù)是女性的兩倍。在兩性數(shù)量基本均衡的背景下,如果無差別采用Facebook的新聞?wù)掌瑯?gòu)建AI模型,幾乎可以肯定會出現(xiàn)性別歧視的傾向。
AI系統(tǒng)引起的“歧視”中最新的案例來自于日本。就在12月份,東京大學(xué)副教授大澤升平在推特上公開宣稱:“不在自己公司錄用中國人”、“從簡歷就篩掉中國人”。在引起中日雙方的輿論抨擊后,大澤升平在推特上公開道歉,并表示“之前一系列推文中提及對特定國籍人士工作能力的判斷,是本公司基于有限數(shù)據(jù)、經(jīng)過人工智能(AI)分析“過度學(xué)習(xí)’得出的結(jié)果?!边@也算是AI系統(tǒng)歧視在2019年臨近結(jié)束時背上的一口黑鍋吧。
3、潛在的濫用風(fēng)險
目前AI技術(shù)還不夠成熟,所以并沒有出現(xiàn)大規(guī)模的商用,但唯有少數(shù)領(lǐng)域例外 –例如面部識別。
2019年可以說時面部識別技術(shù)“飛入尋常百姓家”的一年。不只是傳統(tǒng)的公安部門和金融部門,現(xiàn)在幾乎各行各業(yè)都在嘗試如何把面部識別技術(shù)嵌入到身份認(rèn)證和人群活動管理的功能中來。
2019年10月,杭州野生動物世界因為強制游客“刷臉”才能入園而導(dǎo)致訴訟。作為一個休閑娛樂場所,有沒有必要強制要求游客留下面部生物特征信息呢?
類似的事例還有中國藥科大學(xué)在教室安裝的人臉識別系統(tǒng)。該系統(tǒng)可以通過面部識別技術(shù)識別進入教室聽課的學(xué)生,并全程追蹤學(xué)生聽講、發(fā)呆、睡覺等上課的狀態(tài)。
面部信息是人類最重要的基本生物特征之一,識別度極高且無法輕易改變。更重要的是,面部信息是少數(shù)可以通過遠程非接觸方式進行準(zhǔn)確識別的生物信息。對于任何向第三方隨意暴露出自己詳細面部信息的個體,都等于允許第三方在任何時間和地點以非接觸方式完成自己的身份認(rèn)證。這就好比你把自己的姓名和身份證信息加密印在自己的額頭上,然后把密碼隨意交給第三方。第三方甚至可以在數(shù)公里之外遠程掃一下你額頭的二維碼,就知道你是誰,身份證號碼多少。
如此輕易且準(zhǔn)確的身份識別信息當(dāng)然很重要。于是各方就趁著AI應(yīng)用的東風(fēng)廣泛收集公民個人面部信息。2019年9月?!侗本┣嗄陥蟆放对诰W(wǎng)絡(luò)商城中有17萬條“人臉數(shù)據(jù)”被公開發(fā)售,其中涵蓋了兩千人的肖像,每個人約有50到100張照片。此外,每張照片還搭配有一份數(shù)據(jù)文件,描述了人臉的106處關(guān)鍵識別位置,如眼睛、耳朵、鼻子、嘴、眉毛等的輪廓信息??梢韵胂?,這兩千人的面部和個人信息泄漏將導(dǎo)致他們在公眾場合的活動近似于“裸奔”,任何獲取這些數(shù)據(jù)且具有面部識別功能的攝像頭都可以知道他/是誰,身份證號多少,多大年齡。
正是因為這樣潛在的濫用風(fēng)險,所以各國政府在2019年開始收緊AI技術(shù)在面部識別領(lǐng)域的應(yīng)用。
2019年5月,舊金山市議會以8:1的投票結(jié)果通過禁止警方和其它政府部門使用“人臉識別技術(shù)”的決議。10月,加利福尼亞州州長簽署法令,禁止執(zhí)法機構(gòu)在未來三年內(nèi)使用面部識別技術(shù)。
美國的警用設(shè)備制造商 Axon Enterprise 6月份表示,將不會在自己的設(shè)備上添加人臉識別軟件。目前Axon Enterprise向包括紐約和洛杉磯警察局在內(nèi)的47家美國執(zhí)法機構(gòu)提供隨身攝像頭。
我們不能說美國政府在部分公務(wù)行為中禁止使用面部識別技術(shù)就是對的,但最起碼在非必要領(lǐng)域,如零售、娛樂、普通服務(wù)業(yè)等應(yīng)該嚴(yán)格約束商家采集和應(yīng)用面部識別技術(shù),并制定面部數(shù)據(jù)的采集和應(yīng)用合規(guī)標(biāo)準(zhǔn),以防止2019年出現(xiàn)的面部識別技術(shù)濫用的趨勢。
需要指出的是,隨著AI技術(shù)逐漸深入到商業(yè)和家庭環(huán)境中,類似的涉嫌濫用領(lǐng)域只會越來越多。從智能音箱涉嫌監(jiān)聽客戶家庭的對話,到亞馬遜使用AI系統(tǒng)監(jiān)控員工工作效率,甚至精確計算工人消極懈怠的“工休間隙”時間(Time Off Task,簡稱TOT),2019年AI商業(yè)應(yīng)用不斷豐富的背后,潛在的濫用風(fēng)險也越來越大。
4、軍事應(yīng)用與對抗
AI作為最尖端的互聯(lián)網(wǎng)高科技之一,在海量信息處理能力和瞬時判別響應(yīng)方面具有人力完全不可比擬的優(yōu)勢。AI自然也是軍事部門希望快速擁有和全面應(yīng)用的技術(shù)。
美國國防部去年6月宣布成立聯(lián)合人工智能中心(JAIC),以促進美國軍事工業(yè)在AI技術(shù)實際應(yīng)用的能力。JAIC負責(zé)人為美國空軍中將John N.T. “Jack” Shanahan,研究的重點領(lǐng)域包括:情報探知、預(yù)測性維護與供應(yīng)、救災(zāi)和人道主義援助、以及網(wǎng)絡(luò)空間。
彭博周刊披露,2019年11月初,來自美國軍事工業(yè)的多位高層和智囊齊聚華盛頓討論AI在軍事工業(yè)的應(yīng)用。其中就有JAIC的負責(zé)人Jack Shanahan將軍,也有谷歌董事長Eric Schmidt和首席法律官Kent Walker。
而美國《防務(wù)系統(tǒng)》網(wǎng)站近日報道,美國算法戰(zhàn)跨職能小組(Algorithmic Warfare Cross-Functional Team,簡稱AWCFT 或 "Project Maven")已經(jīng)開發(fā)出四套智能算法,預(yù)計將很快投入實戰(zhàn)應(yīng)用。這個Project Maven小組就是曾經(jīng)與Google公司合作開發(fā)基于AI圖像識別技術(shù)的無人機目標(biāo)識別系統(tǒng)的軍方機構(gòu)。
而美國國會研究處(Congressional Research Service)11月26日發(fā)布的“AI與國家安全”白皮書中明確指出,“人工智能已經(jīng)被納入在伊拉克和敘利亞的軍事行動中?!?/span>
該白皮書的重要內(nèi)容之一,就是闡述未來的AI技術(shù)在“致命自主武器系統(tǒng)”(Lethal Autonomous Weapon Systems,LAWS)領(lǐng)域的應(yīng)用。所謂“自主武器系統(tǒng)”,就是自動識別目標(biāo),自主判斷并進行攻擊的系統(tǒng)。該系統(tǒng)可以徹底擺脫人為控制,按照AI系統(tǒng)的“智能”完成作戰(zhàn)任務(wù)。而其中最為人所熟悉的“自主武器系統(tǒng)”就是戰(zhàn)斗機器人。盡管目前的白皮書還只是把“自主武器系統(tǒng)”的范圍限定在有人類操作員監(jiān)督下運行的自動武器裝置或平臺,并且該系統(tǒng)不能針對人類目標(biāo)進行打擊,只能用于打擊物資或設(shè)備目標(biāo),采用非致命或摧毀其運動能力的攻擊形式,或者是各種形式的電子攻擊。但大家都心知肚明,這樣的系統(tǒng)如果要改造成為真正的自動殺人武器,只是捅破一層窗戶紙罷了。
2019年,是AI技術(shù)逐漸深入社會生活的一年,也是AI系統(tǒng)開始給人類帶來麻煩的一年。如何馴服AI這個能量巨大的“怪獸”,是在大半個世紀(jì)前人類釋放原子能之后面臨的又一難題。原子能帶來的核威懾和“冷戰(zhàn)”時代,會不會也是AI全面應(yīng)用后的必然走向,我不知道。但和平利用AI技術(shù),將與和平利用原子能一樣,會成為未來幾十年乃至上百年人類需要持續(xù)面臨的挑戰(zhàn)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10