
作者 | David Weinberger編譯 | CDA數(shù)據(jù)分析師
偏見是機器學習的原始罪過。它嵌入在機器學習的本質中:系統(tǒng)從數(shù)據(jù)中學習,因此 很容易發(fā)現(xiàn)數(shù)據(jù)所代表的人為偏見。例如,接受過美國現(xiàn)有職業(yè)培訓的ML招聘系統(tǒng)很可能會“學到”,女性與首席執(zhí)行官之間的聯(lián)系不佳。
徹底清除數(shù)據(jù)以使系統(tǒng)不會發(fā)現(xiàn)任何隱藏的有害關聯(lián)可能非常困難。即使經(jīng)過最大程度的照顧,機器學習系統(tǒng)也可能發(fā)現(xiàn)偏向模式是如此微妙和復雜,以至于無法被人類原本最好的關注所掩蓋。因此,計算機科學家,政策制定者以及任何與社會正義有關的人們目前都在關注如何避免AI產(chǎn)生偏見。
然而,機器學習的本質也可能使我們以新的,富有成效的方式思考公平。我們與機器學習(ML)的相遇開始為我們提供概念,詞匯和工具,使我們能夠比以前更直接,更準確地解決偏見和公平問題。
我們長期以來將公平視為道德原始。如果您問某人一個不公平的例子,那么他們談論兩個收到不同數(shù)量Cookie的孩子的可能性就非常高。這顯然是不公平的,除非他們之間存在一些相關的差異來證明這種差異是合理的:其中一個孩子年齡更大,或者更大,或者同意做額外的家務來換取餅干等。在這種簡單的表述中,公平被定義為除非有一些相關的區(qū)別證明不平等待遇是合理的,否則人的平等待遇。
但是什么構成“相關區(qū)別”?事實是,我們比不公平更容易達成共識。我們可能都同意種族歧視是錯誤的,但是六十年后,我們仍在爭論《平權行動》是否是一種公平的補救辦法。
例如,我們都同意,在20世紀70年代,它是不公平的女性音樂家組成少的五大交響樂團的5%樂團。在這種情況下,我們可能會同意,實際的樂團樂隊研究所似乎更為公平:通過將申請人的試鏡放在幕后以掩蓋性別的陰影下,五個頂級交響樂團中的女性比例在1997年上升到25%,現(xiàn)在上升到30%。
但是,是否存在性別盲目的過程足以使結果真正公平?也許文化偏見會給男性音樂家?guī)矸巧飳W上的優(yōu)勢-例如,如果更多的男人被頂級音樂學院錄取,他們可能會接受更好的音樂教育。幾個世紀以來,音樂表現(xiàn)的水準一直圍繞著典型的男性特征或喜好形成,例如手掌大小或表現(xiàn)的侵略性。是否有30%足以讓我們宣布樂團現(xiàn)在在對待女性方面是公平的?也許,音樂家的性別比例應該達到51%,才能反映出整個國家的總體性別統(tǒng)計數(shù)據(jù)?還是應該反映出樂隊中男女申請人的百分比?還是比部分糾正導致人們在樂團中人數(shù)過多的歷史偏見更高的水平?(更不用說,整個討論都假設性別是二元的,不是的。)
機器學習可以幫助我們進行此類討論,因為它要求我們以高度精確的方式指導我們,從道德上講我們會接受哪種結果。它為我們提供了以更清晰,更富有成效的方式進行這些討論的工具(通常是爭論)。
這些工具包括源自機器學習最常見任務的詞匯:決定將給定輸入放入哪個bin。如果輸入是意大利面條醬工廠的傳送帶上的番茄的實時圖像,則該垃圾箱可能會標記為“可接受”或“丟棄”。每個輸入都將分配給具有附加置信度的垃圾箱:72例如,確定此番茄可食用。
如果對西紅柿進行分類是系統(tǒng)的基本任務,那么您將要關心有多少西紅柿被錯誤分類了:ML將哪些西紅柿放入“丟棄”堆中,將多少壞西紅柿放入“可接受的垃圾箱”中-錯誤的批準和錯過的機會。而且,由于對垃圾箱的分配始終基于置信度,因此ML為其設計人員提供了滑塊,以調整結果以反映公平的不同定義。
例如,如果是您的番茄工廠,那么您可能最在乎新ML番茄分選應用程序的整體準確性。但是,監(jiān)管者可能會更擔心壞番茄進入批準箱中,而不是將好番茄扔進丟棄箱中。或者,如果您是一個骯臟的番茄工廠老板,那么扔掉好番茄比在醬汁中加入一些爛番茄可能會更不高興。
ML要求我們完全清楚自己想要什么。如果您擔心壞番茄將其放入醬汁中,則必須決定您(以及您的客戶以及律師)可以與多少壞番茄一起生活。您可以通過調整將西紅柿放入批準箱中所需的置信度來控制此百分比:您是要將閾值置信度設置為98%還是將其降低到60%?將滑塊向左或向右移動時,您將把更多好的西紅柿放到“丟棄”箱中,或者將更多的壞西紅柿放入“批準的”箱中。
用ML的話來說,放在“丟棄”箱中的被忽略的好西紅柿是假陰性,而放入“批準”箱中的壞西紅柿是假陽性。
當我們談論將貸款申請分類到“批準”或“拒絕”箱中的過程時,這些術語會很有用。(出于此假設的目的,我們將忽略任何有關貸款批準程序的法規(guī)。)假設有30%的申請人是女性,但在“批準的垃圾箱”中只有10%的申請是女性。但是,除了查看女性獲得批準的百分比或拖欠貸款的男性和女性比例之外,也許我們應該查看“拒絕女性”分類中誤報的百分比是否高于女性的百分比。拒絕人員區(qū)中的誤報。
ML領域的研究人員還為我們在這里以及其他地方討論的公平類型提供了精確的定義,并使用了“人口統(tǒng)計平價”,“預測匯率平價”和“反事實公平”等名稱。與專家討論這些問題可以使這些討論更容易進行,并且對論點的各個方面都有更全面的理解。他們沒有告訴我們在任何情況下都采用哪種類型的公平性,但是它們使我們更容易就該問題提出富有成效的論據(jù)。
在更高的抽象水平上也是如此,因為我們可以決定什么才是ML系統(tǒng)的成功。例如,我們可以訓練ML貸款應用程序分類程序來優(yōu)化自身,從而為我們的業(yè)務帶來最高的利潤?;颢@得最高收入。或為最大數(shù)量的客戶。我們甚至可以出于經(jīng)濟公正的考慮而決定,我們要向較貧窮的人提供一些貸款,而不是總是向周圍的最富有的人提供貸款。我們的機器學習系統(tǒng)應使我們能夠判斷風險,調整我們希望在“批準的”收款箱中的低收入人群的百分比,或為我們提供的貸款設置最低盈利水平。
ML還清楚地表明,我們無法始終(甚至通常)針對我們可能擁有的每個價值來優(yōu)化結果。例如,在這種假設下,貸款公司可能會發(fā)現(xiàn),將更多的低收入申請人納入“批準的垃圾箱”會影響該垃圾箱中女性的比例??梢韵胂竽荒芡瑫r為兩者優(yōu)化系統(tǒng)。在這種情況下,您可能希望找到另一個愿意修改的值,以便為低收入人群和婦女創(chuàng)造更公平的結果。也許,如果您將公司的風險增加到可接受的程度,則可以實現(xiàn)兩個目標。機器學習系統(tǒng)為我們提供了進行此類調整并預測其結果的杠桿。
當我們看到更高層次的抽象時-從使用滑塊調整容器中的混合,到關于優(yōu)化可能不一致的值的問題-ML告訴我們公平不是簡單而是復雜的,它不是絕對的而是問題權衡。
ML無奈的字面性要求我們做出的決定自然可以導致討論聽起來像對道德的高尚論點或對技術的專業(yè)術語爭執(zhí)不休,而更像是具有不同價值觀的人之間的政治論點:優(yōu)質番茄醬或廉價醬能最大化我們的利潤?增加樂隊中女音樂家的比例還是維持當前樂器的配置?向低收入人群發(fā)放貸款,但也許會降低女性比例?
如果機器學習以新的精度提出了這些問題,為我們提供了討論這些問題的詞匯,并讓我們嘗試進行調整以查看針對所關注的值優(yōu)化系統(tǒng)的最佳方法,那么這是向前邁出了一步。并且,如果機器學習使我們根據(jù)我們關心的價值觀來討論針對不公平情況的補救措施,并準備做出現(xiàn)實的妥協(xié),那么對于許多道德論證來說,那也不是一個壞模型。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03