99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀看機器學習如何推動我們去定義公平
看機器學習如何推動我們去定義公平
2020-03-16
收藏
作者 | David Weinberger
編譯 | CDA數(shù)據(jù)分析師

偏見是機器學習的原始罪過。它嵌入在機器學習的本質中:系統(tǒng)從數(shù)據(jù)中學習,因此 很容易發(fā)現(xiàn)數(shù)據(jù)所代表的人為偏見。例如,接受過美國現(xiàn)有職業(yè)培訓的ML招聘系統(tǒng)很可能會“學到”,女性與首席執(zhí)行官之間的聯(lián)系不佳。

徹底清除數(shù)據(jù)以使系統(tǒng)不會發(fā)現(xiàn)任何隱藏的有害關聯(lián)可能非常困難。即使經(jīng)過最大程度的照顧,機器學習系統(tǒng)也可能發(fā)現(xiàn)偏向模式是如此微妙和復雜,以至于無法被人類原本最好的關注所掩蓋。因此,計算機科學家,政策制定者以及任何與社會正義有關的人們目前都在關注如何避免AI產(chǎn)生偏見。

然而,機器學習的本質也可能使我們以新的,富有成效的方式思考公平。我們與機器學習(ML)的相遇開始為我們提供概念,詞匯和工具,使我們能夠比以前更直接,更準確地解決偏見和公平問題。

我們長期以來將公平視為道德原始。如果您問某人一個不公平的例子,那么他們談論兩個收到不同數(shù)量Cookie的孩子的可能性就非常高。這顯然是不公平的,除非他們之間存在一些相關的差異來證明這種差異是合理的:其中一個孩子年齡更大,或者更大,或者同意做額外的家務來換取餅干等。在這種簡單的表述中,公平被定義為除非有一些相關的區(qū)別證明不平等待遇是合理的,否則人的平等待遇。

但是什么構成“相關區(qū)別”?事實是,我們比不公平更容易達成共識。我們可能都同意種族歧視是錯誤的,但是六十年后,我們仍在爭論《平權行動》是否是一種公平的補救辦法。

例如,我們都同意,在20世紀70年代,它是不公平的女性音樂家組成少的五大交響樂團的5%樂團。在這種情況下,我們可能會同意,實際的樂團樂隊研究所似乎更為公平:通過將申請人的試鏡放在幕后以掩蓋性別的陰影下,五個頂級交響樂團中的女性比例在1997年上升到25%,現(xiàn)在上升到30%。

但是,是否存在性別盲目的過程足以使結果真正公平?也許文化偏見會給男性音樂家?guī)矸巧飳W上的優(yōu)勢-例如,如果更多的男人被頂級音樂學院錄取,他們可能會接受更好的音樂教育。幾個世紀以來,音樂表現(xiàn)的水準一直圍繞著典型的男性特征或喜好形成,例如手掌大小或表現(xiàn)的侵略性。是否有30%足以讓我們宣布樂團現(xiàn)在在對待女性方面是公平的?也許,音樂家的性別比例應該達到51%,才能反映出整個國家的總體性別統(tǒng)計數(shù)據(jù)?還是應該反映出樂隊中男女申請人的百分比?還是比部分糾正導致人們在樂團中人數(shù)過多的歷史偏見更高的水平?(更不用說,整個討論都假設性別是二元的,不是的。)

機器學習可以幫助我們進行此類討論,因為它要求我們以高度精確的方式指導我們,從道德上講我們會接受哪種結果。它為我們提供了以更清晰,更富有成效的方式進行這些討論的工具(通常是爭論)。

這些工具包括源自機器學習最常見任務的詞匯:決定將給定輸入放入哪個bin。如果輸入是意大利面條醬工廠的傳送帶上的番茄的實時圖像,則該垃圾箱可能會標記為“可接受”或“丟棄”。每個輸入都將分配給具有附加置信度的垃圾箱:72例如,確定此番茄可食用。

如果對西紅柿進行分類是系統(tǒng)的基本任務,那么您將要關心有多少西紅柿被錯誤分類了:ML將哪些西紅柿放入“丟棄”堆中,將多少壞西紅柿放入“可接受的垃圾箱”中-錯誤的批準和錯過的機會。而且,由于對垃圾箱的分配始終基于置信度,因此ML為其設計人員提供了滑塊,以調整結果以反映公平的不同定義。

例如,如果是您的番茄工廠,那么您可能最在乎新ML番茄分選應用程序的整體準確性。但是,監(jiān)管者可能會更擔心壞番茄進入批準箱中,而不是將好番茄扔進丟棄箱中。或者,如果您是一個骯臟的番茄工廠老板,那么扔掉好番茄比在醬汁中加入一些爛番茄可能會更不高興。

ML要求我們完全清楚自己想要什么。如果您擔心壞番茄將其放入醬汁中,則必須決定您(以及您的客戶以及律師)可以與多少壞番茄一起生活。您可以通過調整將西紅柿放入批準箱中所需的置信度來控制此百分比:您是要將閾值置信度設置為98%還是將其降低到60%?將滑塊向左或向右移動時,您將把更多好的西紅柿放到“丟棄”箱中,或者將更多的壞西紅柿放入“批準的”箱中。

用ML的話來說,放在“丟棄”箱中的被忽略的好西紅柿是假陰性,而放入“批準”箱中的壞西紅柿是假陽性。

當我們談論將貸款申請分類到“批準”或“拒絕”箱中的過程時,這些術語會很有用。(出于此假設的目的,我們將忽略任何有關貸款批準程序的法規(guī)。)假設有30%的申請人是女性,但在“批準的垃圾箱”中只有10%的申請是女性。但是,除了查看女性獲得批準的百分比或拖欠貸款的男性和女性比例之外,也許我們應該查看“拒絕女性”分類中誤報的百分比是否高于女性的百分比。拒絕人員區(qū)中的誤報。

ML領域的研究人員還為我們在這里以及其他地方討論的公平類型提供了精確的定義,并使用了“人口統(tǒng)計平價”,“預測匯率平價”和“反事實公平”等名稱。與專家討論這些問題可以使這些討論更容易進行,并且對論點的各個方面都有更全面的理解。他們沒有告訴我們在任何情況下都采用哪種類型的公平性,但是它們使我們更容易就該問題提出富有成效的論據(jù)。

在更高的抽象水平上也是如此,因為我們可以決定什么才是ML系統(tǒng)的成功。例如,我們可以訓練ML貸款應用程序分類程序來優(yōu)化自身,從而為我們的業(yè)務帶來最高的利潤?;颢@得最高收入。或為最大數(shù)量的客戶。我們甚至可以出于經(jīng)濟公正的考慮而決定,我們要向較貧窮的人提供一些貸款,而不是總是向周圍的最富有的人提供貸款。我們的機器學習系統(tǒng)應使我們能夠判斷風險,調整我們希望在“批準的”收款箱中的低收入人群的百分比,或為我們提供的貸款設置最低盈利水平。

ML還清楚地表明,我們無法始終(甚至通常)針對我們可能擁有的每個價值來優(yōu)化結果。例如,在這種假設下,貸款公司可能會發(fā)現(xiàn),將更多的低收入申請人納入“批準的垃圾箱”會影響該垃圾箱中女性的比例??梢韵胂竽荒芡瑫r為兩者優(yōu)化系統(tǒng)。在這種情況下,您可能希望找到另一個愿意修改的值,以便為低收入人群和婦女創(chuàng)造更公平的結果。也許,如果您將公司的風險增加到可接受的程度,則可以實現(xiàn)兩個目標。機器學習系統(tǒng)為我們提供了進行此類調整并預測其結果的杠桿。

當我們看到更高層次的抽象時-從使用滑塊調整容器中的混合,到關于優(yōu)化可能不一致的值的問題-ML告訴我們公平不是簡單而是復雜的,它不是絕對的而是問題權衡。

ML無奈的字面性要求我們做出的決定自然可以導致討論聽起來像對道德的高尚論點或對技術的專業(yè)術語爭執(zhí)不休,而更像是具有不同價值觀的人之間的政治論點:優(yōu)質番茄醬或廉價醬能最大化我們的利潤?增加樂隊中女音樂家的比例還是維持當前樂器的配置?向低收入人群發(fā)放貸款,但也許會降低女性比例?

如果機器學習以新的精度提出了這些問題,為我們提供了討論這些問題的詞匯,并讓我們嘗試進行調整以查看針對所關注的值優(yōu)化系統(tǒng)的最佳方法,那么這是向前邁出了一步。并且,如果機器學習使我們根據(jù)我們關心的價值觀來討論針對不公平情況的補救措施,并準備做出現(xiàn)實的妥協(xié),那么對于許多道德論證來說,那也不是一個壞模型。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師考試動態(tài)
數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調,回調的第一個參數(shù)驗證碼對象,之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }