
大數據利益相關者的利益矛盾及其倫理治理
2013年是大數據元年[1],大數據時代的到來,已給我們的生產、生活、學習與工作帶來了前所未有的變革,同時也帶來了許多的挑戰(zhàn)。在一切皆可數據化的新歷史條件下,數據成為了最寶貴的資源,通過循環(huán)往復的數據挖掘和二次利用,隱藏在數據中的巨大價值正在不斷地被挖掘與利用。2014年荷蘭學者Andrej Zwitter撰文Big Data ethics(《大數據倫理》)指出:“這里有三類大數據利益相關者(Big Data stakerholders):大數據搜集者(Big Data collectors),大數據使用者(Big Data utilizers)和大數據生產者(Big Data generators)?!盵2]在這數據搜集、存儲、挖掘、預測與利用的過程中,大數據利益相關者難免會出現這樣或者那樣的利益矛盾,有必要從倫理視角進行相應地治理,特別是在法律規(guī)范相對滯后的前提條件下,實現數據共享的健康運行,最終促進大數據時代的順利發(fā)展。
一、大數據利益相關者的利益矛盾分析
作為利益矛盾共同體的大數據利益相關者,在一切皆可數據化的條件下,應該共同利用大數據技術,挖掘和享有數據的巨大價值。雖然總體而言他們的目標是一致的,都是為了占有與享有大數據蘊藏的巨大價值,但是在總體的共同目標之下,他們又是帶著各自獨特目標的,特別是在大數據技術還沒有全面普及的情況下,由于利益分配不均而導致的諸種利益矛盾將無法避免。
按照Andrej Zwitter的理解,大數據搜集者是按照特定目標來決定搜集和保存哪些數據以及保存多長時間。[2]顯然大數據搜集者的目的并不是為了搜集而搜集,為了存儲而存儲,之所以要搜集與存儲,就是要利用數據進而占有和享有其中的巨大價值。正因為是帶著特定目標來搜集和存儲相關數據,所以必然會導致有所選擇。而這樣的結果就是,所搜集和存儲的數據相對于某一特定目標而言是整體而全面的,但是相對于其他目標則不盡如此了。因此,特定目標直接影響了數據的整體性與全面性。換句話說,大數據搜集者只能搜集和存儲與某一特定目標緊密相關的數據,并想要以此來實現這一特定目標。但是,特定目標最終能否實現還要依賴于大數據使用者。
大數據使用者主要是利用大數據技術對已搜集和存儲的數據進行挖掘、預測和利用。他們可能是帶著特定目標來進行的,也可能是毫無目標的。[2]大數據使用者才是真正的大數據技術掌控者。由于大數據使用者擁有獨特的技術優(yōu)勢,完全有可能導致數據在挖掘、預測和利用中偏離大數據搜集者的初衷,因為數據能夠不斷地被二次利用與挖掘。因此,如果大數據使用者在數據挖掘、預測和利用中產生了超出大數據搜集者本來目標的新價值,那么該如何分配,是共享還是獨享?特別是由于技術優(yōu)勢的存在,大數據搜集者可能根本就不知道原來搜集和存儲的數據產生了怎樣的新價值。當然,如果大數據搜集者和大數據使用者是同一群體的話,就不存在這樣的問題。問題的關鍵在于很難真正實現二者合二為一,因為大數據搜集者是帶著特定的目標來搜集和存儲的,他們僅僅能夠在實現某一目標的過程中既是大數據搜集者,也是大數據使用者,但是數據的二次利用呢?因此,大數據搜集者和大數據使用者很難實現完美合一,總是處于矛盾地合作中。
如果說大數據搜集者和大數據使用者處于利益矛盾之中是因為無法實現利益最大化的話,那么大數據搜集者、大數據使用者和大數據生產者之間的利益矛盾則是如何實現傷害最小化了。相比較而言,大數據生產者一直處于最被動地位。因為大數據生產者每時每刻都自覺與不自覺地生產著數據。在大數據時代,一切皆可數據化,大數據生產者的一言一行都必將以數據的形式存在。這就導致了大數據生產者根本就無法知道哪些數據被搜集和被存儲以及存儲了多長時間,并且根本就不知道自己生產的數據在何種目的的作用下被挖掘、預測與利用,更不可能知道自己生產的數據在被挖掘、預測和利用了之后將對自己產生怎樣的影響。因此,對于大數據生產者而言,只要不對自己產生消極影響就足夠了,根本就無法想象還能從中獲取本屬于自己的價值。如此看來,大數據生產者和大數據搜集者、大數據使用者也必然處于利益矛盾狀態(tài):對于大數據搜集者和大數據使用者而言肯定是要盡可能多地搜集、存儲、挖掘、預測和利用大數據生產者的數據,這就不可避免地會對大數據生產者產生消極影響,例如對隱私(Privacy)、機密(confidentiality)、透明(transparency)、身份(identity)和自由選擇(free choice)等構成了威脅;[3]對于大數據生產者而言,由于處于被動地位,只希望自己的利益能夠得到有效保護,將傷害降到最低限度;如果傷害一旦產生,則希望能夠得到相應的補償,包括物質的和精神的。
綜上分析,由于分工的不同和地位的差異,大數據利益相關者必然處于利益的尖銳矛盾之中。其根本原因就是數據價值很難實現按比例恰當分配:大數據搜集者與大數據使用者難以實現利益均沾,大數據搜集者、大數據使用者與大數據生產者則是利益與傷害不均等。
二、大數據利益相關者的利益矛盾表現
從大數據搜集者與大數據使用者之間的角度來分析,如果是在某一特定目標作用下進行數據的搜集、存儲、挖掘、預測和利用的話,那么到底應該按照何種比例來分配數據的巨大價值呢?或者說,到底是數據搜集與存儲重要呢,還是數據的挖掘、預測和利用重要呢?這就需要做到具體問題具體分析,在數據的搜集、存儲、挖掘、預測和利用之前必須確定相應的比例以避免矛盾的出現。但是到底應該如何確定比例呢,特別是在此過程中如果又產生新價值呢?因此,即使是在同一目標作用下,確定了利益分配的比例,也難免會出現這樣或者那樣的糾紛。
如果不是在某一特定目標作用下進行的話,情況就更加復雜了,利益矛盾就可能更加尖銳。由于數據可以不斷地被二次利用和預測,大數據使用者就能夠從中挖掘出源源不斷的新價值。在某一個特定目標實現之后,數據并不會因此而消失,而是能夠源源不斷地發(fā)現新的價值,即能夠不斷地實現不同的目標。這樣,大數據搜集者與大數據使用者處于分裂狀態(tài)將是必然。相對于大數據搜集者而言,當某一目標實現了之后,搜集與存儲起來的數據就可能處于閑置狀態(tài),不會考慮其中的新價值。但是相對于大數據使用者而言,這些數據并不會因為某一特定目標的實現而被刪除掉,更何況根本就無法刪除,正如維克托·邁爾-舍恩伯格(Vikor Mayer-Schǒnberger)所言:“數字技術已經讓社會喪失了遺忘的能力,取而代之的則是完善的記憶?!盵4]因此,必然會產生源源不斷的新價值。這個新價值該如何分配呢?由于不是在某一特定目標下進行的,大數據搜集者可能根本就不知道自己搜集與存儲的數據被用作他途,這就不僅無法在進行數據挖掘、預測與利用之前確定相應的利益分配比例,甚至大數據搜集者根本就不知道產生了什么新價值,要共享其中的利益談何容易。如果長此以往,矛盾必然持續(xù)爆發(fā)。
有利益分配必然就有責任承擔問題。在數據的搜集、存儲、挖掘、預測和利用的過程中肯定會產生各式各樣的責任,最典型的問題就是對大數據生產者的隱私保護。一旦在此過程中對大數據生產者產生了侵犯隱私的消極后果,那么該如何承擔這一責任呢?肯定不能僅僅由大數據搜集者或者大數據使用者承擔。如果是在某一特定目標下進行,也許會相對好一點,就由他們共同承擔(當然也涉及到責任的比例劃分問題);如果不是在某一特定目標下進行的呢?對于大數據搜集者而言也許處于“無知”狀態(tài),是否也需要承擔由大數據使用者造成消極影響而形成的責任呢?
從大數據搜集者與大數據生產者之間的角度來分析,首先是大數據生產者根本就無法共享利益。如前所述,由于大數據生產者在大數據利益相關者共同體中一直處于被動狀態(tài),可能根本就不知道自己的一言一行已形成數據而被大數據搜集者所搜集與存儲。要和大數據搜集者共享其中的價值根本就無從談起。如此看來,好像大數據搜集者與大數據生產者基本上不會出現什么利益矛盾。但是一旦大數據搜集者在搜集與存儲數據時,對大數據生產者造成了諸如隱私泄露等傷害,二者之間的利益矛盾就必然爆發(fā)。
其次,是二者之間的傷害不對等。數據在搜集和存儲的過程中基本上不會對大數據搜集者構成什么傷害,但是如果沒有遵循諸如保密原則等職業(yè)倫理準則,那么就會對大數據生產者造成持久的傷害。這個不對等地位也必然會導致二者之間處于緊張的利益矛盾狀態(tài)。
再次,是涉及由于二者之間利益矛盾而導致的對大數據生產者的利益補償問題。這就涉及如何進行補償以及補償的比例等問題,難免會出現利益糾紛。
最后,是數據再利用的利益矛盾問題。如果是在為了實現某一特定的公共目標且征得了大數據生產者同意的情況下,大數據搜集者進行了相應數據的搜集與存儲,那么當這一特定目標實現了之后就涉及到數據的刪除問題。但是由于數據無法刪除,難免會被用作他途而導致對大數據生產者產生傷害。在這種情況下,二者也難免會出現各式各樣的利益矛盾。因此大數據搜集者和大數據生產者也必將處于尖銳的利益矛盾之中。
從大數據使用者與大數據生產者之間的角度分析,他們之間的利益矛盾表現不僅與大數據搜集者和大數據生產者之間的利益矛盾表現相一致,還有自己的獨特表現。第一是數據的新價值無法共享。由于數據能夠持續(xù)不斷地二次利用,進而獲得源源不斷的巨大新價值。這些新價值不僅大數據搜集者難以實現與大數據使用者共享,而且大數據生產者根本就無法與大數據使用者共享。因為大數據使用者到底是帶有怎樣的目標來持續(xù)二次利用數據也只有他們本人才清楚,對于大數據生產者而言只能“任人宰割”,因為他們基本上處于“無知”狀態(tài)。
第二是產生持續(xù)傷害。在數據的二次利用中難免會對大數據生產者產生諸如隱私侵犯等傷害,并且這個傷害是隨著數據的不斷二次利用而對大數據生產者構成持續(xù)傷害,而將會產生怎樣的傷害以及傷害多大,對于大數據生產者而言是無法預估的。
第三是必將導致大數據生產者要實現必要的補償顯得異常艱難,甚至無法實現。在自己生產的數據完全無法控制且不斷被二次利用的前提條件下,大數據生產者根本就無法估量將對自己產生怎樣的傷害以及產生多大的傷害,要實現必要的補償就顯得極其艱難,也許一個傷害得到了相應的補償而下一個傷害又接踵而至,使大數據生產者處于循環(huán)往復的深淵之中。因此,大數據生產者與大數據使用者也處于緊張的利益矛盾之中。
總之,在大數據時代條件下,大數據利益相關者處于利益矛盾之中是有其必然性的。
三、大數據利益相關者的利益矛盾的倫理治理
為了協(xié)調好大數據利益相關者之間的利益矛盾,有必要進行相應的倫理治理,以實現數據共享的有序進行,進而實現大數據時代的順利發(fā)展。因此,需要對大數據利益相關者制定出相應的倫理原則。
相對于大數據搜集者和大數據使用者而言,應該遵循如下原則:
原則一:授權。只要情況許可,無論是大數據搜集者還是大數據使用者在搜集、存儲、挖掘、預測和利用數據時都必須得到大數據生產者的授權,如果采用秘密或者非法的手段進行,必將造成難以估量的傷害。沒有得到對方授權而進行的數據搜集、存儲、挖掘、預測和利用等行為本身就是不道德的,應該被譴責。這是進行數據搜集、存儲、挖掘、預測和利用的前提原則。
原則二:告知。在搜集、存儲、挖掘、預測和利用數據時必須告知大數據生產者其中的目標與用途,將產生怎樣的巨大價值以及將產生怎樣的消極影響。如果將產生重大的消極影響,那么大數據搜集者和大數據生產者將采取什么樣的預防措施;如果對大數據生產者產生了傷害,又將采取什么樣的補償措施這些都必須告知大數據生產者。這樣才能夠實現在大數據利益相關者之間和諧有序地進行數據共享。
原則三:保密。在具體的數據搜集、存儲、挖掘、預測和利用的過程中必須實現保密,特別是涉及到大數據生產者隱私的情況下必須采取匿名化技術處理措施,保證大數據生產者不會因為自身數據在共享過程中被非法盜取而產生不必要的傷害。這是保證大數據生產者權益不受到傷害的重要倫理原則。
原則四:自律。自律是大數據搜集者和大數據使用者必須努力養(yǎng)成的基本道德原則。大數據搜集者和大數據使用者必須在數據搜集、存儲、挖掘、預測和利用的過程中養(yǎng)成良好的道德自律,保證符合最起碼的道德規(guī)范和準則。當然,這是一個長期的過程,不是一天兩天就能夠實現,但是無論如何都應該養(yǎng)成良好的道德自律。
原則五:責任。這要求大數據搜集者和大數據使用者必須承擔責任。按照著名技術哲學家漢斯·林克(Hans Lenk)的觀點:在任何情況下,任何技術力量的強大都會導致某種系統(tǒng)的反彈,導致生態(tài)失衡,這其中的根本原因就是我們在利用技術時沒有承擔相應的責任。[5]這就要求大數據搜集者和大數據使用者必須在努力實現數據價值的同時,勇于承擔起相應的責任,特別是在產生消極后果的時候,否則大數據利益相關者之間的利益矛盾將永遠無法得到圓滿解決。
原則六:利益。利益原則就是要實現利益最大化。利益最大化不能僅僅從自身進行考量,更重要的是要從大數據利益相關者視角來實現。即既要實現大數據搜集者利益最大化,也是實現大數據使用者的利益最大化,更為重要的是要實現大數據生產者的利益最大化。這樣才能真正有助于大數據利益相關者的利益矛盾解決。
原則七:傷害。有利益最大化就必然有傷害最小化,這對于大數據生產者而言具有特別重要的意義,也是解決大數據利益相關者利益矛盾的關鍵所在。絕不允許把實現利益最大化建立在導致傷害最大化的基礎上,或者是建立在部分人傷害最大化的基礎上。結合前面的論述,原則七的關鍵是要實現大數據生產者的傷害最小化。
原則八:補償。大數據技術和以往的技術一樣必然具有雙刃性,在給我們帶來巨大價值的同時,也不可避免地帶來了消極影響。要真正利用好大數據技術,對其產生的消極影響絕對不能視而不見,更不能推波助瀾,應該采取積極的補償措施,避免傷害的擴大化。這是大數據技術產生消極影響的重要補救措施。
相對于大數據生產者而言,則應該遵循如下原則:
原則一:轉變觀念。“大數據的核心就是預測?!盵6]在大數據時代,基本上每一個人都是透明的,因為“大數據能讀懂過去、預測未來”。[7]這就要求大數據生產者必須轉變觀念,積極保護自己生產的數據,而不能像原子時代一樣,對自己的生產出來的數據無動于衷。如果繼續(xù)這樣下去,大數據生產者就會出現人性危機,對隱私、機密、透明、身份和自由選擇等等產生威脅。因此,大數據生產者必須時時刻刻關注自己的一言一行,關注自己生產的數據,估量這些數據將產生怎樣的消極影響。而不是想當然地認為這些數據不會對自己的未來產生任何影響。
原則二:自我保護。由于大數據生產者處于被動地位,這就要求他們增強自我保護意識,積極拿起相應的法律道德武器來保護自己的合法權益,使其免受侵犯;當自己的合法權益受到侵犯時,要敢于拿起相應的法律道德武器與之斗爭,并積極爭取相應的精神與物質補償??傊?,大數據時代里大數據生產者的自我保護意識與行為不能停留在原子時代,而應該積極適合大數據時代的發(fā)展需要而變得更為主動與積極。
原則三:注重數據。數據被譽為是大數據時代的取之不盡用之不竭的“石油”,數據中蘊藏著無法估量的巨大價值,我們所能看到的價值僅僅是數據價值的冰山一角。而這些數據主要都是由大數據生產者生產。這就要求大數據生產者更加注重自己所產生的數據,特別是不能讓這些數據用于非法用途而給整個社會帶來消極影響。需要特別指出的是,大數據生產者應該積極關注數據權。
原則四:利益與傷害。大數據技術是一把雙刃劍,既有積極的作用,也有消極的影響。因此,對于大數據生產者而言,必須努力實現數據價值的最大化和傷害的最小化。雖然大數據生產者很難與大數據搜集者、大數據使用者實現利益均沾,但是大數據生產者應該積極地參與到數據利益的分配中,特別是在數據能夠成為商品的條件下。同時,在此過程中必須實現傷害最小化。
原則五:尋求補償。在受到傷害時,大數據生產者應該積極尋求精神與物質的補償。這是實現傷害最小化的一個補救措施,也是在傷害已經產生的條件下應該采取的一個重要措施。這種補償不僅是物質補償,更為重要的是精神補償。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07剖析 CDA 數據分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數據分析師考試作為衡量數據專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數據處理的關鍵技能? 在數據處理與分析工作中,數據格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數據分析師視角:從數據迷霧中探尋商業(yè)真相? 在數字化浪潮席卷全球的今天,數據已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數據分析師:開啟數據職業(yè)發(fā)展新征程? ? 在數據成為核心生產要素的今天,數據分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03