
如何評價《人民日報》于 10 月 5 日發(fā)表的《不能讓算法決定內(nèi)容》?
《人民日報》(4 版)10 月 5 日發(fā)表題為《不能讓算法決定內(nèi)容》的文章。文章稱,隨著大數(shù)據(jù)、人工智能的廣泛應(yīng)用,一些商業(yè)網(wǎng)站、移動新聞客戶端,都在運用算法這個「讀心術(shù)」。文章指出,技術(shù)往往是一把冷冰冰的雙刃劍,在價值和利益的天平上,所謂的算法成為了利益的砝碼。一切圍著流量轉(zhuǎn),唯點擊量、轉(zhuǎn)發(fā)量馬首是瞻,「標(biāo)題黨」泛濫,價值取向跑偏,內(nèi)容淪為附庸。
文章認為,算法不是王法,算法決定內(nèi)容更不是王道。只有算法回歸到服務(wù)內(nèi)容的角色,變得有態(tài)度、有深度、有溫度,才能讓人們在信息的海洋里盡情遨游、在清朗的環(huán)境中自由飛翔,才能使網(wǎng)絡(luò)空間碧波蕩漾,激發(fā)出源源不斷的正能量。
不吹不黑。只從技術(shù)角度來看,《人民日報》這篇文章也提到了一個很有意義的問題,那就是信息化時代我們很容易在不知不覺中被推薦內(nèi)容“洗腦”。在現(xiàn)有技術(shù)手段下,適當(dāng)引入人工篩選可以遏制一些有害行為,如軟文推廣、詐騙信息、虛假新聞等。
簡單的科普一下媒體流常用的推薦算法:
在新用戶注冊時,你會被要求填寫一些感興趣的話題,作為初始“種子”進行文章推送。比如你表明你對籃球感興趣,那么你的首頁有很大比例都是籃球相關(guān)。
隨著你的瀏覽量上升,比如關(guān)注了不同媒體或者大量瀏覽某個話題的文章以后,平臺就會提高這類內(nèi)容的占比。比較傳統(tǒng)的協(xié)同算法,就是找到和你興趣相似的人并把他們的瀏覽內(nèi)容推薦給你,或者和當(dāng)前文章相類似主題的文章。
當(dāng)你看的文章越來越多,風(fēng)格越來越鮮明以后,你的賬戶會被打上一些“標(biāo)簽”,對你的瀏覽愛好進行分類。有時候有社交屬性的網(wǎng)站還會把使用者進行網(wǎng)絡(luò)化/圖譜化分析,加強推薦的準(zhǔn)確性。
1. 推薦算法有什么問題?
你只能看到特定的話題,很難跳出這個信息圈。而這種效應(yīng)會不斷加強,時間久了容易一葉障目不見泰山。普通用戶感興趣的話題還是以生活、娛樂為主,導(dǎo)致其他有意義內(nèi)容的生存空間比較小。不難發(fā)現(xiàn),信息分發(fā)平臺的每日推送頭條常常是以明星八卦為主。慢慢的,你發(fā)現(xiàn)你對每個明星的行程了如指掌,但并不知道原來自動駕駛汽車已經(jīng)上路實驗好幾年了。
很多網(wǎng)站試圖加入一些“創(chuàng)新元素”,比如也會推薦“你可能對XXX感興趣”。但往往這類幫助用戶跳出“舒適圈”的信息流都很難引起大家的興趣,還往往被用戶批判一番。于是,最終能存活在大量用戶時間線上的信息就主要是吸引眼球的爆款文了。這不僅促進了“標(biāo)題黨”和“博眼球”,也使得用戶的精力花在了沒有營養(yǎng)的內(nèi)容上。
2. 如何利用推薦算法“作惡”?
對于推薦系統(tǒng)的依賴也給了別有用心的人發(fā)揮空間。大部分平臺的推薦內(nèi)容中都有一些難以分辨的廣告推廣、高級軟文、甚至詐騙等。比如,一篇介紹中老年疾病的科普文章最后變成了銷售保健品,可謂防不勝防。這可能是因為平臺技術(shù)能力不足,也有可能是裝作看不見甚至推波助瀾,畢竟最后可以把鍋推給算法。推薦系統(tǒng)不僅可以計算出推薦什么內(nèi)容,也可以推測你適合的廣告有哪些。即使不用算法推薦,人工推薦其實早就出現(xiàn)在了分發(fā)平臺上,只不過更多的用在了商業(yè)推廣上。
因此,標(biāo)榜推薦算法的平臺也有“作惡”的權(quán)力,比如慢性洗腦。請相信潛移默化的力量,慢慢的你會以為這些軟文這是自己想看的內(nèi)容,可能還在現(xiàn)實生活中購買了相關(guān)的產(chǎn)品。
3. 如何平衡推薦算法和人工篩選?
在法律法規(guī)和技術(shù)能力的雙重限制下,不妨這么想:
站在官方角度考慮,建議將現(xiàn)在百分之二十的推薦文章替換為“我們需要閱讀的文章”,比如“兩學(xué)一做”等主旋律文章。很多平臺,比如澎湃早就走了這個路線。這部分文章由編輯/運營手動選擇,推薦給所有用戶并關(guān)閉評論。在將來,或許當(dāng)?shù)卣x擇“適合當(dāng)?shù)厝嗣竦膬?nèi)容”...這是時代的選擇,我們都無可選擇。
站在個人用戶的角度,建議將系統(tǒng)推薦中百分之二十替換成“開闊眼界”的文章,比如前沿科技、藝術(shù)賞析、文化歷史等。在比例不高不引起用戶反感的前提下,嘗試給用戶提供一些不同的內(nèi)容。
人工篩選也應(yīng)該被用在識別“有害的內(nèi)容上”,處理那些算法無法識別的惡意信息。很多高級的推廣寫的極具迷惑性,現(xiàn)在的語義分析能力并不能很好的區(qū)分出來。虛假新聞也很難依靠算法識別,這也是編輯/運營可以手動檢索的內(nèi)容之一。
科技企業(yè)也需要提高自己的業(yè)務(wù)道德。不是每一種錢都可以賺,人血饅頭不能吃。如果明知是惡意信息但因為有利益原因還是將其推薦給用戶,我寧可我們沒有先進的技術(shù)。那些因為科技公司作惡而傾家蕩產(chǎn)甚至失去生命的人的名字并沒有遠去,只是很容易被遺忘。內(nèi)容推薦、新聞推送只不過是不同平臺上的另一個應(yīng)用,而類似的悲劇已經(jīng)夠多了。
4. 如果我不喜歡推送或者不愿意被“洗腦”怎么辦?
技術(shù)宅建議還是選擇自己訂閱感興趣的主題如RSS,或者寫爬蟲從特定站點收集自己感興趣的話題。依賴于主流媒體的內(nèi)容推送,不管是人工還是系統(tǒng)推薦,或多或少對會被洗腦。“定制化”和“效率”很難兼得。你如果要節(jié)省時間從平臺處吸收資訊,就得接受他們“強奸”你的思想。
5. 這篇文章對于我們有什么啟發(fā)?
換個角度看,這篇文章無心插柳地給普通大眾提了個醒,要對于科技發(fā)展和技術(shù)公司保持警惕。大部分用戶已經(jīng)把安全和隱私完全交給了科技公司,現(xiàn)在連自己能看到什么也交了出去,這是無奈但正在發(fā)生的事情。過去短短幾年,我們已經(jīng)見識了多少科技公司做過的“惡”。
“民主”和“自由”本身就是對立的。問題的核心還在于提高分發(fā)平臺的商業(yè)道德和技術(shù)能力,以及用戶的閱讀分辨能力。在短時間內(nèi),這兩件事都不會發(fā)生,所以增加人工推薦的比例也不完全是個壞點子。我不反對利用人工篩選來增加些“主旋律內(nèi)容”,但也希望增加一些“拓展眼界”的文章,并利用人工來減少一些迷惑性強的有害內(nèi)容。
退一步說,大時代下沒有人能獨善其身,這也只是個開始而已 ?* ?* ?
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03