跳到主要內容

閱讀 |《大數據的傲慢與偏見》閱讀心得

大數據的傲慢與偏見:一個「圈內數學家」對演算法霸權的警告與揭發
Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy



在大數據標語與口號滿天飛、以及演算法充斥著網頁瀏覽器及社群平台的時代,即便是不曉得演算法為何物的輕度網路使用者(例如許多人的父母長輩),也或多或少能從其瀏覽的網頁資訊、社群軟體當中發現一些端倪。但本書所提到的演算法,並不局限於網路,而是遍佈於你我的生活當中,諸如求職、工作表現評比、廣告、保險、乃至於政府行政與法律問題。作者大量引用了相關報導以及研究,說明錯誤地運用這些複雜的數學演算法,將如何使人類社會失衡並帶來災難。

看完之後令我特別感到有趣的,是本書的作者。作者 Cathy O’Neil 女士,是美國哈佛大學數學博士,除了在大學任教之外,她還有在金融業、行銷、傳媒、等事業單位擔任資料科學家的經歷。在以男性為主要成員的數學與資訊科學相關領域當中,是少見的女性成員。有趣的點,正因為她是一位女性、而且還是一位家庭主婦。

我們常見的大數據、AI、或者其他基於統計學、程式演算法的相關技術,通常應用於工業、商業等領域。坊間也不難找到相關書籍以及收費課程。但上述的應用大多僅強調這些技術的強大以及益處,延伸來解讀,我們可以說其強調如何使應用者邁向成功;但幾乎不會提到,在某些演算機制的缺陷下,或者誤用(乃至於惡意地)這些數學方法,可能有受害者產生(尤其是對那些原本就處於弱勢的人們)。而在傳統社會的印象當中,會認為男性就是應該要有一番作為、被期許要成功、個性要剛強有主見等等;正好而這些「失敗」、「弱勢」等等概念詞彙,相對立的。

同樣地,傳統上,在男人們專注於打拼事業、專注於邁向成功之虞,誰來照顧那些弱勢者?(這裡指弱勢者,可能是老弱婦孺、或泛指社會上生活困頓無可依靠者)以及,誰更容易關切這些弱勢者?是女性。想想戰爭期間,男人上戰場作戰,女人則留守家園照顧老幼、以及進行各種後勤工作。延伸到現代,無論是東方或西方,這種「男人在外工作打拼;女人留在家照顧老幼」的模式,仍不在少數。(啊,這裡沒有表達性別歧視或偏見的意味,我只是在描述從早期一直延伸到現代的一種社會文化認知情況)

我在想,是否正因為作者是女性,且又是一名家庭主婦,她所看到、所想到的,會更容易從「為弱勢著想」的方向來進行。像是,作為一位母親,她不會希望自己的家人、兒女,乃至於其他相對弱勢的家庭,可能因為這種不透明又不公平的演算機制而受害。

她在書本中也提及,她是因為在對沖基金公司任職之後,體認到她所建構的演算法工具,可能讓許多將儲蓄、退休金、養老金投入於基金市場當中的弱勢投資者,在一次的金融衝擊之後,就身無分文頓失依靠。對於那些原本就坐擁大量資產、或者聘僱她來此上班的大老闆而言,這點波動可能只是他們投機事業當中習以為常的一環。但對於那些社經地位弱勢族群,可完全不是那麼一回事。

正因為體認到這一點,所以 Cathy O’Neil 女士才離開該對沖基金公司,轉頭將她的專業投入其他地方,甚至成立部落格與上廣播節目,試圖對世人傳達「數學毀滅性武器」的危害,並如何避免、改善其危害人類社會。

當然上述所言,只是建立在傳統社會文化的刻板印象之下的一種關聯猜想。今日就算撇開作者的性別不談,本書的內容仍具備十足地警世與省思性。當然我們也知道,即便我們能夠知道「數學毀滅性武器」的危害性,要避免其危害,首先要做的是讓當權者(可能是企業的老闆、政府首長)能夠接納並真正實踐這些理念價值。其他國家不說,看台灣就好,瞧瞧諸如性別正義、轉型正義、勞權議題、環保議題、年金改革、司法改革等議題,為什麼在台灣如此難推動?一樣的道理。

講著講著,就厭世起來了。回到這本書,即便改革之路滿佈荊棘,我們不應該就此氣餒。我認為這是一本資料科學相關從業人員都該讀過的書,同時也是適合在國高中的課程當中,在數學、公民、等科目當中,作為延伸教材。說到底,這本書在傳達的是一種對公平正義倫理價值,而這種東西,自然是從基本教育做起。



-----------------------(下收內容節錄)-----------------------



【推薦序】(一)偏見的結構與人工智慧專政
P.11
如果「程式即法律」(Code is Law),那麼「法律也是一種計算」(Law is Computation);諸如倫理、道德、義理人情等難以量化的概念,其實是環境的一部份。針對「智能行為體」的規範,不論該行為體是程式、個人或企業,都必須充分考慮行為體之間的博弈、競爭、演化,以及所有基於人性的行為體必然會出現的認知謬誤與系統內部的統計偏差,定設計出對應的救濟與爭端解決機制。這份工作,人類責無旁貸


【推薦序】(二)歡迎來到第六病房!
P.16 – P.17
理論上,數學模型應該是一種公平的機制,因為所有人都是基於相同的規則,數學模型不容易收到偏見的影響。然而事實剛好相反,數學家藉由大數據以免分析結果遭到例外或異常扭曲,結果反而因此懲罰了那些剛好屬於例外情況的人們。這些數學模型可能還會更深化社會的歧視與不平等。作者將這種獎勵優勢並懲罰弱勢的模型稱為「數學毀滅性武器」(Weapons of Math Destruction),它的應縮寫 WMDs 正好與「大規模毀滅性武器」的縮寫相同,由於這些數學模型會界定自己的事實,並利用這些事實替自己產生的結果辯解。這些數學模型產生的結論,有如神祇一般發號施令,它不聽人話,也不會屈服,更不理會人們的逢迎、威脅及誘騙。它還會自我強化延續,進而產生更大更普遍的危害。活在現代的社會裡,完全不被數學模型監控幾乎是不可能的,這是一種最安靜的恐怖主義


【數學毀滅性武器的三個標準】
P.43 – P.45
(一)
即使參與者知道自己正接受模型的評估,或知道模型的用意,模型是否透明,或甚至是看不見的?不透明、看不見的模型是常規,清楚透明的模型無疑是例外。
(二)
模型的運作是否會損害期對象的利益?簡而言之,模型是否不公平?是否會損害或者摧殘生命?
(三)
模型有能力指數式擴大應用規模嗎?