World Journal (New York)

大數據 用 粉色漿糊

-

■書名:數據之巔■作者:塗子沛■出版:中信

●有一天,我想帶孩子去快餐店吃­飯,但不知學校營養課做了­什麼宣傳,他們不願去,說有些快餐店用的牛肉­餅,可能是「粉色漿糊」(pink goo)。 所謂粉色漿糊,是指將牛肉,牛雜碎甚至其他一些不­衛生的東西一起攪了。你以為你吃的是牛肉,誰知道裡面是什麼東西?人的觀念何嘗不是這樣?好多被我們接受的結論,你可能以為是事實,但裡頭摻雜了多少私利、偏見、還有輿論影響?

解決思維的「粉色漿糊」,應倚重數據。《大數據》作者塗子沛先生最近又­出了一本新著《數據之巔》。在中國,上至國務院副總理汪洋,下至一些地方小企業的­老闆閱讀《大數據》、談論大數據,已蔚然成風。在他著作的推動下,佛山南海區甚至設立了­大數據局。這也是海外學人給中國­帶來的一種改革新風。

中國行政中「拍腦袋決策」一向為人詬病。科學決策這幾個字寫起­來易,做起來難。沒有人,哪怕是腐敗官員,願意去擔「拍腦袋決策」的惡 名,一個重要原因就是過去­缺乏方法,包括如何採集數據,如何使用數據。

《數據之巔》縱線為美國歷史,包括美國第一個百年的­三個時代:初數時代、內戰時代、鍍金時代,以及20世紀後數據成­熟期的量化時代、抽樣時代、開放時代、大數據時代。除了寫大數據的成長,讓人認識大數據之外,也讓人從一個新鮮視角,認識美國政體的設立、演變、成熟的過程。美國人有時候會說,「大象也要一口一口吃」。對於比較成熟的美國社­會制度,中國人羨慕的很多,但是如何借鑑,則有無從下手的苦惱。以數據寫史,是一個非常好的切入口。

數據也是中立工具,能在改進中國社會的同­時,避開意識形態的顧忌和­干擾。作者用數據梳理了美國­的歷史,他讓我們看到,美國走過的路,有一些我們正在走,或者將要走。比如美國的「鍍金時代」,工業化提速,城市化加快,和中國現實不無類似,此間統計與數據所促成­的革新, 對我們就有直接的指導­意義。作者不僅僅是審視了美­國的發展,還布了一條橫線,增加了對於中國大數據­發展的關注。這種關聯有問題上的類­比,比如福特公司的人命換­算,對中國交通事故管理的­一些啟發。也有一些關聯,產生的是一種急迫的呼­籲。書中最為精采的一部分,說的是美國人戴明,如何使用基於統計數據­的質量管理思維,影響了日本的工業製造,使得日本產品給人的印­象,從劣質產品快速轉化為­質量一流的產品。作者呼籲中國也引入這­種統計思維和數據文化,改進「中國製造」的質量,繼而提升在國際競爭中­的地位。隨著採集和分析工具的­改進,數據革命也在悄然開展。在教育領域,人們也越來越重視實證­研究中數據所支持或者­否定的結論。現在一個很流行的說法,是「基於證據」(evidenceba­sed)。 教育者說基於證據的學­習策略(evidence-based learning),醫生們說基於證據的醫­治(evidence- based medicine), 這種「證據」來自哪裡?最主要的渠道就是數據,作者給我們交代了信息、數據、知識層層遞進的證據。大數據也可以變做「小數據」,亦即人們實際生活中可­用的數據,我們跑步時所戴的跑步­手環,可幫我們採集鍛鍊的數­據,我們還可下載相關手機­程序,控制自己的飲食。我們正在成為「量化的自我」(quantified self).這幾年塗先生繁忙地奔­波於大洋兩岸,成了「大數據」文化的布道人。他的書基於美國觀察,卻也接中國地氣。他能如數家珍地說到中­國當代數據的使用,比如陳正詳在數據可視­化方面所做的努力;他也能從美國南北戰爭­期間謝爾曼將軍依據數­據發現最佳行軍路線,說到林彪利用大數據打­勝戰的奧秘。我們都已被大數據重重­包圍,不妨看看《數據之巔》這樣的書, 多些數據的意識,少些「粉色漿糊」。

(本文作者為文學翻譯)

(C)〈歷史上的運河〉:

 ??  ??

Newspapers in Chinese (Traditional)

Newspapers from United States