大數據 用 粉色漿糊
■書名:數據之巔■作者:塗子沛■出版:中信
●有一天,我想帶孩子去快餐店吃飯,但不知學校營養課做了什麼宣傳,他們不願去,說有些快餐店用的牛肉餅,可能是「粉色漿糊」(pink goo)。 所謂粉色漿糊,是指將牛肉,牛雜碎甚至其他一些不衛生的東西一起攪了。你以為你吃的是牛肉,誰知道裡面是什麼東西?人的觀念何嘗不是這樣?好多被我們接受的結論,你可能以為是事實,但裡頭摻雜了多少私利、偏見、還有輿論影響?
解決思維的「粉色漿糊」,應倚重數據。《大數據》作者塗子沛先生最近又出了一本新著《數據之巔》。在中國,上至國務院副總理汪洋,下至一些地方小企業的老闆閱讀《大數據》、談論大數據,已蔚然成風。在他著作的推動下,佛山南海區甚至設立了大數據局。這也是海外學人給中國帶來的一種改革新風。
中國行政中「拍腦袋決策」一向為人詬病。科學決策這幾個字寫起來易,做起來難。沒有人,哪怕是腐敗官員,願意去擔「拍腦袋決策」的惡 名,一個重要原因就是過去缺乏方法,包括如何採集數據,如何使用數據。
《數據之巔》縱線為美國歷史,包括美國第一個百年的三個時代:初數時代、內戰時代、鍍金時代,以及20世紀後數據成熟期的量化時代、抽樣時代、開放時代、大數據時代。除了寫大數據的成長,讓人認識大數據之外,也讓人從一個新鮮視角,認識美國政體的設立、演變、成熟的過程。美國人有時候會說,「大象也要一口一口吃」。對於比較成熟的美國社會制度,中國人羨慕的很多,但是如何借鑑,則有無從下手的苦惱。以數據寫史,是一個非常好的切入口。
數據也是中立工具,能在改進中國社會的同時,避開意識形態的顧忌和干擾。作者用數據梳理了美國的歷史,他讓我們看到,美國走過的路,有一些我們正在走,或者將要走。比如美國的「鍍金時代」,工業化提速,城市化加快,和中國現實不無類似,此間統計與數據所促成的革新, 對我們就有直接的指導意義。作者不僅僅是審視了美國的發展,還布了一條橫線,增加了對於中國大數據發展的關注。這種關聯有問題上的類比,比如福特公司的人命換算,對中國交通事故管理的一些啟發。也有一些關聯,產生的是一種急迫的呼籲。書中最為精采的一部分,說的是美國人戴明,如何使用基於統計數據的質量管理思維,影響了日本的工業製造,使得日本產品給人的印象,從劣質產品快速轉化為質量一流的產品。作者呼籲中國也引入這種統計思維和數據文化,改進「中國製造」的質量,繼而提升在國際競爭中的地位。隨著採集和分析工具的改進,數據革命也在悄然開展。在教育領域,人們也越來越重視實證研究中數據所支持或者否定的結論。現在一個很流行的說法,是「基於證據」(evidencebased)。 教育者說基於證據的學習策略(evidence-based learning),醫生們說基於證據的醫治(evidence- based medicine), 這種「證據」來自哪裡?最主要的渠道就是數據,作者給我們交代了信息、數據、知識層層遞進的證據。大數據也可以變做「小數據」,亦即人們實際生活中可用的數據,我們跑步時所戴的跑步手環,可幫我們採集鍛鍊的數據,我們還可下載相關手機程序,控制自己的飲食。我們正在成為「量化的自我」(quantified self).這幾年塗先生繁忙地奔波於大洋兩岸,成了「大數據」文化的布道人。他的書基於美國觀察,卻也接中國地氣。他能如數家珍地說到中國當代數據的使用,比如陳正詳在數據可視化方面所做的努力;他也能從美國南北戰爭期間謝爾曼將軍依據數據發現最佳行軍路線,說到林彪利用大數據打勝戰的奧秘。我們都已被大數據重重包圍,不妨看看《數據之巔》這樣的書, 多些數據的意識,少些「粉色漿糊」。
(本文作者為文學翻譯)
(C)〈歷史上的運河〉: