2021-03-25 11:20:02來自星星的喵

數商:向阿里巴巴前副總裁學習數據時代的生存商數


數商:向阿里巴巴前副總裁學習數據時代的生存商數
作者:涂子沛 出版社:時報出版 出版日期:2021-01-20 00:00:00

<內容簡介>

☆全系列著作銷售突破100萬冊☆
☆《羅輯思維》創始人羅振宇強力推薦☆

數據不是黃金或石油,而是一片沃土,
孕育我們未來發展的一切所需。

透過生動有趣的歷史故事,
一窺人類文明躍遷的關鍵時刻,
學習生活中的數據科學、解讀數商的深刻內涵。

◆立即上網測試!數據時代來臨,你的生存指數有多高?
http://www.readingtimes.com.tw/timeshtml/ad/BED0285/index.html

數學、數據或數商,並非單純的數字或符號,
而是教你練習邏輯思維,進而學會深度思考,
無論在日常生活或職場中,這都是現代人的必備素養。

我們正站在歷史的轉捩點,你該如何在數據時代勝出?
運用新時代的地圖和清單,做出理性決策;
學習高數商的十大原則,善用數據思考;
助你獲得生存優勢!

◤數據不是一切,但一切都將變成數據。◢

大數據竟是全人類傳染病的最終解方?
軍機在彈孔最少的部位才應該加強裝甲?
南丁格爾用一張數據圖就拯救了無數生命?
大數據竟能決定農作物的生長速度?
網路上大部分免費的數據可能是陷阱?

☆用數據對抗危機和災難
19世紀英國爆發霍亂,眾人謠傳這種瘟疫是經由空氣傳播,唯有麻醉醫師約翰.斯諾獨排眾議,透過嚴謹精確的數據,找出水源汙染才是真正的起因,進而迅速平息了這場災難。

☆用科學數據來優化軍隊
二戰期間,美軍分析了返航的軍機,發現不應在彈孔最多的部位加強裝甲,而是彈孔最少的部位,因為這些部位中彈後,軍機根本無法返航,此即「倖存者偏差」。可以說,正是這些數據起了決定性作用,改變了戰爭的進程。

☆「數據視覺化」拯救生命
白衣天使南丁格爾在戰場上發現,因惡劣醫療衛生條件而死亡的人,竟遠遠超過戰爭的陣亡人數。於是她蒐集統計數據,製作出「極座標圓餅圖」,這促使當局創設了歷史上第一所正式的戰地醫院,因而拯救了無數生命。

☆智慧農業的巨大變革
數據漸漸成為農業不可或缺的全新生產要素,在溫室裡架設雲端和網路,智慧系統就能根據獲得的數據做出決策,使作物達到最優質的生長狀態。在市場供過於求或供不應求時,還能透過調節生產環境,適當加速或延緩作物的成熟速度。

☆免費數據可能是消費陷阱
現在大家都能在搜尋引擎平台購買曝光度,也就是「競價排名」,資訊世界原本的次序也因此被扭曲。大部分免費送到你眼前的數據,都有其目的性,意在消耗你的注意力和金錢。一般人無從分辨真正需要的資訊,導致時常面對消費陷阱。

☆獨家收錄「數商測試題」
本書除了搭配數十幅生動插畫,更為一般大眾精心編製「數商測試題」,讀者可自行檢測數商高低。數商已成為可以用量尺來衡量的數據思維能力,也就是數據智慧時代的度量衡。

◤擁有高數商的人,無論何時都能找到最合適的資訊和數據。◢

生活在全新智慧時代,若只會接收數據,卻不會主動尋找數據,那你就可能成為一個巨嬰。
有人不斷餵食你資訊和數據,你卻不知那些東西是否正確無毒,其後果不堪設想。

對數據優勢、數據實力、數據能力高低的衡量,就是本書所定義的「數商」。
修煉數商,是智慧時代的新潮流,也是人類社會發展到一個新的階段,自然而然衍生出的新要求。

本書將圍繞著數商,闡述新的價值觀、新技能和新工具,並藉由豐富案例對數商的深刻內涵進行解讀,這些故事跨越了遠古到現代,特別是人類社會轉折、文明躍遷的焦點時刻。

無論是學生、教師、職場人士、專業研究人員或是一般讀者,高數商都是你獲得新競爭時代超強優勢的重要能力。

★名人推薦:

Cheap/知識型YouTuber
任維勇/北一女中數學教師
李忠謀/臺灣師範大學副校長、資訊工程系教授、國際資訊奧林匹亞競賽主席
周世恩/QSearch 共同創辦人
邱奕嘉/政大商學院副院長
洪萬生/臺灣數學史學會理事長
楊曙榮/臺灣大學工商管理學系系主任暨商學研究所所長
賴以威/數感實驗室共同創辦人、師大電機系助理教授
一致推薦(以上依姓名筆劃順序排列)

「讀這本書就像錢塘觀潮。才剛覺得大數據時代還是一個潮頭,它瞬間就捲到腳下。除了學會游泳,沒有別的選擇。這本書不僅帶你觀潮,還教你游泳。」
──羅振宇/《羅輯思維》創始人

「這是一本從歷史講述數據蒐集、分析以及使用資料重要性的書。我很樂意推薦,讓更多人從歷史故事中了解到大數據在各領域未來發展上的重要性。」
──李忠謀/臺灣師範大學副校長、資訊工程系教授、國際資訊奧林匹亞競賽主席

「涂子沛老師觀點新穎,可以讓人得到不少啟發。我先前已看過簡體中文版,但這本書實在太好看了,一定要買繁體中文版來收藏。」
──Cheap/知識型YouTuber

★目錄:

〈前言〉為什麼數商如此重要
數商測試

第1章 一名低調賭徒的焦點時刻
第2章 戀愛愈自由,結婚愈要靠高數商
第3章 前線數據中心:維護公平正義的新核心

第4章 創數簡史:數商、智商和情商的量子糾纏
大腦裡開燈:從數量到數字/刻痕是「計」,結繩是「記」/先有數,再有字/貨幣:量化一切的工具 /萬物皆數:數商的源頭/量化:管理情緒的祕密武器/忘恩負義的原因是數商低/全面記錄可以提高情商

第5章 高數商民族:尋找道地的英國人
一次長達二十年的追溯/如何記帳,曾經是個大問題/記帳進入文化和家庭/黃仁宇找答案

第6章 數據與宇宙大發現
叛逆者為何如此溫和/最精準執著的觀星人/在數據叢林跋涉八年/驚人的預測和成功/只有文字,沒有數據的後果

第7章 測量未來
是有 N 種可能,還是一切注定?/居然賭出一門大學問/人性不相信機率/中國為什麼沒有產生機率論?/從死亡中琢磨出的新行業/等待社會科學的克卜勒

第8章 實「數」求是:抗疫要數據,更需要數商
不明就裡便會做蠢事/難以戰勝的人類感覺/數據英雄的逆行/現代流行病學的開創人/中國人對霍亂的理解和治療

第9章 一個高數商模範生的超級成就
第10章 奶茶和糞堆:實驗造就聰明人
第11章 戰爭背後的高數商
第12章 表情編碼:破解隱性知識

第13章 高數商搜尋:為什麼你找不到,別人找得到
在新空間生活/唯快不破的武功:分散式運算/高數商搜尋/記錄:從手帳到個人數據中心/釣愚:搜尋賺錢的模式

第14章 掌握新空間的金剛鑽
數據庫是什麼/掌握一門有「錢途」的語言/演算法:新空間的金剛鑽/金剛鑽是如何煉成的/一半是科學,另一半要靠藝術和故事/三個似是而非的概念

第15章 善數者成,營造一個新的高數商社會
裡應外合的共識/大行其道的倖存者偏見/人人都是圓通大師/在智慧時代成功/高數商源於思維和行動

<作者簡介>

涂子沛
大數據先鋒思想家,曾在美國學習、工作多年,2014年從矽谷回到中國,出任阿里巴巴集團副總裁。2018年創建數文明科技,同時擔任伊斯佳股份董事、人民網和國地科技獨立董事。
著有《大數據》、《數據之巔》、《數文明》、《給孩子講大數據》、《給孩子講人工智能》等作品,相關著作累計銷售已突破100萬冊。
大學畢業於華中科技大學計算機系,研究所畢業於中山大學、卡內基梅隆大學,獲公共管理碩士和訊息技術科學碩士學位。

★內文試閱:

‧前言

為什麼數商如此重要(節錄)
回頭看人類的文明史,不可否認的一項事實是,我們這個物種最重大的成就、最亮眼的變化都發生在最近兩三百年。1946 年,第一台電腦被發明,人類文明開始了新一輪的大躍進,一開始,人類把這個新的時代定義為「資訊時代」,認為資訊無所不在,以前很難找到的資訊與知識現在很容易就能找到。但 21 世紀的最近 20 年,變化開始加速,我們突然發現,新時代像一輛疾馳的列車,載著我們快速馳過了「資訊時代」的月臺,「以前很難找到的資訊與知識現在很容易就能找到」這句話已經不能概括新時代的特點,我們正在邁入一個更新的時代──智慧時代。
驅動我們進入智慧時代最強大的力量,就是數據的爆炸和對數據的處理。由於數據對經濟、政治和文化生活的廣泛影響,智慧型文明相較於以往的任何文明在本質上皆有所不同。這裡所定義的「數據」,是指數位化的資訊,即以「0」和「1」這種二進位保存的所有資訊,它不僅包括傳統的數字,還包括照片、文字、影片等傳統意義上我們不會稱為「數據」的那些資訊。
今天,我們每個人對數據的需求是極其強烈的,你可能沒有意識到,這種需求甚至比對性的需求還要來得強烈。很多人一拿起手機就放不下來,滑手機就是在看資訊,看資訊就是在看數據,離不開手機其實是離不開數據。每一個人,在滿足了以食物作為中心的溫飽生存問題之後,他的神經、意識和觸角,全都在搜集和創造數據。數據不能當飯吃,卻幾乎構建了個體發展的全部基礎。除了城市、鄉村這種物理空間,我們每天還在一個新的空間裡生活:數據空間。人類在數據空間中停留的時間將愈來愈長,比待在物理空間的時間更久,在這個新空間裡,數據和智慧主導一切,這就是人類當下發展的大趨勢。
數據是一種新的資源,可以釋放出新的能量,這種能量對人和世界會產生新的作用力。很多公司已經將數據視為一種新的資產,雖然還沒有發明一種合理的方法來直接評估這種資產的價值,但我們都清楚地看到,數據已經在賦能一些國家、組織和個人了。未來舉凡能保證數據真實、安全的國家和地區,會產生一種新的優勢:坐擁數據的企業可以躺著賺錢,會使用大數據的群體和個人將成為新的社會統治階層。擁有數據優勢的國家、地區、企業和個人正在陸續出現,數據優勢也可以稱為數據實力。
遺憾的是,並不是每個人都能認識到這一點,也不是每個人都會正確且聰明地使用數據。但好消息是,這種能力可以經由訓練獲得,這種價值觀可以從零開始建立,我們還身處這場新革命的早期,一切都還來得及。只要增強對數據的信仰和洞察,學習掌握數據空間的新工具,每個人都可能從數據中釋放出「數能」和「數力」,為己所用。
對數據優勢、數據實力、數據能力高低的衡量,就是我所定義的「數商」。修煉數商,是智慧時代的新潮流。這是人類社會發展到一個新的階段,自然而然衍生出的新要求。
數商,首先是「資訊商」。它是對大數據時代人類獲得資訊能力的一種度量,雖然有海量的資訊在流動,但個人需要的僅是涓涓細流。弱水三千,只取一瓢飲,但是,那一瓢在哪裡呢?我們永遠在找自己最需要的那一瓢。這不是賈寶玉找林黛玉,找到了就一蹴而得。我們每天在不同的時間、地點和場景,都需要不同的資訊,這哪是一件容易的事?資訊是決策的基礎,有足夠且正確的資訊,智商才有運籌帷幄的空間。今天是數據大爆炸的時代,人類最近五年產生的數據,已經超過幾千年文明的數據總和,數據愈大,那一瓢就愈難找,因此需要我們在傳統的智商之外,學習新的工具和技能。
顧名思義,數商又是「數字商」、「數據商」。關於這兩個概念的區別,後續會解釋,但我希望你現在就要知道的是,我們所要討論的數商,雖然包括數量、數字,重點卻在數據。關於數字的科學叫數學,關於數據的科學叫數據科學,它們完全不同,但數學的進步為今天的數據科學奠定了基礎。貫穿本書討論的主題,不是以「計算」為中心的數學,而是以「記錄」為中心的數據科學。人類把萬事萬物的發展軌跡和狀態記錄下來,把它們轉化為數據,然後用分類、聚類分析等演算法,建立相互的聯繫,幫助我們看到更完整的事物全貌,更輕易地理解事物的本質,把握其潛在的規律,預測其未來的趨勢,讓數據服務於決策和創新─這是數據科學。
未來每個人都需要懂得一些數據科學。數商就是對這種能力的衡量,它不僅衡量經由測量和記錄獲得數據的行動能力,也衡量以科學高效的方法保存及使用數據、從數據當中洞察知識和規律以預測未來的能力。本書設計了一套數商的測試方法和試題,我建議你在開始閱讀全書之前,利用30~40 分鐘,完成這個測試,然後根據自己的得失分情況,在本書的閱讀過程中,逐點理解、對照、回顧、提升,相信這樣的閱讀將更有針對性,大有裨益。
數商非常具體,它和智商既有區別,也有很大的關聯,理解智商,就能很容易理解數商;數商也不像情商那般多變、難以捉摸解釋,數商完全可以講得很清楚。本書的中心內容,就是圍繞數商闡述新的價值觀、新的技能和新的工具。我們將從歷史當中去追溯數據思維的形成和發展、數據價值觀的來龍去脈;我將和你一起定義什麼是數商,思考如何在真實的世界透過數據及其分析獲得競爭性優勢,從而遊刃有餘,脫穎勝出於智慧時代。

‧摘文

難以戰勝的人類感覺(節錄)

1831 年,倫敦爆發了第一次霍亂大流行。小災進城,大災離城,在巨大死亡陰影的籠罩下,城市的居民都成群結隊向鄉村逃亡。這個時候,斯諾(John Snow,1813-1858)還是一名學徒,他目睹了出城的人流造成交通大壅塞,人走城空,正常的生活被傳染病快速摧毀,這些場景令他心如刀割。

他是一名麻醉醫生,這種傳染病跟他關係不大,但醫者仁心,他開始關注研究這種病。

當時的人們都傳言,霍亂是經由空氣傳播的,城市裡無處不在的臭味和瘴氣是這種傳染病的根源。

倫敦市政府的戶籍登記處有名統計學家,叫法爾(William Farr,1807-1883),他的職責就是記錄人口的最新變化,例如出生、結婚和死亡。這個法爾非常了不起,他在戶政部門工作 30 幾年,建立了完善的倫敦出生和死亡人口記錄體系,他也是上一章提到的,對疾病進行測量的主要宣導者。在他接手霍亂疫情統計之前,辦事員會記錄死者的姓名、地址、年齡和死因,但死因往往很籠統。法爾認為,增加記錄的變數就會增加數據的價值,他將疾病分成 27 類,並勸說醫生在報告死亡病例的時候,從這 27 類疾病當中選出一個死亡的原因,所以經他統計的數據,不僅有年齡、地址和職業,還有具體的死亡病因,這為倫敦的醫生和衛生機構提供了一個新的制高點,使他們有能力追蹤、調查城市流行病發生的時間、地點,分析其模式和原因。

法爾對死因的記錄方式後來成為世界各國普遍採納的模式,不過當時法爾也篤信瘴氣論,他認為汙濁的空氣會淤積沉澱在低處,更高的地方空氣更好,因此居住在高處的人感染霍亂的可能性較低。為了證明這個推測,他在收集霍亂死亡案例的時候增加了一個要求:記錄病人居住地「海拔高度」的數據項目。

霍亂大流行期間,法爾每週都發布倫敦市的死亡報表。這些數據好像真的顯示出高一些的地區病人更少、更加安全。

1848 年,倫敦爆發了第三次霍亂大流行。斯諾發現,霍亂患者的最初症狀都是腹瀉嘔吐,「如果真的是瘴氣傳播,為什麼最先被感染的不是鼻子和肺,而是腸胃?又為什麼一家人當中會有倖存者,接觸病人的醫生也不會被傳染?」

斯諾斷定,霍亂一定是經口腔進入腸胃的。他推測這極有可能是因為喝了不乾淨的水。但當時的科學設備看不到水裡的微生物,被霍亂弧菌汙染的水,看起來完全和正常的水一樣,仍然純淨透明。斯諾無法說服身邊的人相信他的判斷。

斯諾需要的顯然是更多的證據。他深入疫區,挨家挨戶敲門詢問患者和喝水有關的資訊。他發現了一個驚人的事實,1848 年至 1849 年霍亂爆發期間,倫敦市共有 7,466 人死亡,其中 4,001 人都居住在泰晤士河南岸,這意味著南岸的死亡率接近 0.8%,是市中心區的 3 倍,而倫敦西邊和北邊的死亡率僅僅只有 0.1%。

對此,瘴氣論的流行解釋是,泰晤士河南岸聚居了大量的勞工階層,汙濁的空氣導致死亡率更高。

斯諾認為這個解釋是錯誤的,他舉出反證說,倫敦東區比泰晤士河南岸聚居了更多的民工,是全倫敦最貧窮、最擁擠的地方,但死亡率只有泰晤士河南岸的一半。斯諾認為真正的原因是,南岸的倫敦人都飲用泰晤士河的水,而北岸倫敦人的飲用水來源並不僅限於泰晤士河,而是有多個來源。他分析了各個來源,發現死亡的數據和供水的路線有高度相關性。

斯諾的調查數據表明,飲用 A 公司水的家庭有 1,263 人死於霍亂,而飲用 B 公司水的家庭只有 98 人死於霍亂。當然,單純比較死亡的絕對人數是不公平的,因為有些地區的人多,有些地區的人少,斯諾又拿每一萬戶的死亡人數做對比,結論是飲用 A 公司水的家庭,每一萬戶死亡人數約是 B 公司的 8.5倍(315 除以 37)。

飲用不同供水公司的水,每一萬戶死亡人數就會有高達 8.5 倍的差距,這究竟是什麼原因?斯諾又進一步追蹤了兩家公司的水源,他發現 A 公司在流經倫敦市中心的泰晤士河下游取水,B 公司則在上游取水,而當時泰晤士河已經被霍亂患者的排泄物汙染了。

法爾對斯諾的觀點半信半疑,他提出:要測定水源對霍亂的影響,必須要有兩組居民,這兩組人生活在同一海拔高度、活動於同一空間、吃的東西一樣、日常活動也要相同,僅僅一方面不同,那就是喝的水,但在現實中的倫敦,顯然找不到這樣的實驗條件。

然而,斯諾認為,實驗已經擺在眼前。兩家公司的管道都通向所有的街道,進入幾乎所有的院落和小巷,無論貧富,無論房子大小,兩家公司都等而視之地提供自來水服務,而接受不同公司服務的客戶,他們在生活條件或職業方面也無明顯的區別,特別是他們都被同樣的「瘴氣」圍繞,為什麼有的生病,有的沒事呢?

1849 年,斯諾把這些調查和發現編寫成一本小冊子《霍亂的傳播方式》,正式提出水汙染是霍亂流行的真正原因:「再也設計不出比這更好的實驗方式,讓我們澈底地檢測水對霍亂的影響,整套實驗設計已現成地擺在研究者面前,而且這一實驗的規模相當大,多達 30 萬名不同性別、年齡、職業階層和地位的人,從上流人士到底層窮人,被分成了兩組,他們不僅不能主動選擇,而且在大多數情況下對這種選擇毫不知情。」一組得到乾淨的水,而另一組得到被汙染的水,所以斯諾得出結論:水源不乾淨,才是霍亂傳播的真正原因。

斯諾的論斷是天才式的。他在「隨機對照實驗」的概念遠遠尚未產生的時代,就在現實中發現了一次科學實驗。我們後文會闡述,科學的實驗機制要到 20 世紀初才被統計學家確立。但斯諾的這些論述只獲得極少數的人相信,這本小冊子總共才賣出去幾十本。大眾對瘴氣論深信不疑,畢竟,嗅覺是人類一種最原始的感覺,我們相信自己的感覺,就像哥白尼時代的人相信地球是靜止的一樣。人類對感官的迷信可謂根深蒂固,只有一流腦袋才能將數據當作「感覺的替代品」,透過數據來感知我們自己的身體和外部環境。

斯諾告訴法爾,為什麼光看死亡人數,瘴氣論好像很正確?那是因為在海拔高的地方,人口密度往往較低,因此死亡人口總數更少;但真正的原因不是這些地方遠離瘴氣,而是居民遠離了泰晤士河下游,水源較為乾淨。他甚至得出結論說,如果 A 公司將其取水口移到泰晤士河上游,就可以挽救 1,000多人的生命!斯諾最終說服了法爾,在他的統計當中增加一個新的變數:死亡者的飲用水源。

同樣是數據分析,為什麼只有斯諾才能洞察真正的因果關係?我想這源自於他對事實和規律持之以恆的細密追蹤。很多時候,流於表面的觀察都無濟於事,最高水準的成就來自一步一腳印的追蹤和不罷休。「實事求是」,事,就是事實;是,則是規律。實事求是即透過事實分析並發現事物的規律。斯諾的方法,可以總結為實「數」求是:把事實記錄下來,再透過全面細密的數據來尋找規律。