認(rèn)真閱讀下面的文章,并思考文末互動提出的問題,嚴(yán)格按照互動:你的答案格式在評論區(qū)留言,就有機會獲得由中信出版集團提供的優(yōu)質(zhì)科普書籍《統(tǒng)計的藝術(shù)》。
![]()
如果你已經(jīng)連續(xù)拋出了10次正面,那么下一次最有可能拋出的結(jié)果是什么?貝葉斯定理給出了答案,這不僅適用于拋硬幣,更普遍適用于科學(xué)探索。圖片來源:Wikipedia
先問你一個問題:
假如我拋了一枚硬幣10次,發(fā)現(xiàn)每次都是正面朝上。如果我再拋一次,出現(xiàn)正面的概率是多少?
我(譯者注:作者)經(jīng)常拿這個問題去問學(xué)生,無論是中學(xué)生還是大學(xué)生,甚至去問他們的老師。受過數(shù)學(xué)訓(xùn)練的學(xué)生(通常也包括他們的老師)給出的答案幾乎如出一轍。他們會說,下一次拋出正面的概率絕對是 1/2。他們對此往往非常篤定,通常還會搬出那套熟悉的理論,告訴我“硬幣是沒有記憶的”,或者類似這樣的話。
但如果你去問一個(沒受過多少數(shù)學(xué)訓(xùn)練的)賭徒,他們可能會說,既然這枚硬幣都已經(jīng)連續(xù)出了那么多次正面,風(fēng)水輪流轉(zhuǎn),下次怎么也該輪到反面了吧!所以,出現(xiàn)正面的概率肯定小于 1/2。
但是,在我看來(沒錯,這確實常常引發(fā)相當(dāng)激烈的爭論),這兩種答案都錯了!事實上,下一次拋擲出正面的概率非常接近于 1。你沒看錯,就是 1。你可能會問:“怎么會這樣?難道我以前學(xué)的數(shù)學(xué)都是錯的嗎?”你先別急,咱們理理思路,如果要讓這枚硬幣在下一次拋擲時出正面的概率是 1/2,前提是它必須是一枚“絕對公平”的硬幣(也就是每次拋擲出現(xiàn)正反面的可能性完全相等)。可是,我從頭到尾都沒說過這是一枚公平的硬幣呀!那僅僅是你自己想當(dāng)然的假設(shè)罷了。
你看,明明擺在眼前的是壓倒性的反面證據(jù),你卻依然做出了硬幣是絕對公平的假設(shè)。仔細(xì)想想,如果一枚硬幣連續(xù)十次拋出正面,那它十有八九不是什么正經(jīng)硬幣。事實上,如果這枚硬幣真的質(zhì)地均勻,發(fā)生這種情況的概率只有 0.510,也就是 1/1024 ,接近于千分之一的概率。這就意味著,你需要把“連拋十次”作為一個回合,足足重復(fù)上一千個回合——也就是總共拋擲 10,000 次,我估摸著這至少得連續(xù)拋上三個小時,才能有較大的概率見證一次“連續(xù)十次正面”的奇跡。
估計絕大多數(shù)人扔不到一半就感覺手酸,早早放棄了。因此,既然我們已經(jīng)親眼看到了硬幣連續(xù)出現(xiàn)了十次正面,一個非常合理的推斷就是:這枚硬幣肯定不對勁,它的內(nèi)部可能存在某種偏向性,導(dǎo)致它更容易擲出正面。想通了這一點,情況就很明朗了,下一次拋出正面的概率絕對比 1/2 要高得多。
但是新的問題又來了,到底會高出多少呢?
我在這里所描述的,其實正是科學(xué)研究的運作方式。假設(shè)我們想要研究某個系統(tǒng),我們會先進(jìn)行一系列的觀察,并從中推斷其內(nèi)在可能的機制。這個過程需要我們提出假設(shè),然后用數(shù)據(jù)去檢驗這些假設(shè)。一旦確立了假設(shè),我們就可以開始做預(yù)測。但這必須在收集到數(shù)據(jù)之后才能進(jìn)行,而且我們必須非常謹(jǐn)慎,不能在一開始就對系統(tǒng)做出不切實際的假設(shè)。
這個道理不僅適用于我們的這枚硬幣,還同樣適用于天氣預(yù)報、氣候變化預(yù)測,以及應(yīng)對流行病傳播的決策。它也適用于我們生活中的許多其他方面,無論是司法系統(tǒng)的運轉(zhuǎn),還是我們制定政策(甚至進(jìn)行社會活動)的方式。
幸運的是,我們有一個非常強大的工具可以提供幫助,那就是貝葉斯推斷(Bayesian inference)。如今,人工智能、機器學(xué)習(xí)以及機器的決策能力正在飛速發(fā)展,而貝葉斯推斷正是這一切的核心。
正面,貝葉斯贏!
老師和學(xué)生有時會批評我的第一個問題過于模糊。題干中沒有提供足夠的信息來得出答案。確實,這肯定無法作為一道合格的考題,至少在數(shù)學(xué)考試中是不合格的。從某種意義上說,這種批評是對的。但在現(xiàn)實中,我們經(jīng)常會面臨類似的情境,不得不依靠做出合理的假設(shè)來處理問題。因此,為了讓這個問題更加嚴(yán)謹(jǐn),我將其重新表述如下:
我有一個裝了許多硬幣的袋子。其中大部分是質(zhì)地均勻的普通硬幣,拋出正面或反面的概率均為 1/2。然而,有比例為 p(假設(shè) p 的值很小)的硬幣是特殊的,它們兩面都是正面。如果拋擲這種硬幣,出現(xiàn)正面的概率就是 1(這里假設(shè)硬幣不會立在地面上)。我從這個袋子里隨機摸出一枚硬幣,連拋 10 次,結(jié)果每次都是正面朝上。那么,下一次拋擲它依然出現(xiàn)正面的概率是多少?
![]()
氣象學(xué)依賴于貝葉斯推斷。圖片來源:Pixabay
在這個更為嚴(yán)謹(jǐn)?shù)那榫诚拢覀儙缀蹩梢詳喽ǎ绻矌琶看味紨S出正面,那它極大概率是一枚存在偏向的硬幣(即兩面都是正面的硬幣)。在這種情況下,下一次拋擲肯定還是正面。運用貝葉斯推斷這一奇妙的方法,我們可以將這一推論表述得更加精確,甚至還能看出它與比例 p 的大小有著怎樣的關(guān)系。
要做到這一點,我們需要引入事件的條件概率(conditional probability)這一概念。在前面設(shè)定的游戲中,存在幾種可能發(fā)生的事件。其一便是“抽中一枚存在偏向的硬幣”這一事件。我們將該事件記為 A,并用 P(A) 來表示其發(fā)生的概率。將“抽中一枚均勻硬幣”的事件記為 B,并用 P(B) 表示該事件發(fā)生的概率。那么:
我們通常將這種概率稱為先驗信息(prior information)。只有在對這枚硬幣一無所知的情況下,P (A) = p 這一等式才成立。這是在獲取任何實測數(shù)據(jù)之前,硬幣存在偏向的概率。
一旦開始拋擲硬幣,我們就會對它有更多的了解,并隨之修正先驗信息,從而得出關(guān)于該系統(tǒng)的所謂后驗知識(a-posteriori knowledge)。作為人類,我們的大腦時刻都在經(jīng)歷著這樣的過程:不斷收集關(guān)于周遭環(huán)境的感官信息,并據(jù)此在腦海中構(gòu)建出對當(dāng)前狀況的認(rèn)知。這也是機器進(jìn)行學(xué)習(xí)并更新其對某個系統(tǒng)已有知識的過程。對于這類機器而言,實現(xiàn)這一過程的核心工具正是貝葉斯分析(Bayesian analysis)。接下來,就讓我們看看它是如何發(fā)揮作用的。
假設(shè)我們有兩個事件 A 和 B。條件概率 P(A|B) 指的是在已知事件 B 已經(jīng)發(fā)生的前提下,事件 A 發(fā)生的概率。
舉個例子,假設(shè)事件 A 為“連續(xù)拋擲 10 次硬幣,每次都是正面朝上”,事件 B 為“我們抽中了一枚兩面都是正面的硬幣”,而事件 C 為“我們抽中了一枚質(zhì)地均勻的普通硬幣”。稍作思考就會發(fā)現(xiàn):
這是因為那枚硬幣兩面都是正面,所以它每次拋擲必然都會出現(xiàn)正面。另外,正如我們在前面已經(jīng)計算過的,我們還可以得出:
你可以明顯看出,P(A|B) 要比P(A|C) 大得多。
貝葉斯是怎么說的
在小學(xué)二年級,我們就學(xué)過一個關(guān)于條件概率的通用公式。如果用 P(A and B) 來表示事件 A 和事件 B 同時發(fā)生的概率,那么公式就是:
這個公式可能不是那么一目了然——如果想了解它為什么成立,可以去閱讀相關(guān)的推導(dǎo)文章。
但是,P(A and B) 與 P(B and A) 顯然是同一回事,根據(jù)上述公式,它同樣等于P(B)P(A|B)。這也就意味著:
由中間的等式可得:
這個結(jié)果就是著名的“貝葉斯定理”(Bayes' theorem)。它由托馬斯·貝葉斯牧師(Revd. Thomas Bayes)提出,并由英國皇家學(xué)會(Royal Society)以《論有關(guān)機遇問題的求解》(An Essay towards solving a Problem in the Doctrine of Chances)為題于 1763 年正式發(fā)表。
![]()
托馬斯·貝葉斯(1701-1761)
貝葉斯并不算是一位職業(yè)數(shù)學(xué)家,盡管他對哲學(xué)和統(tǒng)計學(xué)有著濃厚的興趣。事實上,他是一名神職人員。但是,貝葉斯定理卻是整個數(shù)學(xué)領(lǐng)域最重要的成果之一!它不僅在概率論和統(tǒng)計學(xué)中居于核心地位,在衛(wèi)星追蹤(或幾乎任何其他目標(biāo)的追蹤)、考古學(xué)、司法系統(tǒng)、氣象學(xué),甚至在大名鼎鼎(讓人又愛又恨)的蒙提霍爾問題(即著名的“三門問題”)等截然不同的領(lǐng)域中,都有著數(shù)不勝數(shù)的應(yīng)用。它更是構(gòu)建整個機器學(xué)習(xí)領(lǐng)域的基石。對于區(qū)區(qū)一個定理來說,這成就可以說相當(dāng)了不起了。
我們可以用通俗的語言來解釋這個定理為何如此重要。假設(shè)事件 B 是我們真正感興趣的研究對象,而事件 A 是我們?yōu)榱诉M(jìn)一步了解 B 所進(jìn)行的實驗。P(B) 就是我們在進(jìn)行實驗之前對事件 B 掌握的“先驗知識”;而 P(B|A) 則是實驗之后我們對 B 獲得的“后驗知識”。貝葉斯定理為我們提供了一條從先驗知識通往后驗知識的橋梁。我們成功地從數(shù)據(jù)中推斷出了背后的真相,這正是“貝葉斯推斷”一詞的由來。當(dāng)我們想要弄清楚一個無法直接測量的系統(tǒng)內(nèi)部正在發(fā)生什么,并且必須依靠間接的測量結(jié)果來進(jìn)行推論時,這種思想在科學(xué)研究的各個方面都會被一遍又一遍地反復(fù)運用。
硬幣存在偏向的概率有多大?
作為例子,現(xiàn)在讓我們把這個定理應(yīng)用到最初的問題上,在不直接查看硬幣的情況下,推斷這枚硬幣是否兩面都是正面。我們這里重申一下設(shè)定,事件 A 為“連續(xù)擲出 10 次正面”,事件 B 為“我們抽中了一枚兩面都是正面的硬幣”。
我們已經(jīng)知道 P(A|B)=1,并且 P(B)=p。因此,為了計算出 P(B|A)(也就是在已知連續(xù)擲出 10 次正面的前提下,這枚硬幣兩面都是正面的概率),我們需要先算出 P(A)。P(A) 代表的是:從袋子里隨機摸出一枚硬幣,拋擲后連續(xù)出現(xiàn) 10 次正面的總概率。這里需要考慮兩種互斥的情況。第一種情況是,我們抽中了一枚兩面都是正面的硬幣,然后擲出了十次正面。這種情況發(fā)生的概率,其實就等于抽中這枚問題硬幣的概率 P(B)(因為一旦抽中它,擲出十次正面就是板上釘釘?shù)氖铝耍5诙N情況是,我們抽中了一枚質(zhì)地均勻的普通硬幣(我們將此事件記為 C),然后擲出了十次正面。在這種情況下,擲出十次正面的概率就是兩個單獨概率的乘積:P(A|C)P(C)。因此,擲出十次正面的總概率 P(A),就是這兩種互斥情況的概率之和:
我們剛才已經(jīng)算出了這里所有的項:P(B)=p,P(A|C) = 1 / 1024,以及 P(C) = 1-p。因此:
現(xiàn)在,我們可以完成最后的計算,得出在“連續(xù)擲出 10 次正面”的前提下,這枚硬幣兩面都是正面的概率為:
為了讓你對這個概率的具體大小有個直觀感受,假設(shè)我們有一個裝了 100 枚硬幣的袋子,其中只有一枚是兩面全為正面的問題硬幣。那么,p = 1 / 100。在這種情況下,已知硬幣連續(xù)擲出 10 次正面,它是問題硬幣的概率就變成了:
也就是說,這枚硬幣存在偏向的概率高達(dá) 91%。對于大多數(shù)人來說,這個可能性已經(jīng)相當(dāng)有把握了。所以可以看到,在貝葉斯定理的運用下,原本僅有 1% 的“硬幣存在偏向”的先驗概率被更新為了 91%。
再次擲出正面的概率是多少?
現(xiàn)在,我們終于可以回過頭來回答最初提出的那個問題了。在已經(jīng)連續(xù)擲出 10 次正面的前提下,下一次擲出正面的概率究竟是多少?
如果這是一枚問題硬幣(即事件 B),那么下一次擲出正面的概率必然是 1。因此,基于現(xiàn)有的觀察數(shù)據(jù)(連出 10 次正面),下一次擲出正面且硬幣確實存在偏向的概率為:
如果這枚硬幣是質(zhì)地均勻的普通硬幣(即事件 C),那么下一次擲出正面的概率就是 1/2。因此,基于現(xiàn)有數(shù)據(jù),下一次擲出正面且硬幣毫無偏向的概率為:
在第 11 次拋擲這枚硬幣時,再次出現(xiàn)正面的總概率,就是上述這兩個互斥事件概率的總和:
我們之前已經(jīng)算出了 P(B|A) 的值,而 P(C|A) 簡單來說就是 1- P(B|A)。因此,下一次再次擲出正面的概率就變成了:
如果 p = 1 / 100,那么P(再次擲出正面) = 0.955,約為96%。對于大多數(shù)實際情況來說,這個概率已經(jīng)足夠接近于 1 了。
在下圖中,我們將 P(再次擲出正面) 繪制為了 p 的函數(shù)。你可以清楚地看到,只有當(dāng) p 小到極其微弱的程度時,P(再次擲出正面) 才會與 1 產(chǎn)生明顯的差距。因此,我們完全有底氣說,最初那個問題的答案就是,下一次出現(xiàn)正面的概率非常接近 1,即便我們其實并不知道 p 的確切數(shù)值。
![]()
概率 P(再次擲出正面) 隨 p 變化的曲線圖。
大功告成……
……但是等等,有沒有一種可能,我對你隱瞞了真實的數(shù)據(jù)。這種情況下我們該怎么辦?它又跟天氣預(yù)報甚至機器學(xué)習(xí)有什么千絲萬縷的聯(lián)系?欲知后事如何,且聽下文分解。
背面,貝葉斯輸!
在現(xiàn)實中,科學(xué)家們往往只能基于不完美的數(shù)據(jù)來做出預(yù)測,天氣預(yù)報就是一個典型的例子。接下來,本文的后半部分將為你揭秘一項專為解決此問題而生的技術(shù)——“數(shù)據(jù)同化”(data assimilation)。它能夠在新信息的啟發(fā)下更新初始預(yù)測,并充分考慮到一個現(xiàn)實情況:無論是觀測數(shù)據(jù)還是最初的預(yù)測,其實都是不完美的。
在前面的章節(jié)中,我們學(xué)習(xí)了如何基于觀測數(shù)據(jù),運用貝葉斯定理來調(diào)整對某個事件發(fā)生概率的預(yù)測。我們舉的例子是,一枚硬幣連續(xù)十次擲出了正面。面對這樣的數(shù)據(jù),這枚硬幣十有八九存在問題,因此第十一次擲出正面的概率,理應(yīng)高于一枚普通均勻硬幣那 50% 的概率。貝葉斯定理從數(shù)學(xué)上證實了我們的直覺。
然而,對于我們所觀察到的現(xiàn)象,其實還存在另一種解釋。硬幣絕對公平?jīng)]有問題,真正出了問題的,是數(shù)據(jù)本身。例如,我可能在記錄正反面的時候剛好摘下了眼鏡。這下我根本兩眼一抹黑分不清哪面是哪面,為了圖省事兒,干脆把每次拋擲的結(jié)果都記成了正面。又或者,我明明看清了正反面,但是由于電腦系統(tǒng)出了故障,所有的結(jié)果全被強行錄入成了正面。
這些正是所謂儀器誤差(instrumentation error)的例子。在記錄數(shù)據(jù)時,這類誤差其實并不罕見(盡管在現(xiàn)實中往往不會像上述例子那么極端)。要知道,沒有任何數(shù)據(jù)記錄設(shè)備是絕對完美的,它們多多少少都會出現(xiàn)一些偏差。
還有一種可能性是,我在記錄數(shù)據(jù)時故意對你撒了謊。哪怕硬幣擲出了好幾次反面,我仍然向你偽裝出它存在偏向的假象。在刑事案件的取證中,這種情況屢見不鮮,人們往往必須在真假難辨的證據(jù)和數(shù)據(jù)面前,判斷到底該不該相信某位證人的證言。
于是,我們不得不面對這樣一個問題:如果擺在面前的數(shù)據(jù)不完全可靠,那么對于我們正在研究的系統(tǒng)(比如這枚硬幣到底是不是公平的),我們還能做出什么有意義的推斷嗎?
貝葉斯來救場
既然數(shù)據(jù)可能不太靠譜,要想準(zhǔn)確估計系統(tǒng)的真實狀態(tài),我們就需要有辦法來衡量這些數(shù)據(jù)的可靠性。對于測量儀器來說,溫度計就是個很好的例子。假設(shè)我們要測量某個實際溫度 T,溫度計每次給出的讀數(shù)可能會有些許波動,但如果這些讀數(shù)的平均值恰好等于 T,我們就稱這支溫度計是“無偏的”(unbiased)。而這些讀數(shù)的方差(variance)則反映了它們在平均值上下分散的程度,這就為我們提供了一把評估測量結(jié)果到底有多靠譜的標(biāo)尺。如果方差很大,讀數(shù)飄忽不定,我們在心里對這組數(shù)據(jù)的采信度就會打個折扣;反之,如果方差很小,我們就會更加信任這些數(shù)據(jù)。通過這種方式,當(dāng)面對一份可能存在誤差的測量數(shù)據(jù)時,我們就能精確權(quán)衡出究竟需要對原有的預(yù)測做出多大程度的修正,從而完成對某個事件(先驗)預(yù)測的更新。
這個過程,通常就被稱為“數(shù)據(jù)同化”(data assimilation)。數(shù)據(jù)同化的絕妙之處在于,它能將“不太靠譜的預(yù)測”與“同樣不太靠譜的數(shù)據(jù)”結(jié)合起來,最終孕育出一個比這兩者都要準(zhǔn)確得多的全新預(yù)測!這簡直就像變魔術(shù)一樣,我們幾乎是在"無中生有"!
氣象學(xué)家們使用數(shù)據(jù)同化技術(shù)已有大約二十年之久,這極大地提升了天氣預(yù)報的可靠性。理論上,要想根據(jù)今天的天氣狀況準(zhǔn)確預(yù)報明天全球的天氣,氣象學(xué)家在今天就需要對整個大氣層的狀態(tài)進(jìn)行大約十億次測量。但在現(xiàn)實中,這根本不可能辦到,他們窮盡手段,撐死也就只能完成大約一百萬次測量。顯然,單靠這點數(shù)據(jù),遠(yuǎn)不足以了解今天的天氣狀況。
為了解決這個問題,氣象學(xué)家們想出了一個辦法。他們會先拿出昨天對今天所做的天氣預(yù)報,然后朝著今天實際觀測數(shù)據(jù)的方向,對這份預(yù)報進(jìn)行 “微調(diào)”( nudge)。然后用修正后的當(dāng)日天氣預(yù)報,做明天的天氣預(yù)報。
數(shù)據(jù)同化正是用來完成這種“微調(diào)”的,它的基本思路如下:氣象學(xué)家根據(jù)昨天掌握的信息,對今天的天氣做出一個(先驗)預(yù)測。同時,他們還要盡可能多地去測量今天的天氣狀況,比如看溫度計(或者干脆直接瞅瞅窗外)。由于每次測量總會有些微小的差異,所以即便是一支絕對標(biāo)準(zhǔn)的“無偏”溫度計,也會給出一系列可能的測量值。
另一方面,基于昨日天氣對今日天氣所作的預(yù)測同樣也會存在誤差。實際上,是一大堆可能的誤差(畢竟我們的天氣模型和計算能力還遠(yuǎn)遠(yuǎn)談不上完美),我們將這種預(yù)測誤差分布的方差記為 Epred。然后,把這份預(yù)測與我們目前能收集到的關(guān)于今天天氣的(有限)觀測數(shù)據(jù)放在一起進(jìn)行比對。當(dāng)然,這些觀測數(shù)據(jù)自身也是帶有誤差的,我們將它的方差記為 Edata。
如果與 Edata 相比,Epred 的值較小,那么原本的預(yù)測只會朝著觀測數(shù)據(jù)的方向“微調(diào)”一點點。通俗點說,這是因為此時的預(yù)測結(jié)果比今天實際測量的數(shù)據(jù)更可靠,所以我們不想過多地被今天的測量數(shù)據(jù)“帶偏”。相反,如果 Epred 比 Edata 大得多,那我們就會在很大程度上采信實測數(shù)據(jù)。
經(jīng)過這番“微調(diào)”后得到的結(jié)果,我們稱之為“分析值”,記為 A。這個分析值巧妙地兼顧了原始預(yù)測和實測數(shù)據(jù),是對今天天氣狀況做出的最佳估計。拿著這個分析值,天氣預(yù)報員就可以去預(yù)測接下來幾天的天氣了。
![]()
數(shù)據(jù)同化過程示意圖。粉色橢圓代表預(yù)測結(jié)果及其可能存在的誤差范圍,橙色橢圓則代表觀測數(shù)據(jù)及其可能存在的誤差范圍。數(shù)據(jù)同化將原始預(yù)測朝著觀測數(shù)據(jù)的方向進(jìn)行了“微調(diào)”,使得最終結(jié)果既落入原始預(yù)測的誤差橢圓之內(nèi),又同時落在了觀測數(shù)據(jù)的誤差橢圓之中。
這種將觀測數(shù)據(jù)同化到天氣預(yù)測中的想法(在專業(yè)方面衍生出了3 DVAR(三維變分)、4 DVAR(四維變分)以及集合卡爾曼濾波(Ensemble Kalman Filtering)等具體方法),正是英國氣象局(Met Office)、歐洲中期天氣預(yù)報中心(ECMWF)以及全球各地氣象中心每天為我們準(zhǔn)確預(yù)報天氣的關(guān)鍵。
![]()
氣象學(xué)中數(shù)據(jù)同化過程示意圖。
在這個案例,以及其他數(shù)據(jù)同化的應(yīng)用場景里,貝葉斯定理扮演的角色就是,它能精準(zhǔn)地告訴我們,“微調(diào)”的幅度到底需要多大。它在新數(shù)據(jù)的啟發(fā)下不斷更新預(yù)測,并聰明地兼顧到了一個現(xiàn)實情況,也就是,無論是觀測數(shù)據(jù)還是原始預(yù)測,都是不完美的。我們可以利用它來編寫出一套算法,從而找到那個最佳預(yù)測。
極其成功的‘卡爾曼濾波’技術(shù)也運用了同樣的理念,即系統(tǒng)性地將系統(tǒng)已有認(rèn)知與源源不斷的數(shù)據(jù)流結(jié)合起來。該技術(shù)最初是為了追蹤衛(wèi)星而發(fā)明的,如今卻已普及到了千家萬戶,廣泛應(yīng)用于包括飛機導(dǎo)航系統(tǒng)和你口袋里的智能手機在內(nèi)的無數(shù)設(shè)備中。這種想法還進(jìn)一步被應(yīng)用在了現(xiàn)代機器學(xué)習(xí)領(lǐng)域,其中復(fù)雜的神經(jīng)網(wǎng)絡(luò)正是在海量(且可能并不完全可靠的)數(shù)據(jù)的“投喂”下不斷接受訓(xùn)練,從而學(xué)會去執(zhí)行各種五花八門的任務(wù)。
可以毫不夸張地說,我們?nèi)缃竦默F(xiàn)代世界,正是建立在貝葉斯定理及其無數(shù)神奇應(yīng)用的基礎(chǔ)之上!
作者:Chris Budd
翻譯:LogicMoriaty
審校:virens
原文鏈接: &
fu
li
shi
jian
今天我們將送出由中信出版集團提供的《統(tǒng)計的藝術(shù)》。
![]()
這是一本不需要數(shù)學(xué)背景,卻能讓你在人工智能時代保持清醒的“認(rèn)知工具包”。英國皇家統(tǒng)計學(xué)會前會長施皮格爾霍爾特,用日常的生動案例,剝開數(shù)據(jù)迷霧,拆解因果關(guān)系,教你識別陷阱、提出關(guān)鍵問題、做出更優(yōu)決策。在人工智能不斷改變世界的今天,我們更需要統(tǒng)計學(xué)的底層素養(yǎng),作為理解世界不確定性、應(yīng)對噪聲的思維方式——拉開認(rèn)知差距,從擁有統(tǒng)計思維開始。
【互動問題:玩游戲抽卡、排隊或者平時碰運氣的時候,你有沒有遇到過類似‘連出10次正面’這種極其邪門、讓你甚至懷疑‘系統(tǒng)一定動了手腳’的經(jīng)歷?可以分享一下嗎?】
請大家嚴(yán)格按照互動:問題答案的格式在評論區(qū)留言參與互動,格式不符合要求者無效。
截止到本周四中午12:00,參與互動的留言中點贊數(shù)排名第二、三、五的朋友將獲得我們送出的圖書一套(點贊數(shù)相同的留言記為并列,并列的后一名次序加一,如并列第二的后一位讀者記為第三名,以此類推)。
為了保證更多的朋友能夠參與獲獎,過往四期內(nèi)獲過獎的朋友不能再獲得獎品,名次會依次順延
*本活動僅限于微信平臺
編輯:姬子隰
翻譯內(nèi)容僅代表作者觀點
不代表中科院物理所立場
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.