關閉

媒體本是中道力量、社會的良知良心,也是公眾的守護者。《東方報》自九十六年八月一日創刊迄今(前身東方快報),六十多位員工在自己的工作崗位上兢兢業業,只為守護花蓮這塊美麗的土地和善良的人民。尤其《東方報》為善盡社會公器責任,發揚人性光明面,堅持不刊登害人的「地下錢莊廣告」、「六合彩賭博廣告」 及「色情廣告」。 
「雖小道,必有可觀者焉。」《東方報》是花蓮地區一家屬於「社區性」的報紙媒體,每日以八個大版刊登花蓮縣及十三個鄉鎮市的新聞,豐富的、完整的、深度的將全縣新聞呈現出來。而本人也特別要求《東方報》編、採同仁務必秉持「四不原則」∣「不捲入」、「不介入」的採訪和報導心態,提供讀者一個「不加工」、「不加料」的新聞議題,希望提供閱讀公眾一個純淨的新聞報導。  
花蓮是一處充滿「傳媒傳奇」的山城,實際居住人口不到卅萬,產業經濟及文化藝術相對的貧瘠、落後,但是地方媒體竟如此的「蓬勃發展」!因此在花蓮地方媒體充斥的當下,《東方報》將繼續走自己的正路,並堅持扮演社會的良知良心。(社長 林裕勳)

東方報

地址:花蓮縣花蓮市富吉路99號 電話:03-8561858

關於東方報
[東華大學專欄] 常態分布的前世與今生 列印
作者是 user   
週四, 11 一月 2018 08:28

資料提供/東華大學應數系王家禮教授  資料整理/記者江思婷

在現今大數據時代,最熱門的行業當屬資料分析師(舊稱統計顧問),這類工作薪酬驚人、環境優越,令人羨慕。然而,這個行業的始祖亞伯拉罕 • 德莫維爾 (Abraham De Moivre, 1667 - 1754) 卻是在十八世紀初期倫敦一處黑暗且髒兮兮的地方工作。在這家稱為“屠夫咖啡”(Slaughter's Coffee)的店裡,來自法國的新教徒難民德莫維爾為了微薄的酬金,幫賭徒們計算各類賭博遊戲的下注策略和勝率。

機率學裡的二項分佈可以用來解決諸如“如果一個公平的硬幣被投擲100次,那麼獲得60次或更多次正面的機率是多少”的問題。詳細說來,我們可以使用以下公式來計算N次互相獨立且相同的實驗中,得到n次成功的機率:

其中N是實驗的次數(100),n是成功的次數(60),並且p是成功的機率(0.5)。因此,要解決這個問題,你要計算得到60次正面的機率,然後計算61次,62次等的機率,並把所有這些機率加起來。想像一下,在計算器和計算機出現之前,必須花多長時間來計算二項式機率。

由於經常被要求做這些冗長的計算。德莫維爾發現,當實驗(硬幣投擲)次數增加時,二項分布的形狀接近非常平滑的曲線。

他推斷,如果能夠找到這條曲線的數學表達式,他將能夠解決諸如從100次硬幣投擲中計算出現60次或更多次正面的機率之類的問題。他發現的曲線現在被稱為“常態曲線”。

圖1中平滑曲線是常態分布,它非常接近於藍線高度所代表的二項機率,而他推導出用來近似前述機率的公式為:

德莫維爾,常態曲線的原創者,是公認為一位有能力的數學家。他在英國期間當選英國皇家學院的院士,也是牛頓的親密友人。牛頓晚年曾經叫請教他數學問題的人去找德莫維爾,他說:他比我更了解所有這些東西。英國數學家皮爾森 (Karl Pearson) 曾試圖描述德莫維爾的工作情景:”他坐在屠夫咖啡館的角落裡計算,幾個落魄的賭徒圍在他身邊等著答案。這時一輛皇家馬車來到咖啡館前,牛頓跳下車,走進咖啡館,穿過一群醉漢和賭徒去找他的朋友。這景象無疑地可以成為一幅生動的畫。”

儘管一生窮困,德莫維爾持續研究機率論和數學領域直到去世。相傳他隨著年齡的增長,變得愈來愈昏昏欲睡。他注意到每天需要多睡15分鐘,於是正確地計算出他死亡的日期,也就是需要24小時睡眠的那一天。這是一個我們熟知的等差級數公式簡單但是悲傷的應用。

在德莫維爾過世20多年後,他的同胞,有法國牛頓之稱的數學家皮爾-賽蒙 •拉普拉斯 (Pierre-Simon Laplace, 1749 -- 1827) 也推導出了相同的機率分佈。因此,這個結果有時也被稱為de Moivre-Laplace定理。拉普拉斯很有可能知道德莫維爾的工作,但並沒有提及屬於德莫維爾的原創性貢獻,也許是因為德莫維爾與賭博的關係,也許是因為德莫維爾是逃離法國的新教徒,或者是因為拉普拉斯的偉大作品大多是總結了上個世紀發展的數學和科學,且習慣性的不提前人的貢獻。

常態曲線的重要性主要來自與許多自然現象驚人的吻合或相似。常態分布的第一個應用是分析天文觀測中的測量誤差,這種誤差是由於儀器和觀測者的不完善而產生。伽利略在17世紀時指出,這些錯誤是對稱的,小錯誤比大錯誤發生得更頻繁,這個現象導致了幾個錯誤的假設。直到19世紀初卡爾 • 高斯 (Carl Gauss, 1777 -- 1855) 推導出常態分佈的公式,才證明了這種錯誤其實符合常態分佈。標準常態分佈(平均值是0,變異數為1)的公式如下:

19世紀中期,著名的物理學家麥克斯韋(Maxwell)證明,常態分布不僅僅是一個方便的數學工具,而且也可能出現在物理現像中。同一時期,統計學家也發現人類的特徵,如身高,體重和力量等,符合常態分布。表一為有名的實例顯示常態分佈高度的準確性:

在高斯之後,拉普拉斯隨即提出了中央極限定理(Central Limit Theorem),進一步鞏固了統計常態分布的重要性。這個重要的定理說明:即使樣本母體分布不是常態分布,從中重複抽樣得到的樣本平均值之分佈將會非常接近常態分布,樣本量愈大,分布愈接近常態分布。這提供了抽樣調查統計結果的可信度。好比用從抽樣調查中取得的勞工平均薪資幫助我們了解勞工收入的現況。具體來說,令母體樣本的平均值為µ,變異數是 σ2,Xn 是n個樣本的平均值。那麼Xn的機率分布將隨著n增加而收斂到標準常態分布:

自德莫維爾開始,常態分布已被冠上許多不同的名稱,如錯誤定律,拉普拉斯第二定律,高斯定律等等。常態的含義其實是正交而不是“通常”。然而,到了19世紀末,一些作者使用常態分布名稱時,將“常態”一詞當作形容詞,表示這種分布是典型的、普遍的,因此是“正常的”。20世紀初,皮爾森把”常態“作為這種分布的名稱推廣普及。事實上,把拉普拉斯 - 高斯曲線稱為常態曲線容易誤導人們相信其他的機率分布在某種意義上具有“異常”的缺點。

由於中央極限定理指出當樣本數愈大的時候,用常態分布來估計愈準確,這正好符合了當今大數據時代的特性。因此,常態分布和中央極限定理在資料分析的重要性可說是方興未艾。

最後值得一提的是高斯是有史以來最偉大的數學家之一。著名數學史學家貝爾(Bell)在他1954年出版的“數學家”(Men of Mathematicics)一書中名為“數學王子”的章節中寫道:阿基米德,牛頓和高斯,這三人是人類史上最偉大的數學家。他們自成一格,不是我們凡人可以評頭論足式地按優劣排序。這三人在純數學和應用數學方面都開啟了劃時代的風潮。阿基米德對純數學的熱愛勝過對數學的應用;牛頓為他的數學發明找到主要的科學用途;高斯則宣稱,無論從事理論還是應用方面的數學工作,他都是一以貫之。