從範例較容易瞭解假設檢定的概念,舉例如下,便利商店經理根據財務分析,認為若顧客平均每次消費金額高於$170,發行NFC卡將可以獲利。 假設每次消費金額是常態分佈,標準差為$65。 現以400人進行取樣,發現樣本算術平均數(sample mean)為$178。 便利商店經理是否能夠推論發行NFC卡可以獲利?
使用區間來估計未知的母群體參數,以導出對於母群體的推論。 舉例,為了瞭解台北市民的平均月收入(假設有260萬人),挑選其中1000人,紀錄月收入的分佈,區間估計會推論台北市民的平均月收入在50000到70000之間。
隨機實驗 Random Experiment 會導致得到幾種可能的結果 (outcome) 之一的行動或程序。 舉例:擲銅板,可能的結果:正面、反面。 樣本空間 Sample Space 隨機實驗的樣本空間包含所有可能的結果。這些結果必須是 exhaustive 及 mutually exclusive。 樣本空間表示為 S = {O1, O2, ..., Ok} 舉例:擲骰子的樣本空間 S = {1, 2, 3, 4, 5, 6}
自我選擇取樣 (self-selected sampling) 舉例來說,參與call-in民調的電台聽眾,因為對於該議題感興趣而參與調查,這是聽眾的自我選擇。 這種取樣方式幾乎總是有偏差的。
區間資料 (interval data, quantitative data, numerical data) 實數 (real numbers)。 可以對區間資料進行各種運算。 類別資料 (nominal data, qualitative data, categorical data) 舉例來說,變數是班長候選人,值域為「沈佳宜」、「柯景騰」。 有時我們會為類別指定數值。以上例而言,可以指定「沈佳宜」為1,「柯景騰」為2。
政治言詞、廣告主張、對公共議題的辯論——數字用來證明觀點或加強論據,我們每天都遭數字圍攻。利用數據來為某個目標爭論的人,是要支持那個目標,可不見得會很小心地引用數字,甚至不一定誠實。
瀑布中的一滴水滴,你知道它最終會流過河川、匯入大海,但是此時此刻,你卻難以精確地預測這個水滴下一秒鐘會是在河流或是瀑布中的什麼位置。這個觀察告訴了我們,我們可以看得見長期的趨勢,但是微觀的下一秒鐘,我們卻怎麼樣也難以窺見其變化,因為需要考慮的因素太多:水的流量、地形的細微變化、氣候、溫度等等都讓我們對於一個水滴走向的預測無法精準。