本帖最後由 felicity2010 於 2014-3-20 09:54 AM 編輯 5.39.217.76* B) c9 y( Y1 G% d3 K1 D
公仔箱論壇: |6 h) W/ J* a; I3 }4 [, w
練乙錚: 打棍無效:網小子放倒「巨人」張志剛公仔箱論壇3 E1 w3 {9 L2 i( Y$ P, O
7 J* |) @0 E; E J" \3 M5.39.217.76tvb now,tvbnow,bttvb1 H: }* {4 l/ Y6 D' P
知識不等於力量,但如果缺乏知識,就可以很悲慘。無論在哪裏,若統治階級充斥不學無術之輩,社會大方向要出問題。這裏說的知識,當然不是「公婆皆可有理」的看法認知,而是客觀的學問。如果不僅是不學無術,還是別有心術的話,這個統治階級無可藥救。 $ g6 t1 W2 ]2 A% ]- y9 g公仔箱論壇 ) c ~# N, V3 r1 ^5 b. o* L6 q( g: U$ B( T8 _1 c/ K3 M% ^& z. l
臥虎藏龍* |1 f6 k* \/ a. ^/ T
. a( y2 S6 Z' E( |8 [$ e- X0 u公仔箱論壇政改攤牌漸近,當權派集結力量圍攻鍾民調。先是政協委員、恒地副主席李家傑發飆,公開指摘鍾氏經常在關鍵時刻發布對特府或北京不利的民調結果,操弄民意,為反對派開路。跟着,梁派網站《港人講地》發表編輯室文章〈解開特首民望「不合格」之謎〉,指鍾氏在最近的一個關於特首民望的民調裏取巧運用數據說謊,把一個好端端成績亮麗的特首說成多數人視為「不合格」。然後,梁派悍將、行會成員張志剛高調發言並在本周二《明報》撰文,引用上述網文核心內容,質問鍾氏「六成二給特首打50分或以上說明什麼?」【註1】tvb now,tvbnow,bttvb; H1 h% @2 h+ c K! u. S. m. N
; q- g6 l9 w, D$ b0 Z8 D' ~結果,「六成二給特首打50分或以上」說明了《港人講地》編輯室文章有「小小」搞錯了基本統計方法,而「國師」張志剛懵然不知(?)並加小手腳發揮,結果鬧大笑話。公仔箱論壇" M& T: T. f' M M0 l" ]
# u; F |& D* |& L. C& a5 Stvb now,tvbnow,bttvb最先指出《港人講地》文章和張志剛說法有好幾個嚴重初等錯誤的,是一篇又一篇的網上及新媒體文章,作者都懂統計,卻是傳統媒體裏不見經傳的業餘評論者,可謂小孩大衞打死巨人高利亞,亦可謂:網絡世界,臥虎藏龍。本文將這些材料整理,歸納所指出的謬誤,並加若干己見,給大家參考。 " F# I# h7 N7 E4 ?8 t& J: Atvb now,tvbnow,bttvbTVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。' @5 }. S7 @$ Z
首先指出,張志剛文章(下稱「剛」文)的標題數字「62%」,與《港人講地》編輯室文章(下稱「講」文)同源,是一個發水或抽水幾近一倍的數字。「抽水」是指抽了民調回應者當中大批態度完全中立人士的水,把他們捆綁到梁特的支持者那邊,便成功創制出上述那個發水標題數字。過程中,還擅自替民調加上一個不適當的概念,對所導致的矛盾和足令梁特尷尬的結論卻諱莫如深。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。: V- j. J5 J) j" _/ m2 a$ g
5.39.217.765 i2 W5 f P- e
" T* n% u+ q+ x$ d- R: v+ Q公仔箱論壇以上問題是聚焦於特首的支持度,量度分數是由最低的0分至最高的100分,即是總共有101個潛在得分(0,1,2,3,...98,99,100)。而50分剛好是中間點,但根據問題的措辭,50分只是代表「一半半」,沒有任何暗示這是一個合格的最低門檻。 8 w& n6 S8 v. \公仔箱論壇TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。2 W S1 L3 A1 c% G# A! c, _# n
關於港人講地和張志剛聲稱,有61.8%的被訪者評特首50分或以上。但經過筆者分析,這所謂61.8%的比例是來自將選擇50分的被訪者納入50分或以上的組別。但筆者可以告訴讀者,這分組步驟已犯上統計錯誤,因為這種方法可能會令到結果出現頗大偏差(Bias)。tvb now,tvbnow,bttvb8 i% s0 g9 t$ O2 b- ~+ d
9 g" e4 o; F( l. {5.39.217.76以今次民調爭議為例,總評人數是998,包括383人評50分以下,280人評50分,和335人評50分以上。港人講地和張志剛將選擇評分的人分為兩組:0-49分和50-100分。但大家要留意0-49分只有50個選擇分數,而50-100分卻有51個選擇分數,這方法明顯給予50-100分的組別優勢了。但如果我們將分組改為0-50分和51-100分,這又會令0-50分的組別佔有優勢了。總言之,組別的處理方法是可以令到計算組別內的人數出現明顯分別,最終令結果出現偏差。公仔箱論壇* i4 F$ p/ q5 W; r( A
公仔箱論壇% i8 I. w( |* j( r
附表分別採用以上兩種方法去做分組。另外,筆者會使用一個常用的統計方法去處理這分組問題,從而得到一個較客觀和準確的答案。從附表中,讀者可以看到將評50分的人數納入其中一組會帶出截然不同的結論──將0-50分作為一組,即是將評50分的人數納入其中,結果將變為66.4%的被訪者評0-50分,與港人講地和張志剛的38.37%有明顯差距,這正好引證偏差對整個民調的影響。6 |+ Y% n, Z& s% B- E7 a
公仔箱論壇# t! N: V) f" X2 \( i
在統計學上,要妥善解決以上的偏差問題非常簡單。只要將一半評50分的人數放至0-50分組別,而另外一半的人數放在50-100分組別。這方法主要是平衡兩個組別的人數,以免出現過份偏差的情況(讀者可以參考ThomasWonnacott和Ronald Wonnacott的"Introductory Statistics For Business and Economics"(Fourth Edition)第二章腳註一)。如果利用這個「平均分配」的方法去處理分組,最終的答案仍是50分或以下的組別佔過半的百分比(52.4%),反映特首的支持度評分不是太理想。" H. g5 U+ f. p# V
: r' K' w3 |1 [, v6 s
至於特首的平均分被拖低的問題,筆者同意港人講地和張志剛的論點,但我們分析的角度是有分別。他們認為太多人給予極端評分令到平均分下降是主因。從數學推論,這點是正確。但如果港大民研採用的民調方法是符合統計標準,這些極端評分也是反映香港人的民意。想想如果反對派投訴有太多人給予極高評分於特首,拉高了平均分,我們是否認為極高評分也是極端評分呢?對民意分析員來說,極高和極低的評分也是重要的統計資料。 $ {: V1 M% I3 H( N6 Z) W8 `公仔箱論壇5.39.217.764 |( c0 K/ h. Z' E# E
但一旦出現很多人選擇極高或極低評分,以平均分來分析民意的變化的確不是一個最好的指標。原因是評分分佈不是一個正態分佈(Normal Distribution)。因此,更好的「中間位指標」可以考慮採用中位數(Median)或眾數(Mode)等統計指標,筆者提議港大民研在發佈民調結果時可以同時公佈中位數和眾數,務求令公眾有更多資料以了解特首的支持度。以這次民調的數據為例,中位數和眾數均是50分,較平均分47.5分只高了2.5分。tvb now,tvbnow,bttvb7 K& R7 |8 K( u B& e
tvb now,tvbnow,bttvb, R$ @2 V' v4 K( h: ?0 l7 H
另一個處理方法是剔除極高或低評分部份,從而計算「截尾均值」(Trimmed mean)。筆者(關焯照)在中大任教時,也曾負責老師的課程評價(course evaluation)。在報告老師的課程評價時,筆者會同時公佈兩組結果:用所有學生的評分計算平均分和剔除極端評分後的截尾均值,老師可以參考兩組結果從而改善教學技巧。 ) p4 b' G4 {7 [: \TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。 - {( U2 E1 i3 X& b l; B# X民調是一個非常有用的統計學方法了解公眾的觀感(gauge public perception),但一旦在計算上出現如港人講地和張志剛等犯上的初級統計錯誤,便很容易得到錯誤的結論,大家應該引以為誡。5.39.217.768 d# l5 q, w! J
公仔箱論壇% }0 h9 o# m; M S