[時事討論] 練乙錚: 打棍無效：網小子放倒「巨人」張志剛

本帖最後由 felicity2010 於 2014-3-20 09:54 AM 編輯 tvb now,tvbnow,bttvb8 i) h; [# p2 }7 A9 y4 L% n3 H1 C
" u' X5 p/ Z/ ^  }
練乙錚: 打棍無效：網小子放倒「巨人」張志剛. `! P5 p0 U, c( L  W3 ~+ l
5.39.217.766 }7 U0 U2 C" h+ E5 \& R/ z0 R" R4 P" q
5.39.217.76: q5 s& U! Q' v+ s7 a$ q1 ?$ |% z
知識不等於力量，但如果缺乏知識，就可以很悲慘。無論在哪裏，若統治階級充斥不學無術之輩，社會大方向要出問題。這裏說的知識，當然不是「公婆皆可有理」的看法認知，而是客觀的學問。如果不僅是不學無術，還是別有心術的話，這個統治階級無可藥救。
7 {9 x  X0 q# Z; k

臥虎藏龍3 p$ U. x( F7 {2 }6 l; q/ }/ n

政改攤牌漸近，當權派集結力量圍攻鍾民調。先是政協委員、恒地副主席李家傑發飆，公開指摘鍾氏經常在關鍵時刻發布對特府或北京不利的民調結果，操弄民意，為反對派開路。跟着，梁派網站《港人講地》發表編輯室文章〈解開特首民望「不合格」之謎〉，指鍾氏在最近的一個關於特首民望的民調裏取巧運用數據說謊，把一個好端端成績亮麗的特首說成多數人視為「不合格」。然後，梁派悍將、行會成員張志剛高調發言並在本周二《明報》撰文，引用上述網文核心內容，質問鍾氏「六成二給特首打50分或以上說明什麼？」【註1】2 T+ [# n: d4 B2 v& l

結果，「六成二給特首打50分或以上」說明了《港人講地》編輯室文章有「小小」搞錯了基本統計方法，而「國師」張志剛懵然不知（？）並加小手腳發揮，結果鬧大笑話。
5.39.217.76% _4 x$ c9 _% c/ t) R; F6 h, h: [
最先指出《港人講地》文章和張志剛說法有好幾個嚴重初等錯誤的，是一篇又一篇的網上及新媒體文章，作者都懂統計，卻是傳統媒體裏不見經傳的業餘評論者，可謂小孩大衞打死巨人高利亞，亦可謂：網絡世界，臥虎藏龍。本文將這些材料整理，歸納所指出的謬誤，並加若干己見，給大家參考。6 x" d) q" L- \: Y1 {/ G0 m! _
5.39.217.76! E3 K1 [" o& c. K
首先指出，張志剛文章（下稱「剛」文）的標題數字「62%」，與《港人講地》編輯室文章（下稱「講」文）同源，是一個發水或抽水幾近一倍的數字。「抽水」是指抽了民調回應者當中大批態度完全中立人士的水，把他們捆綁到梁特的支持者那邊，便成功創制出上述那個發水標題數字。過程中，還擅自替民調加上一個不適當的概念，對所導致的矛盾和足令梁特尷尬的結論卻諱莫如深。

  t# y  [% |4 n# x
張志剛的「62%」發水近一倍
公仔箱論壇8 n/ ]. S  Y$ }3 W% Y( D9 ^5 v
在港大鍾氏民調裏，特首「民望」數字的給定範圍是0-100，內含101個整數，50分居中。訪問到的998個回應者當中，有383個給特首打的分數低於50分，280個50分，335個高於50分。鍾民調事先給受訪對象說明：
5.39.217.76- N* v1 r" ~2 T! L" U) X
「0分」為「絕對唔支持」，「50分」定義是「一半半」， 100分則為「絕對支持」。5.39.217.76& u, [+ ]7 h  z: E
0 H8 I; ]/ u$ s/ F  |4 T- d+ M

tvb now,tvbnow,bttvb2 F# ^: p. d* P" z( d
因此，對統計者而言，必須嚴格尊重那280個打50分者的中立態度，既不能把他們擺到383個不支持者那邊，亦不可將他們與335個梁特支持者放在一起；但是，「講」文捆綁抽水好自便，把打50分或以上的訪問對象加在一起（「一半半」+支持），一算：（280+335）/998= 62%，好亮麗！公仔箱論壇+ X3 g- Y6 t' p3 f3 @7 V) c. F
tvb now,tvbnow,bttvb' P9 u+ P  k7 U; k
然後張志剛就用這個數字說事，雄辯地問：這個數字「是合格還是不合格？」tvb now,tvbnow,bttvb* M4 x* _1 d8 U0 i$ }

這就有趣了。因為這個算法如果說明特首民望是「嚴重地合格」，那麼，我們同樣可以把那280個態度中立打50分的受訪者加到「不支持者」那邊（「一半半」+唔支持），算出（280+383）/998= 66%。那不就表示梁特民望應該是「更嚴重地不合格」了麼？5.39.217.76/ S4 E3 j+ w1 ~: T

5.39.217.767 \# Q7 k0 _7 `% p9 l
矛盾兼尷尬！正如一篇網文題目所說：「你玩統計，統計玩你」。【註2】
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。- k2 K& G% d+ b2 G
任何公平的統計人，不會像「講」文那樣，抽那些回應「一半半」的態度中立人士的水，而只會用335/998= 34%這個數字，代表在原始數據裏支持梁特的回應者比率。這個數字，固然比不上發水幾近一倍的「62%」，與不支持梁特的回應者比率383/998= 38%相比，也差一截。如此，張志剛更應該雄辯地問問自己：34%這個數字，「是合格還是不合格？」+ `$ ]" e5 I6 H8 F( M

為何說事者可如此便給，大抽態度中立人士的水？因為中間做了幾近無縫的概念轉移。tvb now,tvbnow,bttvb3 S3 I9 u9 ?4 d6 s

政治態度中立→「合格」→「支持」

大家如果留意，當可察覺「講」、「剛」二文其實歪曲了該次鍾民調裏的「50分」的定義，把政治態度上的中立（「一半半」）巧妙地改成「合格」。然而這個民調裏的50分，並非是一個「合格線」。
, [& q. V/ a' u4 n( h
5.39.217.762 j/ F3 g4 S1 V) b/ {. q0 j
「合格」的標準人人不同。例如，筆者當年念的大學，合格線因教授而異；念津貼小學的時候，學校的合格分數是60%；中學則是40%，入讀後，老父不滿名校的標準反而那麼低，筆者卻認為好得很，因為可減輕功課做不好給老父指罵時的「殺傷力」。
5 Z5 K+ M& f5 k
然而，更重要的是，合格和支持不支持，其實沒有必然關係──例如，某醫學院專科生以40.1%的分數合格畢業，你支持不支持這位仁兄當你的心臟手術醫生？
公仔箱論壇+ D; @7 }% e) a4 G: p2 u+ Q
4 O) l/ o! b3 u" `
「講」、「剛」二文先將「50分」擅自定義為「合格」（與民調對象回答問卷時的指定意義不同），然後再把這個他們引入的「合格」概念等同民調裏的「支持」，這般偷換概念之後就可靜雞雞進行上述捆綁抽水。如此，「剛」文就可大剌剌地說：「評50分以上的比率就是62%，比49（分）以及以下的38%，多出一大截。」（注意：「50分以上的比率是62%」起碼應該是「50分或以上」罷？但連這個「或」字也省掉了。）如此逐步深入細緻地做群眾的思想擺布工作，不是第一次，大概也不會是最後一次。

事實上，港大民研計劃已再三聲明，「50分」與「合格」完全無關，指的是態度上的中立。當然，可以有另外的民調專講合格不合格，但這個梁特民望民調本身不適宜講，硬要講，就會出現上面的既矛盾也讓梁特相當尷尬的結論。這個民調只研究特首民望的平均分數高低；得出一個平均分數之後，合格與否，讀者可憑個人喜好各自解讀。大概有些人，就算梁特民望拿個1分平均分，也會認為他是合格的；邏輯上，這沒有問題，但如果濫用民調原始資料特別炮製一個「62%」來說事，就有問題。: f; W9 X% U: i8 ~- b

剔除給0分的！保留給100分的！

' l( ]. m6 m- @8 J* T' ^
所說何事呢？原來，「講」、「剛」二文說，既有「62%」這個亮麗數字，而鍾民調最後竟把梁特的平均民望評分算為47.5，必是因為鍾民調沒有把打0分的那些「極端分子」──即統計學上說的「離群數據」（outliers）──剔除。於是，他們就可結論：鍾民調不科學。這裏有三個問題。tvb now,tvbnow,bttvb  B/ c6 r  r3 ~2 {! Y4 @; g
9 @) V* w& |: K
首先，如果要剔除給0分者，也應該剔除給100分者罷？但張志剛口中振振有辭的那個發水「62%」，卻隱蔽地包含了29個「100分」；這是「打茅波」。0 O: o# o% W. i

其次，已經有專家算出，把回應分數最高和最低的10%（含所有「0分」和「100分」）都剔除後，梁特民望平均值也好不了多少：48.1分，救不了他；用張志剛的話說，依然「不合格」。如此，大動干戈為的顯然不是兩個平均分48.1- 47.5 = 0.6分之差，因為「剛」文對此提都不提。那麼，要剔除91個「0分極端分子」，目的何在？不外起哄，令不諳統計學的人「覺得」鍾民調無理。但請繼續看無理的是誰。
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。5 L/ {8 t4 R5 l) v  P

第三，回應分數值既限在整數0與100之間，而0與100分在民調裏都有清楚而具體定義，那麼，根本就不應剔除回應值為0或100的那些數據，因為那些數據已經不能算是「離群數據」，而是民調設計者特別指明、更要知道的數據；理論上，0分甚至可能是對象回應中的一個「眾數」（mode）而意義尤其重要【註3】。tvb now,tvbnow,bttvb8 m! o% J) ]# y# K, r' y
2 T' V! x. t% e' R' D) d
事實上，在該項民調裏，給0分的91個回應，佔998人的幾乎10%，相當於給50分的280個回應人數的三分之一；這許多回應者，怎可以看成都是該從統計數字裏「槍斃」掉的呢？就看未加權的評分分布，我們也可以猜到，這個分布是雙眾數的（bimodal distribution），兩個眾數分別為280分和0分，因為的確有很多人對梁特極之不滿；若取消了這部分人的數據，那就不是今天的香港了。統計學不應、也不允許那樣搞出河蟹。* B! h& G$ z6 t% b% p+ s
: X1 w3 }- z9 b' N9 w8 l
由此看出，不科學的不是鍾民調，而正正是《港人講地》編輯室和張志剛。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。# m. Q3 \4 M* {* V
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。6 e* O0 [) [% N6 P' ?* J

心術問題之外還有技術問題tvb now,tvbnow,bttvb* B; q; }6 M) I- p* F2 K

「講」、「剛」二文，還犯了一個技術性錯誤：「62%」這個數字，是拿了鍾民調的原始數據做了小手腳就急不及待用來說事的結果，不知道人家有統計學的章法，就是對原始數據適當加權，之後才能用以作統計運算和分析。這裏說的「加權」指什麼？tvb now,tvbnow,bttvb' ?# R2 T. T/ ?7 i, i+ J

大家知道，民調研究的對象人口總數太多，不能全部訪問，只能抽樣取板（sampling），但每一個隨機樣板中的個體特徵分布如年齡、性別等，都不能準確反映總人口中的已知分布，此即所謂的「樣板誤差」；如果所調查的民意（如對梁特的態度）與年齡、性別等特徵有關，樣板便需加工，而統計學用的標準加工工序，是一個加權工序。筆者借用近日一篇網上流傳很廣、署名SweetSourPork（「咕嚕肉」）的《輔仁網》文章裏的具體解釋，稍作修改如下：公仔箱論壇( J. ^. \4 ]2 ^' f  v

「如果今次電話訪問，有41.5%嘅受訪者係男性，但係原來香港人口有45.4%嘅人係男性，比受訪者入面嘅男性多，咁我哋就要將樣板入面嘅男性嘅比重加多啲，平衡番，等數據可以代表香港市民。」【註4】

不做這個加權工序，樣板誤差可令民調的統計分析毫無意義。這是民調統計ABC。「咕嚕肉」於是用了鍾民調的原始數據並作適當加權，重新再算一遍，證明鍾民調算出的梁特評分平均數47.5沒有錯，錯的是這裏又犯了基本統計方法大漏的《港人講地》和張志剛：那個已經包含抽水、概念僭建兼打茅波的「62%」，也是未經加權處理的（雖然因為前三個犯規動作太大太離譜，這第四個謬誤相對而言已顯得不那麼重要）。

大家看看，一個飽含四個大錯漏那麼豐富的「數字」，尊貴的行會成員視為至寶，雄辯滔滔用來攻擊對準鍾民調。那不是很可笑嗎？這種學養的人，放在本朝特府內外「智庫」裏打棍子很稱職，安插在行會，則說到底有損其他大部分成員的面子和心理。

港大民意研究計劃成立於1991年，二十多年來，鍾民調的學術功架已經十分嫻熟，任憑當權派怎樣抹黑，亦不能把他撼倒。最近這次圍剿攻勢，網民當中的專家見招拆招，已經代為瓦解。正如筆者早前提到，鍾民調完全有資格成為香港又一尊屹立不倒的圖騰。
如何看待富二代發飆？tvb now,tvbnow,bttvb& a+ r& D( K* `" ^% M

筆者說過，資本家依法營商便是無咎，發表政治表態言論，更是他們的自由；如果是全國政協委員，黨國對他們更有政治表態的期望。這類表態，愈沒有道理支撐的，價值愈高，因為愈能示「忠」。無徵而信，無論是在天國裏還是在天朝裏，回報都特別豐厚。

作者為《信報》特約評論員TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。6 ]! ?9 O2 G, W7 I
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。8 k( h) v  u) ^3 z7 N/ k* y
3 E1 I5 P! E& a- w& P
【註1】李家傑言論見http://zh.wikipedia.org/wiki/李家傑。《港人講地》編輯室文見http://speakout.hk/index.php/2013-11tvb now,tvbnow,bttvb+ n' J  D; @" y. o1 z  q, [! r
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。9 e% B6 {+ w3 A! r
-04-09-33-03/2013-12-21-08-43-26/1424-2014-03-14-10-38-16。張志剛文見http://news.mingpao.com/20140318/msa.htm。# o+ a: w) _2 o0 ]* G, _" B
【註2】見「陳電鋸」的文章http://www.chainsawriot.com/archives/9292；此文用另一統計加權方法（iterativesample bootstrapping），算出梁特的平均評分為46.3，比鍾民調的47.5稍低。公仔箱論壇7 k0 l- J% v. y4 T$ H, W
【註3】關於離群數據，網文〈勿因蟲廢言〉, Q3 _% g% g3 d  c5 @8 O2 w
有很好的討論：http://aloneinthefart.blogspot.co.nz/2014/03/blog-post_15.html；作者指出，一般而言，問卷回應若不設有效頭尾限（例如100與0）而是可以正負很大數以至無限的話，離群數據才有明顯的潛在不良作用，應該剔除。文章分析頭頭是道，明顯很在行；其上篇更值得看。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。6 F6 c% k& U- s: I7 c% a# t
【註4】「咕嚕肉」文章〈港大民研特首評分係「被拉高」還是「拉低」？〉，用典型香港話寫，解釋統計過程深入淺出，見http://www.vjmedia.com.hk/articles/2014/03/15/66322。不過，文章的加權評分分布圖所表達的概念不對──應該是加權在人而不是加權在分，雖然算出的總平均分一樣是對的。
. o% v" k$ Z, ~! m, m7 L% {0 ^5 g
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。0 G, Q% r  J- D. r$ q! w5 Z. p

J8 u. U' e# d) \ _2 x/ P F+ O

2 t; p' p9 N5 i I

收藏分享評分

回復引用

訂閱 TOP

felicity2010

親王

Rank: 17

2^#

發表於 2014-3-20 09:52 AM | 只看該作者

六成二給特首打50分或以上說明什麼！／文﹕張志剛公仔箱論壇; Q' {0 X# @: W, F( p) T1 r" F
6 w/ M) c) m( X4 `4 w

明報
2014年3月18日
5.39.217.76- @9 r! k! p* c7 o( J7 N9 A. c
8 y0 K  \4 V, G$ Y
【明報專訊】陳莊勤先生在2月8日於《明報》以〈沉默的螺旋〉為題撰文，對現時中大亞太所和港大民意研究計劃所做的特首評分提出質疑。重點就是機構只公布平均分，但打分分數的分佈卻不清楚，只靠一個平均分，根本無法知道事情的真象。而本人上周撰文，指出單靠一個平均數，其實就是瞎子摸象。一般的研究，除了平均數之外，多會公布眾數（最多人打的分數）、中位數，以及50分以上的比率。當時本人大膽推測，眾數和中位數都是50，給特首打50分或以上的應該超過一半。文章見報當日，港大民意研究計劃也公布了最新的一次特首的評分，評分為47.5，而港大也第一次以附錄形式把所有評分的原始數據同時公布，這也是解決了陳莊勤和本人過去一直提出的質疑。因為附錄必須要以SPSS軟件才能打開，一般媒體都不具備這種統計分析的專用軟件，所以沒有引起廣泛關注和報道。當我們打開這個原始數據檔案時，馬上真相大白。陳莊勤不用估，本人也不用猜。/ W! V$ f& i. U' F8 v  S. L! U+ A+ t! ^7 j

! S; g% _: t$ I9 |  V4 O0 ?% a' c: G
　港大首次公布所有原始數據公仔箱論壇$ q0 r+ c3 `4 h6 r5 I- j

　港大把給0分到100分的頻率全部公開，可以說是非常公開透明。為方便表述解釋，現把分數組合成10分一組，一共10組，評分分佈見附圖。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。' o/ U. M# _7 B, v
* J' n* P( H5 O. V
　經運算之後，得出這樣的結果。平均分是47.5，眾數是50，中位數也是50，給50分或以上的高達61.8%。看完那些評分分佈以及這4個重要指標，我們不需要再瞎子摸象，象的形狀完全出現於我們眼前了！TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。% A- X3 s: `2 C& |

　平均分是47.5，一般人的印象就是不合格！但如果看50分以上和以下的比例，在那998個給特首打了分數的人，有28%的人打了50分，給50分以上的有34%，那評50分以上的比率就是62%，比49以及以下的38%，多出一大截。當62%香港市民給特首打50分或以上時，這是合格還是不合格？一些聳人聽聞的講法，例如民望破產之類，又從何說起。( t  n/ V6 a. A8 @' v. ^" K
5.39.217.764 S) s5 u; m1 m$ f3 M
　把平均分拉到只有47.5分，最大的原因是大約有9%的受訪者打了0分。本人之前撰文也解釋過，行政長官的施政有必然的兩面性，無論政策多好，都會有一些人不滿意。雙辣招有八成人支持，但還有兩成人反對，某程度是利益之爭，持有多個投資物業的人就不支持，地產經紀也不支持，迷信絕對自由市場的不支持。因為支持雙辣招而支持特首的，可能給60分，但反對雙辣招的就可能打0分。這種給行政首長的評分，就不能和讀書考試相比擬，資質良好、讀書用功的同學，可以科科取得優異成績，甚至做10A狀元。但行政首長推行政策，一定有得有失，結果也只會把平均分拉向中間。如果不看分佈和其他指標，就只會以偏概全，甚至錯下判斷。公仔箱論壇2 E) _& @6 U/ {) S& G8 k' _7 J% A
公仔箱論壇( D1 [& e" d$ H9 }- e
- D9 \& j5 L) P' x, Z. o" j
　極端10％主導輿情
tvb now,tvbnow,bttvb  i" u& X1 d1 K1 x
　除了看那50分和以上佔了62%的重要數據，我們不妨再把那10組的分數逐一研究，0分到9分的有10.5%，這是最極端反對梁先生的一群。但10到19分的卻只是1.8%，20到29分的也只有3.9%。從分佈來看，這不算是正常的分佈，有點「惡之欲其死」的味道，到30和40分的兩組，才回復正常，逐步回升到8.9%和13.1%。
6 u+ b2 I- O7 J- O( H1 |$ {
　給50分或以上的分佈，就算是正常分佈最多的是50到59分，佔了30.7%，愈高分數的比例愈低，逐步減少，沒有出現10分和20分組別近於斷層式的分佈。而這一成給予0到9分的群組，相信也是最主動發聲，最積極參與激烈行動的一群。當媒體的目光讓這一成人吸引，所謂輿情，便傾向了這最極端的10%。50分以上的組群，他們相對平和理性，政府施政，他們心中有數，但沒有參與激進的意見表達活動，他們就成為了沉默的大多數。但當大學訪問員來電時，他們就把自己的評價說出，但不幸的是，他們的評分又給那9%給零分的人拉低淡，如果沒有把所有得分公之於世的一日，這些沉默大多數的一群，永遠沒有見到「真象」的一日，也永遠讓那極端的10%去主導輿情，和代表民情！: a- K5 W/ }! Q' W! b! k) w
公仔箱論壇  D! o% H' K% U' d& U
　這種錯誤的代表，不僅是把民情扭曲，也形成了陳莊勤先生撰文中所提及的「白色恐怖的寒蟬效應」。支持梁先生的，支持特區政府的，都以為自己是少數，這令到他們變得沉默和冷漠，這也是反政府群體最希望見到的後果和現象。看完這堆港大公布的原始數字，真相大白於人前，支持梁先生的，支持特區政府的，不是少數！這說明過去一年半的政策走對頭，證明特區政府官員的「勤力用心」，市民是看在眼裏。
5.39.217.76! e+ c3 z! d* ^5 j% t
　如果要正確的政策可以走下去，可以開花結果有成績，不僅是需要市民打一個分數，更是要他們表達意見，更是要他們站出來！5 u, A4 W, d* r& G) {) t) w/ O
公仔箱論壇7 X. k/ J% V9 v3 N
　（文章僅代表個人立場）
8 t+ R9 i* U2 J2 g
　張志剛一國兩制研究中心總裁  h5 I; w$ n) L5 ~8 {" V

回復引用

TOP

felicity2010

親王

Rank: 17

3^#

發表於 2014-3-20 10:04 AM | 只看該作者

本帖最後由 felicity2010 於 2014-3-20 10:05 AM 編輯 2 f: j+ @0 j3 P# O! o; _

民調小學雞（關焯照　周文林　雷照盛）

; X: b' \. _- d' I1 Q

" w8 p" J$ @, r3 N! ^' ~; Q# q; S
■「港人講地」發表評論文章，質疑港大民調中特首評分為何不及格。

網站「港人講地」上周五的評論文章《解開特首民望「不合格」之謎》指出，根據港大民意研究計劃（下稱「港大民研」）公佈的最新民調結果和原始資料，在998個被訪市民中，有615人給予特首梁振英50分或以上的支持度評分，即是有61.8%的被訪者給予合格分數。因此，港人講地提出質疑，既然有超過六成人評特首的表現有50分或以上，為何特首評分又會不合格呢？另外，港人講地認為港大民研計算特首的支持度平均分只得47.5分，這個不合格的評分是由於有91個被訪者給予0分的極端評分，因此將特首的平均評分拖低。tvb now,tvbnow,bttvb+ Q) R- R9 E/ x1 ?
5 j: G" o7 Z, E2 [
在港人講地發表這評論文章後，身兼行政會議成員及一國兩制研究中心總裁張志剛接受電子傳媒訪問，以港人講地一文的論點抨擊港大民研的調查準確性，他更形容在不少極端評分的影響下，用平均分來評核梁振英表現，猶如瞎子摸象。; f+ S3 c( `' U/ a) k1 n+ N) K- @3 b
; @: _: D7 I8 T4 N4 l" K8 w. b+ I
筆者在電視的新聞環節和幾份本地報章也看到港人講地和張志剛的批評，認為他們的指控相當嚴重，給予市民的感覺是港大民研有意將特首的支持度平均分拉低，對一間已成立多年的大學民調機構而言，是極大的侮辱。公仔箱論壇4 I; e- B" }) ]8 L. o4 c, E
5.39.217.768 _, P0 j5 ]' R7 r+ Y' d- a$ K
筆者從事計量經濟研究，對統計方法頗有認識。因此對港人講地和張志剛的評論特別關心。既然港大民研已將民調的原始數據公開，作為學者，筆者認為有責任去仔細分析這份數據，以解釋疑團。
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。' B, {1 K4 S6 x7 t" l4 q: u) P
經過基礎的數據分析，竟然發現港人講地和張志剛均犯上一個非常初級的統計錯誤。主要問題是兩者在處理「中間點」50分數據時，在分組（grouping）上出現錯誤。首先，讀者可以細閱以下港大民研被質疑的民調問題：「而家想請你用0-100分評價你對特首梁振英的支持度，0分代表絕對唔支持，100分代表絕對支持，50分代表一半半，你會畀幾多分梁振英呢？」4 s+ u6 q8 R; b3 I+ G* l7 e; C
5.39.217.76/ V  E  x- \! ^* A% M9 u8 b
以上問題是聚焦於特首的支持度，量度分數是由最低的0分至最高的100分，即是總共有101個潛在得分（0,1,2,3,...98,99,100）。而50分剛好是中間點，但根據問題的措辭，50分只是代表「一半半」，沒有任何暗示這是一個合格的最低門檻。TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。( F1 x; j$ n3 ~$ m
4 h1 X4 q4 c2 X2 z! M5 y! s  o
關於港人講地和張志剛聲稱，有61.8%的被訪者評特首50分或以上。但經過筆者分析，這所謂61.8%的比例是來自將選擇50分的被訪者納入50分或以上的組別。但筆者可以告訴讀者，這分組步驟已犯上統計錯誤，因為這種方法可能會令到結果出現頗大偏差（Bias）。
5 u8 {3 d, k( z& N) x& i
以今次民調爭議為例，總評人數是998，包括383人評50分以下，280人評50分，和335人評50分以上。港人講地和張志剛將選擇評分的人分為兩組：0-49分和50-100分。但大家要留意0-49分只有50個選擇分數，而50-100分卻有51個選擇分數，這方法明顯給予50-100分的組別優勢了。但如果我們將分組改為0-50分和51-100分，這又會令0-50分的組別佔有優勢了。總言之，組別的處理方法是可以令到計算組別內的人數出現明顯分別，最終令結果出現偏差。
TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。& B) M# Q$ f# h5 _. {/ X4 N
附表分別採用以上兩種方法去做分組。另外，筆者會使用一個常用的統計方法去處理這分組問題，從而得到一個較客觀和準確的答案。從附表中，讀者可以看到將評50分的人數納入其中一組會帶出截然不同的結論──將0-50分作為一組，即是將評50分的人數納入其中，結果將變為66.4%的被訪者評0-50分，與港人講地和張志剛的38.37%有明顯差距，這正好引證偏差對整個民調的影響。公仔箱論壇* H- V6 k  y; T* U! C# E# k& `# d

在統計學上，要妥善解決以上的偏差問題非常簡單。只要將一半評50分的人數放至0-50分組別，而另外一半的人數放在50-100分組別。這方法主要是平衡兩個組別的人數，以免出現過份偏差的情況（讀者可以參考ThomasWonnacott和Ronald Wonnacott的"Introductory Statistics For Business and Economics"（Fourth Edition）第二章腳註一）。如果利用這個「平均分配」的方法去處理分組，最終的答案仍是50分或以下的組別佔過半的百分比（52.4%），反映特首的支持度評分不是太理想。

至於特首的平均分被拖低的問題，筆者同意港人講地和張志剛的論點，但我們分析的角度是有分別。他們認為太多人給予極端評分令到平均分下降是主因。從數學推論，這點是正確。但如果港大民研採用的民調方法是符合統計標準，這些極端評分也是反映香港人的民意。想想如果反對派投訴有太多人給予極高評分於特首，拉高了平均分，我們是否認為極高評分也是極端評分呢？對民意分析員來說，極高和極低的評分也是重要的統計資料。5.39.217.76. j  J6 d# [) z/ J

但一旦出現很多人選擇極高或極低評分，以平均分來分析民意的變化的確不是一個最好的指標。原因是評分分佈不是一個正態分佈（Normal Distribution）。因此，更好的「中間位指標」可以考慮採用中位數（Median）或眾數（Mode）等統計指標，筆者提議港大民研在發佈民調結果時可以同時公佈中位數和眾數，務求令公眾有更多資料以了解特首的支持度。以這次民調的數據為例，中位數和眾數均是50分，較平均分47.5分只高了2.5分。tvb now,tvbnow,bttvb6 h8 }$ o3 H! T9 B! I1 l

另一個處理方法是剔除極高或低評分部份，從而計算「截尾均值」（Trimmed mean）。筆者（關焯照）在中大任教時，也曾負責老師的課程評價（course evaluation）。在報告老師的課程評價時，筆者會同時公佈兩組結果：用所有學生的評分計算平均分和剔除極端評分後的截尾均值，老師可以參考兩組結果從而改善教學技巧。公仔箱論壇6 @5 ?) V) ^1 T0 R, N2 h
5.39.217.76$ a8 j/ X8 B% N  p
民調是一個非常有用的統計學方法了解公眾的觀感（gauge public perception），但一旦在計算上出現如港人講地和張志剛等犯上的初級統計錯誤，便很容易得到錯誤的結論，大家應該引以為誡。

5.39.217.76" m# S' k! f9 E6 H) A
關焯照TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。3 ]8 e4 T% v$ W& z

經濟學家6 _6 z: M; O9 c* P* `! ^' A
冠域商業及經濟研究中心主任
5.39.217.769 T& A, r% @8 W; c5 \- ]

周文林TVBNOW 含有熱門話題，最新最快電視，軟體，遊戲，電影，動漫及日常生活及興趣交流等資訊。5 `9 ?9 O/ D' w. X6 {3 b5 z' d
6 z, ?8 g1 k+ O  n  A9 V# e) [
經濟學家公仔箱論壇* ?, }9 ]& ^+ |' |: J
冠域商業及經濟研究中心高級研究員5.39.217.76; y- M% b$ Z4 O. r7 c+ j) I% s, @

雷照盛
統計學家、港大統計及精算學系講師冠域商業及經濟研究中心研究員
5.39.217.76, R( a# @0 r* `( Z6 L: O7 p

回復引用

TOP

返回列表