港大民意研究計劃(下稱「港大民研」)的特首民調爭議越演越烈。網站「港人講地」和行會成員張志剛在這幾天仍在電子傳媒和報章發表批評,認為港大民研以評分計算民望的做法有問題。同時,將50分釐定為「一半半」可被一般市民視為合格分數,此外,將被訪者的評分劃分為「0至49分」、「50」及「51至100分」的概念,可能令問題含糊化。
首先,筆者寫這篇文章的目的是,(1)澄清一下做民調分析需要注意的地方,(2)希望避免民調結果的解讀產生誤解。
港人講地及張志剛猛烈批評的港大民研的民調問題是特首的支持度評分,其的內容是:「而家想請你用0-100分評價你對特首梁振英的支持度,0分代表絕對不支持,100分代表絕對支持,50分代表一半半,你會畀幾多分梁振英呢?」
港大民研是採用統計學上常用的等距量表(Interval Scale)的方法去量度特首的支持度(由最低的0分至最高的100分)。這種做法的好處是從得分上了解到市民支持特首的「程度」(附圖)。大家可以細想,有兩位被訪者給予的分數是51分和90分,顯然,評90分的被訪者的支持度遠較評51分的被訪者為高,但如果採用港人講地和張志剛的提議方法去分組,以50分為中間點分界,然後將0-49分和50-100分別釐定為「不合格」和「合格」,讀者便不能看到這兩個評分的差異了。
港人講地和張志剛的做法是將0至100分的範圍變換為兩個不同組別,「合格」與「不合格」。如果用統計學的說法,他們是用一個順序量表(Ordinal Scale)去將數據分類──即是變為分類數據。如果用以上例子,51分和90分是納入為同一組別(合格),但問題是51分和90分是分代表不同程度的支持,但在歸納組別過程(Aggregation)中,這種支持程度的差距便會被剔除,對研究者來說,這可視為流失了重要資料,最終令研究質量被拉低。
一個相關的難題是一旦採用港人講地和張志剛所提出的二元答案(合格和不合格)作為分析,在這情況下,問題的字眼和答案是需要修改。例如,問題可寫為:「你支不支持特首梁振英?」而答案分別是「支持」、「不支持」和「無意見」。一旦港大民研的問題重新改寫為港人講地和張志剛的問題格式,得出來結果(例如支持度的百分比)是極可能有差距,因為問題的本質和問法已不同,至於差距在統計學上是否有明顯分別,這便要用適當的統計方法去驗證了。
最後,另一個爭論點是50分是否一個合格分。單以民調的問題措辭,筆者看不到港大民研有任何表示50分是一個合格分數。至於「一半半」,是一個中性詞彙,可解讀為「中間點」、「一般」、「普普通通」等。然而港人講地和張志剛堅持認為50分是一般人理解為合格分數,這只是他個人意見,正確與否,學界自有公論。
現在整個港大民研的民調爭議只是各說各話,猶如雞同鴨講。但筆者要指出,做學術研究是需要保持嚴謹態度,無論從民調內容、樣本的收集方法和統計分析均要達到起碼的學術水平,這才能令人信服。
關焯照
經濟學家、冠域商業及經濟研究中心主任
周文林
經濟學家、冠域商業及經濟研究中心高級研究員
雷照盛
統計學家、港大統計及精算學系講師、冠域商業及經濟研究中心研究員