<acronym id="kc8mo"></acronym>
<acronym id="kc8mo"><center id="kc8mo"></center></acronym>
st
當前位置:首頁> 經典論文欣賞 > t檢驗,你真的用對了嗎?——論文發表中的一些問題

t檢驗,你真的用對了嗎?——論文發表中的一些問題

小白學統計2020-12-04 07:13:33

t檢驗大概是流傳最廣泛、應用最多的一種統計方法了,不管是在統計學界還是臨床中,t檢驗幾乎無人不知無人不曉。而與此相對應的是,t檢驗大概也是應用錯誤最多的方法之一了。

據本人多年審稿經驗,直至今日,t檢驗應用依然錯誤百出,有時確實令人納悶。因為其實這些都是完全可以避免的,可為什么還存在這么多誤用呢?我想,統計學的正確推廣應用還是路漫漫而任重。

本文結合審稿中的一些現象,說明t檢驗應用中常見的一些錯誤,旨在為臨床醫生提個醒,盡量避免一些可有可無的錯誤。

從筆者審稿情況來看,t檢驗應用常見的問題主要有以下幾種:

1)不考慮數據的正態性,只要是兩組比較就直接用t檢驗。

2)將t檢驗用于多組的兩兩比較,增加假陽性錯誤。

3)不考慮資料是否獨立,采用獨立資料的t檢驗分析非獨立數據。

下面通過3個例子來說明這幾個問題。

1:某研究探討血清腫瘤標記物在肺癌診斷中的意義,對肺癌組與肺良性病變組、健康體檢組血清腫瘤標記物CEA、CA199的水平進行比較(表1)。該研究采用t檢驗分別對其中的任意兩組進行比較。

1 肺癌組與肺良性病變組、健康體檢組血清腫瘤標記物CEACA199

組別

例數

CEA

CA199

肺癌組

173

51.32±8.31a

23.11±2.50a

肺癌

28

17.99±5.05

30.44±10.28

鱗癌

100

69.45±13.57b

24.59±2.94

小細胞癌

45

31.70±7.91b

18.05±4.21

肺良性病變組

99

5.10±8.31d

13.11±1.17d

健康體檢組

42

3.01±0.27

10.37±0.81

注:與肺良性病變組比較,aP<0.05,與鱗癌組比較;bP<0.05,與小細胞癌比較;cP<0.05,與健康體檢組比較,dP>0.05。(此處為作者原文標注)

案例分析:本研究為三組定量資料的比較,且肺癌組還包含三個亞組。研究者直接采用t檢驗分別對其中任意兩組進行比較,這種做法的直接后果就是增加假陽性錯誤,可能導致本來沒有統計學意義的結果變得有統計學意義,從而產生虛假結論。

建議:該研究為多組獨立資料的比較,如果數據服從正態分布且方差齊,建議選用方差分析進行多組間比較,如果多組間差異有統計學意義,再進一步采用兩兩比較的專用方法進行多重比較(兩兩比較方法的選擇將另文詳述)。

專門針對醫生的建議:不知道兩兩比較該怎么做,最好找統計學家。

2為了研究內皮素(ET)與先心病室缺伴肺高壓的關系,選擇無肺高壓的先心病室缺患者為對照組;另選先心病室缺且患有重度肺高壓的患者為觀察組。于術前24h、術后24 h72 h測定血漿中ET含量。作者在方法學部分提到所有數據用t檢驗處理。

2 手術前后血漿中ET濃度的變化

分組

術前24小時

術后24小時

術后72小時

對照組

54.82±14.62

53.14±9.32

51.65±14.87

觀察組

75.50±14.62*

62.56±15.27*#

65.65±16.51*#

注:* 與對照組比較P<0 05;#與術前24 h比較P<005

案例分析:該資料很具有代表性,很多臨床研究都是如此,分幾組,然后在不同時間點觀察療效。此類資料盡管是兩組,但兩組的資料是3次重復測量的數據,術前24小時、術后24小時和術后72小時三個時間點的測量值之間可能具有一定的相關性,即非獨立數據,這一資料實際上是兩組重復測量資料。由于數據非獨立,因此不宜采用獨立樣本的t檢驗,否則容易增加假陽性。

對于此類資料,很多臨床醫生習慣做法是:對每個時間點,分別進行t檢驗,然后對每個時間點分別說明有無差異等。這種做法并不是很合理,現在很多雜志已經要求此類資料應該選擇用重復測量方差分析了。

建議:選用重復測量方差分析,同時分析資料的組間差異和時間點差異,還可分析組別與時間點的交互效應,探索隨時間的變化趨勢等。

專門針對醫生的建議:此類資料,直接找統計學家分析,別自己浪費時間了。

3:某研究探討護理干預對肺癌患者癌性疲乏和生活質量的影響,通過比較護理干預前后各指標值的變化,分析護理干預的作用。文章對所有定量指標全部采用配對t檢驗進行比較。這里列出惡心嘔吐這一指標作為示例(表3)。

3 護理干預前后指標值的變化

指標

干預前

干預后

惡心嘔吐

11.79±17.01

10.16±12.57

案例分析:從表3結果來看,該指標的標準差大于均值,數據很可能是偏態的(當然并不是一定,但起碼值得懷疑),而文章并未報道數據的分布情況,尤其是沒有說明前后差值是否滿足正態性,而直接采用配對t檢驗,忽略了配對t檢驗應用的前提條件。

建議:首先應對該指標進行正態性檢驗,如果前后差值服從正態分布,可以采用配對t檢驗,否則應考慮采用Wilcoxon配對秩檢驗。

專門針對醫生的建議:此類資料比較簡單,可以自己做。如果對非正態數據不知道如何處理,找統計學家幫忙。

捷报比分