加載中........
×

想要建立預測模型,統計方法怎麽選?

2019-12-11 作者:李侗桐   來源:醫咖會 我要評論0
Tags: 預測模型  

是否要建立預測模型?

預測模型是基於變量之間的相關關係,通過一個或幾個變量預測另一個變量的分析方法。我們可以根據自變量(預測變量或解釋變量)預測因變量(應答變量或結局變量)。比如,通過久坐時長預測受試者的血液膽固醇濃度,或者根據受試者的年齡、性別、BMI等變量信息預測高血壓病發病情況。此外,預測模型還可以幫助我們判斷各自變量的重要性,即自變量對因變量的解釋能力。舉例來說,預測模型可以用來分析學曆對收入的解釋程度。示例如下:



根據因變量類型選擇檢驗方法

1 連續變量

確定因變量是連續變量後,我們需要判斷自變量的數量,示例如下:



1.1 隻有一個自變量

簡單線性回歸。該檢驗可以基於一個連續型自變量對相應的連續型因變量進行預測,也可以評價自變量對因變量的解釋力度。

1.2 包含多個自變量

多重線性回歸。該檢驗可以通過多個自變量對相應的連續型因變量進行預測,也可以評價自變量對因變量的解釋力度。

2 計數變量

泊鬆回歸。該檢驗適用於分析因變量是計數變量的多因素預測模型。

注:計數變量是一個非負整數。比如,0、5、16、27是計數變量,但是2.7、5.8、18.2不是,因為它們不是整數;-2、-7、-15也不是,因為它們小於0。

計數變量不屬於我們常用的變量分類,常被視為連續變量納入分析。當計數變量比較大,多數數值超過40時,我們可以將其作為連續變量。但是當計數變量比較小,如多數數值小於10時,我們建議保留其計數變量屬性,避免統計偏倚。計數變量示例如下:

菌群數量,培養基暴露24小時後可觀察到的菌群數量

死亡人數,隊列中每年因吸煙死於肺癌的人數

癲癇發作次數,受試者在一周內的癲癇發作次數

就診人數,某私人診所每天上午9:00-9:30的就診人數

3 有序分類變量

有序多分類logistic回歸。該檢驗適用於分析因變量是有序分類變量的多因素預測模型。比如,通過年齡和收入兩個變量對生活滿意度(非常不滿意、不滿意、一般、滿意、非常滿意)進行預測分析。

4 二分類變量

二分類logistic回歸。該檢驗適用於分析因變量是二分類變量的多因素預測模型。

5 無序分類變量

無序多分類logistic回歸。該檢驗適用於分析因變量是無序分類變量的多因素預測模型。



小提示:78%用戶已下載梅斯醫學APP,更方便閱讀和交流,請掃描二維碼直接下載APP

隻有APP中用戶,且經認證才能發表評論!馬上下載