五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

結(jié)合案例說說Tobit回歸模型

2021-09-28 16:20 作者:SPSSAU官方賬號  | 我要投稿

一、tobit模型

在某些情況下,被解釋變量Y的取值范圍會受到限制,比如研究家庭醫(yī)療保險支出的影響因素時,某此家庭沒有醫(yī)療支出即數(shù)字全部為0,也或者研究家庭收入水平時,某些樣本家庭完全沒有收入那么收入就全部為0,也或者數(shù)據(jù)調(diào)查中有一項(xiàng)為收入為10萬以上,那么10萬以上的具體數(shù)據(jù)就‘截尾’(沒有10萬以上,最多就到10萬),又比如研究存款的影響因素,但是有的樣本存儲為負(fù)數(shù)(即其為負(fù)債非存儲),諸如此類,按常理應(yīng)該是正常的正態(tài)數(shù)據(jù),但是其被解釋變量出現(xiàn)‘?dāng)鄬印▌h失),均可使用tobit模型進(jìn)行研究(而不是常用的ols線性回歸)。

特別提示:

  • 刪除數(shù)據(jù)分為兩類,分別是‘左刪失leftcensor’和‘右刪失rightcensor’。上述中小于等于數(shù)字0即為左刪失,10萬即為右刪失;

  • SPSSAU默認(rèn)支持左刪失和右刪失的設(shè)置,如果不設(shè)置,則其完全等于普通ols線性回歸。

二、案例分析

以下介紹使用SPSSAU-在線SPSS分析工具做tobit回歸模型。

1、背景

當(dāng)前有一項(xiàng)關(guān)于工資影響因素的研究,被解釋變量為ln工資,解釋變量為年齡,是否結(jié)婚(數(shù)字1代表結(jié)婚,數(shù)字0代表未結(jié)婚),子女?dāng)?shù)量,受教育年限共4個。被解釋變量ln工資為工資取對數(shù),如果沒有工資則為數(shù)字0。明顯的,類似這樣的數(shù)據(jù)應(yīng)該使用ols線性回歸,但考慮到數(shù)據(jù)中有很多工資為0(即沒有工資),此時就可考慮使用tobit模型更加適合。為更加方便的查看被解釋變量的數(shù)據(jù)分布情況,將ln工資作直方圖如下:

從上圖可以明顯的看到,數(shù)字出現(xiàn)刪失,即有一部分?jǐn)?shù)據(jù)集中在數(shù)字0。當(dāng)然在分析的時候可考慮篩選出數(shù)字大于0的數(shù)據(jù)再進(jìn)行ols線性回歸也可(但這樣做會減少樣本利用率),如果說篩選出ln工資大于0后再做直方圖如下:

明顯的可以看到,篩選出ln工資大于0的數(shù)據(jù),其明顯的服從正態(tài)分布,使用ols線性回歸非常適合。正因?yàn)榇?,tobit目的在于解釋‘刪失或受限’的數(shù)據(jù)情況。本案例使用tobit回歸模型研究年齡,是否結(jié)婚,子女?dāng)?shù)量,受教育年限共4項(xiàng)對于ln工資的影響情況。

2、?理論

Tobit回歸模型用于解決‘刪失/受限被解釋變量’這種問題,如果被解釋變量中的數(shù)據(jù)有出現(xiàn)‘刪失/受限’,此時進(jìn)行ols回歸并不科學(xué)。刪失分為兩種,分別是‘左刪失leftcensor’和‘右刪失rightcensor’,如果說小于等于某個數(shù)字的數(shù)據(jù)‘不正?!ㄗ髣h失leftcensor),也或者大于等于某個數(shù)字的數(shù)據(jù)‘不正?!?右刪失rightcensor),此時均可使用Tobit模型。

3、?操作

本案例操作截圖如下:

本案例中有左刪失數(shù)據(jù),且leftcensor為0,因此在‘LeftCensored’中輸入數(shù)字0,本案例數(shù)據(jù)并沒有右刪失值,因此不設(shè)置‘RightCensored’。

4、?SPSSAU輸出結(jié)果

SPSSAU共輸出4類表格,分別是Tobit回歸模型似然比檢驗(yàn),Censor數(shù)據(jù)樣本匯總,Tobit回歸分析結(jié)果匯總和Tobit回歸分析結(jié)果匯總-簡化格式。說明如下:

5、文字分析


上表格展示Tobit回歸模型似然比檢驗(yàn)結(jié)果,其一般用于判斷模型是否有意義,原理上Tobit模型使用極大似然法進(jìn)行計(jì)算,因而可對似然比檢驗(yàn)結(jié)果進(jìn)行關(guān)注。從上表可知,似然比檢驗(yàn)的p值為0.000<0.05,即說明放入4個解釋變量對于模型有幫助,即說明模型構(gòu)建有意義。


上表格展示刪失數(shù)據(jù)的分布情況。共有2000個樣本,本案例設(shè)定左刪失leftcensor為數(shù)字0,上表格展示出共有657個樣本為左刪失數(shù)據(jù)(即在657個樣本數(shù)據(jù)小于等于數(shù)字0),比例為32.85%,沒有設(shè)置右刪失rightcensor,則沒有右刪失數(shù)據(jù)。


上表格展示出tobit回歸模型擬合結(jié)果。模型公式為:ln工資 = -2.808 + 0.052*年齡 + 0.484*是否結(jié)婚 + 0.486*子女?dāng)?shù)量 + 0.115*受教育年限。模型的McFadden?R?方為0.064,即意味著4個解釋變量對于工資的解釋力度為6.4%【特別提示:通常情況下對此指標(biāo)的關(guān)注度較低】。

最終具體分析可知:

年齡的回歸系數(shù)值為0.052,并且呈現(xiàn)出0.01水平的顯著性(z=9.078,p=0.000<0.01),意味著年齡會對工資產(chǎn)生顯著的正向影響關(guān)系,年齡越大工資越高。是否結(jié)婚的回歸系數(shù)值為0.484,并且呈現(xiàn)出0.01水平的顯著性(z=4.677,p=0.000<0.01),意味著是否結(jié)婚會對工資產(chǎn)生顯著的正向影響關(guān)系,即相對未婚群體,已婚群體的工資明顯更高。子女?dāng)?shù)量的回歸系數(shù)值為0.486,并且呈現(xiàn)出0.01水平的顯著性(z=15.329,p=0.000<0.01),意味著子女?dāng)?shù)量會對工資產(chǎn)生顯著的正向影響關(guān)系,子女?dāng)?shù)量越多的群體工資收入越高。受教育年限的回歸系數(shù)值為0.115,并且呈現(xiàn)出0.01水平的顯著性(z=7.617,p=0.000<0.01),意味著受教育年限會對工資產(chǎn)生顯著的正向影響關(guān)系,即受教育年限越多的群體工資收入會越多。

總結(jié)分析可知:年齡, 是否結(jié)婚, 子女?dāng)?shù)量, 受教育年限共4項(xiàng)均會對工資產(chǎn)生顯著的正向影響關(guān)系。


上表格展示出Tobit回歸模型的簡化結(jié)果表格,該表格列出模型的關(guān)鍵信息點(diǎn),可直接使用。

6、?剖析

提示‘沒有uncensored數(shù)據(jù)’,如果設(shè)置leftcensored或rightcensored后,導(dǎo)致未刪失數(shù)據(jù)個數(shù)為0,則會出現(xiàn)此提示。

三、疑難解惑

1、Tobit回歸時的模型似然比檢驗(yàn)不通過,顯示模型無意義?

Tobit回歸模型用于解決有刪失數(shù)據(jù)的樣本,當(dāng)然也可考慮使用ols回歸(此時不考慮刪失數(shù)據(jù)這一問題),與此同時,也可考慮先篩選過濾掉刪失數(shù)據(jù),然后再進(jìn)行ols回歸。建議可對比ols回歸和tobit回歸的結(jié)果,綜合進(jìn)行判斷。

2、McFadden?R?方非常低?

Tobit回歸時McFadden?R?方的意義相對較小,一般不用過多關(guān)注此指標(biāo)。


SPSSAU數(shù)據(jù)科學(xué)分析平臺-讓數(shù)據(jù)分析非常簡單。

結(jié)合案例說說Tobit回歸模型的評論 (共 條)

分享到微博請遵守國家法律
游戏| 盐山县| 平凉市| 和龙市| 轮台县| 昂仁县| 潮安县| 湖州市| 高碑店市| 德格县| 长垣县| 乌拉特后旗| 黑龙江省| 乌审旗| 清镇市| 沙湾县| 娄烦县| 梧州市| 临汾市| 理塘县| 黔江区| 武城县| 阿瓦提县| 韶山市| 台东县| 宜都市| 宁强县| 秭归县| 泌阳县| 民勤县| 马龙县| 遵化市| 浙江省| 淮阳县| 安远县| 双牌县| 镇远县| 布尔津县| 嘉兴市| 石景山区| 新昌县|