五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

已知均值和標準誤,做bootstrap統(tǒng)計分析【錯題本】

2023-09-06 13:08 作者:米糊炒面吶吶吶  | 我要投稿

bootstrap分析的目的,應該是假定我們當前獲得的數(shù)據(jù)存在隨機取樣的誤差,推測真實值所在的位置后比較真實值和指定值是否有差異——因為我們不知道真實值,所以只能從手頭數(shù)據(jù)得到真實值的概率分布、然后通過比較真實值的概率分布與指定值的包含關系,確定真實值在多大概率上與指定值有差異。 已知n個人兩個條件的平均數(shù)據(jù)x_bar_i和**標準誤差sem_i** (i = 1, 2 為條件編號),想通過bootstrap方法判斷顯著性差異,即針對每個條件、在均值加減標準差的**隨機分布**里(這里假定隨機數(shù)據(jù)服從高斯分布),有放回隨機取樣數(shù)次(比如10000),每次都計算兩個條件的差值,最后得到兩個條件差值的分布,如果分布的95%置信區(qū)間(也就是從分布中尋找累積概率在2.5%-97.5%的數(shù)據(jù)范圍)包含零,則兩個條件沒有差異,如果不包含零,則在p = 5%的犯錯概率上有顯著差異。 遇到了一個問題:這個**隨機分布**的標準差,應該取sem_i還是n個人得到的標準差sd_i = sem_i*(n)^2呢? 錯誤答案:我一開始想,我們感興趣的是真實值,真實值的分布寬度(標準差SD_i)可以用樣本的分布寬度(sd_i)來估計,所以在做bootstrap隨機取樣的時候,應該使用樣本的分布寬度來替代真實值的分布寬度,所以應該選取sd_i。 然而,這個答案錯誤的地方是:手頭已有n個人的平均數(shù)據(jù)x_bar時,真實值服從的分布不是N(x_bar,sd_i^2),而是N(x_bar, sem_i^2)。 解釋: 這里有SEM(standard error of the mean)的數(shù)學推導, en.wikipedia.org/wiki/Standard_error#:~:text=for%20further%20discussion.-,Derivation,and%20some%20simple%20properties%20thereof.

推導結論:從某個正態(tài)分布N (mu, sigma^2)取樣n個點的話,這n個點的均值x_bar的分布是N (mu, sigma^2/n); SEM是均值x_bar的分布的標準差(standard deviation),也就是sigma/sqrt(n) 所以已知n個人的數(shù)據(jù)均值為x,SEM為sem的話,x則視為從均值分布中取出的一個點;從x推斷均值分布的中心位置應該服從分布N(x, sem^2);所以在做bootstrap的時候,要從N(x, sem_i^2)里頭取樣。 對應我自己的筆記微博:https://weibo.com/5896214783/Ni1x72nPC

已知均值和標準誤,做bootstrap統(tǒng)計分析【錯題本】的評論 (共 條)

分享到微博請遵守國家法律
石棉县| 康定县| 惠州市| 房产| 揭阳市| 全州县| 宜良县| 上林县| 璧山县| 高青县| 呼和浩特市| 定安县| 建始县| 轮台县| 中超| 长宁县| 南阳市| 建湖县| 胶州市| 吉安县| 原阳县| 舒兰市| 日喀则市| 莱州市| 仙居县| 通辽市| 屏山县| 加查县| 泰兴市| 阿荣旗| 土默特右旗| 明光市| 临汾市| 湛江市| 新疆| 从化市| 固安县| 兴山县| 两当县| 高平市| 旌德县|