五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

統(tǒng)計(jì)學(xué)知識大梳理(三)

2022-11-08 17:02 作者:bili_74204057874  | 我要投稿

統(tǒng)計(jì)量及其抽樣分布

?

抽樣容易理解,抽樣分布不容易理解。

?

抽樣是從整個(gè)研究中抽取一部分個(gè)體作為我們真正的研究對象。我們可以簡單地把樣本理解為整體的一個(gè)子集,并通過樣本的結(jié)果來推斷整體情況。例如,我們想知道中國成年男性的平均身高。理論上最準(zhǔn)確的方法是調(diào)查中國所有成年男性的身高,然后計(jì)算平均值。顯然,沒人做過。在實(shí)踐中,我們總是選擇一些人,然后計(jì)算出這些人的平均身高。從這個(gè)平均高度,我們可以估計(jì)出總的平均高度。

?

了解抽樣,然后了解抽樣分布。誰是抽樣分布的分布?答案是樣本統(tǒng)計(jì),例如樣本均值或樣本比率。以樣本均值為例,一般來說,樣本均值的抽樣分布如何。這里,樣本平均數(shù)被視為一個(gè)隨機(jī)變量。我們最想讓你記住的是,樣本均值是一個(gè)隨機(jī)變量,但對于初學(xué)者來說,這是違反直覺的。

?

為什么樣本均值可以看作一個(gè)隨機(jī)變量?因?yàn)闃颖揪等Q于樣本計(jì)算:每組樣本都可以計(jì)算出一個(gè)樣本均值,而這些樣本均值多少會有所不同。因此,樣本均值會隨樣本的不同而隨機(jī)變化。然而,在現(xiàn)實(shí)生活中,我們通常只取一組樣本,計(jì)算一個(gè)樣本的平均值。因此,我們會覺得樣本的平均值是不變的。

?

這一章節(jié),需要大家掌握幾個(gè)核心概念:

?

  • 統(tǒng)計(jì)量

  • 抽樣

  • 抽樣分布

?

參數(shù)估計(jì)

?

在大學(xué)開學(xué)時(shí),學(xué)習(xí)數(shù)理統(tǒng)計(jì)變得越來越困難。在學(xué)習(xí)的過程中,可以說就像吞下了沒有理解的棗子。但現(xiàn)在,經(jīng)過長時(shí)間的實(shí)踐,我們對統(tǒng)計(jì)學(xué)知識有了更深的認(rèn)識。

?

統(tǒng)計(jì)推斷,老實(shí)說,有兩件事。首先,參數(shù)估計(jì)。第二,各種類型的假設(shè)檢驗(yàn)。在這里學(xué)習(xí),如果你做數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí),你會強(qiáng)烈意識到數(shù)據(jù)挖掘和統(tǒng)計(jì)之間存在著無數(shù)的聯(lián)系。

?

參數(shù)估計(jì),顧名思義,就是估計(jì)參數(shù)。什么是參數(shù)?如果你假設(shè)分布的參數(shù),也就是說,你認(rèn)為或知道一個(gè)隨機(jī)過程服從什么分布,但你不確定它的參數(shù)是什么,你應(yīng)該怎么做?你抽樣,取很多樣本(實(shí)際值),通過這些樣本的值來估計(jì)參數(shù)的分布就是參數(shù)估計(jì)。

?

這一章節(jié),需要大家掌握幾個(gè)核心概念:

?

  • 參數(shù)

  • 點(diǎn)估計(jì)

  • 區(qū)間估計(jì)

?

?

?

假設(shè)檢驗(yàn)

?

如上所述,統(tǒng)計(jì)推斷需要理解兩件事,一是參數(shù)估計(jì),二是假設(shè)檢驗(yàn)。

?

什么是假設(shè)檢驗(yàn)?說白了,假設(shè)檢驗(yàn)就是先猜測總體的一個(gè)參數(shù)值,然后用樣本數(shù)據(jù)檢驗(yàn)參數(shù)值的準(zhǔn)確性。

?

Abtest方法在網(wǎng)絡(luò)生產(chǎn)實(shí)踐中經(jīng)常被應(yīng)用到假設(shè)檢驗(yàn)的思想中。

?

舉一個(gè)簡單的例子:

?

學(xué)而思在線學(xué)校應(yīng)用程序已經(jīng)過修訂和迭代,現(xiàn)在有以下兩個(gè)版本

?

版本1:首頁為一屏課程列表?

版本2:首頁為信息流

?

如果要區(qū)分這兩個(gè)版本,用戶更喜歡哪個(gè)版本,轉(zhuǎn)化率會更高。我們需要對整體(所有用戶)進(jìn)行評估,但并不是所有現(xiàn)有用戶都會訪問應(yīng)用,每天都會有很多新用戶加入,所以我們不能對整體(所有用戶)進(jìn)行評估,我們只能從整體用戶中隨機(jī)抽取樣本(訪問應(yīng)用的用戶)進(jìn)行分析,使用樣本數(shù)據(jù)性能作為總體數(shù)據(jù)性能來評估哪個(gè)版本的轉(zhuǎn)換率更高。

?

這一章節(jié),需要大家掌握幾個(gè)核心概念:

?

  • 假設(shè)檢驗(yàn)

  • P值

?

免責(zé)聲明:部分文章整合自網(wǎng)絡(luò),因內(nèi)容龐雜無法聯(lián)系到全部作者,如有侵權(quán),請聯(lián)系刪除,我們會在第一時(shí)間予以答復(fù),萬分感謝。


關(guān)于統(tǒng)計(jì)學(xué),今天就分享到這里。如果內(nèi)容對你有幫助,希望大家不要吝嗇點(diǎn)個(gè)贊哦,我們會繼續(xù)給大家輸出更多優(yōu)質(zhì)內(nèi)容~

最后,祝大家科研順利!如果你想了解更多關(guān)于統(tǒng)計(jì)學(xué)的知識,可以掃碼關(guān)注下哦~


統(tǒng)計(jì)學(xué)知識大梳理(三)的評論 (共 條)

分享到微博請遵守國家法律
广宗县| 瑞安市| 上林县| 延边| 安宁市| 衢州市| 邵阳市| 垦利县| 班戈县| 宝兴县| 荥经县| 伊金霍洛旗| 高碑店市| 库车县| 遵义市| 宿迁市| 平阴县| 什邡市| 东阿县| 丽江市| 吉林市| 廉江市| 石河子市| 合川市| 衡水市| 黎川县| 巴彦县| 高阳县| 柳江县| 吴旗县| 准格尔旗| 金乡县| 开阳县| 喀什市| 沁源县| 建宁县| 甘孜| 永宁县| 平塘县| 延边| 崇明县|