Kvantitatiivsed analüüsimeetodid: usaldusvahemike hindamine. Usaldusvahemiku tõenäosus ja usaldusvahemik Milline on usaldusvahemiku tõenäosus

Sageli peab hindaja analüüsima selle segmendi kinnisvaraturgu, kus hinnatav kinnisvara asub. Kui turg on arenenud, võib kogu esitatud objektide komplekti analüüsimine olla keeruline, seetõttu kasutatakse analüüsimiseks objektide valimit. See valim ei osutu alati homogeenseks, mõnikord on vaja see puhastada äärmuslikest punktidest - liiga kõrgetest või liiga madalatest turupakkumistest. Sel eesmärgil kasutatakse seda usaldusvahemik. Sihtmärk see uuring- viia läbi kahe usaldusvahemiku arvutamise meetodi võrdlev analüüs ja valida parim variant arvutused estimatica.pro süsteemis erinevate valimitega töötamisel.

Usaldusvahemik on valimi põhjal arvutatud atribuutide väärtuste intervall, mis teadaoleva tõenäosusega sisaldab üldkogumi hinnangulist parameetrit.

Usaldusvahemiku arvutamise mõte on koostada selline intervall näidisandmete põhjal nii, et antud tõenäosusega saab väita, et hinnangulise parameetri väärtus on selles intervallis. Teisisõnu sisaldab usaldusvahemik teatud tõenäosusega hinnangulise väärtuse tundmatut väärtust. Mida laiem on intervall, seda suurem on ebatäpsus.

Usaldusvahemiku määramiseks on erinevaid meetodeid. Selles artiklis vaatleme kahte meetodit:

  • läbi mediaani ja standardhälbe;
  • läbi t-statistika kriitilise väärtuse (Studendi koefitsient).

Erinevate CI arvutamise meetodite võrdleva analüüsi etapid:

1. moodustada andmeproov;

2. töötle seda statistilised meetodid: arvutage keskmine, mediaan, dispersioon jne;

3. arvutada usaldusvahemik kahel viisil;

4. analüüsida puhastatud proove ja saadud usaldusvahemikke.

1. etapp. Andmete valim

Valim moodustati süsteemi estimatica.pro abil. Valimisse kuulus 91 pakkumist „Hruštšovka“ tüüpi planeeringuga 1-toaliste 3. hinnatsooni korterite müügiks.

Tabel 1. Esialgne valim

Hind 1 ruutmeetrit, tk

Joonis 1. Esialgne proov



2. etapp. Algproovi töötlemine

Proovi töötlemine statistiliste meetodite abil nõuab järgmiste väärtuste arvutamist:

1. Aritmeetiline keskmine

2. Mediaan on valimit iseloomustav arv: täpselt pooled valimi elemendid on mediaanist suuremad, teised pooled on mediaanist väiksemad.

(paaritu arvu väärtustega proovi jaoks)

3. Vahemik - erinevus proovi maksimaalsete ja minimaalsete väärtuste vahel

4. Dispersioon – kasutatakse andmete varieerumise täpsemaks hindamiseks

5. Valimi standardhälve (edaspidi - SD) on kõige levinum näitaja, mis näitab korrigeerimisväärtuste hajumist aritmeetilise keskmise ümber.

6. Variatsioonikoefitsient – ​​peegeldab korrigeerimisväärtuste hajumise astet

7. võnkekoefitsient – ​​peegeldab valimi äärmuslike hinnaväärtuste suhtelist kõikumist keskmise ümber

Tabel 2. Algvalimi statistilised näitajad

Andmete homogeensust iseloomustav variatsioonikordaja on 12,29%, kuid võnketegur on liiga kõrge. Seega võime öelda, et algne valim ei ole homogeenne, seega jätkame usaldusvahemiku arvutamist.

3. etapp. Usaldusintervalli arvutamine

Meetod 1. Arvutamine mediaani ja standardhälbe abil.

Usaldusvahemik määratakse järgmiselt: minimaalne väärtus – mediaanist lahutatakse standardhälve; maksimaalne väärtus – mediaanile lisatakse standardhälve.

Seega usaldusvahemik (47179 CU; 60689 CU)

Riis. 2. Väärtused, mis jäävad usaldusvahemikku 1.



Meetod 2. Usaldusvahemiku konstrueerimine, kasutades t-statistika kriitilist väärtust (õpilaste koefitsient)

S.V. Gribovsky raamatus " Matemaatilised meetodid Omandi väärtuse hindamine" kirjeldab meetodit usaldusvahemiku arvutamiseks Studenti koefitsiendi abil. Selle meetodi abil arvutamisel peab hindaja ise määrama olulisuse taseme ∝, mis määrab tõenäosuse, millega usaldusvahemik konstrueeritakse. Tavaliselt kasutatakse olulisuse tasemeid 0,1; 0,05 ja 0,01. Need vastavad usalduse tõenäosusele 0,9; 0,95 ja 0,99. Selle meetodi puhul eeldatakse, et matemaatilise ootuse ja dispersiooni tegelikud väärtused on praktiliselt tundmatud (mis on praktiliste hinnanguülesannete lahendamisel peaaegu alati tõene).

Usaldusvahemiku valem:

n - valimi suurus;

t-statistika (Õpilaste jaotuse) kriitiline väärtus olulisuse tasemega ∝, vabadusastmete arv n-1, mis määratakse spetsiaalsetest statistilistest tabelitest või MS Exceli abil (→"Statistiline"→ TUDENG);

∝ - olulisuse tase, võta ∝=0,01.

Riis. 2. Väärtused, mis jäävad usaldusvahemikku 2.

4. etapp. Usaldusvahemiku arvutamise erinevate meetodite analüüs

Kaks usaldusintervalli arvutamise meetodit - läbi mediaani ja Studenti koefitsiendi - viisid intervallide erinevate väärtusteni. Vastavalt sellele saime kaks erinevat puhastatud proovi.

Tabel 3. Statistika kolme valimi kohta.

Indeks

Esialgne proov

1 variant

2. variant

Keskmine väärtus

Dispersioon

Coef. variatsioonid

Coef. võnkumisi

Vanade objektide arv, tk.

Tehtud arvutuste põhjal võime öelda, et erinevate meetoditega saadud usaldusvahemiku väärtused ristuvad, nii et saate hindaja äranägemisel kasutada mis tahes arvutusmeetodeid.

Siiski usume, et süsteemis estimatica.pro töötades on soovitav valida usaldusvahemiku arvutamise meetod sõltuvalt turu arenguastmest:

  • kui turg on väljakujunemata, kasutage mediaani ja standardhälbega arvutusmeetodit, kuna kasutuselt kõrvaldatud objektide arv on sel juhul väike;
  • kui turg on arenenud, rakenda arvutust läbi t-statistika kriitilise väärtuse (Studendi koefitsient), kuna on võimalik moodustada suur algvalim.

Artikli ettevalmistamisel kasutati järgmist:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matemaatilised meetodid vara väärtuse hindamiseks. Moskva, 2014

2. Süsteemiandmed estimatica.pro

SAGEDUSTE JA MURUDE KINNITUSVÄLJAD

© 2008

Riiklik Rahvatervise Instituut, Oslo, Norra

Artiklis kirjeldatakse ja käsitletakse sageduste ja proportsioonide usaldusvahemike arvutamist Wald, Wilson, Clopper - Pearsoni meetodite abil, kasutades nurkteisendust ja Waldi meetodit Agresti - Coull korrektsiooniga. Esitatud materjal annab Üldine informatsioon sageduste ja proportsioonide usaldusvahemike arvutamise meetoditest ning selle eesmärk on äratada ajakirjade lugejates huvi mitte ainult usaldusvahemike kasutamise vastu oma uurimistöö tulemuste esitlemisel, vaid ka erialakirjanduse lugemiseks enne tulevaste väljaannetega töö alustamist.

Märksõnad : usaldusvahemik, sagedus, proportsioon

Üks varasematest väljaannetest mainis lühidalt kvalitatiivsete andmete kirjeldust ja teatas, et nende intervallhinnang on eelistatavam punkthinnangule, et kirjeldada uuritava tunnuse esinemissagedust populatsioonis. Tõepoolest, kuna uuringud tehakse valimiandmete abil, peab tulemuste projekteerimine üldkogumile sisaldama valimi ebatäpsuse elementi. Usaldusvahemik on hinnatava parameetri täpsuse mõõt. Huvitav on see, et mõned arstide põhistatistika raamatud ignoreerivad täielikult sageduste usaldusvahemike teemat. Selles artiklis vaatleme mitmeid viise sageduste usaldusvahemike arvutamiseks, mis viitavad sellistele valimiomadustele nagu mittekordus ja representatiivsus, aga ka vaatluste sõltumatus üksteisest. Käesolevas artiklis ei mõisteta sagedust mitte absoluutarvuna, mis näitab, mitu korda konkreetne väärtus koondväärtuses esineb, vaid suhtelise väärtusena, mis määrab uuringus osalejate osakaalu, kellel uuritav tunnus esineb.

Biomeditsiinilistes uuringutes kasutatakse kõige sagedamini 95% usaldusvahemikke. See usaldusvahemik on ala, mille sisse tegelik osakaal langeb 95% ajast. Teisisõnu võime 95% usaldusväärsusega väita, et tunnuse esinemissageduse tegelik väärtus populatsioonis jääb 95% usaldusvahemikku.

Enamik meditsiiniteadlaste statistika käsiraamatuid teatab, et sagedusviga arvutatakse valemi abil

kus p on tunnuse esinemise sagedus valimis (väärtus 0 kuni 1). Enamik kodumaiseid teadusartikleid näitab tunnuse esinemissagedust proovis (p), samuti selle viga (s) kujul p ± s. Siiski on sobivam esitada 95% usaldusvahemik tunnuse esinemissageduse kohta populatsioonis, mis hõlmab väärtusi alates

enne.

Mõned juhendid soovitavad väikeste valimite puhul N – 1 vabadusastme puhul väärtus 1,96 asendada väärtusega t, kus N on vaatluste arv valimis. T väärtus leitakse t-jaotuse tabelitest, mis on saadaval peaaegu kõigis statistikaõpikutes. T-jaotuse kasutamine Waldi meetodi puhul ei anna nähtavaid eeliseid võrreldes teiste allpool käsitletud meetoditega ja seetõttu ei soovita seda mõned autorid.

Eespool esitatud meetodit sageduste või proportsioonide usaldusvahemike arvutamiseks nimetatakse Waldiks Abraham Waldi (1902–1950) auks, kuna selle laialdane kasutamine algas pärast Waldi ja Wolfowitzi avaldamist 1939. aastal. Meetodi enda pakkus aga välja Pierre Simon Laplace (1749–1827) juba 1812. aastal.

Waldi meetod on väga populaarne, kuid selle rakendamine on seotud märkimisväärsete probleemidega. Meetodit ei soovitata kasutada väikeste valimite puhul, samuti juhtudel, kui tunnuse esinemissagedus kipub olema 0 või 1 (0% või 100%) ning sageduste 0 ja 1 puhul on see lihtsalt võimatu. normaaljaotuse lähendus, mida kasutatakse vea arvutamisel, “ei tööta” juhtudel, kui n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Kuna uus muutuja on normaalse jaotusega, on muutuja φ 95% usaldusvahemiku alumine ja ülemine piir φ-1,96 ja φ+1,96 vasakult">

Väikeste valimite 1,96 asemel on N – 1 vabadusastmega soovitatav asendada t väärtus. See meetod ei anna negatiivseid väärtusi ja võimaldab sageduste usaldusvahemike täpsemaid hinnanguid kui Waldi meetod. Lisaks on seda kirjeldatud paljudes kodumaistes meditsiinistatistika teatmeteostes, mis aga ei ole toonud kaasa selle laialdast kasutamist meditsiiniuuringutes. Usaldusvahemike arvutamine nurkteisendusega ei ole soovitatav 0-le või 1-le lähenevate sageduste korral.

Siinkohal tavaliselt lõpeb usaldusvahemike hindamise meetodite kirjeldus enamikus arstiteadlastele mõeldud statistika aluste raamatutes ning see probleem on omane mitte ainult kodumaisele, vaid ka välismaisele kirjandusele. Mõlemad meetodid põhinevad keskpiiri teoreemil, mis tähendab suurt valimit.

Võttes arvesse puudusi usaldusvahemike hindamisel ülaltoodud meetodite abil, pakkusid Clopper ja Pearson 1934. aastal välja nn täpse usaldusvahemiku arvutamise meetodi, võttes arvesse uuritava tunnuse binoomjaotust. See meetod on saadaval paljudes veebikalkulaatorites, kuid sel viisil saadud usaldusvahemikud on enamasti liiga laiad. Samas on seda meetodit soovitatav kasutada juhtudel, kui on vajalik konservatiivne hindamine. Meetodi konservatiivsus suureneb valimi suuruse vähenemisel, eriti kui N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Paljude statistikute sõnul viiakse sageduste usaldusvahemike kõige optimaalsem hindamine läbi Wilsoni meetodi abil, mis pakuti välja juba 1927. aastal, kuid mida kodumaistes biomeditsiinilistes uuringutes praktiliselt ei kasutatud. See meetod mitte ainult ei võimalda hinnata usaldusvahemikke nii väga väikeste kui ka väga suurte sageduste jaoks, vaid on rakendatav ka väikese arvu vaatluste jaoks. IN üldine vaade Usaldusvahemikul Wilsoni valemi järgi on vorm



kus 95% usaldusvahemiku arvutamisel saab väärtuseks 1,96, N on vaatluste arv ja p on tunnuse esinemise sagedus valimis. See meetod on saadaval veebikalkulaatorites, seega pole selle kasutamine problemaatiline. ja ei soovita seda meetodit kasutada n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Arvatakse, et lisaks Wilsoni meetodile annab Agresti-Colli korrektsiooniga Waldi meetod ka sageduste usaldusvahemiku optimaalse hinnangu. Agresti-Colli parandus on Waldi valemis valimi tunnuse esinemissageduse (p) asendamine p`ga, mille arvutamisel lisatakse lugejale 2 ja nimetajale 4, see tähendab, p` = (X + 2) / (N + 4), kus X on uuringus osalejate arv, kellel on uuritav tunnus, ja N on valimi suurus. See modifikatsioon annab Wilsoni valemiga väga sarnased tulemused, välja arvatud juhul, kui sündmuste sagedus läheneb 0% või 100% ja valim on väike. Lisaks ülaltoodud sageduste usaldusintervallide arvutamise meetoditele on väikeste valimite jaoks välja pakutud pidevuse parandused nii Waldi kui ka Wilsoni meetodi jaoks, kuid uuringud on näidanud, et nende kasutamine on sobimatu.

Vaatleme kahe näite abil ülaltoodud meetodite rakendamist usaldusvahemike arvutamiseks. Esimesel juhul uurime suurt valimit 1000 juhuslikult valitud uuringus osalejast, kellest 450-l on uuritav tunnus (see võib olla riskitegur, tulemus või mõni muu tunnus), mis esindab sagedust 0,45 või 45 %. Teisel juhul viiakse uuring läbi väikese valimiga, näiteks ainult 20 inimesega, ja ainult ühel uuringus osalejal (5%) on uuritav tunnus. Usaldusintervallid, kasutades Waldi meetodit, Waldi meetodit Agresti-Colli korrektsiooniga ja Wilsoni meetodit, arvutati Jeff Sauro välja töötatud veebikalkulaatori abil (http://www. /wald. htm). Wilsoni järjepidevuskorrigeeritud usaldusvahemikud arvutati kalkulaatori abil, mille pakub Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Angular Fisheri teisenduse arvutused viidi läbi käsitsi, kasutades kriitilist t väärtust vastavalt 19 ja 999 vabadusastme jaoks. Mõlema näite arvutustulemused on toodud tabelis.

Usaldusvahemikud arvutatud kahel tekstis kirjeldatud näitel kuuel erineval viisil

Usaldusintervalli arvutamise meetod

P=0,0500 ehk 5%

95% CI, kui X = 450, N = 1000, P = 0,4500 või 45%

–0,0455–0,2541

Wald Agresti–Colli korrektsiooniga

<,0001–0,2541

Wilson koos järjepidevuse korrektsiooniga

Clopper-Pearson "täpne meetod"

Nurga teisendus

<0,0001–0,1967

Nagu tabelist näha, siseneb esimese näite puhul "üldtunnustatud" Waldi meetodil arvutatud usaldusvahemik negatiivsesse piirkonda, mis sageduste puhul nii ei kehti. Kahjuks pole sellised juhtumid vene kirjanduses haruldased. Traditsiooniline andmete esitamise viis sageduse ja selle vea osas varjab seda probleemi osaliselt. Näiteks kui tunnuse esinemissagedus (protsentides) on esitatud kui 2,1 ± 1,4, siis see ei ole nii "silmale solvav" kui 2,1% (95% CI: –0,7; 4,9), kuigi ja tähendab sama asi. Waldi meetod koos Agresti-Colli parandusega ja nurkteisendusega arvutamine annab alampiiri, mis kaldub nulli. Wilsoni järjepidevuskorrigeeritud meetod ja "täpne meetod" toodavad laiemaid usaldusvahemikke kui Wilsoni meetod. Teise näite puhul annavad kõik meetodid ligikaudu ühesugused usaldusvahemikud (erinevused ilmnevad vaid tuhandikes), mis pole üllatav, kuna sündmuse esinemissagedus ei erine selles näites palju 50% ja valimi suurus on üsna suur.

Lugejatele, keda see probleem huvitab, saame soovitada R. G. Newcombe’i ja Browni, Cai ja Dasgupta töid, mis pakuvad plusse ja miinuseid vastavalt 7 ja 10 erineva usaldusintervalli arvutamise meetodi kasutamisele. Kodumaistest käsiraamatutest soovitame raamatut ja mis lisaks teooria üksikasjalikule kirjeldusele esitab Waldi ja Wilsoni meetodid, samuti binoomsagedusjaotust arvestades usaldusintervallide arvutamise meetodit. Lisaks tasuta veebikalkulaatoritele (http://www. /wald. htm ja http://faculty. vassar. edu/lowry/prop1.html) saab sageduste (ja mitte ainult!) usaldusvahemikke arvutada, kasutades CIA programm ( Confidence Intervals Analysis), mille saab alla laadida aadressilt http://www. meditsiinikool. soton. ac. uk/cia/ .

Järgmises artiklis käsitletakse kvalitatiivsete andmete võrdlemise ühemõõtmelisi viise.

Bibliograafia

Meditsiinistatistika selges keeles: sissejuhatav kursus / A. Banerjee. – M.: Praktiline meditsiin, 2007. – 287 lk. Meditsiinistatistika / . – M.: Meditsiiniinfo Agentuur, 2007. – 475 lk. Meditsiiniline ja bioloogiline statistika / S. Glanz. – M.: Praktika, 1998. Andmetüübid, leviku testimine ja kirjeldav statistika // Inimökoloogia – 2008. – Nr 1. – Lk 52–58. KOOS. Meditsiinistatistika: õpik / . – Rostov n/d: Phoenix, 2007. – 160 lk. Rakendusmeditsiiniline statistika / , . - Peterburi. : Foliot, 2003. – 428 lk. F. Biomeetria / . – M.: Kõrgkool, 1990. – 350 lk. A. Matemaatiline statistika meditsiinis / , . – M.: Rahandus ja statistika, 2007. – 798 lk. Matemaatiline statistika kliinilistes uuringutes / , . – M.: GEOTAR-MED, 2001. – 256 lk. Junkerov V. JA. Meditsiiniuuringute andmete meditsiiniline ja statistiline töötlemine / , . - Peterburi. : VmedA, 2002. – 266 lk. Agresti A. Ligikaudne on parem kui täpne binoomproportsioonide intervallide hindamiseks / A. Agresti, B. Coull // Ameerika statistik. – 1998. – N 52. – Lk 119–126. Altman D. Kindel statistika // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – London: BMJ Books, 2000. – 240 lk. Pruun L.D. Intervall estimation for a binomial ratio / L. D. Brown, T. T. Cai, A. Dasgupta // Statistikateadus. – 2001. – N 2. – Lk 101–133. Clopper C.J. Usaldus- või usalduspiiride kasutamine, mida illustreeritakse binoomarvu puhul / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – Lk 404–413. Garcia-Perez M. A. Binoomparameetri usaldusvahemikust / M. A. Garcia-Perez // Kvaliteet ja kvantiteet. – 2005. – N 39. – Lk 467–481. Motulsky H. Intuitiivne biostatistika // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 lk. Newcombe R.G. Kahepoolsed usaldusintervallid ühe proportsiooni jaoks: seitsme meetodi võrdlus / R. G. Newcombe // Meditsiini statistika. – 1998. – N. 17. – Lk 857–872. Sauro J. Valmimismäärade hindamine väikestest valimitest binoomsete usaldusvahemike abil: võrdlused ja soovitused / J. Sauro, J. R. Lewis // Proceedings of the human factor and ergonomics Society aastakoosolek. – Orlando, Florida, 2005. Wald A. Pidevate jaotusfunktsioonide usalduspiirid // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – Lk 105–118. Wilson E.B. Tõenäoline järeldus, pärimisseadus ja statistiline järeldus / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – Lk 209–212.

PROPORTSIOONIDE KONFIDENTSIAALID

A. M. Grjibovski

Riiklik Rahvatervise Instituut, Oslo, Norra

Artiklis esitatakse mitmed meetodid binoomproportsioonide usaldusvahemike arvutamiseks, nimelt Waldi, Wilsoni, arcsiini, Agresti-Coulli ja täpsed Clopper-Pearsoni meetodid. Töö annab ainult üldise sissejuhatuse binoomproportsiooni usaldusintervalli hindamise probleemile ja selle eesmärk ei ole mitte ainult ärgitada lugejaid kasutama usaldusvahemikke omaenda empiirilise uurimistöö tulemuste esitamisel, vaid ka julgustada neid statistikaraamatuid uurima. enne enda andmete analüüsimist ja käsikirjade koostamist.

Võtmesõnad: usaldusvahemik, proportsioon

Kontaktinfo:

Oslo, Norra riikliku rahvatervise instituudi vanemnõunik

Eelmistes alajaotistes käsitlesime tundmatu parameetri hindamise küsimust Aüks number. Seda nimetatakse "punkthinnanguks". Paljude ülesannete puhul ei pea te leidma ainult parameetrit A sobiv arvväärtus, vaid ka hinnata selle täpsust ja usaldusväärsust. Peate teadma, milliseid vigu võib parameetri asendamine kaasa tuua A selle punkthinnang A ja kui suure kindlusega võime eeldada, et need vead ei ületa teadaolevaid piire?

Sedalaadi probleemid on eriti aktuaalsed väikese arvu vaatluste puhul, kui punkthinnang ja sisse on suures osas juhuslik ja a ligikaudne asendamine a-ga võib põhjustada tõsiseid vigu.

Anda aimu hinnangu täpsusest ja usaldusväärsusest A,

Matemaatilises statistikas kasutatakse nn usaldusvahemikke ja usaldustõenäosusi.

Laske parameetri jaoks A kogemusest saadud erapooletu hinnang A. Tahame antud juhul hinnata võimalikku viga. Määrakem mingi piisavalt suur tõenäosus p (näiteks p = 0,9, 0,95 või 0,99), et sündmust tõenäosusega p saaks pidada praktiliselt usaldusväärseks, ja leiame väärtuse s, mille jaoks

Seejärel asendamisel tekkiva vea praktiliselt võimalike väärtuste vahemik A peal A, on ± s; Suured absoluutväärtuse vead ilmnevad ainult väikese tõenäosusega a = 1 - p. Kirjutame (14.3.1) ümber järgmiselt:

Võrdsus (14.3.2) tähendab, et tõenäosusega p on parameetri tundmatu väärtus A jääb intervalli sisse

On vaja märkida üks asjaolu. Varem oleme korduvalt arvestanud tõenäosusega, et juhuslik suurus langeb antud mittejuhuslikku intervalli. Siin on olukord erinev: suurusjärk A ei ole juhuslik, kuid intervall / p on juhuslik. Selle asukoht x-teljel on juhuslik, määratud keskpunkti järgi A; Üldiselt on ka intervalli 2s pikkus juhuslik, kuna s väärtus arvutatakse reeglina katseandmete põhjal. Seetõttu oleks sel juhul parem tõlgendada p väärtust mitte kui tõenäosust punkti "löömiseks" A intervallis / p ja tõenäosusena, et juhuslik intervall / p katab punkti A(joonis 14.3.1).

Riis. 14.3.1

Tavaliselt nimetatakse tõenäosust p usalduse tõenäosus, ja intervall / p - usaldusvahemik. Intervallide piirid Kui. a x =a- s ja a 2 = a + ja neid kutsutakse usalduse piirid.

Andkem usaldusvahemiku mõistele veel üks tõlgendus: seda võib käsitleda parameetri väärtuste intervallina A,ühilduvad eksperimentaalsete andmetega ega ole nendega vastuolus. Tõepoolest, kui nõustume pidama sündmust tõenäosusega a = 1-p praktiliselt võimatuks, siis on need parameetri a väärtused, mille puhul a - a> s tuleb tunnistada vastuolulisteks katseandmeteks ja need, mille puhul |a - A a t na 2 .

Laske parameetri jaoks A on erapooletu hinnang A. Kui me teaksime suuruse jaotuse seadust A, oleks usaldusvahemiku leidmise ülesanne väga lihtne: piisaks, kui leiad väärtuse s, mille jaoks

Raskus seisneb selles, et hinnangute jaotamise seadus A sõltub suuruse jaotusseadusest X ja seetõttu selle tundmatute parameetrite (eriti parameetri enda) järgi A).

Selle raskuse ületamiseks võite kasutada järgmist ligikaudset tehnikat: asendage avaldises olevad tundmatud parameetrid nende punkthinnangutega. Suhteliselt suure hulga katsetega P(umbes 20...30) annab see tehnika tavaliselt täpsuse poolest rahuldavad tulemused.

Vaatleme näiteks matemaatilise ootuse usaldusvahemiku probleemi.

Las toodetakse P X, mille tunnusteks on matemaatiline ootus T ja dispersioon D- teadmata. Nende parameetrite jaoks saadi järgmised hinnangud:

Matemaatilise ootuse jaoks on vaja konstrueerida usaldusvahemik / p, mis vastab usaldustõenäosusele p T kogused X.

Selle probleemi lahendamisel kasutame seda, et kogus T esindab summat P sõltumatud identselt jaotatud juhuslikud muutujad X h ja keskpiiri teoreemi kohaselt piisavalt suure P selle jaotusseadus on normilähedane. Praktikas võib isegi suhteliselt väikese liikmete arvuga (umbes 10...20) summa jaotusseadust pidada ligikaudu normaalseks. Eeldame, et väärtus T jaotatakse tavaseaduse järgi. Selle seaduse tunnused – matemaatiline ootus ja dispersioon – on vastavalt võrdsed T Ja

(vt ptk 13 alajaotis 13.3). Oletame, et väärtus D me teame ja leiame väärtuse Ep, mille jaoks

Kasutades 6. peatüki valemit (6.3.5), väljendame tõenäosuse (14.3.5) vasakul küljel normaaljaotuse funktsiooni kaudu

kus on hinnangu standardhälve T.

Alates Eq.

leidke Sp väärtus:

kus arg Ф* (х) on Ф* pöördfunktsioon (X), need. argumendi selline väärtus, mille normaaljaotuse funktsioon on võrdne X.

Dispersioon D, mille kaudu kogust väljendatakse A 1P, me ei tea täpselt; selle ligikaudse väärtusena võite kasutada hinnangut D(14.3.4) ja pange ligikaudu:

Seega on usaldusvahemiku konstrueerimise probleem ligikaudu lahendatud, mis on võrdne:

kus gp määratakse valemiga (14.3.7).

Pöördinterpolatsiooni vältimiseks funktsiooni Ф* (l) tabelites s p arvutamisel on mugav koostada spetsiaalne tabel (tabel 14.3.1), mis annab suuruse väärtused.

olenevalt r-st. Väärtus (p määrab normaalseaduse jaoks standardhälbete arvu, mis tuleb joonistada dispersioonikeskmest paremale ja vasakule nii, et tõenäosus saada saadud alale on võrdne p-ga.

Kasutades väärtust 7 p, väljendatakse usaldusvahemikku järgmiselt:

Tabel 14.3.1

Näide 1. Kogusega viidi läbi 20 katset X; tulemused on toodud tabelis. 14.3.2.

Tabel 14.3.2

Koguse matemaatilise ootuse jaoks on vaja leida hinnang X ja konstrueerida usaldusvahemik, mis vastab usalduse tõenäosusele p = 0,8.

Lahendus. Meil on:

Valides võrdluspunktiks l: = 10, leiame kolmanda valemi (14.2.14) abil erapooletu hinnangu D :

Tabeli järgi 14.3.1 leiame

Usalduse piirid:

Usaldusvahemik:

Parameetrite väärtused T, selles intervallis asuvad andmed ühilduvad tabelis toodud katseandmetega. 14.3.2.

Dispersiooni usaldusvahemiku saab koostada sarnasel viisil.

Las toodetakse P sõltumatud katsed juhusliku muutujaga X tundmatute parameetritega nii A kui ka dispersiooni jaoks D saadi erapooletu hinnang:

Dispersiooni jaoks on vaja ligikaudselt konstrueerida usaldusvahemik.

Valemist (14.3.11) on selge, et kogus D esindab

summa P juhuslikud muutujad kujul . Need väärtused ei ole

sõltumatu, kuna ükskõik milline neist sisaldab kogust T, sõltuvad kõigist teistest. Siiski võib näidata, et suurenedes P ka nende summa jaotusseadus läheneb normaalsele. Peaaegu kell P= 20...30 võib seda juba normaalseks pidada.

Oletame, et see on nii, ja leiame selle seaduse tunnused: matemaatiline ootus ja dispersioon. Alates hindamisest D- siis erapooletu M[D] = D.

Dispersiooni arvutamine D D on seotud suhteliselt keerukate arvutustega, seega esitame selle avaldise ilma tuletamiseta:

kus q 4 on suuruse neljas keskmoment X.

Selle avaldise kasutamiseks peate asendama väärtused\u003d 4 ja D(vähemalt lähedased). Selle asemel D võite kasutada tema hinnangut D. Põhimõtteliselt võib neljanda keskse momendi asendada ka hinnanguga, näiteks vormi väärtusega:

kuid selline asendamine annab äärmiselt madala täpsuse, kuna üldiselt määratakse piiratud arvu katsete korral kõrge astme momendid suurte vigadega. Praktikas juhtub aga sageli, et kogusejaotuse seaduse tüüp X ette teada: teadmata on ainult selle parameetrid. Seejärel võite proovida väljendada μ 4 läbi D.

Võtame kõige tavalisema juhtumi, kui väärtus X jaotatakse tavaseaduse järgi. Seejärel väljendatakse selle neljandat keskmomenti hajuvusena (vt ptk 6, alajaotis 6.2);

ja valem (14.3.12) annab või

Tundmatu asendamine (14.3.14) D tema hinnang D, saame: kust

Momenti μ 4 saab väljendada läbi D ka mõnel muul juhul, kui väärtuse jaotus X ei ole normaalne, kuid selle välimus on teada. Näiteks ühtlase tiheduse seaduse jaoks (vt 5. peatükk) on meil:

kus (a, P) on intervall, millel seadus on täpsustatud.

Seega

Kasutades valemit (14.3.12) saame: kust me ligikaudu leiame

Juhtudel, kui suuruse 26 jaotusseaduse tüüp on teadmata, on väärtuse a/) ligikaudse hinnangu tegemisel siiski soovitatav kasutada valemit (14.3.16), välja arvatud juhul, kui on erilist põhjust arvata, et see seadus on tavalisest väga erinev (on märgatav positiivne või negatiivne kurtoos) .

Kui ligikaudne väärtus a/) saadakse ühel või teisel viisil, siis saame dispersioonile konstrueerida usaldusvahemiku samamoodi, nagu koostasime selle matemaatilise ootuse jaoks:

kus antud tõenäosusest p sõltuv väärtus leitakse tabeli järgi. 14.3.1.

Näide 2. Leidke juhusliku suuruse dispersiooni ligikaudu 80% usaldusvahemik X näite 1 tingimustel, kui on teada, et väärtus X jaotatakse normaalsele lähedase seaduse järgi.

Lahendus. Väärtus jääb samaks, mis tabelis. 14.3.1:

Vastavalt valemile (14.3.16)

Kasutades valemit (14.3.18) leiame usaldusvahemiku:

Vastav standardhälbe väärtuste vahemik: (0,21; 0,29).

14.4. Täpsed meetodid normaalseaduse järgi jaotatud juhusliku suuruse parameetrite usaldusvahemike konstrueerimiseks

Eelmises alapeatükis uurisime ligikaudseid meetodeid matemaatiliste ootuste ja dispersiooni usaldusvahemike koostamiseks. Siin anname ülevaate täpsetest meetoditest sama probleemi lahendamiseks. Rõhutame, et usaldusvahemike täpseks leidmiseks on tingimata vaja eelnevalt teada suuruse jaotusseaduse kuju X, samas kui ligikaudsete meetodite rakendamiseks pole see vajalik.

Usaldusvahemike konstrueerimise täpsete meetodite idee taandub järgmisele. Iga usaldusvahemik leitakse tingimusest, mis väljendab teatud ebavõrdsuse täitumise tõenäosust, mis sisaldab meid huvitavat hinnangut A. Hindamisjaotuse seadus Aüldiselt sõltub koguse tundmatutest parameetritest X. Mõnikord on aga võimalik juhuslikust suurusest ebavõrdsust sisse kanda A mõnele muule vaadeldavate väärtuste funktsioonile X p X 2, ..., X lk. mille jaotusseadus ei sõltu tundmatutest parameetritest, vaid sõltub ainult katsete arvust ja suuruse jaotusseaduse tüübist X. Seda tüüpi juhuslikud muutujad mängivad matemaatilises statistikas olulist rolli; neid on kõige detailsemalt uuritud koguse normaaljaotuse korral X.

Näiteks on tõestatud, et väärtuse normaaljaotusega X juhuslik väärtus

allub nn Üliõpilaste jagamise seadus Koos P- 1 vabadusaste; selle seaduse tihedusel on vorm

kus G(x) on teadaolev gammafunktsioon:

Samuti on tõestatud, et juhuslik suurus

on "%2 jaotus" koos P- 1 vabadusaste (vt 7. peatükk), mille tihedust väljendatakse valemiga

Jaotuste (14.4.2) ja (14.4.4) tuletustel peatumata näitame, kuidas neid saab rakendada parameetrite usaldusvahemike koostamisel. ty D.

Las toodetakse P sõltumatud katsed juhusliku muutujaga X, tavaliselt jaotatud tundmatute parameetritega T&O. Nende parameetrite kohta saadi hinnangud

Mõlema parameetri jaoks on vaja konstrueerida usaldusvahemikud, mis vastavad usalduse tõenäosusele p.

Koostame esmalt matemaatilise ootuse usaldusvahemiku. On loomulik, et see intervall on sümmeetriline T; tähistame s p poolt intervalli pikkusest. Väärtus s p tuleb valida nii, et tingimus oleks täidetud

Proovime liikuda juhuslikust suurusest võrdsuse (14.4.5) vasakule poole T juhuslikule suurusele T, levitatakse vastavalt Studenti seadusele. Selleks korrutage võrratuse |m-w?| mõlemad pooled

positiivse väärtuse järgi: või kasutades tähistust (14.4.1),

Leiame sellise arvu / p, et väärtuse / p leiaks tingimusest

Valemist (14.4.2) on selge, et (1) on paarisfunktsioon, mistõttu (14.4.8) annab

Võrdsus (14.4.9) määrab väärtuse / p sõltuvalt p-st. Kui teie käsutuses on integraalväärtuste tabel

siis saab /p väärtuse leida pöördinterpolatsiooni teel tabelist. Siiski on mugavam koostada /p väärtuste tabel eelnevalt. Selline tabel on toodud lisas (tabel 5). See tabel näitab väärtusi, mis sõltuvad usaldustasemest p ja vabadusastmete arvust P- 1. Olles määranud tabelist / p. 5 ja eeldades

leiame poole usaldusvahemiku / p laiusest ja intervalli enda

Näide 1. Juhusliku muutujaga viidi läbi 5 sõltumatut katset X, tavaliselt jaotatud tundmatute parameetritega T ja umbes. Katsete tulemused on toodud tabelis. 14.4.1.

Tabel 14.4.1

Otsi hinnang T matemaatilise ootuse jaoks ja konstrueerida selle jaoks 90% usaldusvahemik / p (st intervall, mis vastab usaldustõenäosusele p = 0,9).

Lahendus. Meil on:

Taotluse tabeli 5 kohaselt P - 1 = 4 ja p = 0,9 leiame kus

Usaldusvahemik on

Näide 2. Alajaotise 14.3 näite 1 tingimuste jaoks, eeldades väärtust X normaalselt jaotatud, leidke täpne usaldusvahemik.

Lahendus. Vastavalt lisa tabelile 5 leiame millal P - 1 = 19ir =

0,8 / p = 1,328; siit

Võrreldes alajao 14.3 näite 1 lahendusega (e p = 0,072), oleme veendunud, et lahknevus on väga ebaoluline. Kui säilitame täpsuse teise kümnendkoha täpsusega, langevad täpse ja ligikaudse meetodiga leitud usaldusvahemikud kokku:

Liigume edasi dispersiooni usaldusvahemiku konstrueerimise juurde. Vaatleme erapooletut dispersiooni hindajat

ja väljendada juhuslikku suurust D suurusjärgu kaudu V(14.4.3), jaotus x 2 (14.4.4):

Koguste jaotumise seaduse tundmine V, leiad intervalli /(1), millesse see antud tõenäosusega p.

Jaotamise seadus kn_x(v) suurusjärgus I 7 on joonisel fig. 14.4.1.

Riis. 14.4.1

Tekib küsimus: kuidas valida intervalli / p? Kui suurusjaotuse seadus V oli sümmeetriline (nagu normaalseadus või Studenti jaotus), oleks loomulik võtta intervall /p matemaatilise ootuse suhtes sümmeetriliseks. Sel juhul seadus k p_x (v) asümmeetriline. Leppigem kokku, et valime intervalli /p nii, et väärtuse tõenäosus on V väljaspool intervalli paremale ja vasakule (varjutatud alad joonisel 14.4.1) olid samad ja võrdsed

Selle omadusega intervalli /p konstrueerimiseks kasutame tabelit. 4 rakendust: see sisaldab numbreid y) selline, et

väärtuse eest V, millel on x 2 -jaotus r vabadusastmega. Meie puhul r = n- 1. Parandame r = n- 1 ja leidke tabeli vastavast reast. 4 kaks tähendust x 2 -üks vastab tõenäosusele teine ​​- tõenäosus Tähistame need

väärtused kell 2 Ja xl? Intervall on y 2, vasakuga ja y~õige ots.

Nüüd leiame intervallist / p soovitud usaldusvahemiku /| piiridega D dispersiooni jaoks ja D2, mis katab asja D tõenäosusega p:

Koostame intervalli / (, = (?> ь А), mis katab punkti D siis ja ainult siis, kui väärtus V langeb intervalli /r. Näitame, et intervall

vastab sellele tingimusele. Tõepoolest, ebavõrdsus on samaväärsed ebavõrdsusega

ja need ebavõrdsused on rahuldatud tõenäosusega p. Seega on dispersiooni usaldusvahemik leitud ja seda väljendatakse valemiga (14.4.13).

Näide 3. Leidke dispersiooni usaldusvahemik alajaotise 14.3 näite 2 tingimustel, kui on teada, et väärtus X normaalselt jaotunud.

Lahendus. Meil on . Vastavalt lisa tabelile 4

leiame aadressil r = n - 1 = 19

Valemi (14.4.13) abil leiame dispersiooni usaldusvahemiku

Standardhälbe vastav intervall on (0,21; 0,32). See intervall ületab vaid vähesel määral ligikaudse meetodiga alajao 14.3 näites 2 saadud intervalli (0,21; 0,29).

  • Joonis 14.3.1 käsitleb usaldusvahemikku a suhtes sümmeetriliselt. Üldiselt, nagu hiljem näeme, pole see vajalik.

Matemaatilise ootuse usaldusvahemik - see on intervall, mis on arvutatud andmetest, mis teadaoleva tõenäosusega sisaldavad üldkogumi matemaatilist ootust. Matemaatilise ootuse loomulik hinnang on selle vaadeldud väärtuste aritmeetiline keskmine. Seetõttu kasutame kogu tunni jooksul mõisteid "keskmine" ja "keskmine väärtus". Usaldusvahemiku arvutamise ülesannete puhul on kõige sagedamini nõutav vastus umbes selline: "Keskmise arvu [väärtus konkreetses probleemis] usaldusvahemik on [väiksem väärtus] kuni [suurem väärtus]." Usaldusvahemiku abil saate hinnata mitte ainult keskmisi väärtusi, vaid ka konkreetse tunnuse osakaalu üldkogumis. Õppetunnis käsitletakse keskmisi väärtusi, dispersiooni, standardhälvet ja viga, mille kaudu jõuame uute definitsioonide ja valemiteni Valimi ja üldkogumi tunnused .

Keskmise punkti- ja intervallhinnangud

Kui üldkogumi keskmist väärtust hinnatakse arvu (punkti) järgi, siis üldkogumi teadmata keskmise väärtuse hinnanguks võetakse konkreetne keskmine, mis arvutatakse vaatluste valimi põhjal. Sel juhul ei lange valimi keskmise – juhusliku muutuja – väärtus kokku üldkogumi keskmise väärtusega. Seetõttu peate valimi keskmise märkimisel samaaegselt näitama ka valimi võtmise viga. Valimivea mõõt on standardviga, mida väljendatakse samades ühikutes kui keskmine. Seetõttu kasutatakse sageli järgmist tähistust: .

Kui keskmise hinnangut on vaja seostada teatud tõenäosusega, siis üldkogumi huvipakkuvat parameetrit tuleb hinnata mitte ühe numbri, vaid intervalli järgi. Usaldusvahemik on intervall, milles teatud tõenäosusega P leitakse hinnangulise rahvastikunäitaja väärtus. Usaldusvahemik, milles see on tõenäoline P = 1 - α juhuslik suurus leitakse, arvutatakse järgmiselt:

,

α = 1 - P, mille võib leida peaaegu iga statistikat käsitleva raamatu lisast.

Praktikas ei ole üldkogumi keskmist ja dispersiooni teada, seega asendatakse üldkogumi dispersioon valimi dispersiooniga ja üldkogumi keskmine valimi keskmisega. Seega arvutatakse usaldusvahemik enamikul juhtudel järgmiselt:

.

Usaldusvahemiku valemit saab kasutada populatsiooni keskmise, kui hinnata

  • üldkogumi standardhälve on teada;
  • või üldkogumi standardhälve on teadmata, kuid valimi suurus on suurem kui 30.

Valimi keskmine on üldkogumi keskmise erapooletu hinnang. Omakorda valimi dispersioon ei ole populatsiooni dispersiooni erapooletu hinnang. Valimi dispersiooni valemi populatsiooni dispersiooni erapooletu hinnangu saamiseks valimi suurus n tuleks asendada n-1.

Näide 1. Teatud linna 100 juhuslikult valitud kohvikust koguti infot, et keskmine töötajate arv neis on 10,5 standardhälbega 4,6. Määrake kohviku töötajate arvu 95% usaldusvahemik.

kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,05 .

Seega jäi kohvikutöötajate keskmise arvu 95% usaldusvahemik vahemikku 9,6–11,4.

Näide 2. Juhusliku valimi jaoks 64 vaatluse populatsioonist arvutati järgmised koguväärtused:

väärtuste summa vaatlustes,

väärtuste keskmisest kõrvalekallete ruudu summa .

Arvutage matemaatilise ootuse 95% usaldusvahemik.

Arvutame standardhälbe:

,

Arvutame keskmise väärtuse:

.

Asendame väärtused usaldusvahemiku avaldisesse:

kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,05 .

Saame:

Seega jäi selle valimi matemaatilise ootuse 95% usaldusvahemik vahemikku 7,484 kuni 11,266.

Näide 3. 100 vaatlusega juhusliku populatsiooni valimi puhul on arvutatud keskmine 15,2 ja standardhälve 3,2. Arvutage eeldatava väärtuse 95% usaldusvahemik ja seejärel 99% usaldusvahemik. Kui valimi võimsus ja selle variatsioon jäävad muutumatuks ja usalduskoefitsient suureneb, kas usaldusvahemik kitseneb või laieneb?

Asendame need väärtused usaldusvahemiku avaldisesse:

kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,05 .

Saame:

.

Seega jäi selle valimi keskmise 95% usaldusvahemik vahemikku 14,57–15,82.

Asendame need väärtused uuesti usaldusvahemiku avaldisesse:

kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,01 .

Saame:

.

Seega jäi selle valimi keskmise 99% usaldusvahemik vahemikku 14,37 kuni 16,02.

Nagu näeme, suureneb usalduskoefitsiendi kasvades ka standardse normaaljaotuse kriitiline väärtus ning sellest tulenevalt paiknevad intervalli algus- ja lõpp-punktid keskmisest kaugemal ning seega suureneb matemaatilise ootuse usaldusvahemik. .

Erikaalu punkt- ja intervallhinnangud

Mõne valimi atribuudi osakaalu võib tõlgendada punkthinnanguna erikaal lküldpopulatsioonis samad omadused. Kui seda väärtust on vaja seostada tõenäosusega, tuleks arvutada erikaalu usaldusvahemik lk tõenäosusega populatsioonile iseloomulik P = 1 - α :

.

Näide 4. Mõnes linnas on kaks kandidaati A Ja B kandideerivad linnapeaks. Juhuslikult küsitleti 200 linnaelanikku, kellest 46% vastas, et hääletaks kandidaadi poolt A, 26% - kandidaadile B ja 28% ei tea, kelle poolt nad hääletavad. Määrake kandidaati toetavate linnaelanike osakaalu 95% usaldusvahemik A.

Laske meil olla suur hulk objektid, millel on teatud omaduste normaalne jaotus (näiteks sama tüüpi köögiviljade terviklik ladu, mille suurus ja kaal on erinevad). Tahad teada kogu kaubapartii keskmisi omadusi, kuid sul pole ei aega ega soovi iga köögivilja mõõta ja kaaluda. Saate aru, et see pole vajalik. Aga mitu tükki oleks vaja pisteliseks kontrolliks võtta? Enne mitme selle olukorra jaoks kasuliku valemi esitamist meenutagem mõnda tähistust. Esiteks, kui me mõõdaksime kogu köögiviljalao (seda elementide kogumit nimetatakse üldpopulatsiooniks), siis teaksime kogu meie käsutuses oleva täpsusega kogu partii keskmist kaalu. Nimetagem seda keskmiseks X avg.gen. - üldine keskmine. Me juba teame, mis on täielikult määratud, kui selle keskmine väärtus ja hälve s on teada. Tõsi, me ei tea siiani ei X keskmist geeni ega üldpopulatsiooni s-i. Saame võtta ainult teatud valimi, mõõta vajalikke väärtusi ja arvutada selle valimi jaoks nii keskmise väärtuse X avg.selection kui ka standardhälbe Ssev. On teada, et kui meie valimitestis on palju elemente (tavaliselt n on suurem kui 30) ja need on võetud tõeliselt juhuslikult, siis ei erine üldkogumi s vaevalt S valimitest. normaaljaotust, saame kasutada järgmisi valemeid:

95% tõenäosusega

99% tõenäosusega

.

Üldiselt tõenäosusega P(t)

Seos t väärtuse ja tõenäosusväärtuse P(t) vahel, millega tahame teada usaldusvahemikku, saab võtta järgmisest tabelist:

P(t) 0,683 0,950 0,954 0,990 0,997
t 1,00 1,96 2,00 2,58 3,00

Seega oleme kindlaks teinud, millises vahemikus asub üldkogumi keskmine väärtus (antud tõenäosusega).

Kui meil pole piisavalt suurt valimit, ei saa me öelda, et populatsioonil on valikud s = S. Lisaks on sel juhul problemaatiline valimi lähedus normaaljaotusele. Sel juhul kasutame valemis s asemel ka S select:

kuid t väärtus on fikseeritud tõenäosuse jaoks P(t) sõltub elementide arvust valimis n. Mida suurem n, seda lähemal on saadud usaldusvahemik valemiga (1) antud väärtusele. Sel juhul on t väärtused võetud teisest tabelist (õpilase t-test), mille esitame allpool:

Studenti t-testi väärtused tõenäosusele 0,95 ja 0,99 

n P n P
0.95 0.99 0.95 0.99
2 12.71 63.66 18 2.11 2.90
3 4.30 9.93 19 2.10 2.88
4 3.18 5.84 20 2.093 2.861
5 2.78 4.60 25 2.064 2.797
6 2.57 4.03 30 2.045 2.756
7 2.45 3.71 35 2.032 2.720
8 2.37 3.50 40 2.022 2.708
9 2.31 3.36 45 2.016 2.692
10 2.26 3.25 50 2.009 2.679
11 2.23 3.17 60 2.001 2.662
12 2.20 3.11 70 1.996 2.649
13 2.18 3.06 80 1.991 2.640
14 2.16 3.01 90 1.987 2.633
15 2.15 2.98 100 1.984 2.627
16 2.13 2.95 120 1.980 2.617
17 2.12 2.92 >120 1.960 2.576

Näide 3. Ettevõtte töötajate hulgast valiti juhuslikult 30 inimest. Valimi järgi selgus, et keskmine palk (kuus) on 10 tuhat rubla standardhälbega 3 tuhat rubla. Määrake keskmine palk ettevõttes tõenäosusega 0,99. Lahendus: Tingimuse järgi on meil n = 30, X keskm. = 10000, S = 3000, P = 0,99. Usaldusvahemiku leidmiseks kasutame Studenti t-testile vastavat valemit. Tabelist n = 30 ja P = 0,99 leiame t = 2,756, seega

need. nõutav usaldusvahemik 27484< Х ср.ген < 32516.

Seega tõenäosusega 0,99 võime öelda, et intervall (27484; 32516) sisaldab endas ettevõtte keskmist palka.
Loodame, et kasutate seda meetodit ja pole vaja, et teil oleks iga kord laud kaasas. Arvutused saab teha automaatselt Excelis. Exceli failis olles klõpsake ülemises menüüs nuppu fx. Seejärel valige funktsioonide hulgast "statistiline" tüüp ja aknas pakutud loendist - STUDAR DISCOVER. Seejärel sisestage viipale kursori väljale "tõenäosus" pöördtõenäosuse väärtus (st meie puhul peate tõenäosuse 0,95 asemel sisestama tõenäosuse 0,05). Ilmselt arvutustabel on koostatud nii, et tulemus vastab küsimusele, kui suure tõenäosusega võime eksida. Samamoodi sisestage väljale Vabadusaste oma proovi väärtus (n-1).