Kvantitatiivsed analüüsimeetodid: usaldusvahemike hindamine. Usaldusvahemiku tõenäosus ja usaldusvahemik Milline on usaldusvahemiku tõenäosus

Sageli peab hindaja analüüsima selle segmendi kinnisvaraturgu, kus hindamisobjekt asub. Kui turg on arenenud, võib kogu esitatud objektide komplekti analüüsimine olla keeruline, seetõttu kasutatakse analüüsimiseks objektide valimit. See valim ei ole alati homogeenne, mõnikord tuleb see puhastada äärmustest - liiga kõrgetest või liiga madalatest turupakkumistest. Sel eesmärgil rakendatakse seda usaldusvahemik. Sihtmärk see uuring- viia läbi kahe usaldusvahemiku arvutamise meetodi võrdlev analüüs ja valida parim variant arvutus erinevate valimitega töötamisel süsteemis estimatica.pro.

Usaldusvahemik - arvutatakse valimi põhjal, tunnuse väärtuste intervall, mis teadaoleva tõenäosusega sisaldab üldkogumi hinnangulist parameetrit.

Usaldusvahemiku arvutamise mõte on koostada selline intervall näidisandmete põhjal, et saaks etteantud tõenäosusega väita, et hinnangulise parameetri väärtus on selles intervallis. Teisisõnu sisaldab teatud tõenäosusega usaldusvahemik hinnangulise suuruse tundmatut väärtust. Mida laiem on intervall, seda suurem on ebatäpsus.

Usaldusvahemiku määramiseks on erinevaid meetodeid. Selles artiklis käsitleme kahte võimalust:

  • läbi mediaani ja standardhälbe;
  • läbi t-statistika kriitilise väärtuse (Studendi koefitsient).

Erinevate CI arvutamise meetodite võrdleva analüüsi etapid:

1. moodustada andmeproov;

2. töötle seda statistilised meetodid: arvutage keskmine, mediaan, dispersioon jne;

3. arvutame usaldusvahemiku kahel viisil;

4. Analüüsige puhastatud proove ja saadud usaldusvahemikke.

1. etapp. Andmete valim

Valim moodustati süsteemi estimatica.pro abil. Valimisse kuulus 91 pakkumist 3. hinnatsooni 1-toaliste korterite müügiks planeeringuga "Hruštšov".

Tabel 1. Esialgne valim

Hind 1 ruutmeetrit, c.u.

Joonis 1. Esialgne proov



2. etapp. Algproovi töötlemine

Proovide töötlemine statistiliste meetoditega nõuab järgmiste väärtuste arvutamist:

1. Aritmeetiline keskmine

2. Mediaan - valimit iseloomustav arv: täpselt pooled valimi elemendid on mediaanist suuremad, teine ​​pool on mediaanist väiksemad

(paaritu arvu väärtustega proovi jaoks)

3. Vahemik - erinevus proovi maksimaalsete ja minimaalsete väärtuste vahel

4. Dispersioon – kasutatakse andmete varieerumise täpsemaks hindamiseks

5. Valimi standardhälve (edaspidi RSD) on kõige levinum näitaja, mis näitab korrigeerimisväärtuste hajumist aritmeetilise keskmise ümber.

6. Variatsioonikoefitsient – ​​peegeldab korrigeerimisväärtuste hajumise astet

7. võnkekoefitsient – ​​peegeldab valimi hindade äärmuslike väärtuste suhtelist kõikumist keskmise ümber

Tabel 2. Algvalimi statistilised näitajad

Andmete homogeensust iseloomustav variatsioonikordaja on 12,29%, kuid võnketegur on liiga suur. Seega võime väita, et esialgne valim ei ole homogeenne, seega liigume edasi usaldusvahemiku arvutamise juurde.

3. etapp. Usaldusvahemiku arvutamine

Meetod 1. Arvutamine läbi mediaani ja standardhälbe.

Usaldusvahemik määratakse järgmiselt: minimaalne väärtus - standardhälve lahutatakse mediaanist; maksimaalne väärtus – mediaanile lisatakse standardhälve.

Seega usaldusvahemik (47179 CU; 60689 CU)

Riis. 2. Väärtused usaldusvahemikus 1.



Meetod 2. Usaldusvahemiku loomine läbi t-statistika kriitilise väärtuse (õpilase koefitsient)

S.V. Gribovsky raamatus " Matemaatilised meetodid vara väärtuse hindamine” kirjeldab usaldusvahemiku arvutamist läbi Studenti koefitsiendi. Selle meetodiga arvutamisel peab hindaja ise määrama olulisuse taseme ∝, mis määrab usaldusvahemiku koostamise tõenäosuse. Tavaliselt kasutatakse olulisuse tasemeid 0,1; 0,05 ja 0,01. Need vastavad usalduse tõenäosusele 0,9; 0,95 ja 0,99. Selle meetodi puhul loetakse matemaatilise ootuse ja dispersiooni tegelikud väärtused praktiliselt tundmatuks (mis on praktiliste hindamisülesannete lahendamisel peaaegu alati tõsi).

Usaldusvahemiku valem:

n - valimi suurus;

t-statistika (Studendi jaotused) kriitiline väärtus olulisuse tasemega ∝, vabadusastmete arv n-1, mis määratakse spetsiaalsete statistiliste tabelitega või MS Exceli abil (→"Statistiline"→ STUDRASPOBR);

∝ - olulisuse tase, võtame ∝=0,01.

Riis. 2. Väärtused usaldusvahemikus 2.

Etapp 4. Usaldusvahemiku arvutamise erinevate võimaluste analüüs

Kaks usaldusintervalli arvutamise meetodit - läbi mediaani ja Studenti koefitsiendi - viisid intervallide erinevate väärtusteni. Sellest lähtuvalt saadi kaks erinevat puhastatud proovi.

Tabel 3. Kolme valimi statistilised näitajad.

Indeks

Esialgne proov

1 variant

2. võimalus

Keskmine väärtus

Dispersioon

Coef. variatsioonid

Coef. võnkumisi

Vanade objektide arv, tk.

Tehtud arvutuste põhjal võime öelda, et erinevate meetoditega saadud usaldusvahemike väärtused ristuvad, nii et saate hindaja äranägemisel kasutada mis tahes arvutusmeetodeid.

Siiski usume, et süsteemis estimatica.pro töötades on soovitav valida usaldusvahemiku arvutamise meetod, mis sõltub turu arenguastmest:

  • kui turg ei ole arenenud, rakendage mediaani ja standardhälbe kaudu arvutamise meetodit, kuna kasutuselt kõrvaldatud objektide arv on sel juhul väike;
  • kui turg on arenenud, rakenda arvutust läbi t-statistika kriitilise väärtuse (Studendi koefitsient), kuna on võimalik moodustada suur algvalim.

Artikli ettevalmistamisel kasutati:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matemaatilised meetodid vara väärtuse hindamiseks. Moskva, 2014

2. Andmed süsteemist estimatica.pro

SAGEDUSTE JA OSADE KINNITUSVÄLJAD

© 2008

Riiklik Rahvatervise Instituut, Oslo, Norra

Artiklis kirjeldatakse ja käsitletakse sageduste ja proportsioonide usaldusvahemike arvutamist Waldi, Wilsoni, Klopper-Pearsoni meetodite abil, kasutades nurkteisendust ja Waldi meetodit Agresti-Cowlli korrektsiooniga. Esitatud materjal annab Üldine informatsioon sageduste ja proportsioonide usaldusvahemike arvutamise meetoditest ning selle eesmärk on äratada ajakirja lugejates huvi mitte ainult usaldusvahemike kasutamise vastu oma uurimistöö tulemuste esitlemisel, vaid ka erialakirjanduse lugemiseks enne tulevaste väljaannetega töö alustamist.

Märksõnad : usaldusvahemik, sagedus, proportsioon

Ühes varasemas publikatsioonis mainiti lühidalt kvalitatiivsete andmete kirjeldust ja teatati, et nende intervallhinnang on eelistatavam punkthinnangule, et kirjeldada uuritava tunnuse esinemissagedust üldpopulatsioonis. Tõepoolest, kuna uuringud viiakse läbi valimiandmete abil, peab tulemuste projektsioon üldkogumile sisaldama valimi hinnangus ebatäpsust. Usaldusvahemik on hinnangulise parameetri täpsuse mõõt. Huvitav on see, et mõnes arstidele mõeldud statistika põhitõdesid käsitlevas raamatus jäetakse sageduste usaldusvahemike teema täielikult tähelepanuta. Käesolevas artiklis vaatleme mitmeid viise sageduste usaldusvahemike arvutamiseks, eeldades valimi omadusi, nagu mittekordumine ja representatiivsus, samuti vaatluste sõltumatust üksteisest. Käesolevas artiklis ei mõisteta sagedust absoluutarvuna, mis näitab, mitu korda see või teine ​​väärtus kokkuvõttes esineb, vaid suhtelist väärtust, mis määrab uuringus osalejate osakaalu, kellel on uuritav tunnus.

Biomeditsiinilistes uuringutes kasutatakse kõige sagedamini 95% usaldusvahemikke. See usaldusvahemik on piirkond, millesse tegelik osakaal langeb 95% ajast. Teisisõnu võib 95% kindlusega väita, et tunnuse esinemissageduse tegelik väärtus üldpopulatsioonis jääb 95% usaldusvahemikku.

Enamik meditsiiniteadlastele mõeldud statistikaõpikuid teatab, et sagedusviga arvutatakse valemi abil

kus p on tunnuse esinemise sagedus valimis (väärtus 0 kuni 1). Enamikus kodumaistes teadusartiklites on märgitud tunnuse esinemissageduse väärtus valimis (p), samuti selle viga (s) kujul p ± s. Siiski on otstarbekam esitada tunnuse esinemissageduse üldpopulatsioonis 95% usaldusvahemik, mis hõlmab väärtusi alates

enne.

Mõnes õpikus on väikeste valimite puhul soovitatav N - 1 vabadusastme puhul väärtus 1,96 asendada t väärtusega, kus N on vaatluste arv valimis. T väärtuse leiate t-jaotuse tabelitest, mis on saadaval peaaegu kõigis statistikaõpikutes. t jaotuse kasutamine Waldi meetodi jaoks ei anna nähtavaid eeliseid teiste allpool käsitletud meetodite ees ja seetõttu ei tervita seda mõned autorid.

Ülaltoodud meetod sageduste või murdude usaldusvahemike arvutamiseks on oma nime saanud Abraham Waldi järgi (Abraham Wald, 1902–1950), kuna seda hakati laialdaselt kasutama pärast Waldi ja Wolfowitzi avaldamist 1939. aastal. Meetodi enda pakkus aga välja Pierre Simon Laplace (1749–1827) juba 1812. aastal.

Waldi meetod on väga populaarne, kuid selle rakendamine on seotud märkimisväärsete probleemidega. Meetodit ei soovitata kasutada väikeste valimite puhul, samuti juhtudel, kui tunnuse esinemissagedus kipub olema 0 või 1 (0% või 100%) ning sageduste 0 ja 1 puhul pole see lihtsalt võimalik. normaaljaotuse lähendus, mida kasutatakse vea arvutamisel, "ei tööta" juhtudel, kui n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Kuna uus muutuja on normaalse jaotusega, on muutuja φ 95% usaldusvahemiku alumine ja ülemine piir φ-1,96 ja φ+1,96 vasakult">

Väikeste valimite 1,96 asemel on N - 1 vabadusastmega soovitatav asendada t väärtus. See meetod ei anna negatiivseid väärtusi ja võimaldab teil sageduste usaldusvahemikke täpsemalt hinnata kui Waldi meetod. Lisaks on seda kirjeldatud paljudes kodumaistes meditsiinistatistika teatmeteostes, mis aga ei toonud kaasa selle laialdast kasutamist meditsiiniuuringutes. Usaldusvahemike arvutamine nurgateisendusega ei ole soovitatav 0-le või 1-le lähenevate sageduste korral.

Siinkohal tavaliselt lõpeb usaldusvahemike hindamise meetodite kirjeldus enamikus arstiteadlastele mõeldud statistika aluste raamatutes ning see probleem on omane mitte ainult kodumaisele, vaid ka välismaisele kirjandusele. Mõlemad meetodid põhinevad keskpiiri teoreemil, mis tähendab suurt valimit.

Arvestades puudusi usaldusvahemike hindamisel ülaltoodud meetodite abil, pakkusid Clopper (Clopper) ja Pearson (Pearson) 1934. aastal välja meetodi nn täpse usaldusvahemiku arvutamiseks, võttes arvesse uuritava tunnuse binoomjaotust. See meetod on saadaval paljudes veebikalkulaatorites, kuid sel viisil saadud usaldusvahemikud on enamasti liiga laiad. Samal ajal on seda meetodit soovitatav kasutada juhtudel, kui on vaja konservatiivset hinnangut. Meetodi konservatiivsus suureneb valimi suuruse vähenemisel, eriti N puhul< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Paljude statistikute sõnul tehakse sageduste usaldusvahemike optimaalseim hinnang Wilsoni meetodi abil, mis pakuti välja juba 1927. aastal, kuid mida kodumaistes biomeditsiinilistes uuringutes praktiliselt ei kasutatud. See meetod mitte ainult ei võimalda hinnata usaldusvahemikke nii väga väikeste kui ka väga kõrgete sageduste jaoks, vaid on rakendatav ka väikese arvu vaatluste jaoks. IN üldine vaade usaldusvahemik Wilsoni valemi järgi on kujul alates



kus see võtab 95% usaldusvahemiku arvutamisel väärtuse 1,96, N on vaatluste arv ja p on tunnuse sagedus valimis. See meetod on saadaval veebikalkulaatorites, seega pole selle rakendamine problemaatiline. ja ei soovita seda meetodit kasutada n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Lisaks Wilsoni meetodile arvatakse, et Agresti-Caulli korrigeeritud Waldi meetod annab sageduste usaldusvahemiku optimaalse hinnangu. Agresti-Coulle'i parandus on Waldi valemis valimi tunnuse esinemissageduse (p) asendamine p`-ga, mille arvutamisel lisatakse lugejale 2 ja nimetajale 4, st. , p` = (X + 2) / (N + 4), kus X on uuringus osalejate arv, kellel on uuritav tunnus, ja N on valimi suurus. See modifikatsioon annab Wilsoni valemi tulemustele väga sarnased tulemused, välja arvatud juhul, kui sündmuste määr läheneb 0% või 100% ja valim on väike. Lisaks ülaltoodud sageduste usaldusvahemike arvutamise meetoditele on väikeste valimite puhul välja pakutud pidevuse parandusi nii Waldi kui ka Wilsoni meetodi puhul, kuid uuringud on näidanud, et nende kasutamine ei ole asjakohane.

Kaaluge ülaltoodud meetodite rakendamist usaldusvahemike arvutamiseks kahe näite abil. Esimesel juhul uurime suurt valimit 1000 juhuslikult valitud uuringus osalejast, kellest 450-l on uuritav tunnus (olgu see siis riskitegur, tulemus või mõni muu tunnus), mille esinemissagedus on 0,45 või 45%. Teisel juhul viiakse uuring läbi väikese valimiga, näiteks ainult 20 inimesega, ja ainult 1 uuringus osalejal (5%) on uuritav tunnus. Usaldusvahemikud Waldi meetodi jaoks, Waldi meetodi jaoks Agresti-Colli korrektsiooniga ja Wilsoni meetodi jaoks arvutati Jeff Sauro välja töötatud veebikalkulaatori abil (http://www./wald.htm). Järjepidevuse järgi korrigeeritud Wilsoni usaldusvahemikud arvutati kalkulaatoriga, mille pakub Wassar Stats: Statistical Computation veebisait (http://faculty.vassar.edu/lowry/prop1.html). Fisheri nurkteisendust kasutavad arvutused viidi läbi "käsitsi", kasutades t kriitilist väärtust vastavalt 19 ja 999 vabadusastme jaoks. Mõlema näite arvutustulemused on toodud tabelis.

Usaldusvahemikud on arvutatud kahe tekstis kirjeldatud näite jaoks kuuel erineval viisil

Usaldusintervalli arvutamise meetod

P=0,0500 ehk 5%

95% CI, kui X = 450, N = 1000, P = 0,4500 või 45%

–0,0455–0,2541

Walda Agresti-Colli korrektsiooniga

<,0001–0,2541

Wilson koos järjepidevuse korrektsiooniga

Klopper-Pearsoni "täpne meetod"

Nurga teisendus

<0,0001–0,1967

Nagu tabelist näha, läheb esimese näite puhul "üldtunnustatud" Waldi meetodil arvutatud usaldusvahemik negatiivsesse piirkonda, mis ei saa sageduste puhul nii olla. Kahjuks pole sellised juhtumid vene kirjanduses haruldased. Traditsiooniline viis andmete esitamiseks sagedusena ja selle viga varjab seda probleemi osaliselt. Näiteks kui tunnuse esinemissagedus (protsentides) on esitatud kui 2,1 ± 1,4, siis see ei ole nii "ärritav" kui 2,1% (95% CI: –0,7; 4,9), kuigi ja tähendab sama. Waldi meetod Agresti-Coulle'i parandusega ja nurkteisendust kasutav arvutus annab nullile kalduva alumise piiri. Wilsoni meetod koos pidevuse korrigeerimisega ja "täpne meetod" annavad laiemad usaldusvahemikud kui Wilsoni meetod. Teise näite puhul annavad kõik meetodid ligikaudu ühesugused usaldusvahemikud (erinevused ilmnevad vaid tuhandikes), mis pole üllatav, kuna sündmuse sagedus selles näites ei erine palju 50% -st ja valimi suurus on üsna suur .

Lugejatele, keda see probleem huvitab, võib soovitada R. G. Newcombe’i ja Browni, Cai ja Dasgupta töid, mis annavad plussid ja miinused vastavalt 7 ja 10 erineva usaldusintervalli arvutamise meetodi kasutamisele. Kodumaistest käsiraamatutest on soovitatav raamat ja, milles lisaks teooria üksikasjalikule kirjeldusele on välja toodud Waldi, Wilsoni meetodid, samuti meetod usaldusvahemike arvutamiseks, võttes arvesse binoomsagedusjaotust. . Lisaks tasuta veebikalkulaatoritele (http://www./wald.htm ja http://faculty.vassar.edu/lowry/prop1.html) saab sageduste (ja mitte ainult!) usaldusvahemikke arvutada, kasutades CIA programm ( Confidence Intervals Analysis), mille saab alla laadida aadressilt http://www. meditsiinikool. soton. ac. uk/cia/ .

Järgmises artiklis käsitletakse kvalitatiivsete andmete võrdlemise ühemõõtmelisi viise.

Bibliograafia

Lihtkeeles meditsiinistatistika: sissejuhatav kursus / A. Banerzhi. - M. : Praktiline meditsiin, 2007. - 287 lk. Meditsiinistatistika / . - M. : Meditsiiniinfo Agentuur, 2007. - 475 lk. Meditsiini-bioloogiline statistika / S. Glants. - M. : Praktika, 1998. Andmetüübid, leviku kontrollimine ja kirjeldav statistika / // Inimökoloogia - 2008. - Nr 1. - Lk 52–58. KOOS. Meditsiinistatistika: õpik / . - Rostov n / D: Phoenix, 2007. - 160 lk. Rakendusmeditsiiniline statistika / ,. - Peterburi. : Folio, 2003. - 428 lk. F. Biomeetria / . - M. : Kõrgkool, 1990. - 350 lk. A. Matemaatiline statistika meditsiinis / , . - M. : Rahandus ja statistika, 2007. - 798 lk. Matemaatiline statistika kliinilistes uuringutes / , . - M. : GEOTAR-MED, 2001. - 256 lk. Junkerov V. JA. Meditsiiniuuringute andmete meditsiinilis-statistiline töötlemine /,. - Peterburi. : VmedA, 2002. - 266 lk. Agresti A. Ligikaudne on parem kui täpne binoomproportsioonide intervallide hindamiseks / A. Agresti, B. Coull // Ameerika statistik. - 1998. - N 52. - S. 119-126. Altman D. Kindel statistika // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 lk. Pruun L.D. Intervall estimation for a binomial ratio / L. D. Brown, T. T. Cai, A. Dasgupta // Statistikateadus. - 2001. - N 2. - Lk 101-133. Clopper C.J. Usaldus- või usalduspiiride kasutamine, mida illustreeritakse binoomarvu puhul / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - Lk 404-413. Garcia-Perez M. A. Binoomparameetri usaldusvahemikust / M. A. Garcia-Perez // Kvaliteet ja kvantiteet. - 2005. - N 39. - Lk 467-481. Motulsky H. Intuitiivne biostatistika // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 lk. Newcombe R.G. Kahepoolsed usaldusintervallid ühe proportsiooni jaoks: seitsme meetodi võrdlus / R. G. Newcombe // Meditsiini statistika. - 1998. - N. 17. - Lk 857–872. Sauro J. Valmimismäärade hindamine väikestest valimitest binoomsete usaldusvahemike abil: võrdlused ja soovitused / J. Sauro, J. R. Lewis // Proceedings of the human factor and ergonomics Society aastakoosolek. – Orlando, Florida, 2005. Wald A. Pidevate jaotusfunktsioonide usalduspiirid // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - Lk 105–118. Wilson E.B. Tõenäoline järeldus, pärimisseadus ja statistiline järeldus / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - Lk 209-212.

PROPORTSIOONIDE KONFIDENTSIAALID

A. M. Grjibovski

Riiklik Rahvatervise Instituut, Oslo, Norra

Artiklis esitatakse mitmed meetodid binoomproportsioonide usaldusvahemike arvutamiseks, nimelt Waldi, Wilsoni, arcsiini, Agresti-Coulli ja täpsed Clopper-Pearsoni meetodid. Töö annab ainult üldise sissejuhatuse binoomproportsiooni usaldusintervallide hindamise probleemisse ja selle eesmärk ei ole mitte ainult ärgitada lugejaid kasutama usaldusvahemikke enda empiiriliste uurimisvahemike tulemuste esitamisel, vaid ka julgustada neid enne statistikaraamatutega tutvuma. enda andmete analüüsimiseks ja käsikirjade ettevalmistamiseks.

võtmesõnad: usaldusvahemik, proportsioon

Kontaktinfo:

Oslo, Norra riikliku rahvatervise instituudi vanemnõunik

Eelmistes alajaotistes käsitlesime tundmatu parameetri hindamise küsimust Aüks number. Sellist hinnangut nimetatakse "punktiks". Paljude ülesannete puhul pole vaja ainult parameetrit leida A sobiv arvväärtus, vaid hinnake ka selle täpsust ja usaldusväärsust. On vaja teada, milliseid vigu parameetrite asendamine kaasa tuua võib A selle punkthinnang A ja kui suure kindlusega võime eeldada, et need vead ei ületa teadaolevaid piire?

Sedalaadi probleemid on eriti olulised väikese arvu vaatluste puhul, kui punkthinnang ja sisse on suures osas juhuslik ja a ligikaudne asendamine a-ga võib põhjustada tõsiseid vigu.

Anda aimu hinnangu täpsusest ja usaldusväärsusest A,

matemaatilises statistikas kasutatakse nn usaldusvahemikke ja usaldustõenäosusi.

Laske parameetri jaoks A saadud kogemusest erapooletu hinnanguga A. Tahame antud juhul hinnata võimalikku viga. Määrakem mingi piisavalt suur tõenäosus p (näiteks p = 0,9, 0,95 või 0,99), et sündmust tõenäosusega p saaks pidada praktiliselt kindlaks, ja leiame s väärtuse, mille korral

Seejärel asendamisel ilmneva vea praktiliselt võimalike väärtuste vahemik A peal A, on ± s; suured absoluutvead ilmnevad ainult väikese tõenäosusega a = 1 - p. Kirjutame (14.3.1) ümber järgmiselt:

Võrdsus (14.3.2) tähendab, et tõenäosusega p on parameetri tundmatu väärtus A jääb intervalli sisse

Sel juhul tuleb märkida üks asjaolu. Varem kaalusime korduvalt tõenäosust, et juhuslik suurus langeb antud mittejuhuslikku intervalli. Siin on olukord erinev: A mitte juhuslik, vaid juhuslik intervall / r. Juhuslikult selle asukoht x-teljel, mille määrab selle keskpunkt A; üldiselt on ka intervalli 2s pikkus juhuslik, kuna s väärtus arvutatakse reeglina katseandmete põhjal. Seetõttu oleks sel juhul parem tõlgendada p väärtust mitte kui tõenäosust "punkti tabada" A intervalli / p, vaid tõenäosusena, et juhuslik intervall / p katab punkti A(joonis 14.3.1).

Riis. 14.3.1

Tõenäosust p nimetatakse usalduse tase ja intervall / p - usaldusvahemik. Intervallide piirid kui. a x \u003d a- s ja a 2 = a + ja neid kutsutakse usalduse piirid.

Andkem usaldusintervalli mõistele veel üks tõlgendus: seda võib pidada parameetri väärtuste intervalliks A,ühilduvad eksperimentaalsete andmetega ega ole nendega vastuolus. Tõepoolest, kui nõustume pidama sündmust tõenäosusega a = 1-p praktiliselt võimatuks, siis on need parameetri a väärtused, mille puhul a - a> s tuleb tunnistada katseandmetega vastuolus olevaks ja need, mille puhul |a - A a t na 2 .

Laske parameetri jaoks A on erapooletu hinnang A. Kui me teaksime suuruse jaotuse seadust A, oleks usaldusvahemiku leidmise probleem üsna lihtne: piisaks s väärtuse leidmisest, mille jaoks

Raskus seisneb selles, et hinnangu jaotusseadus A sõltub koguse jaotuse seadusest X ja järelikult ka selle tundmatutel parameetritel (eriti parameetril endal A).

Sellest raskusest ülesaamiseks saab rakendada järgmist ligikaudset nippi: asendada avaldises olevad tundmatud parameetrid nende punkthinnangutega. Suhteliselt suure hulga katsetega P(umbes 20 ... 30) annab see tehnika tavaliselt täpsuse osas rahuldavaid tulemusi.

Vaatleme näiteks matemaatilise ootuse usaldusvahemiku probleemi.

Lase toota P x, mille tunnusteks on matemaatiline ootus T ja dispersioon D- teadmata. Nende parameetrite kohta saadi järgmised hinnangud:

Matemaatilise ootuse jaoks on vaja koostada usaldusvahemik / р, mis vastab usaldustõenäosusele р T kogused x.

Selle probleemi lahendamisel kasutame asjaolu, et kogus T on summa P sõltumatud identselt jaotatud juhuslikud muutujad X h ja keskpiiri teoreemi järgi piisavalt suureks P selle jaotusseadus on normilähedane. Praktikas võib isegi suhteliselt väikese liikmete arvuga (suurusjärgus 10 ... 20) summa jaotusseadust pidada ligikaudu normaalseks. Eeldame, et väärtus T jaotatakse tavaseaduse järgi. Selle seaduse tunnused – matemaatiline ootus ja dispersioon – on vastavalt võrdsed T Ja

(vt ptk 13 alajaotis 13.3). Oletame, et väärtus D on meile teada ja leiame sellise väärtuse Ep mille jaoks

Rakendades 6. peatüki valemit (6.3.5), väljendame tõenäosuse (14.3.5) vasakul küljel normaaljaotuse funktsioonina

kus on hinnangu standardhälve T.

Võrrandist

leidke Sp väärtus:

kus arg Ф* (x) on Ф* pöördfunktsioon (X), need. argumendi selline väärtus, mille normaaljaotuse funktsioon on võrdne X.

Dispersioon D, mille kaudu väärtust väljendatakse A 1P, me ei tea täpselt; selle ligikaudse väärtusena võite kasutada hinnangut D(14.3.4) ja pange ligikaudu:

Seega on usaldusvahemiku konstrueerimise probleem ligikaudu lahendatud, mis on võrdne:

kus gp on defineeritud valemiga (14.3.7).

Pöördinterpolatsiooni vältimiseks funktsiooni Ф * (l) tabelites s p arvutamisel on mugav koostada spetsiaalne tabel (tabel 14.3.1), kus on loetletud suuruse väärtused.

olenevalt r-st. Väärtus (p määrab normaalseaduse jaoks standardhälbete arvu, mis tuleb dispersioonikeskmest paremale ja vasakule jätta kõrvale, et saadavasse piirkonda langemise tõenäosus oleks võrdne p-ga.

Väärtuse 7 p kaudu väljendatakse usaldusvahemikku järgmiselt:

Tabel 14.3.1

Näide 1. Väärtusega viidi läbi 20 katset x; tulemused on toodud tabelis. 14.3.2.

Tabel 14.3.2

On vaja leida kvantiteedi matemaatilise ootuse hinnang X ja konstrueerida usaldusvahemik, mis vastab usaldustasemele p = 0,8.

Lahendus. Meil on:

Valides lähtepunktiks n: = 10, leiame kolmanda valemi (14.2.14) järgi erapooletu hinnangu D :

Tabeli järgi 14.3.1 leiame

Usalduse piirid:

Usaldusvahemik:

Parameetrite väärtused T, selles intervallis asuvad andmed ühilduvad tabelis toodud katseandmetega. 14.3.2.

Sarnasel viisil saab dispersiooni jaoks konstrueerida usaldusvahemiku.

Lase toota P sõltumatud katsed juhusliku muutujaga X tundmatute parameetritega alates ja A ning dispersiooni jaoks D erapooletu hinnang saadakse:

Dispersioonile tuleb ligikaudselt luua usaldusvahemik.

Valemist (14.3.11) on näha, et väärtus D esindab

summa P juhuslikud muutujad kujul . Need väärtused ei ole

sõltumatu, kuna ükskõik milline neist sisaldab kogust T, sõltuvad kõigist teistest. Siiski saab näidata, et nagu P ka nende summa jaotusseadus on normaallähedane. Peaaegu kell P= 20...30 võib seda juba normaalseks pidada.

Oletame, et see on nii, ja leiame selle seaduse tunnused: matemaatiline ootus ja dispersioon. Alates skoori D- siis erapooletu M[D] = D.

Dispersiooni arvutamine D D on seotud suhteliselt keerukate arvutustega, seega anname selle avaldise ilma tuletamiseta:

kus c 4 - suuruse neljas keskmoment x.

Selle avaldise kasutamiseks peate selles asendama väärtused 4 ja D(vähemalt ligikaudne). Selle asemel D saate hindamist kasutada D. Põhimõtteliselt saab neljanda keskmomendi asendada ka selle hinnanguga, näiteks vormi väärtusega:

kuid selline asendamine annab äärmiselt madala täpsuse, kuna üldiselt määratakse piiratud arvu katsete korral kõrgetasemelised momendid suurte vigadega. Kuid praktikas juhtub sageli, et suuruse jaotusseaduse vorm X ette teada: teadmata on ainult selle parameetrid. Seejärel võime proovida u4-d väljendada D.

Võtame kõige tavalisema juhtumi, kui väärtus X jaotatakse tavaseaduse järgi. Seejärel väljendatakse selle neljandat keskmomenti dispersioonina (vt 6. peatüki alajaotis 6.2);

ja valem (14.3.12) annab või

Asendab (14.3.14) tundmatu D tema hinnang D, saame: kust

Momenti u 4 saab väljendada D ka mõnel muul juhul, kui koguse jaotamine X ei ole normaalne, kuid selle välimus on teada. Näiteks ühtlase tiheduse seaduse jaoks (vt 5. peatükk) on meil:

kus (a, P) on intervall, millel seadus on antud.

Seega

Valemi (14.3.12) järgi saame: kust leiame ligikaudu

Juhtudel, kui väärtuse 26 jaotusseaduse vorm on teadmata, on a /) väärtuse hindamisel siiski soovitatav kasutada valemit (14.3.16), kui pole erilist alust arvata, et see seadus erineb oluliselt tavalisest (on märgatav positiivne või negatiivne kurtoos) .

Kui a /) ligikaudne väärtus saadakse ühel või teisel viisil, siis on dispersioonile võimalik konstrueerida usaldusvahemik samamoodi nagu me selle matemaatilise ootuse jaoks koostasime:

kus antud tõenäosusest p sõltuv väärtus on leitud tabelist. 14.3.1.

Näide 2. Leidke juhusliku muutuja dispersiooni ligikaudu 80% usaldusvahemik X näite 1 tingimustel, kui on teada, et väärtus X jaotatakse normaalsele lähedase seaduse järgi.

Lahendus. Väärtus jääb samaks nagu tabelis. 14.3.1:

Vastavalt valemile (14.3.16)

Valemi (14.3.18) järgi leiame usaldusvahemiku:

Standardhälbe vastav väärtuste vahemik: (0,21; 0,29).

14.4. Täpsed meetodid normaalseaduse järgi jaotatud juhusliku suuruse parameetrite usaldusvahemike konstrueerimiseks

Eelmises alapeatükis käsitlesime ligikaudseid meetodeid keskmise ja dispersiooni usaldusvahemike koostamiseks. Siin anname ülevaate täpsetest meetoditest sama probleemi lahendamiseks. Rõhutame, et usaldusvahemike täpseks leidmiseks on tingimata vaja eelnevalt teada suuruse jaotusseaduse vormi x, arvestades, et see ei ole ligikaudsete meetodite rakendamiseks vajalik.

Usaldusvahemike konstrueerimise täpsete meetodite idee on järgmine. Iga usaldusvahemik leitakse tingimusest, mis väljendab teatud ebavõrdsuse täitumise tõenäosust, mis sisaldab meile huvipakkuvat hinnangut A. Hinnete jaotamise seadus Aüldiselt sõltub koguse tundmatutest parameetritest x. Mõnikord on aga võimalik juhuslikust suurusest ebavõrdsust sisse kanda A mõnele muule vaadeldavate väärtuste funktsioonile X p X 2, ..., X lk. mille jaotusseadus ei sõltu tundmatutest parameetritest, vaid sõltub ainult katsete arvust ja suuruse jaotusseaduse vormist x. Seda tüüpi juhuslikud muutujad mängivad matemaatilises statistikas suurt rolli; neid on kõige detailsemalt uuritud koguse normaaljaotuse korral x.

Näiteks on tõestatud, et koguse normaaljaotuse korral X juhuslik väärtus

alluvad nn Üliõpilaste jaotusseadus Koos P- 1 vabadusaste; selle seaduse tihedusel on vorm

kus G(x) on teadaolev gammafunktsioon:

Samuti on tõestatud, et juhuslik suurus

on "distribution % 2 " koos P- 1 vabadusaste (vt ptk 7), mille tihedust väljendatakse valemiga

Jaotuste (14.4.2) ja (14.4.4) tuletustel peatumata näitame, kuidas neid saab rakendada parameetrite usaldusvahemike koostamisel. Ty D.

Lase toota P sõltumatud katsed juhusliku muutujaga x, jaotatud tavaseaduse järgi tundmatute parameetritega TIO. Nende parameetrite puhul hinnangud

Mõlema parameetri jaoks on vaja konstrueerida usaldusvahemikud, mis vastavad usalduse tõenäosusele p.

Alustuseks koostame matemaatilise ootuse usaldusvahemiku. On loomulik, et see intervall on sümmeetriline T; tähistab s p poolt intervalli pikkusest. Sp väärtus tuleb valida nii, et tingimus

Proovime juhuslikust suurusest võrdsuse (14.4.5) vasakut poolt edasi anda T juhuslikule suurusele T, levitatakse vastavalt Studenti seadusele. Selleks korrutame mõlemad võrratuse osad |m-w?|

positiivse väärtuseni: või kasutades tähist (14.4.1),

Leiame sellise arvu / p, et väärtuse / p on võimalik leida tingimusest

Valemist (14.4.2) on näha, et (1) on paarisfunktsioon, seega (14.4.8) annab

Võrdsus (14.4.9) määrab väärtuse / p sõltuvalt p-st. Kui teie käsutuses on integraalväärtuste tabel

siis saab väärtuse / p leida tabelist pöördinterpolatsiooni teel. Siiski on mugavam koostada väärtuste / p tabel eelnevalt. Selline tabel on toodud lisas (tabel 5). See tabel näitab väärtusi, mis sõltuvad usalduse tõenäosusest p ja vabadusastmete arvust P- 1. Olles määranud / p vastavalt tabelile. 5 ja eeldades

leiame pool usaldusvahemiku / p laiusest ja intervalli enda

Näide 1. Juhusliku muutujaga viidi läbi 5 sõltumatut katset x, tavaliselt jaotatud tundmatute parameetritega T ja umbes. Katsete tulemused on toodud tabelis. 14.4.1.

Tabel 14.4.1

Leidke hinnang T matemaatilise ootuse jaoks ja konstrueerige selle jaoks 90% usaldusvahemik / p (st intervall, mis vastab usalduse tõenäosusele p \u003d 0,9).

Lahendus. Meil on:

Taotluse tabeli 5 kohaselt P - 1 = 4 ja p = 0,9 leiame kus

Usaldusvahemik on

Näide 2. Alajaotise 14.3 näite 1 tingimuste jaoks, eeldades väärtust X normaalselt jaotatud, leidke täpne usaldusvahemik.

Lahendus. Taotluse tabeli 5 järgi leiame kl P - 1 = 19ir =

0,8 / p = 1,328; siit

Võrreldes alajao 14.3 näite 1 lahendusega (e p = 0,072), näeme, et lahknevus on väga väike. Kui jätta täpsus teise kümnendkohani, on täpse ja ligikaudse meetodiga leitud usaldusvahemikud samad:

Liigume edasi dispersiooni usaldusvahemiku konstrueerimise juurde. Võtke arvesse erapooletut dispersiooni hinnangut

ja väljendada juhuslikku suurust D väärtuse kaudu V(14.4.3) jaotusega x 2 (14.4.4):

Suuruse jaotusseaduse tundmine V, on võimalik leida intervall / (1 ), kuhu see etteantud tõenäosusega p langeb.

jaotusseadus k n _ x (v) I 7 väärtus on joonisel fig. 14.4.1.

Riis. 14.4.1

Tekib küsimus: kuidas valida intervalli / p? Kui suuruse jaotusseadus V oli sümmeetriline (nagu normaalseadus või Studenti jaotus), oleks loomulik võtta intervall /p matemaatilise ootuse suhtes sümmeetriliseks. Sel juhul seadus k n _ x (v) asümmeetriline. Leppigem kokku, et valime intervalli /p nii, et suuruse väljundi tõenäosused V väljaspool intervalli paremale ja vasakule (varjutatud alad joonisel 14.4.1) olid samad ja võrdsed

Selle omadusega intervalli / p konstrueerimiseks kasutame tabelit. 4 rakendust: see sisaldab numbreid y) selline, et

koguse eest V, millel on x 2 -jaotus r vabadusastmega. Meie puhul r = n- 1. Paranda r = n- 1 ja leidke tabeli vastavalt realt. 4 kaks väärtust x 2 -üks vastab tõenäosusele teine ​​- tõenäosused Märgime need

väärtused kell 2 Ja xl? Intervall on y 2 , vasakuga ja y ~õige ots.

Nüüd leiame nõutava usaldusvahemiku /| dispersiooni jaoks piiridega D, ja D2, mis katab asja D tõenäosusega p:

Koostame sellise intervalli / (, = (?> b A), mis katab punkti D siis ja ainult siis, kui väärtus V langeb intervalli / r. Näitame, et intervall

vastab sellele tingimusele. Tõepoolest, ebavõrdsus on samaväärsed ebavõrdsusega

ja need ebavõrdsused kehtivad tõenäosusega p. Seega leitakse dispersiooni usaldusvahemik ja seda väljendatakse valemiga (14.4.13).

Näide 3. Leidke dispersiooni usaldusvahemik alajaotise 14.3 näite 2 tingimustel, kui on teada, et väärtus X normaalselt jaotatud.

Lahendus. Meil on . Taotluse tabeli 4 kohaselt

leiame aadressil r = n - 1 = 19

Valemi (14.4.13) järgi leiame dispersiooni usaldusvahemiku

Standardhälbe vastav intervall: (0,21; 0,32). See intervall ületab vaid pisut intervalli (0,21; 0,29), mis saadi alajao 14.3 näites 2 ligikaudse meetodiga.

  • Joonis 14.3.1 vaatleb usaldusvahemikku, mis on sümmeetriline a suhtes. Üldiselt, nagu hiljem näeme, pole see vajalik.

Matemaatilise ootuse usaldusvahemik - see on selline andmetest arvutatud intervall, mis teadaoleva tõenäosusega sisaldab üldkogumi matemaatilist ootust. Matemaatilise ootuse loomulik hinnang on selle vaadeldud väärtuste aritmeetiline keskmine. Seetõttu kasutame tunnis edaspidi mõisteid "keskmine", "keskmine väärtus". Usaldusvahemiku arvutamise ülesannetes nõutakse kõige sagedamini vastust "Keskmise arvu [väärtus konkreetses ülesandes] usaldusvahemik on [madalama väärtuse] kuni [kõrgema väärtuseni]". Usaldusvahemiku abil on võimalik hinnata mitte ainult keskmisi väärtusi, vaid ka ühe või teise tunnuse osakaalu üldkogumis. Õppetunnis analüüsitakse keskmisi väärtusi, dispersiooni, standardhälvet ja viga, mille kaudu jõuame uute definitsioonide ja valemiteni Valimi ja populatsiooni karakteristikud .

Keskmise punkti- ja intervallhinnangud

Kui üldkogumi keskmist väärtust hinnatakse arvu (punkti) abil, siis üldkogumi tundmatu keskmise hinnanguks võetakse vaatluste valimi põhjal arvutatud konkreetne keskmine. Sel juhul ei lange valimi keskmise – juhusliku muutuja – väärtus kokku üldkogumi keskmise väärtusega. Seetõttu on valimi keskmise väärtuse näitamisel vajalik samaaegselt näidata ka valimi viga. Standardviga kasutatakse valimivea mõõduna, mida väljendatakse samades ühikutes kui keskmine. Seetõttu kasutatakse sageli järgmist tähistust: .

Kui keskmise hinnangut nõutakse siduma teatud tõenäosusega, siis huvipakkuva üldkogumi parameetrit tuleb hinnata mitte ühe arvu, vaid intervalli järgi. Usaldusvahemik on intervall, milles teatud tõenäosusega P leitakse üldkogumi hinnangulise näitaja väärtus. Usaldusvahemik, milles tõenäosusega P = 1 - α on juhuslik muutuja , arvutatakse järgmiselt:

,

α = 1 - P, mille võib leida peaaegu iga statistikat käsitleva raamatu lisast.

Praktikas ei ole üldkogumi keskmist ja dispersiooni teada, seega asendatakse üldkogumi dispersioon valimi dispersiooniga ja üldkogumi keskmine valimi keskmisega. Seega arvutatakse usaldusvahemik enamikul juhtudel järgmiselt:

.

Usaldusvahemiku valemit saab kasutada populatsiooni keskmise, kui hinnata

  • üldkogumi standardhälve on teada;
  • või üldkogumi standardhälve pole teada, kuid valimi suurus on suurem kui 30.

Valimi keskmine on üldkogumi keskmise erapooletu hinnang. Omakorda valimi dispersioon ei ole populatsiooni dispersiooni erapooletu hinnang. Valimi dispersiooni valemi populatsiooni dispersiooni erapooletu hinnangu saamiseks valimi suurus on n tuleks asendada n-1.

Näide 1 Teatud linna 100 juhuslikult valitud kohvikust kogutakse infot, et keskmine töötajate arv neis on 10,5 standardhälbega 4,6. Määrake usaldusvahemik 95% kohviku töötajate arvust.

kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,05 .

Seega jäi kohvikutöötajate keskmise arvu 95% usaldusvahemik 9,6 ja 11,4 vahele.

Näide 2 Juhusliku valimi jaoks 64 vaatlusest koosnevast üldpopulatsioonist arvutati järgmised koguväärtused:

väärtuste summa vaatlustes,

väärtuste keskmisest kõrvalekallete ruudu summa .

Arvutage eeldatava väärtuse 95% usaldusvahemik.

arvutage standardhälve:

,

arvutage keskmine väärtus:

.

Asendage usaldusvahemiku väärtused avaldises:

kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,05 .

Saame:

Seega jäi selle valimi matemaatilise ootuse 95% usaldusvahemik vahemikku 7,484 kuni 11,266.

Näide 3 Juhusliku valimi jaoks 100 vaatlusega üldpopulatsioonist arvutati keskmine väärtus 15,2 ja standardhälve 3,2. Arvutage eeldatava väärtuse 95% usaldusvahemik ja seejärel 99% usaldusvahemik. Kui valimi võimsus ja selle variatsioon jäävad samaks, kuid usaldustegur suureneb, kas siis usaldusvahemik kitseneb või laieneb?

Asendame need väärtused usaldusvahemiku avaldisesse:

kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,05 .

Saame:

.

Seega oli selle valimi keskmise 95% usaldusvahemik 14,57 kuni 15,82.

Jällegi asendame need väärtused usaldusvahemiku avaldisega:

kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,01 .

Saame:

.

Seega oli selle valimi keskmise 99% usaldusvahemik 14,37 kuni 16,02.

Nagu näete, suureneb usaldusteguri suurenedes ka standardse normaaljaotuse kriitiline väärtus ja seetõttu asuvad intervalli algus- ja lõpp-punktid keskmisest kaugemal ja seega ka matemaatilise ootuse usaldusvahemik. suureneb.

Erikaalu punkt- ja intervallhinnangud

Valimi mõne tunnuse osakaalu võib tõlgendada punkthinnanguna erikaal lk sama tunnus üldpopulatsioonis. Kui seda väärtust on vaja seostada tõenäosusega, tuleks arvutada erikaalu usaldusvahemik lk omadus üldpopulatsioonis suure tõenäosusega P = 1 - α :

.

Näide 4Ühes linnas on kaks kandidaati A Ja B kandideerib linnapeaks. Juhuslikult küsitleti 200 linnaelanikku, kellest 46% vastas, et hääletaks kandidaadi poolt A, 26% - kandidaadile B ja 28% ei tea, kelle poolt nad hääletavad. Määrake kandidaati toetavate linnaelanike osakaalu 95% usaldusvahemik A.

Laske meil olla suur hulk mõne tunnuse normaaljaotusega kaubad (näiteks täisladu sama liiki köögivilju, mille suurus ja kaal on erinevad). Tahad teada kogu kaubapartii keskmisi omadusi, kuid sul pole ei aega ega tahtmist iga köögivilja mõõtmiseks ja kaalumiseks. Saate aru, et see pole vajalik. Aga mitu tükki oleks vaja pisteliseks kontrolliks võtta? Enne mõne selle olukorra jaoks kasulike valemite esitamist tuletame meelde mõningaid tähistusi. Esiteks, kui me mõõdaksime kogu köögiviljaladu (seda elementide kogumit nimetatakse üldkogumiks), siis saaksime kogu meie käsutuses oleva täpsusega teada kogu partii massi keskmise väärtuse. Nimetagem seda keskmiseks X keskmine geen. - üldine keskmine. Me juba teame, mis on täielikult määratud, kui selle keskmine väärtus ja hälve s on teada. Tõsi, me ei tea siiani ei X keskmist geeni ega üldpopulatsiooni s-i. Saame võtta ainult mõne proovi, mõõta vajalikud väärtused ja arvutada selle valimi jaoks nii keskmise väärtuse X avg. kui ka standardhälbe S vyb. On teada, et kui meie valimikontroll sisaldab suurt hulka elemente (tavaliselt n rohkem kui 30) ja need on võetud tõesti juhuslikult, siis üldkogumi s peaaegu ei erine S valimitest. normaaljaotuse korral saame kasutada järgmisi valemeid:

95% tõenäosusega

99% tõenäosusega

.

Üldiselt tõenäosusega Р(t)

Seos t väärtuse ja tõenäosuse väärtuse P(t) vahel, millega tahame teada usaldusvahemikku, saab võtta järgmisest tabelist:

P(t) 0,683 0,950 0,954 0,990 0,997
t 1,00 1,96 2,00 2,58 3,00

Seega oleme kindlaks teinud, millises vahemikus on üldkogumi keskmine väärtus (antud tõenäosusega).

Kui meil pole piisavalt suurt valimit, ei saa me väita, et populatsioonis on s = S valimid. Lisaks on sel juhul problemaatiline valimi lähedus normaaljaotusele. Sel juhul kasutage valemis s asemel ka S s:

kuid t väärtus fikseeritud tõenäosuse korral P(t) sõltub elementide arvust valimis n. Mida suurem n, seda lähemal on saadud usaldusvahemik valemiga (1) antud väärtusele. Sel juhul on t väärtused võetud teisest tabelist (õpilase t-test), mille pakume allpool:

Studenti t-testi väärtused tõenäosusele 0,95 ja 0,99 

n P n P
0.95 0.99 0.95 0.99
2 12.71 63.66 18 2.11 2.90
3 4.30 9.93 19 2.10 2.88
4 3.18 5.84 20 2.093 2.861
5 2.78 4.60 25 2.064 2.797
6 2.57 4.03 30 2.045 2.756
7 2.45 3.71 35 2.032 2.720
8 2.37 3.50 40 2.022 2.708
9 2.31 3.36 45 2.016 2.692
10 2.26 3.25 50 2.009 2.679
11 2.23 3.17 60 2.001 2.662
12 2.20 3.11 70 1.996 2.649
13 2.18 3.06 80 1.991 2.640
14 2.16 3.01 90 1.987 2.633
15 2.15 2.98 100 1.984 2.627
16 2.13 2.95 120 1.980 2.617
17 2.12 2.92 >120 1.960 2.576

Näide 3 Ettevõtte töötajate hulgast valiti juhuslikult 30 inimest. Valimi põhjal selgus, et keskmine palk (kuus) on 10 tuhat rubla keskmise ruuthälbega 3 tuhat rubla. Tõenäosusega 0,99 määrake ettevõtte keskmine palk. Lahendus: Tingimuse järgi on meil n = 30, X vrd. = 10000, S = 3000, P = 0,99. Usaldusvahemiku leidmiseks kasutame Studenti kriteeriumile vastavat valemit. Tabeli järgi n \u003d 30 ja P \u003d 0,99 leiame t \u003d 2,756, seega

need. soovitud usaldusvahemik 27484< Х ср.ген < 32516.

Seega võib tõenäosusega 0,99 väita, et intervall (27484; 32516) sisaldab ettevõtte keskmist palka.
Loodame, et kasutate seda meetodit ilma, et teil oleks iga kord arvutustabelit kaasas. Arvutused saab teha automaatselt Excelis. Kui olete Exceli failis, klõpsake ülemises menüüs nuppu fx. Seejärel valige funktsioonide hulgast tüüp "statistiline" ja kastis pakutavast loendist - STEUDRASP. Seejärel sisestage viibale kursori väljale "tõenäosus" vastastikuse tõenäosuse väärtus (see tähendab, et meie puhul peate tõenäosuse 0,95 asemel sisestama tõenäosuse 0,05). Ilmselt arvutustabel koostatud nii, et tulemus vastaks küsimusele, kui suure tõenäosusega võime eksida. Samamoodi sisestage väljale "vabadusaste" oma valimi väärtus (n-1).