Statistiliste lahenduste meetodid. Otsuste tegemise tõenäosuslikud ja statistilised mudelid II temaatiline planeerimine

2. OTSUSTETEORIA MÄÄRAMATUSTE KIRJELDUS

2.2. Tõenäosuslikud ja statistilised meetodid määramatuste kirjeldamiseks otsustusteoorias

2.2.1. Tõenäosusteooria ja matemaatiline statistika otsuste tegemisel

Kuidas kasutatakse tõenäosusteooriat ja matemaatilist statistikat? Need distsipliinid on tõenäosuslikkuse aluseks statistilised meetodid otsuse tegemine. Nende matemaatilise aparatuuri kasutamiseks on vaja otsustusprobleeme väljendada tõenäosus-statistiliste mudelite kaudu. Konkreetse tõenäosus-statistilise otsustusmeetodi rakendamine koosneb kolmest etapist:

Üleminek majanduslikult, juhtimis-, tehnoloogiliselt reaalsuselt abstraktsele matemaatilisele ja statistilisele skeemile, s.o. kontrollsüsteemi tõenäosusliku mudeli koostamine, tehnoloogiline protsess, otsustusprotseduur, eelkõige statistilise kontrolli tulemuste põhjal jne.

Puhtmatemaatilisi vahendeid kasutades arvutuste tegemine ja järelduste tegemine tõenäosusmudeli raames;

Matemaatiliste ja statistiliste järelduste tõlgendamine seoses reaalse olukorraga ja asjakohase otsuse tegemine (näiteks toote kvaliteedi vastavuse või mittevastavuse kohta kehtestatud nõuetele, tehnoloogilise protsessi kohandamise vajaduse jms kohta), eelkõige järeldused (defektsete tooteühikute osakaalu kohta partiis, tehnoloogilise protsessi kontrollitavate parameetrite jaotusseaduste konkreetse vormi kohta jne).

Matemaatilises statistikas kasutatakse tõenäosusteooria mõisteid, meetodeid ja tulemusi. Vaatleme majandus-, juhtimis-, tehnoloogiliste ja muudes olukordades otsustamise tõenäosuslike mudelite konstrueerimise põhiküsimusi. Tõenäosuslike ja statistiliste otsustusmeetodite regulatiivsete, tehniliste ja juhenddokumentide aktiivseks ja korrektseks kasutamiseks on vaja eelteadmisi. Seega on vaja teada, millistel tingimustel konkreetset dokumenti kasutada, millist algteavet on vaja selle valikuks ja rakendamiseks omada, milliseid otsuseid andmetöötluse tulemuste põhjal teha jne.

Rakenduse näited tõenäosusteooria ja matemaatiline statistika. Vaatleme tõenäosuslikuna mitmeid näiteid statistilised mudelid on hea vahend juhtimis-, tootmis-, majandus- ja rahvamajandusprobleemide lahendamiseks. Nii öeldakse näiteks A. N. Tolstoi romaanis “Kõndimine läbi piinade” (1. köide): “Töökoda toodab kakskümmend kolm protsenti praakidest, sina jääd selle näitaja juurde,” rääkis Strukov Ivan Iljitšile.

Tekib küsimus, kuidas neid sõnu tehasejuhtide vestluses mõista, kuna üks tootmisüksus ei saa olla 23% defektne. See võib olla hea või defektne. Tõenäoliselt pidas Strukov silmas seda, et suuremahulises partiis on ligikaudu 23% defektseid toodanguühikuid. Siis tekib küsimus, mida tähendab "ligikaudne"? Las 100 testitud toodanguühikust 30 osutuvad defektseks või 1000 - 300 või 100 000 - 30 000 jne, kas Strukovit peaks süüdistama valetamises?

Või teine ​​näide. Partiina kasutatav münt peab olema “sümmeetriline”, s.t. selle viskamisel peaks keskmiselt pooltel juhtudel ilmuma vapp ja pooltel juhtudel - räsi (sabad, number). Aga mida tähendab "keskmiselt"? Kui teete igas seerias palju 10 viske seeriat, siis kohtate sageli seeriaid, kus münt maandub vapina 4 korda. Sümmeetrilise mündi puhul juhtub see 20,5% jooksmistest. Ja kui pärast 100 000 viskamist on 40 000 vappi, kas saab münti pidada sümmeetriliseks? Otsuste tegemise protseduur põhineb tõenäosusteoorial ja matemaatilisel statistikal.

Kõnealune näide ei pruugi tunduda piisavalt tõsine. Siiski ei ole. Loosimist kasutatakse laialdaselt tööstuslike tehniliste ja majanduslike katsete korraldamisel, näiteks laagrite kvaliteedinäitaja (hõõrdemomendi) mõõtmise tulemuste töötlemisel sõltuvalt erinevatest tehnoloogilistest teguritest (säilituskeskkonna mõju, laagrite valmistamise meetodid enne mõõtmist). , laagrikoormuste mõju mõõtmisprotsessi ajal jne). P.). Oletame, et on vaja võrrelda laagrite kvaliteeti sõltuvalt nende ladustamise tulemustest erinevates säilitusõlides, st. koostisõlides A Ja IN. Sellise katse kavandamisel tekib küsimus, millised laagrid tuleks kompositsiooni õli sisse panna A, ja millised - õli koostises IN, kuid nii, et vältida subjektiivsust ja tagada tehtud otsuse objektiivsus.

Sellele küsimusele saab vastuse loosi teel. Sarnase näite võib tuua mis tahes toote kvaliteedikontrolliga. Otsustamaks, kas kontrollitav toodete partii vastab või ei vasta kehtestatud nõuetele, valitakse sellest proov. Proovikontrolli tulemuste põhjal tehakse järeldus kogu partii kohta. Sellisel juhul on proovi moodustamisel väga oluline vältida subjektiivsust, st on vaja, et iga kontrollitava partii tooteüksus oleks ühesuguse tõenäosusega valimisse valitud. Tootmistingimustes toimub tooteühikute valimine proovi jaoks tavaliselt mitte loosi teel, vaid spetsiaalsete juhuslike arvude tabelite või arvutite juhuslike numbrite andurite abil.

Sarnased võrdluse objektiivsuse tagamise probleemid tekivad ka erinevate tootmise korraldamise, tasustamise, pakkumiste ja konkursside ajal ning kandidaatide valimisel. vabu kohti ja nii edasi. Kõikjal vajame loosi või sarnaseid protseduure. Selgitame näitel tugevaima ja tugevuselt teise võistkonna väljaselgitamist olümpiasüsteemi järgi turniiri korraldamisel (kaotaja langeb välja). Las tugevam meeskond võidab alati nõrgemat. Selge on see, et meistriks tuleb kindlasti tugevaim meeskond. Tugevuselt teine ​​meeskond pääseb finaali siis ja ainult siis, kui tal pole enne finaali tulevase meistriga mänge. Kui selline mäng on kavas, siis tugevuselt teine ​​meeskond finaali ei pääse. Turniiri planeerija võib turniirilt enne tähtaega "välja lüüa" tugevuselt teise võistkonna, pannes selle esimeses kohtumises liidri vastu, või anda talle teise koha, tagades kohtumised nõrgemate meeskondadega kuni turniiri lõpuni. lõplik. Subjektiivsuse vältimiseks viiakse läbi viik. 8 meeskonnaga turniiri puhul on tõenäosus, et finaalis kohtuvad kaks paremat meeskonda, 4/7. Seetõttu lahkub tugevuselt teine ​​meeskond turniirilt varakult tõenäosusega 3/7.

Kõik tooteühikute mõõtmised (kasutades nihikut, mikromeetrit, ampermeetrit jne) sisaldavad vigu. Et teada saada, kas tegemist on süstemaatiliste vigadega, on vaja teha korduvaid mõõtmisi tooteühiku kohta, mille omadused on teada (näiteks standardproov). Tuleb meeles pidada, et lisaks süstemaatilisele veale esineb ka juhuslikku viga.

Seetõttu tekib küsimus, kuidas mõõtmistulemustest välja selgitada, kas tegemist on süstemaatilise veaga. Kui märkida ainult see, kas järgmisel mõõtmisel saadud viga on positiivne või negatiivne, saab selle ülesande taandada eelmisele. Tõepoolest, võrdleme mõõtmist mündi viskamisega, positiivset viga vapi kadumisega, negatiivset ruudustikuga (nullviga piisava arvu skaalajaotustega peaaegu kunagi ei esine). Seejärel võrdub süstemaatilise vea puudumise kontrollimine mündi sümmeetria kontrollimisega.

Nende kaalutluste eesmärk on taandada süstemaatilise vea puudumise kontrollimise probleem mündi sümmeetria kontrollimise probleemiks. Ülaltoodud arutluskäik viib matemaatilise statistika nn märgikriteeriumini.

Tehnoloogiliste protsesside statistilises reguleerimises, mis põhinevad matemaatilise statistika meetoditel, töötatakse välja statistilise protsessi juhtimise reeglid ja plaanid, mille eesmärk on tehnoloogiliste protsesside probleemide õigeaegne avastamine ja meetmete võtmine nende kohandamiseks ja selliste toodete väljalaskmise vältimiseks, mis ei tööta. vastama kehtestatud nõuetele. Nende meetmete eesmärk on vähendada tootmiskulusid ja madala kvaliteediga üksuste tarnimisest tulenevaid kadusid. Statistilise vastuvõtukontrolli käigus koostatakse matemaatilise statistika meetoditele tuginedes kvaliteedikontrolli plaanid tootepartiide proovide analüüsimise teel. Raskus seisneb selles, et osatakse õigesti üles ehitada tõenäosuslik-statistilised otsustusmudelid, mille põhjal saab vastata ülaltoodud küsimustele. Matemaatilises statistikas on selleks välja töötatud tõenäosuslikud mudelid ja meetodid hüpoteeside kontrollimiseks, eelkõige hüpoteesid, et defektsete toodanguühikute osakaal on võrdne teatud arvuga. p 0, Näiteks, p 0= 0,23 (meenutagem Strukovi sõnu A. N. Tolstoi romaanist).

Hindamisülesanded. Mitmetes juhtimis-, tootmis-, majandus- ja rahvamajanduslikes olukordades tekivad erinevat tüüpi probleemid - tõenäosusjaotuste omaduste ja parameetrite hindamise probleemid.

Vaatame näidet. Lase partii N elektrilambid Sellest partiist näidis n elektrilambid Tekib hulk loomulikke küsimusi. Kuidas määrata näidiselementide katsetulemuste põhjal elektrilampide keskmist kasutusiga ja millise täpsusega saab seda tunnust hinnata? Kuidas muutub täpsus, kui võtame suurema proovi? Mis tundide arvul T võib garanteerida, et vähemalt 90% elektrilampidest kestab T ja rohkem tunde?

Oletame, et valimi suuruse testimisel n elektrilambid osutusid vigaseks X elektrilambid Siis tekivad järgmised küsimused. Milliseid piire saab arvule määrata? D defektsed lambipirnid partiina, defektitaseme kohta D/ N ja nii edasi.?

Või on tehnoloogiliste protsesside täpsuse ja stabiilsuse statistilisel analüüsimisel vaja hinnata selliseid kvaliteedinäitajaid nagu kontrollitava parameetri keskmine väärtus ja selle hajumise määr vaadeldavas protsessis. Tõenäosusteooria järgi on soovitatav kasutada juhusliku suuruse keskmise väärtusena selle matemaatilist ootust ning dispersiooni, standardhälvet või variatsioonikoefitsienti dispersiooni statistilise tunnusena. See tõstatab küsimuse: kuidas neid statistilisi karakteristikuid näidisandmete põhjal hinnata ja millise täpsusega seda teha? Sarnaseid näiteid võib tuua palju. Siin oli oluline näidata, kuidas saab kasutada tõenäosusteooriat ja matemaatilist statistikat tootmise juhtimine statistikatoodete kvaliteedijuhtimise valdkonna otsuste tegemisel.

Mis on "matemaatiline statistika"? Matemaatilise statistika all mõistetakse „matemaatika haru, mis on pühendatud statistiliste andmete kogumise, süstematiseerimise, töötlemise ja tõlgendamise matemaatilistele meetoditele, samuti nende kasutamisele teaduslike või praktiliste järelduste tegemiseks. Matemaatilise statistika reeglid ja protseduurid põhinevad tõenäosusteoorial, mis võimaldab olemasoleva statistilise materjali põhjal hinnata igas ülesandes tehtud järelduste täpsust ja usaldusväärsust. Sel juhul viitavad statistilised andmed teabele teatud omadustega objektide arvu kohta mis tahes enam-vähem ulatuslikus kogus.

Sõltuvalt lahendatavate probleemide tüübist jagatakse matemaatiline statistika tavaliselt kolmeks osaks: andmete kirjeldamine, hindamine ja hüpoteeside testimine.

Sõltuvalt töödeldavate statistiliste andmete tüübist on matemaatiline statistika jagatud nelja valdkonda:

Ühemõõtmeline statistika (juhuslike muutujate statistika), milles vaatluse tulemust kirjeldatakse reaalarvuga;

Mitmemõõtmeline statistiline analüüs, kus objekti vaatlemise tulemust kirjeldatakse mitme numbriga (vektoriga);

Juhuslike protsesside ja aegridade statistika, kus vaatlustulemuseks on funktsioon;

Mittenumbrilise iseloomuga objektide statistika, milles vaatluse tulemus on mittenumbriline, näiteks on see hulk (geomeetriline kujund), järjestus või saadud mõõtmise tulemusena kvalitatiivsel kriteeriumil.

Ajalooliselt ilmusid esimesena mõned mittenumbrilise iseloomuga objektide statistika valdkonnad (eelkõige defektide osakaalu hindamise ja selle kohta püstitatud hüpoteeside kontrollimise probleemid) ja ühemõõtmeline statistika. Matemaatiline aparaat on nende jaoks lihtsam, seetõttu kasutatakse nende näidet tavaliselt matemaatilise statistika põhiideede demonstreerimiseks.

Ainult need andmetöötlusmeetodid, s.o. matemaatiline statistika on tõenduspõhine, mis põhineb asjakohaste reaalsete nähtuste ja protsesside tõenäosusmudelitel. Räägime tarbijakäitumise mudelitest, riskide esinemisest, toimimisest tehnoloogilised seadmed, katse tulemuste saamine, haiguse kulg jne. Reaalse nähtuse tõenäosusmudelit tuleks lugeda konstrueerituks, kui vaadeldavad suurused ja nendevahelised seosed on väljendatud tõenäosusteoorias. Vastavus tõenäosuslikule tegelikkuse mudelile, s.o. selle adekvaatsust põhjendatakse eelkõige statistiliste meetoditega hüpoteeside kontrollimiseks.

Mittetõenäosuslikud andmetöötlusmeetodid on uurimuslikud, neid saab kasutada ainult esialgses andmeanalüüsis, kuna need ei võimalda hinnata piiratud statistilise materjali põhjal tehtud järelduste täpsust ja usaldusväärsust.

Tõenäosuslikud ja statistilised meetodid on rakendatavad kõikjal, kus on võimalik konstrueerida ja põhjendada nähtuse või protsessi tõenäosusmudelit. Nende kasutamine on kohustuslik, kui valimiandmete põhjal tehtud järeldused kantakse üle kogu populatsioonile (näiteks proovist tervele tootepartiile).

Konkreetsetes rakendusvaldkondades kasutatakse nii tõenäosuslikke kui ka statistilisi üldkasutatavaid ja spetsiifilisi meetodeid. Näiteks tootmisjuhtimise sektsioonis, mis on pühendatud toodete kvaliteedijuhtimise statistilistele meetoditele, kasutatakse rakenduslikku matemaatilist statistikat (sh eksperimentide kavandamist). Selle meetoditega viiakse läbi tehnoloogiliste protsesside täpsuse ja stabiilsuse statistiline analüüs ning statistiline kvaliteedihindamine. Spetsiifiliste meetodite hulka kuuluvad tootekvaliteedi statistilise aktsepteerimise kontrolli meetodid, tehnoloogiliste protsesside statistiline reguleerimine, töökindluse hindamine ja kontroll jne.

Laialdaselt kasutatakse rakenduslikke tõenäosus- ja statistilisi distsipliine, nagu usaldusväärsuse teooria ja järjekorrateooria. Neist esimese sisu selgub nimest, teine ​​tegeleb selliste süsteemide uurimisega nagu telefonikeskjaam, mis võtab kõnesid vastu suvalistel aegadel – telefoniaparaadis numbreid valivate abonentide nõuded. Nende nõuete teenindamise kestus, s.o. vestluste kestust modelleeritakse ka juhuslike suurustega. Suure panuse nende erialade arengusse andis NSVL Teaduste Akadeemia korrespondentliige A.Ya. Khinchin (1894-1959), Ukraina NSV Teaduste Akadeemia akadeemik B. V. Gnedenko (1912-1995) ja teised kodumaised teadlased.

Lühidalt matemaatilise statistika ajaloost. Matemaatiline statistika kui teadus saab alguse kuulsa saksa matemaatiku Carl Friedrich Gaussi (1777-1855) töödest, kes tõenäosusteooriale tuginedes uuris ja põhjendas tema 1795. aastal loodud vähimruutude meetodit, mida kasutati astronoomiliste andmete töötlemiseks ( väikese planeedi Cerese orbiidi selgitamiseks). Tema järgi nimetatakse sageli ka üht populaarseimat tõenäosusjaotust, normaaljaotust ja juhuslike protsesside teoorias on peamiseks uurimisobjektiks Gaussi protsessid.

IN XIX lõpus V. - 20. sajandi algus Suure panuse matemaatilisse statistikasse andsid inglise teadlased, eelkõige K. Pearson (1857-1936) ja R. A. Fisher (1890-1962). Eelkõige töötas Pearson välja hii-ruuttesti statistiliste hüpoteeside kontrollimiseks ja Fisher dispersioonanalüüsi, eksperimentaaldisaini teooria ja maksimaalse tõenäosuse meetodi parameetrite hindamiseks.

Kahekümnenda sajandi 30. aastatel. Poolakas Jerzy Neyman (1894-1977) ja inglane E. Pearson arendasid üldine teooria statistiliste hüpoteeside testimine ja nõukogude matemaatikud akadeemik A.N. Kolmogorov (1903-1987) ja NSVL Teaduste Akadeemia korrespondentliige N. V. Smirnov (1900-1966) panid aluse mitteparameetrilisele statistikale. Kahekümnenda sajandi neljakümnendatel. Rumeenlane A. Wald (1902-1950) ehitas üles järjestikuse statistilise analüüsi teooria.

Matemaatiline statistika areneb praegu kiiresti. Seega saab viimase 40 aasta jooksul eristada nelja põhimõtteliselt uut uurimisvaldkonda:

Arendus ja rakendamine matemaatilised meetodid katsete planeerimine;

Mittenumbrilise iseloomuga objektide statistika arendamine nagu iseseisev suund rakenduslikus matemaatilises statistikas;

Kasutatavast tõenäosusmudelist väikestele kõrvalekalletele vastupidavate statistiliste meetodite väljatöötamine;

Statistilise andmeanalüüsi jaoks mõeldud arvutitarkvarapakettide loomise töö laialdane areng.

Tõenäosus-statistilised meetodid ja optimeerimine. Optimeerimise idee läbib kaasaegset rakenduslikku matemaatilist statistikat ja muid statistilisi meetodeid. Nimelt katsete planeerimise meetodid, statistiline vastuvõtukontroll, tehnoloogiliste protsesside statistiline reguleerimine jne. Seevastu optimeerimise formuleeringud otsuste tegemise teoorias, näiteks rakenduslik teooria toote kvaliteedi optimeerimise ja standardinõuete kohta, näevad ette tõenäosusstatistika meetodite laialdane kasutamine, peamiselt rakendatud matemaatiline statistika.

Tootmise juhtimises, eelkõige toote kvaliteedi ja standardinõuete optimeerimisel, on eriti oluline statistiliste meetodite rakendamine toote elutsükli algfaasis, s.o. uuringute staadiumis eksperimentaaldisaini arenduste ettevalmistamine (tootele paljulubavate nõuete väljatöötamine, eelprojekteerimine, lähteülesanne eksperimentaalseks arendamiseks). Selle põhjuseks on toote olelusringi algfaasis saadaoleva teabe piiratus ning vajadus prognoosida tehnilisi võimalusi ja majanduslikku olukorda tulevikuks. Statistilisi meetodeid tuleks kasutada optimeerimisülesande lahendamise kõigis etappides - muutujate skaleerimisel, toodete ja süsteemide toimimise matemaatiliste mudelite väljatöötamisel, tehniliste ja majanduslike katsete läbiviimisel jne.

Optimeerimisprobleemides, sealhulgas toodete kvaliteedi ja standardinõuete optimeerimisel, kasutatakse kõiki statistika valdkondi. Nimelt juhuslike suuruste statistika, mitmemõõtmeline statistiline analüüs, juhuslike protsesside ja aegridade statistika, mittenumbrilise iseloomuga objektide statistika. Soovitatav on valida statistiline meetod konkreetsete andmete analüüsimiseks vastavalt soovitustele.

Eelmine

Saada oma head tööd teadmistebaasi on lihtne. Kasutage allolevat vormi

Üliõpilased, magistrandid, noored teadlased, kes kasutavad teadmistebaasi oma õpingutes ja töös, on teile väga tänulikud.

postitatud http://www.allbest.ru/

[Sisesta tekst]

Sissejuhatus

1. Tõenäosusteooria ja matemaatiline statistika otsuste tegemisel

1.1 Kuidas kasutatakse tõenäosusteooriat ja matemaatilist statistikat

1.2 Näiteid tõenäosusteooria ja matemaatilise statistika rakendamisest

1.3 Hindamiseesmärgid

1.4 Mis on "matemaatiline statistika"

1.5 Lühidalt matemaatilise statistika ajaloost

1.6 Tõenäosus-statistilised meetodid ja optimeerimine

2. Tõenäosus-statistilise otsustamise tüüpilised praktilised probleemid ja nende lahendamise meetodid

2.1 Statistika ja rakendusstatistika

2.2 Tehnoloogiliste protsesside täpsuse ja stabiilsuse ning tootekvaliteedi statistilise analüüsi ülesanded

2.3 Ühemõõtmelise statistika (juhuslike suuruste statistika) probleemid

2.4 Mitmemõõtmeline statistiline analüüs

2.5 Juhuslike protsesside ja aegridade statistika

2.6 Mittenumbrilise iseloomuga objektide statistika

3. Tõenäosuslike ja statistiliste otsustusmeetodite rakendamine majandusprobleemide lahendamisel

Järeldus

Viited

Sissejuhatus

Tõenäosusstatistilisi otsustusmeetodeid kasutatakse juhul, kui tehtud otsuste efektiivsus sõltub teguritest, mis on juhuslikud suurused, mille tõenäosusjaotuse seadused ja muud statistilised tunnused on teada. Veelgi enam, iga otsus võib viia ühe paljudest võimalikest tulemustest ja igal tulemusel on teatav esinemise tõenäosus, mida saab arvutada. Iseloomustavad näitajad probleemne olukord, kirjeldatakse ka tõenäosustunnuste abil. Selliste otsustusülesannete puhul on otsustajal alati oht saada tulemus, millele ta ei orienteeru, valides juhuslike tegurite keskmistatud statistiliste karakteristikute põhjal optimaalse lahenduse, st otsus tehakse vastavalt riskitingimused.

Praktikas kasutatakse tõenäosuslikke ja statistilisi meetodeid sageli siis, kui valimiandmete põhjal tehtud järeldused kantakse üle kogu populatsioonile (näiteks valimilt tervele tootepartiile). Igas konkreetses olukorras tuleks aga esmalt hinnata põhimõttelist võimalust saada piisavalt usaldusväärseid tõenäosus- ja statistilisi andmeid.

Tõenäosusteooria ja matemaatilise statistika ideede ja tulemuste kasutamisel otsuste tegemisel on aluseks matemaatiline mudel, milles objektiivsed seosed väljenduvad tõenäosusteoorias. Tõenäosusi kasutatakse eelkõige selleks, et kirjeldada juhuslikkust, millega tuleb otsuste tegemisel arvestada. See viitab nii soovimatutele võimalustele (riskid) kui ka atraktiivsetele (“õnnelik juhus”).

Tõenäosus-statistiliste otsustusmeetodite olemus seisneb tõenäosuslike mudelite kasutamises, mis põhinevad valimi karakteristikuid kasutades hüpoteeside hindamisel ja kontrollimisel.

Valimikarakteristikute kasutamise loogika teoreetilistel mudelitel põhinevate otsuste tegemisel hõlmab kahe paralleelse mõistete seeria samaaegset kasutamist – need, mis on seotud teooriaga (tõenäosuslik mudel) ja need, mis on seotud praktikaga (vaatlustulemuste valim). Näiteks vastab teoreetiline tõenäosus valimi põhjal leitud sagedusele. Matemaatiline ootus (teoreetiline jada) vastab valimi aritmeetilisele keskmisele (praktiline jada). Tavaliselt on valimi karakteristikud teoreetiliste karakteristikute hinnangud.

Nende meetodite kasutamise eelised hõlmavad võimalust võtta arvesse erinevaid sündmuste arengu stsenaariume ja nende tõenäosusi. Nende meetodite puuduseks on see, et arvutustes kasutatud stsenaariumide tõenäosusväärtusi on praktikas tavaliselt väga raske saada.

Konkreetse tõenäosus-statistilise otsustusmeetodi rakendamine koosneb kolmest etapist:

Üleminek majanduslikult, juhtimis-, tehnoloogiliselt reaalsuselt abstraktsele matemaatilisele ja statistilisele skeemile, s.o. kontrollsüsteemi, tehnoloogilise protsessi, otsustusprotseduuri tõenäosusliku mudeli koostamine, eelkõige statistilise kontrolli tulemuste põhjal jms;

Reaalse nähtuse tõenäosusmudelit tuleks lugeda konstrueerituks, kui vaadeldavad suurused ja nendevahelised seosed on väljendatud tõenäosusteoorias. Tõenäosusmudeli adekvaatsust põhjendatakse eelkõige statistiliste meetoditega hüpoteeside kontrollimiseks.

Sõltuvalt lahendatava probleemi tüübist jagatakse matemaatiline statistika tavaliselt kolmeks osaks: andmete kirjeldus, hinnang ja hüpoteeside testimine. Sõltuvalt töödeldavate statistiliste andmete tüübist on matemaatiline statistika jagatud nelja valdkonda:

Näide, millal on soovitatav kasutada tõenäosus-statistilisi mudeleid.

Iga toote kvaliteedi kontrollimisel valitakse sellest valim, et otsustada, kas toodetav tootepartii vastab kehtestatud nõuetele. Proovikontrolli tulemuste põhjal tehakse järeldus kogu partii kohta. Sellisel juhul on proovi moodustamisel väga oluline vältida subjektiivsust, st on vaja, et iga kontrollitava partii tooteüksus oleks ühesuguse tõenäosusega valimisse valitud. Liisupõhine valik ei ole sellises olukorras piisavalt objektiivne. Seetõttu toimub tootmistingimustes tooteühikute valimine proovi jaoks tavaliselt mitte loosi teel, vaid spetsiaalsete juhuslike arvude tabelite või arvutite juhuslike numbrite andurite abil.

Tehnoloogiliste protsesside statistilises reguleerimises, mis põhinevad matemaatilise statistika meetoditel, töötatakse välja statistilise protsessi juhtimise reeglid ja plaanid, mille eesmärk on tehnoloogiliste protsesside probleemide õigeaegne avastamine ja meetmete võtmine nende kohandamiseks ja selliste toodete väljalaskmise vältimiseks, mis ei tööta. vastama kehtestatud nõuetele. Nende meetmete eesmärk on vähendada tootmiskulusid ja madala kvaliteediga üksuste tarnimisest tulenevaid kadusid. Statistilise vastuvõtukontrolli käigus koostatakse matemaatilise statistika meetoditele tuginedes kvaliteedikontrolli plaanid tootepartiide proovide analüüsimise teel. Raskus seisneb selles, et osatakse õigesti üles ehitada tõenäosuslik-statistilised otsustusmudelid, mille põhjal saab vastata ülaltoodud küsimustele. Matemaatilises statistikas on selleks välja töötatud tõenäosusmudelid ja meetodid hüpoteeside kontrollimiseks.

Lisaks tekivad paljudes juhtimis-, tootmis-, majandus- ja riigimajanduslikes olukordades erinevat tüüpi probleemid - tõenäosusjaotuste omaduste ja parameetrite hindamise probleemid.

Või on tehnoloogiliste protsesside täpsuse ja stabiilsuse statistilisel analüüsimisel vaja hinnata selliseid kvaliteedinäitajaid nagu kontrollitava parameetri keskmine väärtus ja selle hajumise määr vaadeldavas protsessis. Tõenäosusteooria järgi on soovitatav kasutada juhusliku suuruse keskmise väärtusena selle matemaatilist ootust ning dispersiooni, standardhälvet või variatsioonikoefitsienti dispersiooni statistilise tunnusena. See tõstatab küsimuse: kuidas neid statistilisi karakteristikuid näidisandmete põhjal hinnata ja millise täpsusega seda teha? Kirjanduses on palju sarnaseid näiteid. Kõik need näitavad, kuidas tõenäosusteooriat ja matemaatilist statistikat saab tootmisjuhtimises kasutada statistiliste toodete kvaliteedijuhtimise valdkonna otsuste tegemisel.

Konkreetsetes rakendusvaldkondades kasutatakse nii tõenäosuslikke kui ka statistilisi üldkasutatavaid ja spetsiifilisi meetodeid. Näiteks tootmisjuhtimise sektsioonis, mis on pühendatud toodete kvaliteedijuhtimise statistilistele meetoditele, kasutatakse rakenduslikku matemaatilist statistikat (sh eksperimentide kavandamist). Selle meetoditega viiakse läbi tehnoloogiliste protsesside täpsuse ja stabiilsuse statistiline analüüs ning statistiline kvaliteedihindamine. Spetsiifilised meetodid hõlmavad toote kvaliteedi statistilise aktsepteerimise kontrolli meetodeid, tehnoloogiliste protsesside statistilist reguleerimist, usaldusväärsuse hindamist ja kontrolli.
ja jne.

Tootmise juhtimises, eelkõige toote kvaliteedi optimeerimisel ja standardnõuetele vastavuse tagamisel, on eriti oluline statistiliste meetodite rakendamine toote elutsükli algfaasis, s.o. eksperimentaaldisaini arenduste uurimistöö ettevalmistamise etapis (perspektiivsete tootenõuete väljatöötamine, eelprojekt, katseprojekti väljatöötamise tehnilised kirjeldused). Selle põhjuseks on toote olelusringi algfaasis saadaoleva teabe piiratus ning vajadus prognoosida tehnilisi võimalusi ja majanduslikku olukorda tulevikuks.

Levinumad tõenäosusstatistika meetodid on regressioonanalüüs, faktoranalüüs, dispersioonanalüüs, statistilised meetodid riskide hindamiseks, stsenaariumimeetod jne. Üha olulisemaks muutub statistiliste meetodite valdkond, mis on pühendatud mittenumbrilise iseloomuga statistiliste andmete analüüsile. mõõtmistulemused, mis põhinevad kvalitatiivsetel ja erinevat tüüpi tunnustel. Mittenumbrilise iseloomuga objektide statistika üks peamisi rakendusi on statistiliste otsuste ja hääletusprobleemide teooriaga seotud eksperthinnangute teooria ja praktika.

Inimese roll ülesannete lahendamisel statistiliste lahendusteooria meetoditega on probleemi püstitamine, s.t reaalse probleemi taandamine vastavaks standardseks, sündmuste tõenäosuste määramine statistiliste andmete põhjal ja ka kinnitada saadud optimaalne lahendus.

1. Tõenäosusteooria ja matemaatiline statistika otsuste tegemisel

1.1 Kuidas tõenäosusteooriat kasutatakseja matemaatiline statistika

Need distsipliinid on otsuste tegemise tõenäosuslike ja statistiliste meetodite aluseks. Nende matemaatilise aparatuuri kasutamiseks on vaja otsustusprobleeme väljendada tõenäosus-statistiliste mudelite kaudu. Konkreetse tõenäosus-statistilise otsustusmeetodi rakendamine koosneb kolmest etapist:

Üleminek majanduslikult, juhtimis-, tehnoloogiliselt reaalsuselt abstraktsele matemaatilisele ja statistilisele skeemile, s.o. kontrollsüsteemi tõenäosusliku mudeli koostamine, tehnoloogiline protsess, otsustusprotseduur, eelkõige statistilise kontrolli tulemuste põhjal jne.

Puhtmatemaatilisi vahendeid kasutades arvutuste tegemine ja järelduste tegemine tõenäosusmudeli raames;

Matemaatiliste ja statistiliste järelduste tõlgendamine seoses reaalse olukorraga ja asjakohase otsuse tegemine (näiteks toote kvaliteedi vastavuse või mittevastavuse kohta kehtestatud nõuetele, tehnoloogilise protsessi kohandamise vajaduse jms kohta), eelkõige järeldused (defektsete tooteühikute osakaalu kohta partiis, tehnoloogilise protsessi kontrollitavate parameetrite jaotusseaduste konkreetse vormi kohta jne).

Matemaatilises statistikas kasutatakse tõenäosusteooria mõisteid, meetodeid ja tulemusi. Vaatleme majandus-, juhtimis-, tehnoloogiliste ja muudes olukordades otsustamise tõenäosuslike mudelite konstrueerimise põhiküsimusi. Tõenäosuslike ja statistiliste otsustusmeetodite regulatiivsete, tehniliste ja juhenddokumentide aktiivseks ja korrektseks kasutamiseks on vaja eelteadmisi. Seega on vaja teada, millistel tingimustel konkreetset dokumenti kasutada, millist algteavet on vaja selle valikuks ja rakendamiseks omada, milliseid otsuseid andmetöötluse tulemuste põhjal teha jne.

1.2 Tõenäosusteooria rakendusnäitedja matemaatiline statistika

Vaatleme mitmeid näiteid, kus tõenäosuslik-statistilised mudelid on heaks abivahendiks juhtimise, tootmise, majanduse ja rahvamajanduse probleemide lahendamisel. Nii öeldakse näiteks A. N. Tolstoi romaanis “Kõndimine läbi piinade” (1. köide): “Töökoda toodab kakskümmend kolm protsenti praakidest, sina jääd selle näitaja juurde,” rääkis Strukov Ivan Iljitšile.

Tekib küsimus, kuidas neid sõnu tehasejuhtide vestluses mõista, kuna üks tootmisüksus ei saa olla 23% defektne. See võib olla hea või defektne. Tõenäoliselt pidas Strukov silmas seda, et suuremahulises partiis on ligikaudu 23% defektseid toodanguühikuid. Siis tekib küsimus, mida tähendab "ligikaudne"? Las 100 testitud toodanguühikust 30 osutuvad defektseks või 1000 - 300 või 100 000 - 30 000 jne, kas on vaja Strukovit valetamises süüdistada?

Või teine ​​näide. Partiina kasutatav münt peab olema “sümmeetriline”, s.t. selle viskamisel peaks keskmiselt pooltel juhtudel vapp välja kukkuma ja pooltel juhtudel - räsi (sabad, number). Aga mida tähendab "keskmiselt"? Kui teete igas seerias palju 10 viske seeriat, siis kohtate sageli seeriaid, kus münt maandub vapina 4 korda. Sümmeetrilise mündi puhul juhtub see 20,5% jooksmistest. Ja kui pärast 100 000 viskamist on 40 000 vappi, kas saab münti pidada sümmeetriliseks? Otsuste tegemise protseduur põhineb tõenäosusteoorial ja matemaatilisel statistikal.

Kõnealune näide ei pruugi tunduda piisavalt tõsine. Siiski ei ole. Loosimist kasutatakse laialdaselt tööstuslike tehniliste ja majanduslike katsete korraldamisel, näiteks laagrite kvaliteedinäitaja (hõõrdemomendi) mõõtmise tulemuste töötlemisel sõltuvalt erinevatest tehnoloogilistest teguritest (säilituskeskkonna mõju, laagrite valmistamise meetodid enne mõõtmist). , laagrikoormuste mõju mõõtmisprotsessi ajal jne). P.). Oletame, et on vaja võrrelda laagrite kvaliteeti sõltuvalt nende ladustamise tulemustest erinevates säilitusõlides, st. õlides koostisega A ja B. Sellise katse kavandamisel tekib küsimus, millised laagrid tuleks panna koostisega A õlisse ja millised B koostisega õlidesse, kuid nii, et vältida subjektiivsust. ja tagavad tehtud otsuse objektiivsuse.

Sellele küsimusele saab vastuse loosi teel. Sarnase näite võib tuua mis tahes toote kvaliteedikontrolliga. Otsustamaks, kas kontrollitav toodete partii vastab või ei vasta kehtestatud nõuetele, valitakse sellest proov. Proovikontrolli tulemuste põhjal tehakse järeldus kogu partii kohta. Sellisel juhul on proovi moodustamisel väga oluline vältida subjektiivsust, st on vaja, et iga kontrollitava partii tooteüksus oleks ühesuguse tõenäosusega valimisse valitud. Tootmistingimustes toimub tooteühikute valimine proovi jaoks tavaliselt mitte loosi teel, vaid spetsiaalsete juhuslike arvude tabelite või arvutite juhuslike numbrite andurite abil.

Sarnased võrdlusobjektiivsuse tagamise probleemid tekivad ka siis, kui võrrelda erinevaid tootmise korraldamise skeeme, töötasustamist, pakkumiste ja konkursside käigus, kandidaatide valimisel vabadele ametikohtadele jne. Kõikjal vajame loosi või sarnaseid protseduure. Selgitame näitel tugevaima ja tugevuselt teise võistkonna väljaselgitamist olümpiasüsteemi järgi turniiri korraldamisel (kaotaja langeb välja). Las tugevam meeskond võidab alati nõrgemat. Selge on see, et meistriks tuleb kindlasti tugevaim meeskond. Tugevuselt teine ​​meeskond pääseb finaali siis ja ainult siis, kui tal pole enne finaali tulevase meistriga mänge. Kui selline mäng on kavas, siis tugevuselt teine ​​meeskond finaali ei pääse. Turniiri planeerija võib turniirilt enne tähtaega "välja lüüa" tugevuselt teise võistkonna, pannes selle esimeses kohtumises liidri vastu, või anda talle teise koha, tagades kohtumised nõrgemate meeskondadega kuni turniiri lõpuni. lõplik. Subjektiivsuse vältimiseks viiakse läbi viik. 8 meeskonnaga turniiri puhul on tõenäosus, et finaalis kohtuvad kaks paremat meeskonda, 4/7. Seetõttu lahkub tugevuselt teine ​​meeskond turniirilt varakult tõenäosusega 3/7.

Kõik tooteühikute mõõtmised (kasutades nihikut, mikromeetrit, ampermeetrit jne) sisaldavad vigu. Et teada saada, kas tegemist on süstemaatiliste vigadega, on vaja teha korduvaid mõõtmisi tooteühiku kohta, mille omadused on teada (näiteks standardproov). Tuleb meeles pidada, et lisaks süstemaatilisele veale esineb ka juhuslikku viga.

Seetõttu tekib küsimus, kuidas mõõtmistulemustest välja selgitada, kas tegemist on süstemaatilise veaga. Kui märkida ainult see, kas järgmisel mõõtmisel saadud viga on positiivne või negatiivne, saab selle ülesande taandada eelmisele. Tõepoolest, võrdleme mõõtmist mündi viskamisega, positiivset viga vapi kadumisega ja negatiivset ruudustikuga (nullviga piisava arvu skaalajaotustega ei esine peaaegu kunagi). Seejärel võrdub süstemaatilise vea puudumise kontrollimine mündi sümmeetria kontrollimisega.

Nende kaalutluste eesmärk on taandada süstemaatilise vea puudumise kontrollimise probleem mündi sümmeetria kontrollimise probleemiks. Ülaltoodud arutluskäik viib matemaatilise statistika nn märgikriteeriumini.

Tehnoloogiliste protsesside statistilises reguleerimises, mis põhinevad matemaatilise statistika meetoditel, töötatakse välja statistilise protsessi juhtimise reeglid ja plaanid, mille eesmärk on tehnoloogiliste protsesside probleemide õigeaegne avastamine ja meetmete võtmine nende kohandamiseks ja selliste toodete väljalaskmise vältimiseks, mis ei tööta. vastama kehtestatud nõuetele. Nende meetmete eesmärk on vähendada tootmiskulusid ja madala kvaliteediga üksuste tarnimisest tulenevaid kadusid. Statistilise vastuvõtukontrolli käigus koostatakse matemaatilise statistika meetoditele tuginedes kvaliteedikontrolli plaanid tootepartiide proovide analüüsimise teel. Raskus seisneb selles, et osatakse õigesti üles ehitada tõenäosuslik-statistilised otsustusmudelid, mille põhjal saab vastata ülaltoodud küsimustele. Matemaatilises statistikas on selleks välja töötatud tõenäosuslikud mudelid ja meetodid hüpoteeside kontrollimiseks, eelkõige hüpoteesid, et defektsete toodanguühikute osakaal on võrdne teatud arvuga p0, näiteks p0 = 0,23 (meenutagem Strukovi sõnu). A. N. Tolstoi romaanist).

1.3 Hindamiseesmärgid

Mitmetes juhtimis-, tootmis-, majandus- ja rahvamajanduslikes olukordades tekivad erinevat tüüpi probleemid - tõenäosusjaotuste omaduste ja parameetrite hindamise probleemid.

Vaatame näidet. Laske N elektrilampide partii ülevaatuseks kohale jõuda. Sellest partiist valiti juhuslikult n elektrilampi. Tekib hulk loomulikke küsimusi. Kuidas määrata näidiselementide katsetulemuste põhjal elektrilampide keskmist kasutusiga ja millise täpsusega saab seda tunnust hinnata? Kuidas muutub täpsus, kui võtame suurema proovi? Kui mitu tundi T saab tagada, et vähemalt 90% elektrilampidest kestab T või rohkem tundi?

Oletame, et n-st elektrilambist koosneva proovi testimisel osutus X elektrilampi defektseks. Siis tekivad järgmised küsimused. Milliseid piirmäärasid saab määrata defektsete elektrilampide arvule D partiis, defektitasemele D/N jne?

Või on tehnoloogiliste protsesside täpsuse ja stabiilsuse statistilisel analüüsimisel vaja hinnata selliseid kvaliteedinäitajaid nagu kontrollitava parameetri keskmine väärtus ja selle hajumise määr vaadeldavas protsessis. Tõenäosusteooria järgi on soovitatav kasutada juhusliku suuruse keskmise väärtusena selle matemaatilist ootust ning dispersiooni, standardhälvet või variatsioonikoefitsienti dispersiooni statistilise tunnusena. See tõstatab küsimuse: kuidas neid statistilisi karakteristikuid näidisandmete põhjal hinnata ja millise täpsusega seda teha? Sarnaseid näiteid võib tuua palju. Siin oli oluline näidata, kuidas tõenäosusteooriat ja matemaatilist statistikat saab tootmisjuhtimises kasutada tootekvaliteedi statistilise juhtimise valdkonna otsuste tegemisel.

1.4 Mis on "matemaatiline statistika"

Matemaatilise statistika all mõistetakse „matemaatika haru, mis on pühendatud statistiliste andmete kogumise, süstematiseerimise, töötlemise ja tõlgendamise matemaatilistele meetoditele, samuti nende kasutamisele teaduslike või praktiliste järelduste tegemiseks. Matemaatilise statistika reeglid ja protseduurid põhinevad tõenäosusteoorial, mis võimaldab olemasoleva statistilise materjali põhjal hinnata igas ülesandes tehtud järelduste täpsust ja usaldusväärsust. Sel juhul viitavad statistilised andmed teabele teatud omadustega objektide arvu kohta mis tahes enam-vähem ulatuslikus kogus.

Sõltuvalt lahendatavate probleemide tüübist jagatakse matemaatiline statistika tavaliselt kolmeks osaks: andmete kirjeldamine, hindamine ja hüpoteeside testimine.

Sõltuvalt töödeldavate statistiliste andmete tüübist on matemaatiline statistika jagatud nelja valdkonda:

Ühemõõtmeline statistika (juhuslike muutujate statistika), milles vaatluse tulemust kirjeldatakse reaalarvuga;

Mitmemõõtmeline statistiline analüüs, kus objekti vaatlemise tulemust kirjeldatakse mitme numbriga (vektoriga);

Juhuslike protsesside ja aegridade statistika, kus vaatluse tulemuseks on funktsioon;

Mittenumbrilise iseloomuga objektide statistika, milles vaatluse tulemus on mittenumbriline, näiteks on see hulk (geomeetriline kujund), järjestus või saadud mõõtmise tulemusena kvalitatiivsel kriteeriumil.

Ajalooliselt ilmusid esimesena mõned mittenumbrilise iseloomuga objektide statistika valdkonnad (eelkõige defektide osakaalu hindamise ja selle kohta püstitatud hüpoteeside kontrollimise probleemid) ja ühemõõtmeline statistika. Matemaatiline aparaat on nende jaoks lihtsam, seetõttu kasutatakse nende näidet tavaliselt matemaatilise statistika põhiideede demonstreerimiseks.

Ainult need andmetöötlusmeetodid, s.o. matemaatiline statistika on tõenduspõhine, mis põhineb asjakohaste reaalsete nähtuste ja protsesside tõenäosusmudelitel. Räägime tarbijakäitumise mudelitest, riskide tekkimisest, tehnoloogiliste seadmete toimimisest, katsetulemuste saamisest, haiguse kulgemisest jne. Reaalse nähtuse tõenäosusmudelit tuleks lugeda konstrueerituks, kui vaadeldavad suurused ja nendevahelised seosed on väljendatud tõenäosusteoorias. Vastavus tõenäosuslikule tegelikkuse mudelile, s.o. selle adekvaatsust põhjendatakse eelkõige statistiliste meetoditega hüpoteeside kontrollimiseks.

Mittetõenäosuslikud andmetöötlusmeetodid on uurimuslikud, neid saab kasutada ainult esialgses andmeanalüüsis, kuna need ei võimalda hinnata piiratud statistilise materjali põhjal tehtud järelduste täpsust ja usaldusväärsust.

Tõenäosuslikud ja statistilised meetodid on rakendatavad kõikjal, kus on võimalik konstrueerida ja põhjendada nähtuse või protsessi tõenäosusmudelit. Nende kasutamine on kohustuslik, kui valimiandmete põhjal tehtud järeldused kantakse üle kogu populatsioonile (näiteks proovist tervele tootepartiile).

Konkreetsetes rakendusvaldkondades kasutatakse nii tõenäosuslikke kui ka statistilisi üldkasutatavaid ja spetsiifilisi meetodeid. Näiteks tootmisjuhtimise sektsioonis, mis on pühendatud toodete kvaliteedijuhtimise statistilistele meetoditele, kasutatakse rakenduslikku matemaatilist statistikat (sh eksperimentide kavandamist). Selle meetoditega viiakse läbi tehnoloogiliste protsesside täpsuse ja stabiilsuse statistiline analüüs ning statistiline kvaliteedihindamine. Spetsiifiliste meetodite hulka kuuluvad tootekvaliteedi statistilise aktsepteerimise kontrolli meetodid, tehnoloogiliste protsesside statistiline reguleerimine, töökindluse hindamine ja kontroll jne.

Laialdaselt kasutatakse rakenduslikke tõenäosus- ja statistilisi distsipliine, nagu usaldusväärsuse teooria ja järjekorrateooria. Neist esimese sisu selgub nimest, teine ​​tegeleb selliste süsteemide uurimisega nagu telefonikeskjaam, mis võtab kõnesid vastu suvalistel aegadel – telefoniaparaadis numbreid valivate abonentide nõuded. Nende nõuete teenindamise kestus, s.o. vestluste kestust modelleeritakse ka juhuslike suurustega. Suure panuse nende erialade arengusse andis NSVL Teaduste Akadeemia korrespondentliige A.Ya. Khinchin (1894-1959), Ukraina NSV Teaduste Akadeemia akadeemik B. V. Gnedenko (1912-1995) ja teised kodumaised teadlased.

1.5 Lühidalt matemaatilise statistika ajaloost

Matemaatiline statistika kui teadus saab alguse kuulsa saksa matemaatiku Carl Friedrich Gaussi (1777-1855) töödest, kes tõenäosusteooriale tuginedes uuris ja põhjendas tema 1795. aastal loodud vähimruutude meetodit, mida kasutati astronoomiliste andmete töötlemiseks ( väikese planeedi Cerese orbiidi selgitamiseks). Tema järgi nimetatakse sageli ka üht populaarseimat tõenäosusjaotust, normaaljaotust ja juhuslike protsesside teoorias on peamiseks uurimisobjektiks Gaussi protsessid.

19. sajandi lõpus. - 20. sajandi algus Suure panuse matemaatilisse statistikasse andsid inglise teadlased, eelkõige K. Pearson (1857-1936) ja R. A. Fisher (1890-1962). Eelkõige töötas Pearson välja hii-ruuttesti statistiliste hüpoteeside kontrollimiseks ja Fisher dispersioonanalüüsi, eksperimentaaldisaini teooria ja maksimaalse tõenäosuse meetodi parameetrite hindamiseks.

Kahekümnenda sajandi 30. aastatel. Poolakas Jerzy Neumann (1894-1977) ja inglane E. Pearson töötasid välja statistiliste hüpoteeside kontrollimise üldteooria ning nõukogude matemaatikud akadeemik A.N. Kolmogorov (1903-1987) ja NSVL Teaduste Akadeemia korrespondentliige N. V. Smirnov (1900-1966) panid aluse mitteparameetrilisele statistikale. Kahekümnenda sajandi neljakümnendatel. Rumeenlane A. Wald (1902-1950) ehitas üles järjestikuse statistilise analüüsi teooria.

Matemaatiline statistika areneb praegu kiiresti. Seega saab viimase 40 aasta jooksul eristada nelja põhimõtteliselt uut uurimisvaldkonda:

Matemaatiliste meetodite väljatöötamine ja rakendamine katsete planeerimiseks;

Mittenumbrilise iseloomuga objektide statistika arendamine iseseisva suunana rakendusmatemaatilises statistikas;

Kasutatavast tõenäosusmudelist väikestele kõrvalekalletele vastupidavate statistiliste meetodite väljatöötamine;

Statistilise andmeanalüüsi jaoks mõeldud arvutitarkvarapakettide loomise töö laialdane areng.

1.6 Tõenäosus-statistilised meetodid ja optimeerimine

Optimeerimise idee läbib kaasaegset rakenduslikku matemaatilist statistikat ja muid statistilisi meetodeid. Nimelt katsete planeerimise meetodid, statistiline vastuvõtukontroll, tehnoloogiliste protsesside statistiline reguleerimine jne. Seevastu optimeerimise formuleeringud otsuste tegemise teoorias, näiteks rakenduslik teooria toote kvaliteedi optimeerimise ja standardinõuete kohta, näevad ette tõenäosusstatistika meetodite laialdane kasutamine, peamiselt rakendatud matemaatiline statistika.

Tootmise juhtimises, eelkõige toote kvaliteedi ja standardinõuete optimeerimisel, on eriti oluline statistiliste meetodite rakendamine toote elutsükli algfaasis, s.o. eksperimentaaldisaini arenduste uurimistöö ettevalmistamise etapis (perspektiivsete tootenõuete väljatöötamine, eelprojekt, katseprojekti väljatöötamise tehnilised kirjeldused). Selle põhjuseks on toote olelusringi algfaasis saadaoleva teabe piiratus ning vajadus prognoosida tehnilisi võimalusi ja majanduslikku olukorda tulevikuks. Statistilisi meetodeid tuleks kasutada optimeerimisülesande lahendamise kõigis etappides - muutujate skaleerimisel, toodete ja süsteemide toimimise matemaatiliste mudelite väljatöötamisel, tehniliste ja majanduslike katsete läbiviimisel jne.

Optimeerimisprobleemides, sealhulgas toodete kvaliteedi ja standardinõuete optimeerimisel, kasutatakse kõiki statistika valdkondi. Nimelt juhuslike suuruste statistika, mitmemõõtmeline statistiline analüüs, juhuslike protsesside ja aegridade statistika, mittenumbrilise iseloomuga objektide statistika. Soovitatav on valida statistiline meetod konkreetsete andmete analüüsimiseks vastavalt soovitustele.

2. Tõenäosuse tüüpilised praktilised probleemid-statistlik otsuste tegemineja meetodid nende lahendamiseks

2.1 Statistika ja rakendusstatistika

Rakendusstatistika all mõistetakse matemaatilise statistika osa, mis on pühendatud reaalsete statistiliste andmete töötlemise meetoditele, samuti vastavatele matemaatilistele ja tarkvara. Seega puhtmatemaatilisi probleeme rakendusstatistika ei hõlma.

Statistiliste andmete all mõistetakse uuritavate objektide kontrollitavate parameetrite (märkide) arvulisi või mittearvulisi väärtusi, mis saadakse teatud arvu vaatluste (mõõtmised, analüüsid, testid, katsed jne) tulemusena. märgid iga uuringusse kaasatud üksuse kohta. Statistiliste andmete saamise meetodid ja valimi suurused kehtestatakse konkreetse rakendusprobleemi sõnastuse alusel, tuginedes katse planeerimise matemaatilise teooria meetoditele.

Yi-nda valimiüksuse uuritava tunnuse X (või uuritud tunnuste kogumi X) vaatluse xi tulemus peegeldab arvuga i (siin i = 1, 2, ) uuritava üksuse kvantitatiivseid ja/või kvalitatiivseid omadusi. .., n, kus n on valimi suurus).

Vaatluste x1, x2,…, xn tulemusi, kus xi on i-nda valimiüksuse vaatluse tulemus või mitme valimi vaatlustulemused, töödeldakse ülesandele vastavate rakendusstatistika meetoditega. Tavaliselt kasutatakse analüüsimeetodid, st. arvulistel arvutustel põhinevad meetodid (mittenumbrilise iseloomuga objekte kirjeldatakse numbrite abil). Mõnel juhul on selle kasutamine lubatud graafilised meetodid(visuaalne analüüs).

2.2 Tehnoloogiliste protsesside täpsuse ja stabiilsuse ning tootekvaliteedi statistilise analüüsi ülesanded

Statistilisi meetodeid kasutatakse eelkõige tehnoloogiliste protsesside täpsuse ja stabiilsuse ning tootekvaliteedi analüüsimiseks. Eesmärk on koostada lahendusi, mis tagavad tehnoloogiliste sõlmede efektiivse toimimise ning parandavad valmistatud toodete kvaliteeti ja konkurentsivõimet. Statistilisi meetodeid tuleks kasutada kõigil juhtudel, kui piiratud arvu vaatluste tulemuste põhjal on vaja välja selgitada tehnoloogiliste seadmete täpsuse ja stabiilsuse paranemise või halvenemise põhjused. Tehnoloogilise protsessi täpsust mõistetakse kui tehnoloogilise protsessi omadust, mis määrab valmistatud toote parameetrite tegelike ja nimiväärtuste läheduse. Tehnoloogilise protsessi stabiilsust mõistetakse kui tehnoloogilise protsessi omadust, mis määrab selle parameetrite tõenäosusjaotuste püsivuse teatud aja jooksul ilma välise sekkumiseta.

Statistiliste meetodite rakendamise eesmärgid tehnoloogiliste protsesside täpsuse ja stabiilsuse ning toodete kvaliteedi analüüsimiseks toodete arendamise, tootmise ja käitamise (tarbimise) etappides on eelkõige:

* tehnoloogilise protsessi, seadmete või toote kvaliteedi täpsuse ja stabiilsuse tegelike näitajate määramine;

* toote kvaliteedi vastavuse tuvastamine regulatiivse ja tehnilise dokumentatsiooni nõuetele;

* tehnoloogilise distsipliini järgimise kontrollimine;

* juhuslike ja süsteemsete tegurite uurimine, mis võivad põhjustada defekte;

* tootmis- ja tehnoloogiavarude väljaselgitamine;

* põhjendus tehnilisi standardeid ja toodete kinnitused;

* prototüüpide katsetulemuste hindamine neile tootenõuete ja standardite põhjendamisel;

* tehnoloogiliste seadmete ning mõõte- ja katsevahendite valiku põhjendus;

* erinevate tootenäidiste võrdlus;

* pideva kontrolli asendamise põhjendus statistilise kontrolliga;

* tootekvaliteedi juhtimise statistiliste meetodite kasutuselevõtu võimaluse väljaselgitamine jne.

Ülaltoodud eesmärkide saavutamiseks kasutage erinevaid meetodeid andmete kirjeldamine, hüpoteeside hindamine ja kontrollimine. Toome näiteid probleemipüstitustest.

2.3 Ühemõõtmelise statistika (juhuslike suuruste statistika) probleemid

Matemaatiliste ootuste võrdlemine toimub juhtudel, kui on vaja tuvastada valmistatud toote ja võrdlusproovi kvaliteedinäitajate vastavus. See on hüpoteesi testimise ülesanne:

H0: M(X) = m0,

kus m0 on võrdlusproovile vastav väärtus; X on juhuslik suurus, mis modelleerib vaatluste tulemusi. Sõltuvalt olukorra tõenäosusmudeli sõnastusest ja alternatiivsest hüpoteesist viiakse matemaatiliste ootuste võrdlus läbi kas parameetriliste või mitteparameetriliste meetoditega.

Dispersioone võrreldakse siis, kui on vaja kindlaks teha kvaliteedinäitaja ja nominaalse dispersiooni erinevus. Selleks testime hüpoteesi:

Mitte vähem olulised kui hüpoteeside kontrollimise probleemid on parameetrite hindamise probleemid. Need, nagu hüpoteeside testimise probleemid, jagunevad parameetrilisteks ja mitteparameetrilisteks, sõltuvalt kasutatava olukorra tõenäosusmudelist.

Parameetrilistes hinnanguülesannetes võetakse kasutusele tõenäosusmudel, mille järgi vaatlemise x1, x2,..., xn tulemusi käsitletakse n sõltumatute juhusliku suuruse realisatsioonidena jaotusfunktsiooniga F(x;u). Siin ja on tundmatu parameeter, mis asub kasutatava tõenäosusmudeliga määratud parameetriruumis. Hindamisülesanne on määrata parameetri ja parameetri punktihinnangud ja usalduspiirid (või usalduspiirkond).

Parameeter ja on kas arv või fikseeritud lõpliku mõõtmega vektor. Niisiis, normaaljaotuse korral on = (m, y2) kahemõõtmeline vektor, binoomjaotuse korral ja = p on arv, gamma jaotuse korral
ja = (a, b, c) on kolmemõõtmeline vektor jne.

Kaasaegses matemaatilises statistikas on mitmeid levinud meetodid hinnangute ja usalduspiiride määramine - momentide meetod, maksimaalse tõenäosuse meetod, üheastmeline hindamismeetod, stabiilne (robustne) hinnangumeetod, erapooletu hinnangumeetod jne.

Vaatame lühidalt neist kolme esimest.

Momentide meetod põhineb vaadeldavate juhuslike muutujate momentide avaldiste kasutamisel nende jaotusfunktsioonide parameetrite kaudu. Momentide meetodi hinnangud saadakse, asendades näidismomendid teoreetiliste momentide asemel parameetreid momentides väljendavate funktsioonidega.

Peamiselt R. A. Fisheri välja töötatud maksimaalse tõenäosuse meetodi puhul võetakse parameetri u hinnanguks väärtus u*, mille puhul on nn tõenäosusfunktsioon maksimaalne.

f(x1, u) f(x2, u) … f(xn, u),

kus x1, x2,…, xn on vaatluste tulemused; f(x, u) on nende jaotustihedus, olenevalt parameetrist u, mida tuleb hinnata.

Maksimaalse tõenäosuse hindajad kipuvad olema tõhusad (või asümptootiliselt tõhusad) ja neil on väiksem dispersioon kui hetkede meetodi hindajad. Mõnel juhul kirjutatakse nende valemid selgesõnaliselt välja (normaaljaotus, eksponentsiaalne jaotus ilma nihketa). Kuid sagedamini on nende leidmiseks vaja numbriliselt lahendada transtsendentaalsete võrrandite süsteem (Weibull-Gnedenko jaotused, gamma). Sellistel juhtudel on soovitatav kasutada mitte maksimaalse tõenäosuse hinnanguid, vaid muud tüüpi hinnanguid, peamiselt üheastmelisi hinnanguid.

Mitteparameetrilistes hinnanguülesannetes võetakse kasutusele tõenäosusmudel, milles vaatluste x1, x2,..., xn tulemusi käsitletakse n sõltumatute juhuslike suuruste realisatsioonidena jaotusfunktsiooniga F(x) üldine vaade. F(x) peab täitma ainult teatud tingimusi, nagu järjepidevus, matemaatilise ootuse ja dispersiooni olemasolu jne. Sellised tingimused ei ole nii ranged kui teatud parameetriliste perekonda kuulumise tingimus.

Mitteparameetrilises seadistuses hinnatakse kas juhusliku suuruse tunnuseid (matemaatiline ootus, dispersioon, variatsioonikordaja) või selle jaotusfunktsiooni, tihedust jne. Seega on valimi aritmeetiline keskmine suurte arvude seaduse kohaselt matemaatilise ootuse M(X) järjepidev hinnang (mis tahes vaatlustulemuste jaotusfunktsiooni F(x) korral, mille jaoks matemaatiline ootus on olemas). Keskpiiri teoreemi abil määratakse asümptootilised usalduspiirid

(M(X))H =, (M(X))B = .

kus g - usalduse tõenäosus, - standardse normaaljaotuse N(0;1) järgu kvantiil nulli matemaatilise ootuse ja ühikulise dispersiooniga, - valimi aritmeetiline keskmine, s - valimi standardhälve. Mõiste "asümptootilised usalduspiirid" tähendab, et tõenäosused

P((M(X))H< M(X)}, P{(M(X))B >M(X)),

P((M(X))H< M(X) < (M(X))B}

kalduvad ja r, vastavalt, kui n > ?, kuid üldiselt ei võrdu need lõpliku n väärtustega. Praktikas tagavad asümptootilised usalduspiirid piisava täpsuse n suurusjärgus 10.

Teine mitteparameetrilise hinnangu näide on jaotusfunktsiooni hindamine. Glivenko teoreemi kohaselt on empiiriline jaotusfunktsioon Fn(x) jaotusfunktsiooni F(x) järjepidev hinnang. Kui F(x) on pidev funktsioon, siis Kolmogorovi teoreemile tuginedes määratakse jaotusfunktsiooni F(x) usalduspiirid kujul

(F(x))Н = max, (F(x))B = min,

kus k(r,n) on Kolmogorovi statistika jaotuse r-kvantiil valimi suuruse n korral (tuletame meelde, et selle statistika jaotus ei sõltu F(x)-st).

Hinnangute ja usalduspiiride määramise reeglid parameetrilisel juhul põhinevad parameetrilisel jaotuste perekonnal F(x;u). Reaalsete andmete töötlemisel tekib küsimus: kas need andmed vastavad aktsepteeritud tõenäosusmudelile? Need. statistiline hüpotees, et vaatlustulemustel on jaotusfunktsioon perekonnast (F(x;u) ja U) mõne u = u0? Selliseid hüpoteese nimetatakse kokkuleppehüpoteesideks ja nende kontrollimise kriteeriume kokkuleppekriteeriumideks.

Kui parameetri u = u0 tegelik väärtus on teada, jaotusfunktsioon F(x; u0) on pidev, siis sobivuse hüpoteesi kontrollimiseks kasutatakse sageli statistikal põhinevat Kolmogorovi testi

kus Fn(x) on empiiriline jaotusfunktsioon.

Kui parameetri u0 tegelik väärtus on teadmata, näiteks vaatlustulemuste jaotuse normaalsuse hüpoteesi kontrollimisel (st testimisel, kas see jaotus kuulub normaaljaotuste perekonda), kasutatakse mõnikord statistikat.

See erineb Kolmogorovi statistikast Dn selle poolest, et parameetri u0 tegeliku väärtuse asemel on selle hinnang u* asendatud.

Dn(u*) statistika jaotus on väga erinev Dn statistika jaotusest. Näiteks kaaluge normaalsuse testi, kui u = (m, y2) ja u* = (, s2). Sel juhul on statistika jaotuste kvantilid Dn ja Dn(u*) toodud tabelis 1. Seega erinevad kvantilid ligikaudu 1,5 korda.

Tabel 1 – Statistika kvantilid Dn ja Dn(ja*) normaalsuse kontrollimisel

Statistiliste andmete esmasel töötlemisel on oluliseks ülesandeks välistada jämedate vigade ja möödalaskmiste tulemusena saadud vaatlustulemused. Näiteks vastsündinud laste kaalu (kilogrammides) andmete vaatamisel võib koos numbritega 3500, 2750, 4200 ilmuda arv 35,00. On selge, et see on viga ja vigane arv saadi eksliku salvestuse tõttu - koma nihutati ühe märgi võrra, mille tulemusena suurendati vaatlustulemust ekslikult 10 korda.

Statistilised meetodid kõrvalekallete välistamiseks põhinevad eeldusel, et sellistel vaatlustel on jaotused, mis erinevad järsult uuritavatest ja seetõttu tuleks need valimist välja jätta.

Lihtsaim tõenäosusmudel on see. Nullhüpoteesi korral käsitletakse vaatlustulemusi sõltumatute identselt jaotatud juhuslike suuruste X1, X2, Xn realisatsioonidena jaotusfunktsiooniga F(x). Alternatiivse hüpoteesi korral on X1, X2, Xn-1 samad, mis nullhüpoteesi korral ja Xn vastab brutoveale ja sellel on jaotusfunktsioon G(x) = F(x - c), kus c on suur. Seejärel tõenäosusega, mis on lähedane 1-le (täpsemalt, kaldudes valimi suuruse suurenedes 1-ni),

Xn = max (X1, X2, Xn) = Xmax,

need. Andmete kirjeldamisel tuleks Xmaxi pidada võimalikuks veaks. Kriitilisel piirkonnal on vorm

Ш = (x: x > d).

Kriitiline väärtus d = d(b,n) valitakse sõltuvalt tingimuse olulisuse tasemest b ja valimi suurusest n

P(Xmax > d | H0) = b (1)

Tingimus (1) on suure n ja väikese b jaoks samaväärne järgmisega:

Kui vaatlustulemuste F(x) jaotusfunktsioon on teada, siis kriitiline väärtus d leitakse seosest (2). Kui F(x) on näiteks parameetriteni teada, siis on teada, et F(x) - normaalne funktsioon jaotust, siis on välja töötatud ka vaadeldava hüpoteesi kontrollimise reeglid.

Kuid sageli pole vaatlustulemuste jaotusfunktsiooni vorm teada absoluutselt täpselt ja mitte parameetrite täpsusega, vaid ainult teatud veaga. Siis muutub seos (2) praktiliselt kasutuks, kuna väike viga F(x) määramisel, nagu võib näidata, toob kaasa suure vea kriitilise väärtuse d määramisel tingimusest (2) ja fikseeritud d korral kriteeriumi olulisus võib nominaalsest oluliselt erineda.

Seega olukorras, kus puudub täielik informatsioon F(x) kohta, kuid on teada vaatlustulemuste X1, X2, Xn matemaatiline ootus M(X) ja dispersioon y2 = D(X), põhinevad mitteparameetrilised tagasilükkamise reeglid. Tšebõševi ebavõrdsust saab kasutada. Seda võrratust kasutades leiame kriitilise väärtuse d = d(b,n) sellise, et

siis seos (3) on täidetud, kui

Tšebõševi ebavõrdsuse järgi

seetõttu, et (4) oleks täidetud, piisab valemite (4) ja (5) parempoolsete võrdsustamist, s.o. määra d tingimusest

Valemi (6) abil arvutatud kriitilisel väärtusel d põhinev tagasilükkamisreegel kasutab jaotusfunktsiooni F(x) kohta minimaalset teavet ja välistab seetõttu ainult need vaatlustulemused, mis on massist väga kaugel. Teisisõnu, seosega (1) antud d1 väärtus on tavaliselt palju väiksem kui seose (6) antud d2 väärtus.

2.4 Mitmemõõtmeline statistiline analüüs

Mitmemõõtmelist statistilist analüüsi kasutatakse järgmiste probleemide lahendamiseks:

* märkidevahelise sõltuvuse uurimine;

* vektorite poolt määratud objektide või tunnuste klassifikatsioon;

* funktsiooniruumi mõõtmete vähendamine.

Sel juhul on vaatluste tulemuseks objektis mõõdetud kindla arvu kvantitatiivsete ja mõnikord kvalitatiivsete omaduste väärtuste vektor. Kvantitatiivne tunnus on vaadeldava ühiku tunnus, mida saab otseselt väljendada arvu ja mõõtühikuga. Kvantitatiivne tunnus vastandatakse kvalitatiivsele tunnusele - vaadeldava üksuse tunnusele, mis määratakse ühele kahest või enamast tingimuslikust kategooriast (kui kategooriaid on täpselt kaks, siis nimetatakse seda tunnust alternatiivseks). Kvalitatiivsete tunnuste statistiline analüüs on osa mittenumbrilise iseloomuga objektide statistikast. Kvantitatiivsed tunnused jagunevad tunnusteks, mida mõõdetakse intervallide, suhete, erinevuste ja absoluutse skaalal.

Ja kvalitatiivsed - tunnuste jaoks, mida mõõdetakse nimede ja järgu skaalal. Andmetöötlusmeetodid peavad olema kooskõlas skaaladega, milles kõnealuseid omadusi mõõdetakse.

Tunnustevahelise sõltuvuse uurimise eesmärkideks on tunnustevahelise seose olemasolu tõestamine ja selle seose uurimine. Kahe juhusliku suuruse X ja Y vahelise seose olemasolu tõestamiseks kasutatakse korrelatsioonianalüüsi. Kui X ja Y ühisjaotus on normaalne, siis statistilised järeldused põhinevad valimi lineaarsel korrelatsioonikordajal, muudel juhtudel kasutatakse Kendalli ja Spearmani auaste korrelatsioonikordajaid ning kvalitatiivsete tunnuste puhul hii-ruut testi.

Regressioonanalüüsi kasutatakse kvantitatiivse tunnuse Y funktsionaalse sõltuvuse uurimiseks kvantitatiivsetest tunnustest x(1), x(2), ..., x(k). Seda sõltuvust nimetatakse regressiooniks või lühidalt regressiooniks. Regressioonanalüüsi lihtsaim tõenäosusmudel (juhul k = 1) kasutab algteabena vaatlustulemuste paaride komplekti (xi, yi), i = 1, 2, … , n ja on kujul

yi = axi + b + ei, i = 1, 2, … , n,

kus ei on vaatlusvead. Mõnikord eeldatakse, et ei on sõltumatud juhuslikud muutujad, millel on sama normaaljaotus N(0, y2). Kuna vaatlusvigade jaotus erineb tavaliselt normaalsest, on regressioonimudeliga soovitatav arvestada mitteparameetrilises sõnastuses, s.t. suvalise ei jaotusega.

Regressioonanalüüsi põhiülesanne on hinnata tundmatuid parameetreid a ja b, mis määratlevad y lineaarse sõltuvuse x-st. Selle ülesande lahendamiseks kasutatakse K. Gaussi 1794. aastal välja töötatud vähimruutude meetodit, s.o. leida ruutude summa minimeerimise tingimusest hinnangud tundmatute mudeliparameetrite a ja b kohta

muutujate a ja b järgi.

Dispersioonanalüüsi kasutatakse kvalitatiivsete tunnuste mõju uurimiseks kvantitatiivsele muutujale. Näiteks olgu mõõtmistulemustest k näidist kvantitatiivne näitaja k masinal toodetud tooteühikute kvaliteet, s.o. arvude hulk (x1(j), x2(j), … , xn(j)), kus j on masina number, j = 1, 2, …, k ja n on valimi suurus. Levinud dispersioonanalüüsi sõnastuses eeldatakse, et mõõtmistulemused on sõltumatud ja igas proovis on neil sama dispersiooniga normaaljaotus N(m(j), y2).

Toote kvaliteedi ühtluse kontrollimine, s.o. masina numbri mõju puudumine toote kvaliteedile taandub hüpoteesi kontrollimisele

H0: m(1) = m(2) = … = m(k).

Dispersioonanalüüs on välja töötanud meetodid selliste hüpoteeside kontrollimiseks.

Hüpoteesi H0 kontrollitakse alternatiivse hüpoteesiga H1, mille kohaselt vähemalt üks määratud võrdsustest ei ole täidetud. Selle hüpoteesi test põhineb järgmisel R. A. Fisheri määratletud dispersioonide lagunemisel:

kus s2 on valimi dispersioon koondproovis, st.

Seega peegeldab esimene liige valemi (7) paremal küljel rühmasisest dispersiooni. Lõpuks on rühmadevaheline dispersioon,

Dispersioonilaiendustega, nagu valem (7) seotud rakendusstatistika valdkonda nimetatakse dispersioonanalüüsiks. Dispersioonanalüüsi probleemi näitena kaaluge ülaltoodud hüpoteesi H0 testimist eeldusel, et mõõtmistulemused on sõltumatud ja igas proovis on neil sama dispersiooniga normaaljaotus N(m(j), y2). Kui H0 on tõene, on valemi (7) paremal küljel oleval esimesel liikmel, jagatud y2-ga, hii-ruutjaotus k(n-1) vabadusastmega ja teisel liikmel, jagatud y2-ga, on samuti hii-ruutjaotus, kuid (k-1) vabadusastmega, kusjuures esimene ja teine ​​liige on juhuslikud muutujad sõltumatud. Seetõttu juhuslik suurus

omab Fisheri jaotust (k-1) lugeja vabadusastmega ja k(n-1) nimetaja vabadusastmega. Hüpotees H0 on aktsepteeritud, kui F< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

Klassikaliste dispersioonanalüüsi probleemide lahendamiseks on välja töötatud mitteparameetrilised meetodid, eelkõige hüpoteesi H0 kontrollimiseks.

Järgmine mitmemõõtmelise statistilise analüüsi probleemide tüüp on klassifitseerimisprobleemid. Need jagunevad põhimõtteliselt kolmeks erinevat tüüpi- diskriminantanalüüs, klasteranalüüs, rühmitamisprobleemid.

Diskriminantanalüüsi ülesanne on leida reegel vaadeldava objekti klassifitseerimiseks mõnda eelnevalt kirjeldatud klassi. Sel juhul kirjeldatakse objekte matemaatilises mudelis, kasutades vektoreid, mille koordinaadid on igas objektis mitmete tunnuste vaatlemise tulemused. Tunde kirjeldatakse kas otse matemaatiliselt või kasutades treeningnäidiseid. Treeningkomplekt on näidis, mille iga elemendi jaoks on näidatud, millisesse klassi see kuulub.

...

Sarnased dokumendid

    Ökonomeetria ja rakendusstatistika ajalugu. Rakendatud statistika aastal rahvamajandus. Kasvupunktid. Mitteparameetriline statistika. Mittenumbrilise iseloomuga objektide statistika on rakendusstatistika osa.

    abstraktne, lisatud 01.08.2009

    Deterministliku komponendi struktuurikomponendid. Aegridade statistilise analüüsi põhieesmärk. Majandusprotsesside ekstrapoleerimine. Anomaalsete vaatluste tuvastamine, samuti aegridade mudelite koostamine.

    kursusetöö, lisatud 11.03.2014

    Otsuste tegemise statistilised mudelid. Keskkonnaseisundi teadaoleva tõenäosusjaotusega mudelite kirjeldus. Kaalutlus kõige lihtsam skeem dünaamiline otsustusprotsess. Ettevõtte muutmise tõenäosuse arvutamine.

    test, lisatud 07.11.2011

    Statistilised meetodid ühemõõtmeliste aegridade analüüsimiseks, analüüsi- ja prognoosimisülesannete lahendamiseks, uuritava näitaja graafiku koostamine. Kriteeriumid seeria komponentide tuvastamiseks, seeria juhuslikkuse ja standardvigade väärtuste hüpoteesi kontrollimiseks.

    test, lisatud 13.08.2010

    Statistiliste meetodite roll juhtimisprotsessi kvantitatiivsete ja kvalitatiivsete tunnuste objektiivsel hindamisel. Kvaliteedivahendite kasutamine protsesside ja tooteparameetrite analüüsimisel. Diskreetsed juhuslikud muutujad. Tõenäosusteooria.

    kursusetöö, lisatud 11.01.2015

    Matemaatiline teooria optimaalne otsuste tegemine. Tabeliline simpleksmeetod. Duaallineaarse programmeerimise ülesande sõnastamine ja lahendamine. Matemaatiline mudel transpordi probleem. Tootmise teostatavuse analüüs ettevõttes.

    test, lisatud 13.06.2012

    Üldine, valimipopulatsioon. Metoodiline alus tõenäosuslik-statistiline analüüs. MathCadi funktsioonid, mis on loodud matemaatilise statistika probleemide lahendamiseks. Ülesannete lahendamine MS Excelis valemite ja menüü "Andmeanalüüs" abil.

    kursusetöö, lisatud 20.01.2014

    Tootmisplaani kulude summa arvutamine. Paaritud regressiooni lineaarvõrrandi koefitsiendid. Tulemuste graafilise tõlgendamise tunnused. Majandusprotsesside areng. Aegridade ökonomeetrilise modelleerimise tunnused.

    test, lisatud 22.02.2011

    Aegridade ökonomeetrilise analüüsi põhielemendid. Analüüsiülesanded ja nende esmane töötlemine. Aegridade väärtuste lühi- ja keskpika perioodi prognoosimise probleemide lahendamine. Trendivõrrandi parameetrite leidmise meetodid. Vähima ruudu meetod.

    test, lisatud 03.06.2009

    Elementaarsed mõisted juhuslike sündmuste, suuruste ja funktsioonide kohta. Juhuslike suuruste arvulised karakteristikud. Jaotuse asümmeetria tüübid. Juhuslike suuruste jaotuse statistiline hindamine. Struktuur-parameetrilise identifitseerimise ülesannete lahendamine.

Kuidas kasutatakse otsuste tegemisel tõenäosusteooria ja matemaatilise statistika lähenemisviise, ideid ja tulemusi?

Aluseks on reaalse nähtuse või protsessi tõenäosusmudel, s.t. matemaatiline mudel, milles objektiivseid seoseid väljendatakse tõenäosusteooria kaudu. Tõenäosusi kasutatakse eelkõige määramatuste kirjeldamiseks, millega tuleb otsuste tegemisel arvestada. See viitab nii soovimatutele võimalustele (riskid) kui ka atraktiivsetele (“õnnelik juhus”). Mõnikord tuuakse olukorda teadlikult juhuslikult, näiteks loosimisel, juhuslikult kontrollimiseks ühikute valimisel, loterii korraldamisel või tarbijaküsitlustel.

Tõenäosusteooria võimaldab ühe tõenäosuse abil arvutada teisi uurijale huvi pakkuvaid tõenäosusi. Kasutades näiteks vapi saamise tõenäosust, saad arvutada tõenäosuse, et 10 mündiviskega saad vähemalt 3 vappi. Selline arvutus põhineb tõenäosusmudelil, mille kohaselt kirjeldatakse mündiviskeid sõltumatute katsete mustriga, lisaks on vapp ja räsimärgid võrdselt võimalikud ning seetõttu on mõlema sündmuse tõenäosus võrdne kuni ½. Keerulisem on mudel, mis kaalub mündi viskamise asemel tootmisüksuse kvaliteedi kontrollimist. Vastav tõenäosusmudel põhineb eeldusel, et erinevate tootmisüksuste kvaliteedikontrolli kirjeldab sõltumatu testimisskeem. Erinevalt mündiviske mudelist on vaja kasutusele võtta uus parameeter – tõenäosus p, et toodanguühik on defektne. Mudelit kirjeldatakse täielikult, kui eeldame, et kõigil tootmisüksustel on sama tõenäosus, et need on defektsed. Kui viimane eeldus on vale, siis mudeli parameetrite arv suureneb. Näiteks võite eeldada, et igal tootmisüksusel on oma tõenäosus, et see on defektne.

Arutleme kvaliteedikontrolli mudeli üle, mille defekti tõenäosus p on ühine kõikidele tootmisüksustele. Et mudelit analüüsides “numbrini jõuda”, on vaja p asendada mingi kindla väärtusega. Selleks on vaja liikuda tõenäosusmudelist kaugemale ja pöörduda kvaliteedikontrolli käigus saadud andmete poole.

Matemaatiline statistika lahendab tõenäosusteooriaga seotud pöördülesande. Selle eesmärk on vaatluste (mõõtmised, analüüsid, testid, katsed) tulemuste põhjal teha järeldusi tõenäosusmudeli aluseks olevate tõenäosuste kohta. Näiteks defektsete toodete esinemise sageduse põhjal kontrollimisel saab teha järeldusi defekti tekkimise tõenäosuse kohta (vt ülaltoodud Bernoulli teoreem).

Tšebõševi ebavõrdsuse põhjal tehti järeldused defektsete toodete esinemissageduse vastavuse kohta hüpoteesile, et defekti tõenäosus omandab teatud väärtuse.

Seega põhineb matemaatilise statistika rakendamine nähtuse või protsessi tõenäosusmudelil. Kasutatakse kahte paralleelset mõisteseeriat – teooriaga (tõenäosuslik mudel) ja praktikaga seonduvaid (vaatlustulemuste valim). Näiteks vastab teoreetiline tõenäosus valimi põhjal leitud sagedusele. Matemaatiline ootus (teoreetiline jada) vastab valimi aritmeetilisele keskmisele (praktiline jada). Valimikarakteristikud on reeglina teoreetiliste hinnangud. Samas teoreetilise seeriaga seotud suurused “on uurijate peas”, seostuvad ideede maailmaga (vana-Kreeka filosoofi Platoni järgi) ega ole otseseks mõõtmiseks kättesaadavad. Teadlastel on ainult näidisandmed, mille abil nad püüavad kindlaks teha neid huvitava teoreetilise tõenäosusmudeli omadusi.

Miks me vajame tõenäosuslikku mudelit? Fakt on see, et ainult tema abiga saab konkreetse proovi analüüsist välja kujunenud omadusi üle kanda teistele proovidele, aga ka kogu nn üldkogumile. Mõistet "rahvastik" kasutatakse, kui viidatakse suurele, kuid piiratud uuritavate üksuste kogumile. Näiteks kõigi Venemaa elanike või Moskva lahustuva kohvi tarbijate koguarvu kohta. Turundus- või sotsioloogiliste uuringute eesmärk on kanda sadadest või tuhandetest inimestest koosnevast valimist saadud väiteid mitme miljonilise elanikkonna hulka. Kvaliteedikontrollis toimib tootepartii üldkogumina.

Valimi järelduste ülekandmine suuremale populatsioonile nõuab mõningaid eeldusi valimi tunnuste ja selle suurema populatsiooni omaduste seose kohta. Need eeldused põhinevad sobival tõenäosusmudelil.

Loomulikult on võimalik näidisandmeid töödelda üht või teist tõenäosusmudelit kasutamata. Näiteks saab arvutada näidisaritmeetilise keskmise, loendada teatud tingimuste täitmise sagedust jne. Arvutustulemused puudutavad aga ainult konkreetset valimit, nende abil saadud järelduste ülekandmine muule populatsioonile on vale. Seda tegevust nimetatakse mõnikord "andmete analüüsiks". Võrreldes tõenäosus-statistiliste meetoditega on andmeanalüüsil piiratud hariduslik väärtus.

Seega on tõenäosuslike mudelite kasutamine, mis põhinevad valimi karakteristikuid kasutavate hüpoteeside hindamisel ja kontrollimisel, tõenäosuslik-statistiliste otsustusmeetodite olemus.

Rõhutame, et valimikarakteristikute kasutamise loogika teoreetilistel mudelitel põhinevate otsuste tegemisel hõlmab kahe paralleelse mõisteseeria samaaegset kasutamist, millest üks vastab tõenäosusmudelitele ja teine ​​valimiandmetele. Kahjuks ei tehta paljudes kirjanduslikes allikates, mis on tavaliselt vananenud või kirjutatud retsepti vaimus, näidis- ja teoreetilist karakteristikku, mis põhjustab lugejates segadust ja vigu statistiliste meetodite praktilisel kasutamisel.

Samuti töötatakse välja ja põhjendatakse nn statistiliste otsuste teooria raames meetodeid riskitingimustes otsuste tegemiseks. Statistiline otsustusteooria on läbiviimise teooria statistilised tähelepanekud, töötleb neid tähelepanekuid ja kasutab neid. Majandusuuringute ülesandeks on teatavasti mõista majandusobjekti olemust ja paljastada selle olulisemate muutujate vahelise seose mehhanism. See arusaam võimaldab meil areneda ja rakendada vajalikke meetmeid selle rajatise haldamiseks või majanduspoliitika. Selleks vajame ülesandega adekvaatseid meetodeid, mis võtavad arvesse nende majandusandmete olemust ja eripära, mis on aluseks kvalitatiivsetele ja kvantitatiivsetele väidetele uuritava majandusobjekti või nähtuse kohta.

Kõik majandusandmed esindavad mis tahes majandusobjekti kvantitatiivseid omadusi. Need moodustuvad paljude tegurite mõjul, millest kõik ei ole välisele kontrollile kättesaadavad. Kontrollimatud tegurid võivad mõnest väärtuste komplektist võtta juhuslikke väärtusi ja seeläbi muuta nende määratletud andmed juhuslikuks. Majandusandmete stohhastilisuse tõttu on vaja kasutada nende analüüsiks ja töötlemiseks spetsiaalseid statistilisi meetodeid.

Äririski kvantitatiivne hindamine, olenemata konkreetse ülesande sisust, on reeglina võimalik matemaatilise statistika meetodeid kasutades. Selle hindamismeetodi peamised tööriistad on dispersioon, standardhälve ja variatsioonikoefitsient.

Tüüpilisi konstruktsioone, mis põhinevad riskitingimuste varieeruvuse või tõenäosuse mõõtmisel, kasutatakse rakendustes laialdaselt. Seega hinnatakse finantsriske, mis on põhjustatud tulemuse kõikumisest eeldatava väärtuse, näiteks efektiivsuse ümber, kasutades dispersiooni või eeldatavat absoluutset kõrvalekallet keskmisest. Kapitali juhtimise probleemide puhul on levinud riskiastme mõõdupuuks kahju või saamata jäänud tulu tõenäosus võrreldes prognoositud variandiga.

Riski suuruse (riski astme) hindamiseks keskendume järgmistele kriteeriumidele:

  • 1) keskmine eeldatav väärtus;
  • 2) võimaliku tulemuse kõikumine (variatiivsus).

Statistilise valimi jaoks

Kus Xj - iga vaatlusjuhtumi eeldatav väärtus (/" = 1, 2,...), l, - vaatlusjuhtumite arv (sagedus) väärtus l:, x=E - keskmine eeldatav väärtus, st - dispersioon,

V - variatsioonikoefitsient, meil on:

Vaatleme ärilepingute riskide hindamise probleemi. Interproduct LLC otsustab sõlmida toiduainete tarnimise lepingu ühel kolmest alusest. Olles kogunud andmeid nende aluste kaupa kaupade eest tasumise tingimuste kohta (tabel 6.7), on vaja pärast riski hindamist valida kauba tarnelepingu sõlmimisel baas, mis tasub kauba eest võimalikult lühikese aja jooksul. .

Tabel 6.7

Maksetingimused päevades

Täheldatud juhtumite arv P

HP

(x-x)

(x-x ) 2

(x-x) 2 p

Esimese aluse jaoks, mis põhineb valemitel (6.4.1):

Teise aluse jaoks

Kolmanda aluse jaoks

Esimese baasi variatsioonikoefitsient on väikseim, mis näitab selle baasiga toote tarnelepingu sõlmimise otstarbekust.

Vaadeldavad näited näitavad, et riskil on matemaatiliselt väljendatud kahju tõenäosus, mis põhineb statistilistel andmetel ja on arvutatav üsna suure täpsusega. Kõige vastuvõetavama lahenduse valikul lähtuti tulemuse optimaalse tõenäosuse reeglist, mis seisneb selles, et võimalike lahenduste hulgast valitakse see, mille puhul on tulemuse tõenäosus ettevõtjale vastuvõetav.

Praktikas kombineeritakse tulemuse optimaalse tõenäosuse reegli rakendamist tavaliselt tulemuse optimaalse muutlikkuse reegliga.

Teatavasti väljendatakse näitajate varieeruvust nende dispersiooni, standardhälbe ja variatsioonikoefitsiendiga. Tulemuse optimaalse kõikumise reegli olemus seisneb selles, et võimalike lahenduste hulgast valitakse välja see, mille puhul on sama riskantse kapitaliinvesteeringu võitmise ja kaotuse tõenäosus väike vahe, s.t. väikseim dispersiooni suurus, variatsiooni standardhälve. Vaadeldavate probleemide puhul tehti optimaalsete lahenduste valik nende kahe reegli alusel.

olenevalt andmete tüübist "sisendis":

2.1. Numbrid.

2.2. Lõpliku mõõtmega vektorid.

2.3. Funktsioonid (aegread).

2.4. Mittenumbrilise iseloomuga objektid.

Kõige huvitavam klassifikatsioon põhineb nendel kontrolliprobleemidel, mille lahendamiseks kasutatakse ökonomeetrilisi meetodeid. Selle lähenemisviisi abil saab plokke eraldada:

3.1. Toetage prognoosimist ja planeerimist.

3.2. Jälgimine kontrollitud parameetrid ja anomaaliate tuvastamine.

3.3. Toetus otsuse tegemine, ja jne.

Millised tegurid määravad teatud ökonomeetriliste kontrollivahendite kasutamise sageduse? Nagu ka teiste ökonomeetria rakenduste puhul, on siin kaks peamist tegurite rühma - lahendatavad ülesanded ja spetsialistide kvalifikatsioon.

Kell praktilise rakendamiseökonomeetrilisi meetodeid kontrolleri töös on vaja rakendada vastavaid tarkvarasüsteemid. Üldised statistikasüsteemid nagu SPSS, Statgraphics, Statistica, ADDA ja rohkem spetsialiseerunud Statcon, SPC, NADIS, REST(vastavalt intervallandmete statistikale), Matrixer ja paljud teised. Lihtsalt kasutatavate toodete massiline kasutuselevõtt tarkvaratooted, sealhulgas kaasaegseid ökonomeetrilisi tööriistu konkreetsete majandusandmete analüüsimiseks, võib pidada üheks tõhusaid viise kiirendus teaduse ja tehnoloogia areng, kaasaegsete ökonomeetriliste teadmiste levitamine.

Ökonomeetria areneb pidevalt. Rakendusuuringud toovad kaasa vajaduse klassikaliste meetodite põhjalikuma analüüsi järele.

Hea näide, mida arutada, on kahe proovi homogeensuse testimise meetodid. Agregaate on kaks ja me peame otsustama, kas need on erinevad või samad. Selleks võetakse igaühest neist proov ja homogeensuse kontrollimiseks kasutatakse üht või teist statistilist meetodit. Umbes 100 aastat tagasi pakuti välja Student meetod, mida kasutatakse laialdaselt tänapäevalgi. Sellel on aga terve hunnik puudusi. Esiteks peavad Studenti järgi valimielementide jaotused olema normaalsed (Gaussi). Reeglina see nii ei ole. Teiseks ei ole see suunatud mitte homogeensuse kontrollimisele üldiselt (nn absoluutse homogeensuse ehk kahele populatsioonile vastavate jaotusfunktsioonide kokkulangevuse), vaid ainult matemaatiliste ootuste võrdsuse kontrollimisele. Kuid kolmandaks eeldatakse tingimata, et kahe valimi elementide dispersioonid langevad kokku. Dispersioonide võrdsuse ja eriti normaalsuse kontrollimine on aga palju keerulisem kui matemaatiliste ootuste võrdsus. Seetõttu kasutatakse Studenti t-testi tavaliselt ilma selliseid kontrolle tegemata. Ja siis jäävad õhku rippuma Üliõpilase kriteeriumi põhjal tehtud järeldused.

Teoreetiliselt arenenumad spetsialistid pöörduvad muude kriteeriumide, näiteks Wilcoxoni testi poole. See on mitteparameetriline, st. ei tugine normaalsuse eeldusele. Kuid see pole ilma puudusteta. Seda ei saa kasutada absoluutse homogeensuse (kahele populatsioonile vastavate jaotusfunktsioonide kokkulangevuse) kontrollimiseks. Seda saab teha ainult kasutades nn. järjekindlad kriteeriumid, eelkõige Smirnovi kriteeriumid ja oomega-ruudu tüüp.

Praktilisest küljest on Smirnovi kriteeriumil puudus - selle statistika võtab vaid väikese arvu väärtusi, selle jaotus on koondunud vähestesse punktidesse ning traditsioonilisi olulisuse tasemeid 0,05 ja 0,01 pole võimalik kasutada. .

Mõiste "statistilised kõrgtehnoloogiad". Mõistes “statistilised kõrgtehnoloogiad” on kõigil kolmel sõnal oma tähendus.

"Kõrge" tähendab, nagu ka teistes valdkondades, seda, et tehnoloogia põhineb teooria ja praktika kaasaegsetel saavutustel, eelkõige tõenäosusteoorial ja rakenduslikul matemaatilisel statistikal. Samas tähendab “kaasaegsetel teadussaavutustel põhinev” esiteks seda, et tehnoloogia matemaatiline alus vastava teadusdistsipliini raames saadi suhteliselt hiljuti ning teiseks, et arvutusalgoritmid töötati välja ja põhjendati vastavalt 2010. aasta 2010. aasta 2010. aasta aruannetele. see (ja ei ole nn "heuristiline"). Aja jooksul, kui uued lähenemised ja tulemused ei sunni tehnoloogia rakendatavuse ja võimaluste hindamist ümber vaatama või seda kaasaegsemaga asendama, muutub „kõrgökonomeetriline tehnoloogia“ „klassikaliseks statistikatehnoloogiaks“. Nagu näiteks vähima ruudu meetod. Seega on kõrged statistilised tehnoloogiad hiljutiste tõsiste saavutuste viljad teaduslikud uuringud. Siin on kaks võtmemõisteid- tehnoloogia "noorus" (igal juhul mitte vanem kui 50 aastat ja parem, mitte vanem kui 10 või 30 aastat) ja "kõrgteadusele" tuginemine.

Mõiste "statistika" on tuttav, kuid sellel on palju varjundeid. Mõistel "statistika" on rohkem kui 200 definitsiooni.

Lõpuks kasutatakse mõistet „tehnoloogia” seoses statistikaga suhteliselt harva. Andmeanalüüs hõlmab tavaliselt mitmeid protseduure ja algoritme, mis viiakse läbi järjestikku, paralleelselt või keerukamal viisil. Eelkõige saab eristada järgmisi tüüpilisi etappe:

  • statistilise uuringu kavandamine;
  • andmete kogumise korraldamine optimaalse või vähemalt ratsionaalse programmi järgi (valimi planeerimine, loomine organisatsiooniline struktuur ja spetsialistide meeskonna valimine, andmeid koguma hakkava personali, samuti vastutavate töötlejate koolitamine jne);
  • andmete otsene kogumine ja nende salvestamine teatud andmekandjatele (koos kogumise kvaliteedikontrolliga ja ekslike andmete tagasilükkamine teemavaldkonnast tulenevatel põhjustel);
  • andmete esmane kirjeldus (erinevate valimikarakteristikute arvutamine, jaotusfunktsioonid, mitteparameetrilised tiheduse hinnangud, histogrammide koostamine, korrelatsiooniväljad, erinevad tabelid ja diagrammid jne),
  • jaotuste teatud arvuliste või mittenumbriliste karakteristikute ja parameetrite hindamine (näiteks variatsioonikordaja mitteparameetriline intervallhinnang või vastuse ja tegurite vahelise seose taastamine, st funktsiooni hindamine),
  • statistiliste hüpoteeside (mõnikord nende ahelate) testimine - pärast eelmise hüpoteesi kontrollimist otsustatakse üht või teist järgnevat hüpoteesi testida,
  • põhjalikumat uurimist, s.o. erinevate algoritmide rakendamine mitme muutujaga statistilise analüüsi, diagnostiliste ja klassifitseerimisalgoritmide, mittenumbriliste ja intervallandmete statistika, aegridade analüüsi jms jaoks;
  • saadud hinnangute ja järelduste stabiilsuse kontrollimine lähteandmete lubatud hälvete ja kasutatud tõenäosus-statistiliste mudelite eelduste kohta, mõõteskaalade lubatud teisendused, eelkõige hinnangute omaduste uurimine valimite korrutamise meetodil. ;
  • saadud statistiliste tulemuste rakendamine rakenduslikel eesmärkidel (näiteks konkreetsete materjalide diagnoosimiseks, prognooside tegemiseks, selekteerimiseks investeerimisprojekt pakutud variantidest tehnoloogilise protsessi rakendamiseks optimaalse režiimi leidmine, proovide testimise tulemuste summeerimine tehnilised seadmed ja jne),
  • lõpparuannete koostamine, eelkõige mõeldud neile, kes ei ole andmeanalüüsi ökonomeetriliste ja statistiliste meetodite spetsialistid, sh juhtkonnale – “otsustajatele”.

Võimalik on ka muu statistiliste tehnoloogiate struktureerimine. Oluline on rõhutada, et statistiliste meetodite kvalifitseeritud ja tõhus kasutamine ei ole mingil juhul ühe individuaalse statistilise hüpoteesi testimine või kindla perekonna ühe antud jaotuse parameetrite hindamine. Selline operatsioonid on vaid statistilise tehnoloogia ehitusplokid. Samal ajal räägitakse statistika ja ökonomeetria õpikutes ja monograafiates tavaliselt üksikutest ehitusplokkidest, kuid ei käsitleta nende rakenduslikuks kasutamiseks mõeldud tehnoloogiaks organiseerimise probleeme. Üleminek ühelt statistiliselt protseduurilt teisele jääb varju.

Eraldi läbimõtlemist nõuab statistiliste algoritmide “liitumise” probleem, kuna eelmise algoritmi kasutamise tulemusena rikutakse sageli ka järgmise rakendamistingimusi. Eelkõige võivad vaatlustulemused lakata olemast sõltumatud, muutuda nende jaotus jne.

Näiteks statistiliste hüpoteeside testimisel on suur tähtsus olulisuse tasemel ja võimsusel. Nende arvutamise ja ühe hüpoteesi kontrollimise meetodid on tavaliselt hästi teada. Kui esmalt testitakse üht hüpoteesi ja seejärel, arvestades selle testimise tulemusi, teist, siis on lõplikul protseduuril, mida võib pidada ka mõne (keerukama) statistilise hüpoteesi testimiseks, omadused (olulisuse tase ja võimsus), mida reeglina ei saa lihtsalt väljendada kahe komponendi hüpoteesi omadustega ja seetõttu on need tavaliselt tundmatud. Seetõttu ei saa lõplikku protseduuri pidada teaduslikult põhjendatuks, see viitab heuristilistele algoritmidele. Loomulikult võib see pärast asjakohast uurimist, näiteks Monte Carlo meetodit kasutades, saada üheks rakendusstatistika teaduslikult põhjendatud protseduuriks.

Seega on ökonomeetrilise või statistilise andmete analüüsi protseduur teave tehnoloogiline protsess ehk teisisõnu üht või teist infotehnoloogiat. Praegu oleks kergemeelne rääkida kogu ökonomeetrilise (statistilise) andmeanalüüsi protsessi automatiseerimisest, kuna liiga palju on lahendamata probleeme, mis tekitavad spetsialistide vahel arutelusid.

Kogu praegu kasutatavate statistiliste meetodite arsenali saab jagada kolme voogu:

  • kõrged statistilised tehnoloogiad;
  • klassikalised statistikatehnoloogiad,
  • madala statistilise tehnoloogiaga.

Tuleb tagada, et konkreetsetes uuringutes kasutatakse ainult kahte esimest tüüpi tehnoloogiaid. Samas peame klassikaliste statistikatehnoloogiate all silmas auväärses eas tehnoloogiaid, mis on säilitanud oma teadusliku väärtuse ja olulisuse kaasaegse statistikapraktika jaoks. Need on vähima ruudu meetod, Kolmogorovi, Smirnovi statistika, oomega ruut, mitteparameetrilised Spearmani ja Kendalli korrelatsioonikordajad ja paljud teised.

Meil on ökonomeetrikuid suurusjärgu võrra vähem kui USA-s ja Suurbritannias (Ameerika statistikaliidus on üle 20 000 liikme). Venemaa vajab uute spetsialistide – ökonomeetrikute väljaõpet.

Ükskõik, milliseid uusi teadustulemusi saadakse, kui need jäävad õpilastele teadmata, siis on uus põlvkond teadlasi ja insenere sunnitud neid üksi tegutsedes valdama või isegi uuesti avastama. Mõnevõrra jämedalt öeldes võib öelda nii: need lähenemisviisid, ideed, tulemused, faktid, algoritmid, mis sisaldusid koolituskursustel ja vastavad õppevahendid- salvestatakse ja kasutatakse järeltulijate poolt, need, mis ei kuulu, kaovad raamatukogude tolmu.

Kasvupunktid. Neid on viis praegused trendid, milles arendatakse kaasaegset rakendusstatistikat, s.o. viis "kasvupunkti": mitteparameetrilisus, robustsus, alglaadimine, intervallstatistika, mittenumbriliste objektide statistika. Arutleme lühidalt nende praeguste suundumuste üle.

Mitteparameetriline või mitteparameetriline statistika võimaldab teha statistilisi järeldusi, hinnata jaotuskarakteristikuid ja testida statistilisi hüpoteese ilma nõrgalt põhjendatud eeldusteta, et valimi elementide jaotusfunktsioon on osa konkreetsest parameetrilisest perekonnast. Näiteks on levinud arvamus, et statistika järgib sageli normaaljaotust. Konkreetsete vaatlustulemuste, eelkõige mõõtmisvigade analüüs aga näitab, et valdaval enamusel juhtudel erinevad reaalsed jaotused tavalistest oluliselt. Normaalsuse hüpoteesi kriitikavaba kasutamine toob sageli kaasa olulisi vigu, näiteks kõrvalekallete tagasilükkamisel, statistilise kvaliteedikontrolli käigus ja muudel juhtudel. Seetõttu on soovitatav kasutada mitteparameetrilisi meetodeid, kus vaatlustulemuste jaotusfunktsioonidele esitatakse ainult väga nõrgad nõuded. Tavaliselt eeldatakse ainult nende järjepidevust. Praeguseks on mitteparameetriliste meetodite abil võimalik lahendada peaaegu sama hulk probleeme, mida varem lahendati parameetriliste meetoditega.

Töökindluse (stabiilsuse) töö põhiidee: järeldused peaksid algandmete väikeste muutuste ja mudeli eeldustest kõrvalekallete korral vähe muutuma. Siin on kaks ülesannete komplekti. Üks on levinud andmekaeve algoritmide töökindluse uurimine. Teine on kindlate algoritmide otsimine teatud probleemide lahendamiseks.

Mõistel "robustsus" pole selget tähendust. Alati on vaja täpsustada konkreetne tõenäosus-statistiline mudel. Kuid Tukey-Huber-Hampeli "ummistuse" mudel pole tavaliselt praktiliselt kasulik. See keskendub "sabade kaalumisele" ja reaalsetes olukordades "lõigatakse sabad ära" a priori piirangutega näiteks kasutatavate mõõtevahenditega seotud vaatlustulemustele.

Bootstrap on mitteparameetrilise statistika haru, mis põhineb intensiivsel kasutamisel infotehnoloogiad. Põhiidee on “proovide korrutamine”, st. paljude proovide komplekti saamisel, mis sarnanevad katses saadud prooviga. Seda komplekti kasutades saab hinnata erinevate statistiliste protseduuride omadusi. Lihtsaim viis“proovi korrutamine” seisneb ühe vaatlustulemuse väljajätmises. Välistame esimese vaatluse, saame esialgsega sarnase valimi, mille suurus on vähendatud 1 võrra. Seejärel tagastame esimese vaatluse välistatud tulemuse, kuid välistame teise vaatluse. Saame teise proovi, mis on sarnane algsele. Seejärel tagastame teise vaatluse tulemuse jne. Proovide reprodutseerimiseks on ka teisi viise. Näiteks võite kasutada algset valimit jaotusfunktsiooni ühe või teise hinnangu koostamiseks ja seejärel kasutada statistilisi teste, et simuleerida mitmeid elementide valimeid. rakendusstatistikas on tegemist valimiga, s.o. sõltumatute identselt jaotatud juhuslike elementide kogum. Mis on nende elementide olemus? Klassikalises matemaatilises statistikas on valimielementideks arvud või vektorid. Ja mittenumbrilises statistikas on näidiselemendid mittenumbrilise iseloomuga objektid, mida ei saa arvudega liita ja korrutada. Teisisõnu, mittenumbrilised objektid asuvad ruumides, millel puudub vektorstruktuur.