Statistilised otsustusmeetodid. Tõenäosuslikud ja statistilised otsustusmudelid Ii Temaatiline planeerimine

2. OTSUSTAMISTEOORIA MÄÄRAMATUSTE KIRJELDUS

2.2. Tõenäosus-statistilised meetodid määramatuste kirjeldamiseks otsustusteoorias

2.2.1. Tõenäosusteooria ja matemaatiline statistika otsuste tegemisel

Kuidas kasutatakse tõenäosusteooriat ja matemaatilist statistikat? Need distsipliinid on tõenäosuslike ja statistiliste otsustusmeetodite aluseks. Nende matemaatilise aparatuuri kasutamiseks on vaja otsustusprobleeme väljendada tõenäosus-statistiliste mudelite kaudu. Konkreetse tõenäosus-statistilise otsustusmeetodi rakendamine koosneb kolmest etapist:

Üleminek majanduslikult, juhtimis-, tehnoloogiliselt reaalsuselt abstraktsele matemaatilisele ja statistilisele skeemile, s.o. kontrollsüsteemi tõenäosusliku mudeli koostamine, tehnoloogiline protsess, otsustusprotseduur, eelkõige statistilise kontrolli tulemuste põhjal jne.

Arvutuste läbiviimine ja järelduste tegemine puhtmatemaatiliselt tõenäosusliku mudeli raames;

Matemaatiliste ja statistiliste järelduste tõlgendamine seoses reaalse olukorraga ja asjakohase otsuse tegemine (näiteks toote kvaliteedi vastavuse või mittevastavuse kohta kehtestatud nõuetele, tehnoloogilise protsessi kohandamise vajaduse kohta jne), eelkõige järeldused (defektsete tooteühikute osakaalu kohta partiis, tehnoloogilise protsessi kontrollitavate parameetrite jaotusseaduste spetsiifilise vormi kohta jne).

Matemaatilises statistikas kasutatakse tõenäosusteooria mõisteid, meetodeid ja tulemusi. Vaatleme tõenäosuslike otsustusmudelite konstrueerimise põhiküsimusi majanduslikes, juhtimis-, tehnoloogilistes ja muudes olukordades. Tõenäosus-statistiliste otsustusmeetodite normatiiv-tehniliste ja õpetlik-metoodiliste dokumentide aktiivseks ja korrektseks kasutamiseks on vaja eelteadmisi. Seega on vaja teada, millistel tingimustel konkreetset dokumenti rakendada, millist algteavet selle valikuks ja rakendamiseks vaja on, milliseid otsuseid andmetöötluse tulemuste põhjal teha jne.

Rakenduse näited tõenäosusteooria ja matemaatiline statistika. Vaatleme mõnda näidet, kui tõenäosuslik-statistilised mudelid on heaks vahendiks juhtimis-, tootmis-, majandus- ja rahvamajandusprobleemide lahendamisel. Nii öeldakse näiteks AN Tolstoi romaanis "Kõndimine läbi agoonia" (1. köide): "töökoda annab kakskümmend kolm protsenti abielust ja te jääte selle näitaja juurde," ütles Strukov Ivan Iljitšile. ."

Tekib küsimus, kuidas neid sõnu tehasejuhtide vestluses mõista, kuna üks tootmisüksus ei saa olla 23% defektne. See võib olla hea või defektne. Tõenäoliselt pidas Strukov silmas seda, et suures partiis on umbes 23% defektseid esemeid. Siis tekib küsimus, mida tähendab "ligikaudne"? Las 100 testitud toodanguühikust 30 osutuvad defektseks või 1000 - 300 või 100 000 - 30 000 jne, kas Strukovit peaks süüdistama valetamises?

Või teine ​​näide. Partiina kasutatav münt peab olema "sümmeetriline", s.t. selle viskamisel peaks keskmiselt pooltel juhtudel vapp välja kukkuma ja pooltel juhtudel - võre (sabad, number). Aga mida tähendab "keskmine"? Kui sooritate igas seerias palju 10 viskega seeriaid, kohtate sageli seeriaid, kus münt langeb embleemiga 4 korda. Sümmeetrilise mündi puhul esineb seda 20,5% seeriast. Ja kui 100 000 viske kohta on 40 000 vappi, siis kas münti võib pidada sümmeetriliseks? Otsustusprotseduur põhineb tõenäosusteoorial ja matemaatilisel statistikal.

Kõnealune näide ei pruugi tunduda piisavalt tõsine. Siiski ei ole. Loosimist kasutatakse laialdaselt tööstuslike tehniliste ja majanduslike katsete korraldamisel, näiteks laagrite kvaliteedinäitaja (hõõrdemomendi) mõõtmise tulemuste töötlemisel sõltuvalt erinevatest tehnoloogilistest teguritest (säilituskeskkonna mõju, meetodid). laagrite ettevalmistamine enne mõõtmist, laagrikoormuse mõju mõõtmisel jne). P.). Oletame, et on vaja võrrelda laagrite kvaliteeti sõltuvalt nende ladustamise tulemustest erinevates säilitusõlides, st. õlide koostises A ja V... Sellise katse kavandamisel tekib küsimus, millised laagrid tuleks kompositsiooni õli sisse panna A, ja millised - õli koostisesse V, vaid selleks, et vältida subjektiivsust ja tagada otsuse objektiivsus.

Sellele küsimusele saab vastuse loosi teel. Sarnase näite võib tuua mis tahes toote kvaliteedikontrolliga. Otsustamaks, kas kontrollitud tootepartii vastab kehtestatud nõuetele või mitte, võetakse sellest proov. Proovivõtu tulemuste põhjal tehakse järeldus kogu partii kohta. Sel juhul on väga oluline vältida valimi valimisel subjektiivsust, st on vaja, et iga kontrollitava partii toodanguüksus oleks ühesuguse tõenäosusega valimisse sattunud. Tootmistingimustes toimub toodanguühikute valimine valimisse tavaliselt mitte loosi teel, vaid spetsiaalsete juhuslike arvude tabelite või arvutite juhuslike arvude andurite abil.

Sarnased võrdluse objektiivsuse tagamise probleemid tekivad ka erinevate tootmise korraldamise, tasustamise skeemide võrdlemisel, pakkumiste ja konkursside läbiviimisel, kandidaatide valimisel vabadele ametikohtadele jne. Igal pool on vaja loosimisi vms protseduure. Selgitame turniiri korraldamisel olümpiasüsteemi järgi tugevaima ja tugevuselt teise võistkonna väljaselgitamise näitel (kaotaja langeb välja). Võidab tugevam meeskond alati nõrgemat. Selge on see, et meistriks tuleb kindlasti tugevaim meeskond. Tugevuselt teine ​​meeskond pääseb finaali siis ja ainult siis, kui tal pole enne finaali tulevase meistriga mänge. Kui selline mäng on kavas, siis tugevuselt teine ​​meeskond finaali ei pääse. Igaüks, kes plaanib turniiri, võib turniirilt enne tähtaega “välja lüüa” tugevuselt teise võistkonna, viies selle kokku esimeses kohtumises liidriga, või anda talle teise koha, tagades kohtumised nõrgemate võistkondadega kuni finaalini. Subjektiivsuse vältimiseks loosike. 8 meeskonnaga turniiri puhul on tõenäosus, et finaalis kohtuvad kaks tugevamat meeskonda, 4/7. Seetõttu lahkub tugevuselt teine ​​meeskond turniirilt enne tähtaega tõenäosusega 3/7.

Iga tooteühiku mõõtmisel (kasutades nihikut, mikromeetrit, ampermeetrit jne) on vigu. Et teada saada, kas tegemist on süstemaatiliste vigadega, on vaja teha toodanguühikul, mille omadused on teada (näiteks standardproov), teha mitu mõõtmist. Tuleb meeles pidada, et lisaks süstemaatilisele veale on ka juhuslik viga.

Seetõttu tekib küsimus, kuidas mõõtmistulemustest välja selgitada, kas tegemist on süstemaatilise veaga. Kui märkida ainult see, kas järgmisel mõõtmisel saadud viga on positiivne või negatiivne, saab selle probleemi taandada eelmisele. Tõepoolest, võrrelgem mõõtmist mündi viskamisega, positiivset viga - vapi langemisega, negatiivset - võrega (piisava arvu skaalajaotiste korral nullviga praktiliselt ei esine). Seejärel võrdub süstemaatilise vea puudumise kontrollimine mündi sümmeetria kontrollimisega.

Selle mõttekäigu eesmärk on taandada süstemaatilise vea puudumise kontrollimise probleem mündi sümmeetria kontrollimise probleemiks. Ülaltoodud arutluskäik viib matemaatilise statistika nn märgikriteeriumini.

Tehnoloogiliste protsesside statistilise reguleerimisega matemaatilise statistika meetodite alusel töötatakse välja protsesside statistilise kontrolli reeglid ja plaanid, mille eesmärk on õigeaegselt avastada tehnoloogilistes protsessides esinevad ebakorrapärasused ning võtta meetmeid nende kohandamiseks ja toodete vabastamise vältimiseks. mis ei vasta kehtestatud nõuetele. Nende meetmete eesmärk on vähendada tootmiskulusid ja nõuetele mittevastavate toodete tarnimisest tulenevaid kadusid. Statistilises vastuvõtukontrollis koostatakse matemaatilise statistika meetoditele tuginedes kvaliteedikontrolli plaanid tootepartiide proovide analüüsimise teel. Raskus seisneb selles, et osatakse õigesti ehitada tõenäosuslikke ja statistilisi otsustusmudeleid, mille põhjal on võimalik vastata eeltoodud küsimustele. Matemaatilises statistikas on selleks välja töötatud tõenäosuslikud mudelid ja meetodid hüpoteeside kontrollimiseks, eelkõige hüpoteesid, et defektsete toodanguühikute osakaal võrdub teatud arvuga. p 0, Näiteks, p 0= 0,23 (meenutagem Strukovi sõnu A. N. Tolstoi romaanist).

Hindamisülesanded. Paljudes juhtimis-, tööstus-, majandus- ja riigimajanduslikes olukordades tekivad erinevat tüüpi probleemid - tõenäosusjaotuste omaduste ja parameetrite hindamise probleem.

Vaatame näidet. Laske partiil alates N lambipirnid. Sellest partiist valiti juhuslikult suuruse valim n lambipirnid. Tekib hulk loomulikke küsimusi. Kuidas näidise elementide katsetamise tulemuste põhjal määrata elektrilampide keskmist kasutusiga ja millise täpsusega saab seda tunnust hinnata? Kuidas muutub täpsus, kui võtate suurema proovi? Mis tundide arvul T võib garanteerida, et vähemalt 90% pirnidest peab vastu T ja rohkem tunde?

Oletame, et suuruse valimi testimisel n lambipirnid leiti olevat rikkis X lambipirnid. Siis tekivad järgmised küsimused. Milliseid piire saab arvule määrata D defektsed lambipirnid partiidena, defektsuse taseme järgi D/ N jne.?

Või on tehnoloogiliste protsesside täpsuse ja stabiilsuse statistilises analüüsis vaja hinnata selliseid kvaliteedinäitajaid nagu kontrollitava parameetri keskmine väärtus ja selle hajutuse aste vaadeldavas protsessis. Tõenäosusteooria kohaselt on soovitatav kasutada juhusliku suuruse keskmise väärtusena selle matemaatilist ootust ning dispersiooni, standardhälvet või variatsioonikordaja leviku statistilise tunnusena. See tõstatab küsimuse: kuidas neid statistilisi tunnuseid näidisandmete põhjal hinnata ja millise täpsusega seda teha? Sarnaseid näiteid on palju. Siin oli oluline näidata, kuidas tõenäosusteooriat ja matemaatilist statistikat saab tootmisjuhtimises kasutada tootekvaliteedi statistilise juhtimise valdkonna otsuste tegemisel.

Mis on "matemaatiline statistika"? Matemaatilise statistika all mõistetakse „matemaatika osa, mis on pühendatud statistiliste andmete kogumise, korrastamise, töötlemise ja tõlgendamise matemaatilistele meetoditele, samuti nende kasutamisele teaduslike või praktiliste järelduste tegemiseks. Matemaatilise statistika reeglid ja protseduurid põhinevad tõenäosusteoorial, mis võimaldab olemasoleva statistilise materjali põhjal hinnata igas ülesandes tehtud järelduste täpsust ja usaldusväärsust. Sel juhul nimetatakse statistilisteks andmeteks teavet objektide arvu kohta mõnes enam-vähem ulatuslikus kogumis, millel on teatud omadused.

Vastavalt lahendatavate ülesannete tüübile jagatakse matemaatiline statistika tavaliselt kolmeks osaks: andmete kirjeldamine, hindamine ja hüpoteeside testimine.

Töödeldud statistiliste andmete tüübi järgi jaguneb matemaatiline statistika nelja valdkonda:

Ühemõõtmeline statistika (juhuslike muutujate statistika), milles vaatlustulemust kirjeldatakse reaalarvuga;

Mitmemõõtmeline statistiline analüüs, kus objekti vaatlustulemust kirjeldatakse mitme arvuga (vektoriga);

Juhuslike protsesside ja aegridade statistika, kus vaatlustulemuseks on funktsioon;

Mittenumbrilise iseloomuga objektide statistika, mille puhul vaatlustulemus on mittenumbriline, näiteks on see hulk (geomeetriline joonis), järjestus või saadakse kvalitatiivse atribuudiga mõõtmise tulemusena .

Ajalooliselt ilmusid esimesena mõned mittenumbrilise iseloomuga objektide statistika valdkonnad (eelkõige abielu osakaalu hindamise ja selle kohta püstitatud hüpoteeside kontrollimise probleem) ja ühemõõtmeline statistika. Matemaatiline aparaat on nende jaoks lihtsam, seetõttu demonstreeritakse nende näitel tavaliselt matemaatilise statistika põhiideed.

Ainult need andmetöötlusmeetodid, s.o. matemaatiline statistika on tõendusmaterjal, mis põhineb asjakohaste reaalsete nähtuste ja protsesside tõenäosusmudelitel. Räägime tarbijakäitumise mudelitest, riskide tekkimisest, tehnoloogiliste seadmete toimimisest, katsetulemuste saamisest, haiguse kulgemisest jne. Reaalse nähtuse tõenäosusmudelit tuleks lugeda konstrueerituks, kui vaadeldavad suurused ja nendevahelised seosed on väljendatud tõenäosusteoorias. Vastavus tõenäosuslikule tegelikkuse mudelile, s.o. selle adekvaatsust põhjendatakse eelkõige hüpoteeside kontrollimise statistiliste meetodite abil.

Ebatõenäolised andmetöötlusmeetodid on uurimuslikud, neid saab kasutada vaid andmete esialgseks analüüsiks, kuna need ei võimalda hinnata piiratud statistilise materjali põhjal tehtud järelduste täpsust ja usaldusväärsust.

Tõenäosuslikud ja statistilised meetodid on rakendatavad kõikjal, kus on võimalik luua ja põhjendada nähtuse või protsessi tõenäosuslikku mudelit. Nende kasutamine on kohustuslik, kui andmete valimi põhjal tehtud järeldused kantakse üle kogu populatsioonile (näiteks valimilt tervele tootepartiile).

Konkreetsetes rakendusvaldkondades kasutatakse nii laialt levinud tõenäosusstatistilisi meetodeid kui ka spetsiifilisi. Näiteks tootmisjuhtimise sektsioonis, mis on pühendatud tootekvaliteedi juhtimise statistilistele meetoditele, kasutatakse rakenduslikku matemaatilist statistikat (sh katsete planeerimist). Selle meetoditega viiakse läbi tehnoloogiliste protsesside täpsuse ja stabiilsuse statistiline analüüs ning kvaliteedi statistiline hindamine. Spetsiifilised meetodid hõlmavad toodete kvaliteedi statistilise aktsepteerimise kontrolli, tehnoloogiliste protsesside statistilise reguleerimise, töökindluse hindamise ja kontrolli jne meetodeid.

Laialdaselt kasutatakse rakenduslikke tõenäosus- ja statistilisi distsipliine, nagu usaldusväärsusteooria ja järjekorrateooria. Neist esimese sisu selgub nimest, teise puhul uuritakse selliseid süsteeme nagu telefonikeskjaam, mis juhuslikel aegadel kõnesid vastu võtab – telefonis numbreid valivate abonentide nõuded. Nende nõuete teenindamise kestus, s.o. vestluste kestust modelleeritakse samuti juhuslike suurustega. Suure panuse nende erialade arengusse andis NSVL Teaduste Akadeemia korrespondentliige A.Ya. Khinchin (1894-1959), Ukraina NSV Teaduste Akadeemia akadeemik B. V. Gnedenko (1912-1995) ja teised kodumaised teadlased.

Lühidalt matemaatilise statistika ajaloost. Matemaatiline statistika kui teadus saab alguse kuulsa saksa matemaatiku Karl Friedrich Gaussi (1777-1855) töödest, kes tõenäosusteooria põhjal uuris ja põhjendas tema 1795. aastal loodud vähimruutude meetodit, mida kasutati astronoomiliste uuringute tegemiseks. andmed (väikeplaneedi Cerese orbiidi selgitamiseks). Tema nime nimetatakse sageli üheks populaarsemaks tõenäosusjaotuseks - normaaljaotuseks ning juhuslike protsesside teoorias on peamiseks uurimisobjektiks Gaussi protsessid.

XIX sajandi lõpus. - kahekümnenda sajandi algus. suure panuse matemaatilisse statistikasse andsid inglise teadlased, eelkõige K. Pearson (1857-1936) ja R.A. Fisher (1890-1962). Eelkõige töötas Pearson statistiliste hüpoteeside testimiseks välja "hii ruudu" testi ja Fisher - dispersioonanalüüsi, eksperimentaalse disaini teooria, parameetrite hindamise maksimaalse tõenäosuse meetodi.

Kahekümnenda sajandi 30. aastatel. Poolakas Jerzy Neumann (1894-1977) ja inglane E. Pearson töötasid välja statistiliste hüpoteeside kontrollimise üldteooria ning nõukogude matemaatikud akadeemik A.N. Kolmogorov (1903-1987) ja NSVL Teaduste Akadeemia korrespondentliige N. V. Smirnov (1900-1966) panid aluse mitteparameetrilisele statistikale. Kahekümnenda sajandi neljakümnendatel. Rumeenlane A. Wald (1902-1950) ehitas järjestikuse statistilise analüüsi teooria.

Matemaatiline statistika areneb praegu kiiresti. Seega saab viimase 40 aasta jooksul eristada nelja põhimõtteliselt uut uurimisvaldkonda:

Matemaatiliste meetodite väljatöötamine ja rakendamine katsete planeerimiseks;

Mittenumbrilise olemusega objektide statistika arendamine iseseisva suunana rakendusmatemaatilises statistikas;

Statistiliste meetodite väljatöötamine, mis on stabiilsed väikeste kõrvalekallete suhtes kasutatavast tõenäosusmudelist;

Andmete statistilise analüüsi jaoks mõeldud arvutitarkvarapakettide loomise töö laialdane areng.

Tõenäosuslikud statistilised meetodid ja optimeerimine. Optimeerimise idee läbib kaasaegset rakenduslikku matemaatilist statistikat ja muid statistilisi meetodeid. Nimelt rakendati matemaatilist statistikat katsete planeerimise meetodid, statistiline vastuvõtukontroll, tehnoloogiliste protsesside statistiline reguleerimine jne.

Tootmise juhtimises, eelkõige toote kvaliteedi ja standardite nõuete optimeerimisel, on eriti oluline statistiliste meetodite rakendamine toote elutsükli algfaasis, s.o. eksperimentaaldisaini arenduste uurimistöö ettevalmistamise etapis (tootele perspektiivsete nõuete väljatöötamine, eelprojekt, katseprojekti väljatöötamise tehnilised kirjeldused). Selle põhjuseks on toote olelusringi algfaasis saadaoleva teabe piiratus ning vajadus prognoosida tehnilisi võimalusi ja majanduslikku olukorda tulevikuks. Statistilisi meetodeid tuleks rakendada optimeerimisülesande lahendamise kõikides etappides - muutujate skaleerimisel, toodete ja süsteemide toimimise matemaatiliste mudelite väljatöötamisel, tehniliste ja majanduslike katsete läbiviimisel jne.

Optimeerimisprobleemide lahendamisel kasutatakse kõiki statistikavaldkondi, sealhulgas toodete kvaliteedi ja standardite nõuete optimeerimist. Nimelt juhuslike suuruste statistika, mitmemõõtmeline statistiline analüüs, juhuslike protsesside ja aegridade statistika, mittenumbrilise iseloomuga objektide statistika. Statistilise meetodi valimine konkreetsete andmete analüüsimiseks on soovitatav teha vastavalt soovitustele.

Eelmine

Saada oma head tööd teadmistebaasi on lihtne. Kasutage allolevat vormi

Üliõpilased, magistrandid, noored teadlased, kes kasutavad teadmistebaasi oma õpingutes ja töös, on teile väga tänulikud.

postitatud http://www.allbest.ru/

[Sisesta tekst]

Sissejuhatus

1. Tõenäosusteooria ja matemaatiline statistika otsuste tegemisel

1.1 Kuidas kasutatakse tõenäosusteooriat ja matemaatilist statistikat

1.2 Näiteid tõenäosusteooria ja matemaatilise statistika rakendamisest

1.3 Hindamiseesmärgid

1.4 Mis on "matemaatiline statistika"

1.5 Lühidalt matemaatilise statistika ajaloost

1.6 Tõenäosus-statistilised meetodid ja optimeerimine

2. Tõenäosus-statistilise otsustamise tüüpilised praktilised probleemid ja meetodid nende lahendamiseks

2.1 Statistika ja rakendusstatistika

2.2 Tehnoloogiliste protsesside täpsuse ja stabiilsuse ning tootekvaliteedi statistilise analüüsi ülesanded

2.3 Ühemõõtmelise statistika (juhuslike suuruste statistika) probleemid

2.4 Mitmemõõtmeline statistiline analüüs

2.5 Stohhastiliste protsesside ja aegridade statistika

2.6 Mittenumbrilise iseloomuga objektide statistika

3. Tõenäosuslike ja statistiliste otsustusmeetodite rakendamine majandusprobleemide lahendamisel

Järeldus

Viited

Sissejuhatus

Tõenäosuslikke ja statistilisi otsustusmeetodeid kasutatakse juhul, kui tehtud otsuste tõhusus sõltub teguritest, mis on juhuslikud suurused, mille tõenäosusjaotuse seadused ja muud statistilised tunnused on teada. Lisaks võib iga otsus viia ühe paljudest võimalikest tulemustest, kusjuures igal tulemusel on teatav tõenäosus, mida saab arvutada. Probleemset olukorda iseloomustavaid näitajaid kirjeldatakse ka tõenäosustunnuste abil. Selliste otsustusülesannete puhul on otsustajal alati oht saada vale tulemus, millest ta juhindub, valides juhuslike tegurite keskmistatud statistiliste karakteristikute põhjal optimaalse lahenduse ehk otsus tehakse riskiga. tingimused.

Praktikas kasutatakse tõenäosuslikke ja statistilisi meetodeid sageli siis, kui andmete valimi põhjal tehtud järeldused kantakse üle kogu populatsioonile (näiteks valimilt tervele tootepartiile). Igas konkreetses olukorras tuleks aga esmalt hinnata põhimõttelist võimalust saada piisavalt usaldusväärseid tõenäosus- ja statistilisi andmeid.

Tõenäosusteooria ja matemaatilise statistika ideede ja tulemuste kasutamisel otsuste tegemisel on aluseks matemaatiline mudel, milles väljendatakse objektiivseid seoseid tõenäosusteooria mõistes. Tõenäosusi kasutatakse eelkõige juhuslikkuse kirjeldamiseks, millega tuleb otsuste tegemisel arvestada. See viitab nii soovimatutele võimalustele (riskidele) kui ka atraktiivsetele ("õnnelik juhus").

Tõenäosus-statistiliste otsustusmeetodite olemus seisneb tõenäosuslike mudelite kasutamisel, mis põhinevad hüpoteeside hindamisel ja kontrollimisel valimi karakteristikuid kasutades.

Valimikarakteristikute kasutamise loogika teoreetilistel mudelitel põhinevate otsuste tegemisel eeldab kahe paralleelse mõisteseeria - teooriaga (tõenäosuslik mudel) ja praktikaga (vaatlustulemuste valim) seotud mõistete samaaegset kasutamist. Näiteks teoreetiline tõenäosus vastab valimi põhjal leitud sagedusele. Matemaatiline ootus (teoreetiline jada) vastab valimi aritmeetilisele keskmisele (praktiline jada). Tavaliselt on valimi karakteristikud teoreetiliste karakteristikute hinnangud.

Nende meetodite kasutamise eelised hõlmavad võimalust võtta arvesse erinevaid sündmuste arengu stsenaariume ja nende tõenäosusi. Nende meetodite puuduseks on see, et arvutustes kasutatavate stsenaariumide tõenäosuste väärtusi on praktikas tavaliselt väga raske saada.

Konkreetse tõenäosus-statistilise otsustusmeetodi rakendamine koosneb kolmest etapist:

Üleminek majanduslikult, juhtimis-, tehnoloogiliselt reaalsuselt abstraktsele matemaatilisele ja statistilisele skeemile, s.o. kontrollsüsteemi, tehnoloogilise protsessi, otsustusprotseduuride tõenäosusliku mudeli ehitamine, eelkõige statistilise kontrolli tulemuste põhjal jne;

Reaalse nähtuse tõenäosusmudelit tuleks lugeda konstrueerituks, kui vaadeldavad suurused ja nendevahelised seosed on väljendatud tõenäosusteoorias. Tõenäosusmudeli adekvaatsust põhjendatakse eelkõige statistiliste meetodite abil hüpoteeside kontrollimiseks.

Matemaatiline statistika lahendatavate ülesannete tüübi järgi jaguneb tavaliselt kolmeks osaks: andmete kirjeldamine, hindamine ja hüpoteeside testimine. Töödeldud statistiliste andmete tüübi järgi jaguneb matemaatiline statistika nelja valdkonda:

Näide, millal on soovitatav kasutada tõenäosus-statistilisi mudeleid.

Iga toote kvaliteedi kontrollimisel võetakse sellest proov, et otsustada, kas toodetud toodete partii vastab kehtestatud nõuetele. Proovivõtu tulemuste põhjal tehakse järeldus kogu partii kohta. Sel juhul on väga oluline vältida valimi valimisel subjektiivsust, st on vaja, et iga kontrollitava partii toodanguüksus oleks ühesuguse tõenäosusega valimisse sattunud. Loosi teel tehtud valik sellises olukorras ei ole piisavalt objektiivne. Seetõttu toimub tootmistingimustes toodanguühikute valimine valimisse tavaliselt mitte loosi teel, vaid spetsiaalsete juhuslike arvude tabelite või arvuti juhuslike arvuandurite abil.

Tehnoloogiliste protsesside statistilise reguleerimisega matemaatilise statistika meetodite alusel töötatakse välja protsesside statistilise kontrolli reeglid ja plaanid, mille eesmärk on õigeaegselt avastada tehnoloogilistes protsessides esinevad ebakorrapärasused ning võtta meetmeid nende kohandamiseks ja toodete vabastamise vältimiseks. mis ei vasta kehtestatud nõuetele. Nende meetmete eesmärk on vähendada tootmiskulusid ja nõuetele mittevastavate toodete tarnimisest tulenevaid kadusid. Statistilises vastuvõtukontrollis koostatakse matemaatilise statistika meetoditele tuginedes kvaliteedikontrolli plaanid tootepartiide proovide analüüsimise teel. Raskus seisneb selles, et osatakse õigesti ehitada tõenäosuslikke ja statistilisi otsustusmudeleid, mille põhjal on võimalik vastata eeltoodud küsimustele. Matemaatilises statistikas on selleks välja töötatud tõenäosusmudelid ja meetodid hüpoteeside kontrollimiseks.

Lisaks tekivad paljudes juhtimis-, tootmis-, majandus- ja riigimajanduslikes olukordades erinevat tüüpi probleemid - tõenäosusjaotuste omaduste ja parameetrite hindamise probleem.

Või on tehnoloogiliste protsesside täpsuse ja stabiilsuse statistilises analüüsis vaja hinnata selliseid kvaliteedinäitajaid nagu kontrollitava parameetri keskmine väärtus ja selle hajutuse aste vaadeldavas protsessis. Tõenäosusteooria kohaselt on soovitatav kasutada juhusliku suuruse keskmise väärtusena selle matemaatilist ootust ning dispersiooni, standardhälvet või variatsioonikordaja leviku statistilise tunnusena. See tõstatab küsimuse: kuidas neid statistilisi tunnuseid näidisandmete põhjal hinnata ja millise täpsusega seda teha? Kirjanduses on palju sarnaseid näiteid. Kõik need näitavad, kuidas tõenäosusteooriat ja matemaatilist statistikat saab tootmisjuhtimises kasutada statistiliste toodete kvaliteedijuhtimise valdkonna otsuste tegemisel.

Konkreetsetes rakendusvaldkondades kasutatakse nii laialt levinud tõenäosusstatistilisi meetodeid kui ka spetsiifilisi. Näiteks tootmisjuhtimise sektsioonis, mis on pühendatud tootekvaliteedi juhtimise statistilistele meetoditele, kasutatakse rakenduslikku matemaatilist statistikat (sh katsete planeerimist). Selle meetoditega viiakse läbi tehnoloogiliste protsesside täpsuse ja stabiilsuse statistiline analüüs ning kvaliteedi statistiline hindamine. Spetsiifilised meetodid hõlmavad toodete kvaliteedi statistilise aktsepteerimise kontrolli, tehnoloogiliste protsesside statistilise reguleerimise, usaldusväärsuse hindamise ja kontrolli meetodeid.
ja jne.

Tootmise juhtimises, eelkõige toote kvaliteedi optimeerimisel ja standardnõuetele vastavuse tagamisel, on eriti oluline statistiliste meetodite rakendamine toote elutsükli algfaasis, s.o. eksperimentaaldisaini arenduste uurimistöö ettevalmistamise etapis (tootele perspektiivsete nõuete väljatöötamine, eelprojekt, katseprojekti väljatöötamise tehnilised kirjeldused). Selle põhjuseks on toote olelusringi algfaasis saadaoleva teabe piiratus ning vajadus prognoosida tehnilisi võimalusi ja majanduslikku olukorda tulevikuks.

Levinumad tõenäosusstatistika meetodid on regressioonanalüüs, faktoranalüüs, dispersioonanalüüs, statistilised riskihindamise meetodid, stsenaariumimeetod jne. Statistiliste meetodite valdkond, mis on pühendatud mittenumbriliste statistiliste andmete analüüsile, muutub üha olulisemaks. kvalitatiivsete ja mitmekesiste omaduste mõõtmistulemused. Mittenumbrilise iseloomuga objektide statistika üks peamisi rakendusi on statistiliste otsuste ja hääletusprobleemide teooriaga seotud eksperthinnangute teooria ja praktika.

Inimese roll ülesannete lahendamisel statistiliste otsuste teooria meetodeid kasutades on probleemi sõnastamine ehk tegeliku probleemi taandamine vastavaks standardseks, sündmuste tõenäosuste määramine statistiliste andmete põhjal ja ka saadud optimaalse lahenduse kinnitamiseks.

1. Tõenäosusteooria ja matemaatiline statistika otsuste tegemisel

1.1 Kuidas tõenäosusteooriat kasutatakseja matemaatiline statistika

Need distsipliinid on tõenäosuslike ja statistiliste otsustusmeetodite aluseks. Nende matemaatilise aparatuuri kasutamiseks on vaja otsustusprobleeme väljendada tõenäosus-statistiliste mudelite kaudu. Konkreetse tõenäosus-statistilise otsustusmeetodi rakendamine koosneb kolmest etapist:

Üleminek majanduslikult, juhtimis-, tehnoloogiliselt reaalsuselt abstraktsele matemaatilisele ja statistilisele skeemile, s.o. kontrollsüsteemi tõenäosusliku mudeli koostamine, tehnoloogiline protsess, otsustusprotseduur, eelkõige statistilise kontrolli tulemuste põhjal jne.

Arvutuste läbiviimine ja järelduste tegemine puhtmatemaatiliselt tõenäosusliku mudeli raames;

Matemaatiliste ja statistiliste järelduste tõlgendamine seoses reaalse olukorraga ja asjakohase otsuse tegemine (näiteks toote kvaliteedi vastavuse või mittevastavuse kohta kehtestatud nõuetele, tehnoloogilise protsessi kohandamise vajaduse kohta jne), eelkõige järeldused (defektsete tooteühikute osakaalu kohta partiis, tehnoloogilise protsessi kontrollitavate parameetrite jaotusseaduste spetsiifilise vormi kohta jne).

Matemaatilises statistikas kasutatakse tõenäosusteooria mõisteid, meetodeid ja tulemusi. Vaatleme tõenäosuslike otsustusmudelite konstrueerimise põhiküsimusi majanduslikes, juhtimis-, tehnoloogilistes ja muudes olukordades. Tõenäosus-statistiliste otsustusmeetodite normatiiv-tehniliste ja õpetlik-metoodiliste dokumentide aktiivseks ja korrektseks kasutamiseks on vaja eelteadmisi. Seega on vaja teada, millistel tingimustel konkreetset dokumenti rakendada, millist algteavet selle valikuks ja rakendamiseks vaja on, milliseid otsuseid andmetöötluse tulemuste põhjal teha jne.

1.2 Näiteid tõenäosusteooria rakendamisestja matemaatiline statistika

Vaatleme mõnda näidet, kui tõenäosuslik-statistilised mudelid on heaks vahendiks juhtimis-, tootmis-, majandus- ja rahvamajandusprobleemide lahendamisel. Nii öeldakse näiteks AN Tolstoi romaanis "Kõndimine läbi agoonia" (1. köide): "töökoda annab kakskümmend kolm protsenti abielust ja te jääte selle näitaja juurde," ütles Strukov Ivan Iljitšile. ."

Tekib küsimus, kuidas neid sõnu tehasejuhtide vestluses mõista, kuna üks tootmisüksus ei saa olla 23% defektne. See võib olla hea või defektne. Tõenäoliselt pidas Strukov silmas seda, et suures partiis on umbes 23% defektseid esemeid. Siis tekib küsimus, mida tähendab "ligikaudne"? Las 100 testitud toodanguühikust 30 osutuvad defektseks või 1000 - 300 või 100 000 - 30 000 jne, kas Strukovit peaks süüdistama valetamises?

Või teine ​​näide. Partiina kasutatav münt peab olema "sümmeetriline", s.t. selle viskamisel peaks keskmiselt pooltel juhtudel vapp välja kukkuma ja pooltel juhtudel - võre (sabad, number). Aga mida tähendab "keskmine"? Kui sooritate igas seerias palju 10 viskega seeriaid, kohtate sageli seeriaid, kus münt langeb embleemiga 4 korda. Sümmeetrilise mündi puhul esineb seda 20,5% seeriast. Ja kui 100 000 viske kohta on 40 000 vappi, siis kas münti võib pidada sümmeetriliseks? Otsustusprotseduur põhineb tõenäosusteoorial ja matemaatilisel statistikal.

Kõnealune näide ei pruugi tunduda piisavalt tõsine. Siiski ei ole. Loosimist kasutatakse laialdaselt tööstuslike tehniliste ja majanduslike katsete korraldamisel, näiteks laagrite kvaliteedinäitaja (hõõrdemomendi) mõõtmise tulemuste töötlemisel sõltuvalt erinevatest tehnoloogilistest teguritest (säilituskeskkonna mõju, meetodid). laagrite ettevalmistamine enne mõõtmist, laagrikoormuse mõju mõõtmisel jne). P.). Oletame, et on vaja võrrelda laagrite kvaliteeti sõltuvalt nende ladustamise tulemustest erinevates säilitusõlides, st. õlides koostisega A ja B. Sellise katse kavandamisel tekib küsimus, millised laagrid tuleks asetada koostisega A õlisse ja millised - koostisega B õlidesse, kuid nii, et vältida subjektiivsust ja tagada otsuse objektiivsus.

Sellele küsimusele saab vastuse loosi teel. Sarnase näite võib tuua mis tahes toote kvaliteedikontrolliga. Otsustamaks, kas kontrollitud tootepartii vastab kehtestatud nõuetele või mitte, võetakse sellest proov. Proovivõtu tulemuste põhjal tehakse järeldus kogu partii kohta. Sel juhul on väga oluline vältida valimi valimisel subjektiivsust, st on vaja, et iga kontrollitava partii toodanguüksus oleks ühesuguse tõenäosusega valimisse sattunud. Tootmistingimustes toimub toodanguühikute valimine valimisse tavaliselt mitte loosi teel, vaid spetsiaalsete juhuslike arvude tabelite või arvutite juhuslike arvude andurite abil.

Sarnased võrdluse objektiivsuse tagamise probleemid tekivad ka erinevate tootmise korraldamise, tasustamise skeemide võrdlemisel, pakkumiste ja konkursside läbiviimisel, kandidaatide valimisel vabadele ametikohtadele jne. Igal pool on vaja loosimisi vms protseduure. Selgitame turniiri korraldamisel olümpiasüsteemi järgi tugevaima ja tugevuselt teise võistkonna väljaselgitamise näitel (kaotaja langeb välja). Võidab tugevam meeskond alati nõrgemat. Selge on see, et meistriks tuleb kindlasti tugevaim meeskond. Tugevuselt teine ​​meeskond pääseb finaali siis ja ainult siis, kui tal pole enne finaali tulevase meistriga mänge. Kui selline mäng on kavas, siis tugevuselt teine ​​meeskond finaali ei pääse. Igaüks, kes plaanib turniiri, võib turniirilt enne tähtaega “välja lüüa” tugevuselt teise võistkonna, viies selle kokku esimeses kohtumises liidriga, või anda talle teise koha, tagades kohtumised nõrgemate võistkondadega kuni finaalini. Subjektiivsuse vältimiseks loosike. 8 meeskonnaga turniiri puhul on tõenäosus, et finaalis kohtuvad kaks tugevamat meeskonda, 4/7. Seetõttu lahkub tugevuselt teine ​​meeskond turniirilt enne tähtaega tõenäosusega 3/7.

Iga tooteühiku mõõtmisel (kasutades nihikut, mikromeetrit, ampermeetrit jne) on vigu. Et teada saada, kas tegemist on süstemaatiliste vigadega, on vaja teha toodanguühikul, mille omadused on teada (näiteks standardproov), teha mitu mõõtmist. Tuleb meeles pidada, et lisaks süstemaatilisele veale on ka juhuslik viga.

Seetõttu tekib küsimus, kuidas mõõtmistulemustest välja selgitada, kas tegemist on süstemaatilise veaga. Kui märkida ainult see, kas järgmisel mõõtmisel saadud viga on positiivne või negatiivne, saab selle probleemi taandada eelmisele. Tõepoolest, võrrelgem mõõtmist mündi viskamisega, positiivset viga - vapi langemisega, negatiivset - võrega (piisava arvu skaalajaotiste korral nullviga praktiliselt ei esine). Seejärel võrdub süstemaatilise vea puudumise kontrollimine mündi sümmeetria kontrollimisega.

Selle mõttekäigu eesmärk on taandada süstemaatilise vea puudumise kontrollimise probleem mündi sümmeetria kontrollimise probleemiks. Ülaltoodud arutluskäik viib matemaatilise statistika nn märgikriteeriumini.

Tehnoloogiliste protsesside statistilise reguleerimisega matemaatilise statistika meetodite alusel töötatakse välja protsesside statistilise kontrolli reeglid ja plaanid, mille eesmärk on õigeaegselt avastada tehnoloogilistes protsessides esinevad ebakorrapärasused ning võtta meetmeid nende kohandamiseks ja toodete vabastamise vältimiseks. mis ei vasta kehtestatud nõuetele. Nende meetmete eesmärk on vähendada tootmiskulusid ja nõuetele mittevastavate toodete tarnimisest tulenevaid kadusid. Statistilises vastuvõtukontrollis koostatakse matemaatilise statistika meetoditele tuginedes kvaliteedikontrolli plaanid tootepartiide proovide analüüsimise teel. Raskus seisneb selles, et osatakse õigesti ehitada tõenäosuslikke ja statistilisi otsustusmudeleid, mille põhjal on võimalik vastata eeltoodud küsimustele. Matemaatilises statistikas on selleks välja töötatud tõenäosuslikud mudelid ja meetodid hüpoteeside kontrollimiseks, eelkõige hüpoteesid, et defektsete toodanguühikute osakaal võrdub teatud arvuga p0, näiteks p0 = 0,23 (meenutagem Strukovi sõnu aastast AN Tolstoi romaan).

1.3 Hindamiseesmärgid

Paljudes juhtimis-, tööstus-, majandus- ja riigimajanduslikes olukordades tekivad erinevat tüüpi probleemid - tõenäosusjaotuste omaduste ja parameetrite hindamise probleem.

Vaatame näidet. Oletame, et kontrollimiseks saadi N lambipirni partii. Sellest partiist valiti juhuslikult n lambipirni proov. Tekib hulk loomulikke küsimusi. Kuidas näidise elementide katsetamise tulemuste põhjal määrata elektrilampide keskmist kasutusiga ja millise täpsusega saab seda tunnust hinnata? Kuidas muutub täpsus, kui võtate suurema proovi? Kui mitu tundi T saab garanteerida, et vähemalt 90% elektrilampidest kestab T ja rohkem tundi?

Oletame, et n lambi ruumalaga proovi testimisel osutusid X lambid defektseks. Siis tekivad järgmised küsimused. Milliseid piiranguid saab määrata defektsete lampide arvule D partiis, defektitasemele D / N jne?

Või on tehnoloogiliste protsesside täpsuse ja stabiilsuse statistilises analüüsis vaja hinnata selliseid kvaliteedinäitajaid nagu kontrollitava parameetri keskmine väärtus ja selle hajutuse aste vaadeldavas protsessis. Tõenäosusteooria kohaselt on soovitatav kasutada juhusliku suuruse keskmise väärtusena selle matemaatilist ootust ning dispersiooni, standardhälvet või variatsioonikordaja leviku statistilise tunnusena. See tõstatab küsimuse: kuidas neid statistilisi tunnuseid näidisandmete põhjal hinnata ja millise täpsusega seda teha? Sarnaseid näiteid on palju. Siin oli oluline näidata, kuidas tõenäosusteooriat ja matemaatilist statistikat saab tootmisjuhtimises kasutada tootekvaliteedi statistilise juhtimise valdkonna otsuste tegemisel.

1.4 Mis on "matemaatiline statistika"

Matemaatilise statistika all mõistetakse „matemaatika osa, mis on pühendatud statistiliste andmete kogumise, korrastamise, töötlemise ja tõlgendamise matemaatilistele meetoditele, samuti nende kasutamisele teaduslike või praktiliste järelduste tegemiseks. Matemaatilise statistika reeglid ja protseduurid põhinevad tõenäosusteoorial, mis võimaldab olemasoleva statistilise materjali põhjal hinnata igas ülesandes tehtud järelduste täpsust ja usaldusväärsust. Sel juhul nimetatakse statistilisteks andmeteks teavet objektide arvu kohta mõnes enam-vähem ulatuslikus kogumis, millel on teatud omadused.

Vastavalt lahendatavate ülesannete tüübile jagatakse matemaatiline statistika tavaliselt kolmeks osaks: andmete kirjeldamine, hindamine ja hüpoteeside testimine.

Töödeldud statistiliste andmete tüübi järgi jaguneb matemaatiline statistika nelja valdkonda:

Ühemõõtmeline statistika (juhuslike muutujate statistika), milles vaatlustulemust kirjeldatakse reaalarvuga;

Mitmemõõtmeline statistiline analüüs, kus objekti vaatlustulemust kirjeldatakse mitme arvuga (vektoriga);

Juhuslike protsesside ja aegridade statistika, kus vaatlustulemuseks on funktsioon;

Mittenumbrilise iseloomuga objektide statistika, mille puhul vaatlustulemus on mittenumbriline, näiteks on see hulk (geomeetriline joonis), järjestus või saadakse kvalitatiivse atribuudiga mõõtmise tulemusena .

Ajalooliselt ilmusid esimesena mõned mittenumbrilise iseloomuga objektide statistika valdkonnad (eelkõige abielu osakaalu hindamise ja selle kohta püstitatud hüpoteeside kontrollimise probleem) ja ühemõõtmeline statistika. Matemaatiline aparaat on nende jaoks lihtsam, seetõttu demonstreeritakse nende näitel tavaliselt matemaatilise statistika põhiideed.

Ainult need andmetöötlusmeetodid, s.o. matemaatiline statistika on tõendusmaterjal, mis põhineb asjakohaste reaalsete nähtuste ja protsesside tõenäosusmudelitel. Räägime tarbijakäitumise mudelitest, riskide tekkimisest, tehnoloogiliste seadmete toimimisest, katsetulemuste saamisest, haiguse kulgemisest jne. Reaalse nähtuse tõenäosusmudelit tuleks lugeda konstrueerituks, kui vaadeldavad suurused ja nendevahelised seosed on väljendatud tõenäosusteoorias. Vastavus tõenäosuslikule tegelikkuse mudelile, s.o. selle adekvaatsust põhjendatakse eelkõige hüpoteeside kontrollimise statistiliste meetodite abil.

Ebatõenäolised andmetöötlusmeetodid on uurimuslikud, neid saab kasutada vaid andmete esialgseks analüüsiks, kuna need ei võimalda hinnata piiratud statistilise materjali põhjal tehtud järelduste täpsust ja usaldusväärsust.

Tõenäosuslikud ja statistilised meetodid on rakendatavad kõikjal, kus on võimalik luua ja põhjendada nähtuse või protsessi tõenäosuslikku mudelit. Nende kasutamine on kohustuslik, kui andmete valimi põhjal tehtud järeldused kantakse üle kogu populatsioonile (näiteks valimilt tervele tootepartiile).

Konkreetsetes rakendusvaldkondades kasutatakse nii laialt levinud tõenäosusstatistilisi meetodeid kui ka spetsiifilisi. Näiteks tootmisjuhtimise sektsioonis, mis on pühendatud tootekvaliteedi juhtimise statistilistele meetoditele, kasutatakse rakenduslikku matemaatilist statistikat (sh katsete planeerimist). Selle meetoditega viiakse läbi tehnoloogiliste protsesside täpsuse ja stabiilsuse statistiline analüüs ning kvaliteedi statistiline hindamine. Spetsiifilised meetodid hõlmavad toodete kvaliteedi statistilise aktsepteerimise kontrolli, tehnoloogiliste protsesside statistilise reguleerimise, töökindluse hindamise ja kontrolli jne meetodeid.

Laialdaselt kasutatakse rakenduslikke tõenäosus- ja statistilisi distsipliine, nagu usaldusväärsusteooria ja järjekorrateooria. Neist esimese sisu selgub nimest, teise puhul uuritakse selliseid süsteeme nagu telefonikeskjaam, mis juhuslikel aegadel kõnesid vastu võtab – telefonis numbreid valivate abonentide nõuded. Nende nõuete teenindamise kestus, s.o. vestluste kestust modelleeritakse samuti juhuslike suurustega. Suure panuse nende erialade arengusse andis NSVL Teaduste Akadeemia korrespondentliige A.Ya. Khinchin (1894-1959), Ukraina NSV Teaduste Akadeemia akadeemik B. V. Gnedenko (1912-1995) ja teised kodumaised teadlased.

1.5 Lühidalt matemaatilise statistika ajaloost

Matemaatiline statistika kui teadus saab alguse kuulsa saksa matemaatiku Karl Friedrich Gaussi (1777-1855) töödest, kes tõenäosusteooria põhjal uuris ja põhjendas tema 1795. aastal loodud vähimruutude meetodit, mida kasutati astronoomiliste uuringute tegemiseks. andmed (väikeplaneedi Cerese orbiidi selgitamiseks). Tema nime nimetatakse sageli üheks populaarsemaks tõenäosusjaotuseks - normaaljaotuseks ning juhuslike protsesside teoorias on peamiseks uurimisobjektiks Gaussi protsessid.

XIX sajandi lõpus. - kahekümnenda sajandi algus. suure panuse matemaatilisse statistikasse andsid inglise teadlased, eelkõige K. Pearson (1857-1936) ja R.A. Fisher (1890-1962). Eelkõige töötas Pearson statistiliste hüpoteeside testimiseks välja "hii ruudu" testi ja Fisher - dispersioonanalüüsi, eksperimentaalse disaini teooria, parameetrite hindamise maksimaalse tõenäosuse meetodi.

Kahekümnenda sajandi 30. aastatel. Poolakas Jerzy Neumann (1894-1977) ja inglane E. Pearson töötasid välja statistiliste hüpoteeside kontrollimise üldteooria ning nõukogude matemaatikud akadeemik A.N. Kolmogorov (1903-1987) ja NSVL Teaduste Akadeemia korrespondentliige N. V. Smirnov (1900-1966) panid aluse mitteparameetrilisele statistikale. Kahekümnenda sajandi neljakümnendatel. Rumeenlane A. Wald (1902-1950) ehitas järjestikuse statistilise analüüsi teooria.

Matemaatiline statistika areneb praegu kiiresti. Seega saab viimase 40 aasta jooksul eristada nelja põhimõtteliselt uut uurimisvaldkonda:

Matemaatiliste meetodite väljatöötamine ja rakendamine katsete planeerimiseks;

Mittenumbrilise olemusega objektide statistika arendamine iseseisva suunana rakendusmatemaatilises statistikas;

Statistiliste meetodite väljatöötamine, mis on stabiilsed väikeste kõrvalekallete suhtes kasutatavast tõenäosusmudelist;

Andmete statistilise analüüsi jaoks mõeldud arvutitarkvarapakettide loomise töö laialdane areng.

1.6 Tõenäosus-statistilised meetodid ja optimeerimine

Optimeerimise idee läbib kaasaegset rakenduslikku matemaatilist statistikat ja muid statistilisi meetodeid. Nimelt rakendati matemaatilist statistikat katsete planeerimise meetodid, statistiline vastuvõtukontroll, tehnoloogiliste protsesside statistiline reguleerimine jne.

Tootmise juhtimises, eelkõige toote kvaliteedi ja standardite nõuete optimeerimisel, on eriti oluline statistiliste meetodite rakendamine toote elutsükli algfaasis, s.o. eksperimentaaldisaini arenduste uurimistöö ettevalmistamise etapis (tootele perspektiivsete nõuete väljatöötamine, eelprojekt, katseprojekti väljatöötamise tehnilised kirjeldused). Selle põhjuseks on toote olelusringi algfaasis saadaoleva teabe piiratus ning vajadus prognoosida tehnilisi võimalusi ja majanduslikku olukorda tulevikuks. Statistilisi meetodeid tuleks rakendada optimeerimisülesande lahendamise kõikides etappides - muutujate skaleerimisel, toodete ja süsteemide toimimise matemaatiliste mudelite väljatöötamisel, tehniliste ja majanduslike katsete läbiviimisel jne.

Optimeerimisprobleemide lahendamisel kasutatakse kõiki statistikavaldkondi, sealhulgas toodete kvaliteedi ja standardite nõuete optimeerimist. Nimelt juhuslike suuruste statistika, mitmemõõtmeline statistiline analüüs, juhuslike protsesside ja aegridade statistika, mittenumbrilise iseloomuga objektide statistika. Statistilise meetodi valimine konkreetsete andmete analüüsimiseks on soovitatav teha vastavalt soovitustele.

2. Tüüpilised praktilised ülesanded tõenäosus-statistlik otsuste tegemineja nende lahendamise meetodid

2.1 Statistika ja rakendusstatistika

Rakendusstatistika all mõistetakse matemaatilise statistika osa, mis on pühendatud reaalsete statistiliste andmete töötlemise meetoditele, samuti vastavale matemaatikale ja tarkvarale. Seega puhtmatemaatilisi probleeme rakendusstatistika ei hõlma.

Statistiliste andmete all mõistetakse uuritavate objektide kontrollitavate parameetrite (omaduste) arvulisi või mittearvulisi väärtusi, mis saadakse teatud objekti vaatluste (mõõtmised, analüüsid, testid, katsed jne) tulemusena. funktsioonide arv iga uuringusse kaasatud üksuse kohta. Statistiliste andmete saamise meetodid ja valimi suurused kehtestatakse konkreetse rakendusprobleemi sõnastuste põhjal, mis põhinevad katse planeerimise matemaatilise teooria meetoditel.

y-nda valimiüksuse uuritava tunnuse X (või uuritavate tunnuste hulga X) vaatlustulemus xi peegeldab uuritava üksuse arvu i kvantitatiivseid ja/või kvalitatiivseid omadusi (siin i = 1, 2, .. ., n, kus n on valimi suurus).

Vaatlustulemusi x1, x2, ..., xn, kus xi on i-nda valimi üksuse vaatlustulemus või mitme valimi vaatlustulemused, töödeldakse antud ülesandele vastavate rakendusstatistika meetoditega. Reeglina kasutatakse analüütilisi meetodeid, s.o. arvulistel arvutustel põhinevad meetodid (mittenumbrilise iseloomuga objekte kirjeldatakse numbrite abil). Mõnel juhul on lubatud kasutada graafilisi meetodeid (visuaalne analüüs).

2.2 Tehnoloogiliste protsesside täpsuse ja stabiilsuse ning tootekvaliteedi statistilise analüüsi ülesanded

Statistilisi meetodeid kasutatakse eelkõige tehnoloogiliste protsesside täpsuse ja stabiilsuse ning tootekvaliteedi analüüsimiseks. Eesmärk on koostada lahendusi, mis tagavad tehnoloogiliste üksuste tõhusa toimimise ning parandavad toodete kvaliteeti ja konkurentsivõimet. Statistilisi meetodeid tuleks kasutada alati, kui protsessiseadmete täpsuse ja stabiilsuse paranemise või halvenemise põhjuste kindlaksmääramiseks on vaja teha piiratud arv vaatlusi. Tehnoloogilise protsessi täpsust mõistetakse kui tehnoloogilise protsessi omadust, mis määrab valmistatavate toodete parameetrite tegelike ja nimiväärtuste läheduse. Tehnoloogilise protsessi stabiilsust mõistetakse kui tehnoloogilise protsessi omadust, mis määrab selle parameetrite tõenäosusjaotuste püsivuse teatud ajavahemikus ilma välise sekkumiseta.

Statistiliste meetodite kasutamise eesmärgid tehnoloogiliste protsesside täpsuse ja stabiilsuse ning tootekvaliteedi analüüsimisel toodete arendamise, tootmise ja käitamise (tarbimise) etappidel on eelkõige:

* tehnoloogilise protsessi, seadmete või toote kvaliteedi täpsuse ja stabiilsuse tegelike näitajate määramine;

* Toote kvaliteedi vastavuse tuvastamine regulatiivse ja tehnilise dokumentatsiooni nõuetele;

* tehnoloogilise distsipliini järgimise kontrollimine;

* juhuslike ja süstemaatiliste tegurite uurimine, mis võivad viia defektide ilmnemiseni;

* tootmis- ja tehnoloogiavarude tuvastamine;

* tehniliste standardite ja toote tolerantside põhjendamine;

* prototüüpide katsetulemuste hindamine toodetele esitatavate nõuete ja selle standardite põhjendamisel;

* tehnoloogiliste seadmete ning mõõte- ja katsevahendite valiku põhjendamine;

* erinevate tootenäidiste võrdlus;

* põhjendus pideva kontrolli asendamiseks statistilisega;

* tootekvaliteedijuhtimise statistiliste meetodite kasutuselevõtu võimaluse väljaselgitamine jne.

Eelpool loetletud eesmärkide saavutamiseks kasutatakse erinevaid meetodeid andmete kirjeldamiseks, hüpoteeside hindamiseks ja kontrollimiseks. Siin on mõned näited probleemiavaldustest.

2.3 Ühemõõtmelise statistika (juhuslike suuruste statistika) probleemid

Matemaatiliste ootuste võrdlemine toimub juhtudel, kui on vaja kindlaks teha vastavus valmistatud toote kvaliteedinäitajate ja võrdlusproovi vahel. See on hüpoteesi kontrollimise ülesanne:

H0: M (X) = m0,

kus m0 on võrdlusproovile vastav väärtus; X on juhuslik suurus, mis simuleerib vaatluste tulemusi. Olenevalt olukorra tõenäosusmudeli sõnastusest ja alternatiivsest hüpoteesist viiakse matemaatiliste ootuste võrdlus läbi kas parameetriliste või mitteparameetriliste meetoditega.

Dispersioone võrreldakse siis, kui on vaja kindlaks teha erinevus kvaliteedinäitaja ja nominaalväärtuse hajumise vahel. Selleks testige hüpoteesi:

Parameetrite hindamise probleemid pole vähem olulised kui hüpoteeside testimise probleemid. Need, nagu ka hüpoteeside kontrollimise probleemid, jagunevad sõltuvalt kasutatavast olukorra tõenäosusmudelist parameetrilisteks ja mitteparameetrilisteks.

Parameetrilistes hindamisülesannetes võetakse kasutusele tõenäosusmudel, mille kohaselt vaatluste x1, x2,…, xn tulemusi käsitletakse n sõltumatute juhuslike suuruste realisatsioonidena jaotusfunktsiooniga F (x; u). Siin ja on tundmatu parameeter, mis asub parameetriruumis ja on antud kasutatud tõenäosusmudeliga. Hindamisülesanne on määrata parameetri ja parameetri punktihinnangud ja usalduspiirid (või usalduspiirkond).

Parameeter ja on kas arv või fikseeritud lõpliku mõõtmega vektor. Niisiis, normaaljaotuse korral on u = (m, y2) kahemõõtmeline vektor, binoomjaotuse korral u = p - arv, gamma jaotuse korral
ja = (a, b, c) on kolmemõõtmeline vektor jne.

Kaasaegses matemaatilises statistikas on hinnangute ja usalduspiiride määramiseks välja töötatud mitmeid üldisi meetodeid - momentide meetod, maksimaalse tõenäosuse meetod, üheastmeliste hinnangute meetod, stabiilsete (robustsete) hinnangute meetod, meetod. erapooletuid hinnanguid jne.

Vaatame lühidalt neist kolme esimest.

Momentide meetod põhineb vaadeldavate juhuslike muutujate momentide avaldiste kasutamisel nende jaotusfunktsioonide parameetrite osas. Momentide meetodi hinnangud saadakse, kui parameetreid momentides väljendavates funktsioonides asendatakse teoreetiliste momentide asemel näidismomendid.

Peamiselt R. A. Fisheri välja töötatud maksimaalse tõenäosuse meetodil parameetri hinnanguks ja võtta väärtus u *, mille puhul nn tõenäosusfunktsioon on maksimaalne

f (x1, u) f (x2, u) ... f (xn, u),

kus x1, x2,…, xn - vaatlustulemused; f (x, u) - nende jaotustihedus, olenevalt parameetrist ja mida tuleb hinnata.

Maksimaalse tõenäosuse hinnangud on tavaliselt tõhusad (või asümptootiliselt tõhusad) ja väiksema dispersiooniga kui hetkehinnangute meetod. Mõnel juhul on nende valemid selgesõnaliselt välja kirjutatud (normaaljaotus, eksponentsiaalne jaotus ilma nihketa). Nende leidmiseks on aga sagedamini vaja numbriliselt lahendada transtsendentaalsete võrrandite süsteem (Weibull-Gnedenko jaotused, gamma). Sellistel juhtudel on soovitatav kasutada mitte maksimaalse tõenäosuse hinnanguid, vaid muud tüüpi hinnanguid, peamiselt üheastmelisi hinnanguid.

Mitteparameetrilistes hinnanguülesannetes võetakse kasutusele tõenäosusmudel, milles vaatluste x1, x2,…, xn tulemusi käsitletakse n sõltumatu juhusliku muutuja realisatsioonidena üldkujulise jaotusfunktsiooniga F (x). F (x) peab täitma ainult teatud tingimusi, nagu järjepidevus, matemaatilise ootuse ja dispersiooni olemasolu jne. Sellised tingimused ei ole nii ranged kui teatud parameetriliste perekonda kuulumise tingimus.

Mitteparameetrilises seadistuses hinnatakse kas juhusliku suuruse tunnuseid (matemaatiline ootus, dispersioon, variatsioonikordaja) või selle jaotusfunktsiooni, tihedust jne. Seega on suurte arvude seaduse kohaselt valimi aritmeetiline keskmine matemaatilise ootuse M (X) järjepidev hinnang (mis tahes vaatlustulemuste jaotusfunktsiooni F (x) korral, mille jaoks matemaatiline ootus on olemas). Keskpiiri teoreemi abil määratakse asümptootilised usalduspiirid

(M (X)) H =, (M (X)) B =.

kus r on usaldustõenäosus, on standardse normaaljaotuse N (0; 1) järgu kvantiil nulli matemaatilise ootuse ja ühikulise dispersiooniga, on valimi aritmeetiline keskmine, s on valimi standardhälve. Mõiste "asümptootilised usalduspiirid" tähendab, et tõenäosused

P ((M (X)) H< M(X)}, P{(M(X))B >M (X)),

P ((M (X)) H< M(X) < (M(X))B}

kipuvad ja r, vastavalt n>?, kuid üldiselt ei ole need lõpliku n jaoks võrdsed nende väärtustega. Praktikas annavad asümptootilised usalduspiirid piisava täpsuse n suurusjärgus 10.

Teine mitteparameetrilise hinnangu näide on jaotusfunktsiooni hindamine. Glivenko teoreemi kohaselt on empiiriline jaotusfunktsioon Fn (x) jaotusfunktsiooni F (x) järjepidev hinnang. Kui F (x) on pidev funktsioon, siis Kolmogorovi teoreemi alusel on jaotusfunktsiooni F (x) usalduspiirid antud kujul

(F (x)) Н = max, (F (x)) B = min,

kus k (r, n) on Kolmogorovi statistika jaotuse r-järgu kvantiil valimi suuruse n korral (tuletame meelde, et selle statistika jaotus ei sõltu F (x)-st).

Reeglid hinnangute ja usalduspiiride määramiseks parameetrilisel juhul põhinevad parameetrilisel jaotuste perekonnal F (x; ja). Reaalsete andmete töötlemisel tekib küsimus – kas need andmed vastavad aktsepteeritud tõenäosusmudelile? Need. statistiline hüpotees, et vaatlustulemustel on jaotusfunktsioon perekonnast (F (x; u), u) mõne u = u0 korral? Selliseid hüpoteese nimetatakse sobivuse hüpoteesideks ja nende kontrollimise kriteeriume nimetatakse sobivuse kriteeriumiteks.

Kui parameetri u = u0 tegelik väärtus on teada, jaotusfunktsioon F (x; u0) on pidev, siis on statistikal põhinev Kolmogorovi test

kus Fn (x) on empiiriline jaotusfunktsioon.

Kui näiteks vaatlustulemuste normaaljaotuse hüpoteesi kontrollimisel (s.o. selle jaotuse normaaljaotuste perekonda kuulumise kontrollimisel) parameetri u0 tegelik väärtus on teadmata, siis mõnikord kasutatakse statistikat.

See erineb Kolmogorovi statistikast Dn selle poolest, et parameetri u0 tegeliku väärtuse asemel on asendatud selle hinnang u *.

Statistika Dn (u *) jaotus erineb oluliselt statistika Dn jaotusest. Näiteks vaatleme normaalsuse kontrolli, kui u = (m, y2) ja u * = (, s2). Sel juhul on statistika Dn ja Dn (ja *) jaotuste kvantilid toodud tabelis 1. Seega erinevad kvantilid umbes 1,5 korda.

Tabel 1 - Statistika kvantilid Dn ja Dn (ja *) normaalsuse kontrollimisel

Statistiliste andmete esmasel töötlemisel on oluliseks ülesandeks välistada jämedate vigade ja vigade tulemusena saadud vaatlustulemused. Näiteks vastsündinud imikute kaalu (kilogrammides) andmete vaatamisel võib koos numbritega 3500, 2750, 4200 ilmuda arv 35,00. On selge, et see on viga ja vigane number saadi vigase sisestusega - koma nihutatakse ühe numbri võrra, mille tulemusena suurendatakse vaatlustulemust ekslikult 10 korda.

Statistilised meetodid järsult eristuvate vaatlustulemuste välistamiseks põhinevad eeldusel, et sellistel vaatlustulemustel on uuritutest järsult erinevad jaotused ja seetõttu tuleks need valimist välja jätta.

Lihtsaim tõenäosusmudel on järgmine. Nullhüpoteesi korral käsitletakse vaatlustulemusi sõltumatute identselt jaotatud juhuslike suuruste X1, X2, Xn realisatsioonidena jaotusfunktsiooniga F (x). Alternatiivse hüpoteesi korral on X1, X2, Xn-1 samad, mis nullhüpoteesi korral ja Xn vastab brutoveale ja sellel on jaotusfunktsioon G (x) = F (x - c), kus c on suur. Seejärel tõenäosusega, mis on lähedane 1-le (täpsemalt kipub valimi suuruse kasvades 1-ni),

Xn = max (X1, X2, Xn) = Xmax,

need. Xmaxi tuleks andmete kirjeldamisel pidada võimalikuks veaks. Kriitilisel piirkonnal on vorm

W = (x: x> d).

Kriitiline väärtus d = d (b, n) valitakse sõltuvalt tingimuse olulisuse tasemest b ja valimi suurusest n

P (Xmax> d | H0) = b (1)

Tingimus (1) on suure n ja väikese b jaoks samaväärne järgmisega:

Kui vaatlustulemuste jaotusfunktsioon F (x) on teada, siis kriitiline väärtus d leitakse seosest (2). Kui F (x) on teada kuni parameetriteni, näiteks on teada, et F (x) on normaaljaotuse funktsioon, siis töötatakse välja ka vaadeldava hüpoteesi kontrollimise reeglid.

Vaatlustulemuste jaotusfunktsiooni vorm on aga sageli teada mitte absoluutselt täpselt ja mitte parameetrite täpsusega, vaid ainult teatud veaga. Siis muutub seos (2) praktiliselt kasutuks, kuna väike viga F (x) määramisel, nagu võib näidata, toob kaasa suure vea d kriitilise väärtuse määramisel tingimusest (2) ja fikseeritud d korral. , võib kriteeriumi olulisuse tase oluliselt erineda nominaalsest ...

Seega olukorras, kus puudub täielik informatsioon F (x) kohta, kuid on teada vaatlustulemuste X1, X2, Xn matemaatiline ootus M (X) ja dispersioon у2 = D (X), võib kasutada mitteparameetrilist. tagasilükkamise reeglid, mis põhinevad Tšebõševi ebavõrdsusel. Seda võrratust kasutades leiame kriitilise väärtuse d = d (b, n) sellise, et

siis seos (3) on täidetud, kui

Tšebõševi ebavõrdsuse järgi

seetõttu, et (4) oleks täidetud, piisab valemite (4) ja (5) paremate külgede võrdsustamisest, s.o. määra d tingimusest

Valemiga (6) arvutatud d kriitilisel väärtusel põhinev tagasilükkamisreegel kasutab jaotusfunktsiooni F (x) kohta minimaalset teavet ja jätab seetõttu välja ainult need vaatlustulemused, mis on põhimassist väga kaugel. Teisisõnu, seosega (1) antud d1 väärtus on tavaliselt palju väiksem kui seose (6) antud d2 väärtus.

2.4 Mitmemõõtmeline statistiline analüüs

Mitmemõõtmelist statistilist analüüsi kasutatakse järgmiste probleemide lahendamiseks:

* märkide omavahelise seose uurimine;

* vektoritega antud objektide või atribuutide klassifikatsioon;

* funktsiooniruumi mõõtmete vähendamine.

Sel juhul on vaatluste tulemuseks objektil mõõdetud kindla arvu kvantitatiivsete ja mõnikord ka kvalitatiivsete omaduste väärtuste vektor. Kvantitatiivne tunnus on vaadeldava ühiku tunnus, mida saab otseselt väljendada arvu ja mõõtühikuga. Kvantitatiivne tunnus vastandub kvalitatiivsele tunnusele - vaadeldava üksuse tunnusele, mis määratakse ühele kahest või enamast tingimuslikust kategooriast määramisega (kui kategooriaid on täpselt kaks, nimetatakse tunnust alternatiivseks). Kvalitatiivsete tunnuste statistiline analüüs on osa mittenumbrilise iseloomuga objektide statistikast. Kvantitatiivsed tunnused jagunevad tunnusteks, mida mõõdetakse intervallide, suhete, erinevuste ja absoluutsete skaaladega.

Ja kvalitatiivne - nimede ja järgu skaalal mõõdetavatel märkidel. Andmetöötlusmeetodid peaksid olema kooskõlas skaaladega, milles kõnealuseid omadusi mõõdetakse.

Märkidevahelise seose uurimise eesmärgid on märkidevahelise seose olemasolu tõestamine ja selle seose uurimine. Kahe juhusliku suuruse X ja Y vahelise seose olemasolu tõestamiseks kasutatakse korrelatsioonianalüüsi. Kui X ja Y ühisjaotus on normaalne, siis statistilised järeldused põhinevad valimi lineaarsel korrelatsioonikordajal, muudel juhtudel kasutatakse Kendalli ja Spearmani auaste korrelatsioonikordajaid ning kvalitatiivsete tunnuste puhul hii-ruut testi. .

Regressioonanalüüsi kasutatakse kvantitatiivse tunnuse Y funktsionaalse sõltuvuse uurimiseks kvantitatiivsetest tunnustest x (1), x (2), ..., x (k). Seda seost nimetatakse regressiooniks või lühidalt regressiooniks. Regressioonanalüüsi lihtsaim tõenäosusmudel (juhul k = 1) kasutab algteabena vaatlustulemuste paaride komplekti (xi, yi), i = 1, 2, ..., n ja sellel on vorm

yi = axi + b + ei, i = 1, 2, ..., n,

kus еi on vaatlusvead. Mõnikord eeldatakse, et ei on sõltumatud juhuslikud suurused, millel on sama normaaljaotus N (0, y2). Kuna vaatlusvigade jaotus on tavaliselt tavapärasest erinev, on soovitatav regressioonimudelit käsitleda mitteparameetrilises seades, s.o. еi suvaliseks jaotamiseks.

Regressioonanalüüsi põhiülesanne on hinnata tundmatuid parameetreid a ja b, mis täpsustavad y lineaarset sõltuvust x-st. Selle ülesande lahendamiseks kasutatakse K. Gaussi 1794. aastal välja töötatud vähimruutude meetodit, s.o. leida hinnangud mudeli a ja b tundmatutele parameetritele ruutude summa minimeerimise tingimusest

muutujates a ja b.

Dispersioonanalüüsi kasutatakse kvalitatiivsete tunnuste mõju uurimiseks kvantitatiivsele muutujale. Näiteks oletame, et k masinal toodetud tooteühikute kvaliteedi kvantitatiivse näitaja mõõtmistulemuste näidist on k, s.o. arvude hulk (x1 (j), x2 (j),…, xn (j)), kus j on masina number, j = 1, 2,…, k ja n on valimi suurus. Dispersioonanalüüsi laialt levinud sõnastuses eeldatakse, et mõõtmistulemused on sõltumatud ja igas proovis on normaaljaotusega N (m (j), y2) sama dispersiooniga.

Toote kvaliteedi ühtluse kontrollimine, s.o. masina numbri mõju puudumine toote kvaliteedile taandatakse hüpoteesi kontrollimisele

H0: m (1) = m (2) =… = m (k).

Dispersioonanalüüs on välja töötanud meetodid selliste hüpoteeside kontrollimiseks.

Hüpoteesi H0 kontrollitakse alternatiivse hüpoteesiga H1, mille kohaselt vähemalt üks määratud võrdsustest ei ole täidetud. Selle hüpoteesi testimine põhineb järgmisel "dispersioonide lagunemisel", mille on näidanud R.A. Fisher:

kus s2 on valimi dispersioon koondproovis, st.

Seega peegeldab esimene liige valemi (7) paremal küljel rühmasisest dispersiooni. Lõpuks on rühmadevaheline dispersioon,

Valemi (7) tüübi dispersioondekompositsiooniga seotud rakendusstatistika valdkonda nimetatakse dispersioonanalüüsiks. Dispersioonanalüüsi probleemi näitena kaaluge ülaltoodud hüpoteesi H0 testimist eeldusel, et mõõtmistulemused on sõltumatud ja igas valimis on normaaljaotusega N (m (j), y2) sama dispersiooniga. Kui H0 kehtib, on valemi (7) parempoolsel esimesel liikmel, jagatud y2-ga, hii-ruutjaotus k (n-1) vabadusastmega ja teisel liikmel, jagatud y2-ga, on samuti hii-ruutjaotusega, kuid ( k-1) vabadusastmega ning esimene ja teine ​​liige on juhuslike muutujatena sõltumatud. Seetõttu juhuslik muutuja

omab Fisheri jaotust lugeja (k-1) ja nimetaja k (n-1) vabadusastmega. Hüpotees Н0 on aktsepteeritud, kui F< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

Mitteparameetrilised meetodid on välja töötatud klassikaliste dispersioonanalüüsi probleemide lahendamiseks, eelkõige hüpoteesi H0 kontrollimiseks.

Järgmine mitmemõõtmelise statistilise analüüsi probleemide tüüp on klassifitseerimisprobleemid. Need jagunevad kolme põhimõtteliselt erinevaks tüübiks – diskriminantanalüüs, klasteranalüüs, probleemide rühmitamine.

Diskriminantanalüüsi ülesanne on leida reegel vaadeldava objekti määramiseks mõnda eelnevalt kirjeldatud klassist. Sel juhul kirjeldatakse objekte matemaatilises mudelis, kasutades vektoreid, mille koordinaadid on iga objekti puhul mitmete tunnuste vaatlemise tulemused. Tunde kirjeldatakse kas otse matemaatiliselt või kasutades treeningnäidiseid. Koolitusnäidis on valim, mille iga elemendi puhul on näidatud, millisesse klassi see kuulub.

...

Sarnased dokumendid

    Ökonomeetria ja rakendusstatistika ajalugu. Rakendusstatistika rahvamajanduses. Kasvupunktid. Mitteparameetriline statistika. Mittenumbriline objektistatistika on rakendusstatistika osa.

    abstraktne, lisatud 01.08.2009

    Deterministliku komponendi struktuurikomponendid. Aegridade statistilise analüüsi põhieesmärk. Majandusprotsesside ekstrapoleerimine. Anomaalsete vaatluste tuvastamine, samuti aegridade mudelite koostamine.

    Kursitöö lisatud 11.03.2014

    Statistilised otsustusmudelid. Keskkonnaseisundi teadaoleva tõenäosusjaotusega mudelite kirjeldus. Dünaamilise otsustusprotsessi lihtsaima diagrammi käsitlemine. Ettevõtte muutmise tõenäosuse arvutamine.

    test, lisatud 07.11.2011

    Statistilised meetodid ühemõõtmeliste aegridade analüüsiks, analüüsi- ja prognoosimisülesannete lahendamiseks, uuritava näitaja joonistamiseks. Kriteeriumid seeria komponentide tuvastamiseks, seeria juhuslikkuse ja standardvigade väärtuste hüpoteesi kontrollimiseks.

    test, lisatud 13.08.2010

    Statistiliste meetodite roll juhtimisprotsessi kvantitatiivsete ja kvalitatiivsete tunnuste objektiivsel hindamisel. Kvaliteedivahendite kasutamine protsesside ja tooteparameetrite analüüsimisel. Diskreetsed juhuslikud muutujad. Tõenäosusteooria.

    Kursitöö lisatud 11.01.2015

    Optimaalse otsuste tegemise matemaatiline teooria. Tabeliline simpleksmeetod. Topeltlineaarse programmeerimise ülesande koostamine ja lahendamine. Transpordiprobleemi matemaatiline mudel. Ettevõttes tootmise teostatavuse analüüs.

    test, lisatud 13.06.2012

    Üldine, valimipopulatsioon. Tõenäosusliku ja statistilise analüüsi metoodilised alused. MathCadi funktsioonid, mis on loodud matemaatilise statistika probleemide lahendamiseks. Ülesannete lahendamine MS Excelis, valemite ja menüü "Andmeanalüüs" kasutamine.

    Kursitöö lisatud 20.01.2014

    Tootmisplaani kulude summa arvutamine. Paari regressiooni lineaarvõrrandi koefitsiendid. Tulemuste graafilise tõlgendamise tunnused. Majandusprotsesside areng. Aegridade ökonomeetrilise modelleerimise tunnused.

    test, lisatud 22.02.2011

    Aegridade ökonomeetrilise analüüsi põhielemendid. Analüüsiülesanded ja nende esmane töötlemine. Aegridade väärtuste lühi- ja keskpika perioodi prognoosimise ülesannete lahendamine. Trendivõrrandi parameetrite leidmise meetodid. Vähima ruudu meetod.

    test, lisatud 03.06.2009

    Elementaarsed mõisted juhuslike sündmuste, suuruste ja funktsioonide kohta. Juhuslike suuruste arvulised karakteristikud. Jaotuste asümmeetria tüübid. Juhuslike suuruste jaotuse statistiline hindamine. Struktuurse ja parameetrilise identifitseerimise ülesannete lahendamine.

Kuidas kasutatakse otsuste tegemisel tõenäosusteooria ja matemaatilise statistika lähenemisviise, ideid ja tulemusi?

Aluseks on reaalse nähtuse või protsessi tõenäosusmudel, s.t. matemaatiline mudel, milles objektiivseid seoseid väljendatakse tõenäosusteooria kaudu. Tõenäosusi kasutatakse eelkõige määramatuste kirjeldamiseks, mida tuleb otsuste tegemisel arvestada. See viitab nii soovimatutele võimalustele (riskidele) kui ka atraktiivsetele ("õnnelik juhus"). Mõnikord tuuakse olukorda teadlikult juhuslikult, näiteks loositakse, valitakse juhuslikult kontrollitavad üksused, korraldatakse loteriisid või tarbijaküsitlusi.

Tõenäosusteooria võimaldab teatud tõenäosustega arvutada teisi, mis uurijale huvi pakuvad. Näiteks vapi väljakukkumise tõenäosuse põhjal saab arvutada tõenäosuse, et 10 mündiviskega kukub välja vähemalt 3 vappi. Selline arvutus põhineb tõenäosusmudelil, mille järgi mündiviskeid kirjeldatakse sõltumatute testide skeemi abil, lisaks on võrdselt võimalikud embleem ja võre väljakukkumine ning seetõttu on iga sündmuse tõenäosus Ѕ. Keerulisem on mudel, kus mündi viskamise asemel mõeldakse väljundühiku kvaliteedi kontrollimisele. Vastav tõenäosusmudel põhineb eeldusel, et erinevate toodanguartiklite kvaliteedikontrolli kirjeldab sõltumatu testskeem. Erinevalt mündiviskamise mudelist tuleb kasutusele võtta uus parameeter - tõenäosus p, et toodanguüksus on defektne. Mudelit kirjeldatakse täielikult, kui eeldatakse, et kõigi üksuste defektide tõenäosus on sama. Kui viimane eeldus on vale, siis mudeli parameetrite arv suureneb. Näiteks võite eeldada, et igal üksusel on oma tõenäosus, et see on defektne.

Arutleme kvaliteedikontrolli mudeli üle, millel on kõigi tooteüksuste jaoks ühine defekti tõenäosus p. Et mudelit analüüsides “numbrini jõuda”, on vaja p asendada mingi kindla väärtusega. Selleks on vaja minna tõenäosusmudelist kaugemale ja pöörduda kvaliteedikontrolli käigus saadud andmete poole.

Matemaatiline statistika lahendab tõenäosusteooriaga seotud pöördülesande. Selle eesmärk on vaatluste (mõõtmised, analüüsid, testid, katsed) tulemuste põhjal teha järeldusi tõenäosusmudeli aluseks olevate tõenäosuste kohta. Näiteks defektsete toodete esinemissageduse põhjal kontrollimisel saab teha järeldusi defekti tekkimise tõenäosuse kohta (vt Bernoulli teoreem eespool).

Tšebõševi ebavõrdsuse põhjal tehti järeldused defektsete toodete esinemissageduse vastavuse kohta hüpoteesile, et defekti tõenäosus omandab teatud väärtuse.

Seega põhineb matemaatilise statistika rakendamine nähtuse või protsessi tõenäosusmudelil. Kasutatakse kahte paralleelset mõisteseeriat – teooriaga seotud (tõenäosuslik mudel) ja praktikaga seotud (vaatlustulemuste näidis). Näiteks teoreetiline tõenäosus vastab valimi põhjal leitud sagedusele. Matemaatiline ootus (teoreetiline jada) vastab valimi aritmeetilisele keskmisele (praktiline jada). Tavaliselt on valimi karakteristikud teoreetilised hinnangud. Samal ajal on teoreetilise seeriaga seotud väärtused "uurijate peas", viitavad ideede maailmale (vana-Kreeka filosoofi Platoni järgi) ja on otseseks mõõtmiseks kättesaamatud. Teadlaste käsutuses on vaid näidisandmed, mille abil püütakse paika panna neid huvitavaid teoreetilise tõenäosusmudeli omadusi.

Miks on tõenäosusmudelit vaja? Fakt on see, et ainult tema abiga on võimalik konkreetse proovi analüüsi tulemustest välja kujunenud omadusi üle kanda teistele proovidele, aga ka kogu nn üldkogumile. Mõistet “üldrahvastik” kasutatakse, kui viidatakse suurele, kuid piiratud huvipakkuvate üksuste populatsioonile. Näiteks kõigi Venemaa elanike või Moskva lahustuva kohvi tarbijate koguarvu kohta. Turundus- või arvamusküsitluste eesmärk on kanda sadadest või tuhandetest inimestest koosneva valimi väiteid mitme miljonilise elanikkonna hulka. Kvaliteedikontrollis toimib tootepartii üldkogumina.

Valimi järelduste ülekandmiseks suuremale üldkogumile on vajalik üks või teine ​​eeldus valimi tunnuste seose kohta selle suurema üldkogumi tunnustega. Need eeldused põhinevad sobival tõenäosusmudelil.

Loomulikult on võimalik näidisandmeid töödelda ilma konkreetset tõenäosusmudelit kasutamata. Näiteks saab arvutada valimi aritmeetilise keskmise, arvutada teatud tingimuste täitmise sagedust jne. Arvutustulemused puudutavad aga ainult konkreetset valimit, nende abil saadud järelduste ülekandmine muule populatsioonile on vale. Seda tegevust nimetatakse mõnikord andmekaeveks. Võrreldes tõenäosus-statistiliste meetoditega on andmeanalüüsil piiratud kognitiivne väärtus.

Seega on tõenäosuslik-statistiliste otsustusmeetodite olemuslik hüpoteeside hindamisel ja kontrollimisel valimi karakteristikute abil põhinevate tõenäosusmudelite kasutamine.

Rõhutame, et valimikarakteristikute kasutamise loogika teoreetilistel mudelitel põhinevate otsuste tegemisel eeldab kahe paralleelse mõisteseeria samaaegset kasutamist, millest üks vastab tõenäosusmudelitele ja teine ​​näidisandmetele. Kahjuks ei tehta paljudes kirjanduslikes allikates, mis on tavaliselt vananenud või retseptivaimus kirjutatud, valikuliste ja teoreetiliste tunnuste vahel vahet, mis viib lugejate hämmeldumise ja statistiliste meetodite praktilise kasutamise vigadeni.

Samuti töötatakse välja ja põhjendatakse nn statistiliste otsuste teooria raames meetodeid riskitingimustes otsuste tegemiseks. Statistiliste otsuste teooria on statistiliste vaatluste tegemise, nende vaatluste töötlemise ja kasutamise teooria. Majandusuuringute ülesanne on teatavasti mõista majandusobjekti olemust, paljastada selle olulisemate muutujate vahelise seose mehhanism. Selline arusaam võimaldab välja töötada ja rakendada selle objekti ehk majanduspoliitika haldamiseks vajalikke meetmeid. Selleks on vaja ülesandega adekvaatseid, majandusandmete olemust ja spetsiifikat arvestavaid meetodeid, mis on aluseks kvalitatiivsetele ja kvantitatiivsetele väidetele uuritava majandusobjekti või nähtuse kohta.

Kõik majandusandmed esindavad mis tahes majandusobjekti kvantitatiivseid omadusi. Need moodustuvad paljude tegurite mõjul, millest kõik ei ole välisele kontrollile kättesaadavad. Kontrollimatud tegurid võivad teatud väärtuste hulgast võtta juhuslikke väärtusi ja seega määrata nende poolt määratud andmete juhuslikkuse. Majandusandmete stohhastilisuse tõttu on nende analüüsiks ja töötlemiseks vaja kasutada spetsiaalseid adekvaatseid statistilisi meetodeid.

Ettevõtlusriski kvantitatiivne hindamine, sõltumata konkreetse probleemi sisust, on reeglina võimalik matemaatilise statistika meetodeid kasutades. Selle hindamismeetodi peamised tööriistad on dispersioon, standardhälve, variatsioonikordaja.

Rakendustes kasutatakse laialdaselt tüüpilisi disainilahendusi, mis põhinevad riskiga seotud seisundite varieeruvuse või tõenäosuse näitajatel. Seega hinnatakse finantsriske, mis on tingitud tulemuse kõikumisest eeldatava väärtuse, näiteks efektiivsuse ümber, kasutades dispersiooni või eeldatavat absoluutset kõrvalekallet keskmisest. Kapitali juhtimise probleemide puhul on levinud riskiastme mõõdupuuks saamata jäänud või saamata jäänud tulu tõenäosus võrreldes prognoositava variandiga.

Riski suuruse (riski astme) hindamiseks keskendume järgmistele kriteeriumidele:

  • 1) keskmine eeldatav väärtus;
  • 2) võimaliku tulemuse volatiilsus (muutuvus).

Statistilise valimi jaoks

kus Xj - iga vaatlusjuhtumi eeldatav väärtus (/ "= 1, 2, ...), l, - vaatlusjuhtude arv (sagedus) väärtused l :, x = E - keskmine eeldatav väärtus, st - dispersioon,

V on variatsioonikoefitsient, meil on:

Mõelge ärilepingute riski hindamise probleemile. LLC "Interproduct" otsustab sõlmida toiduainete tarnimise lepingu ühel kolmest alusest. Pärast nende aluste kaupa kauba eest tasumise aja kohta andmete kogumist (tabel 6.7) on vaja pärast riski hindamist valida kauba tarnelepingu sõlmimisel baas, mis tasub kauba eest võimalikult lühikese aja jooksul. tooted.

Tabel 6.7

Maksetingimused päevades

Vaatlusjuhtude arv P

xn

(xx)

(x-x ) 2

(x-x) 2 p

Esimese aluse jaoks, mis põhineb valemitel (6.4.1):

Teise aluse jaoks

Kolmanda aluse jaoks

Esimese baasi variatsioonikoefitsient on väikseim, mis näitab selle baasiga toodete tarnimise lepingu sõlmimise otstarbekust.

Vaadeldud näited näitavad, et riskil on matemaatiliselt väljendatud kahju tõenäosus, mis põhineb statistilistel andmetel ja on arvutatav üsna suure täpsusega. Vastuvõetavaima lahenduse valikul lähtuti tulemuse optimaalse tõenäosuse reeglist, mis seisneb selles, et võimalike lahenduste hulgast valitakse see, mille puhul on tulemuse tõenäosus ettevõtja jaoks vastuvõetav.

Praktikas kombineeritakse tulemuse optimaalse tõenäosuse reegli rakendamist enamasti tulemuse optimaalse varieeruvuse reegliga.

Teatavasti väljendatakse näitajate varieeruvust nende dispersiooni, standardhälbe ja variatsioonikoefitsiendiga. Tulemuse optimaalse varieeruvuse reegli olemus seisneb selles, et võimalike lahenduste hulgast valitakse see, mille puhul on sama riskantse kapitaliinvesteeringu võitmise ja kaotuse tõenäosus väike vahe, s.t. väikseim dispersiooni suurus, variatsiooni standardhälve. Vaadeldavate probleemide puhul tehti optimaalsete lahenduste valik nende kahe reegli alusel.

milliste andmete järgi "sisendis" on:

2.1. Numbrid.

2.2. Lõplikud vektorid.

2.3. Funktsioonid (aegread).

2.4. Mittenumbrilise iseloomuga objektid.

Kõige huvitavam on klassifikatsioon nende kontrolliprobleemide järgi, mille lahendamiseks kasutatakse ökonomeetrilisi meetodeid. Selle lähenemisviisi abil saab plokke eraldada:

3.1. Prognoosimise ja planeerimise tugi.

3.2. Jälgimine kontrollitud parameetrid ja kõrvalekallete tuvastamine.

3.3. Toetus otsuse tegemine, ja jne.

Millised tegurid määravad teatud ökonomeetriliste kontrollivahendite kasutamise sageduse? Nagu ka teistes ökonomeetria rakendustes, on siin kaks peamist tegurite rühma - lahendatavad ülesanded ja spetsialistide kvalifikatsioon.

Ökonomeetriliste meetodite praktilisel rakendamisel kontrolleri töös on vajalik kasutada vastavaid tarkvarasüsteeme. Üldised statistikasüsteemid nagu SPSS, Statgraphics, Statistica, ADDA ja rohkem spetsialiseerunud Statcon, SPC, NADIS, REST(vastavalt intervallandmete statistikale), Matrixer ja paljud teised. Lihtsasti kasutatavate tarkvaratoodete, sealhulgas kaasaegsete ökonomeetriliste vahendite massilist kasutuselevõttu konkreetsete majandusandmete analüüsimiseks võib pidada üheks tõhusaks viisiks teaduse ja tehnika arengu kiirendamiseks, kaasaegsete ökonomeetriliste teadmiste levitamiseks.

Ökonomeetria areneb pidevalt... Rakendusuuringud toovad kaasa vajaduse klassikaliste meetodite sügavama analüüsi järele.

Kahe proovi homogeensuse testimise meetodid on hea näide aruteluks. Agregaate on kaks ja tuleb otsustada, kas need on erinevad või samad. Selleks võtke igaühest neist proov ja rakendage üht või teist statistilist meetodit homogeensuse kontrollimiseks. Umbes 100 aastat tagasi pakuti välja Studenti meetod, mida kasutatakse laialdaselt tänapäevalgi. Sellel on aga terve hulk puudusi. Esiteks, Studenti t-jaotuse järgi peaksid valimite elementide jaotused olema normaaljaotused (Gaussi). Tavaliselt see nii ei ole. Teiseks on see suunatud mitte homogeensuse kui terviku (nn absoluutse homogeensuse, st kahele hulgale vastavate jaotusfunktsioonide kokkulangevuse) kontrollimisele, vaid ainult matemaatiliste ootuste võrdsuse kontrollimisele. Kuid kolmandaks eeldatakse tingimata, et kahe valimi elementide dispersioonid langevad kokku. Dispersioonide võrdsust, rääkimata normaalsusest, on aga palju keerulisem kontrollida kui matemaatiliste ootuste võrdsust. Seetõttu rakendatakse Studenti t-testi tavaliselt selliseid kontrolle tegemata. Ja siis jäävad õhku rippuma järeldused Studenti kriteeriumi järgi.

Teoorias edasijõudnumad spetsialistid pöörduvad teiste kriteeriumide, näiteks Wilcoxoni kriteeriumi poole. See on mitteparameetriline, st. ei tugine normaalsuse eeldusele. Kuid tal pole puudusi. Seda ei saa kasutada absoluutse homogeensuse (kahele hulgale vastavate jaotusfunktsioonide kokkulangevuse) kontrollimiseks. Seda saab teha ainult nn. järjekindlad kriteeriumid, eelkõige Smirnovi kriteeriumid ja oomega-ruudu tüüp.

Praktilisest küljest on Smirnovi kriteeriumil puudus - selle statistika võtab vaid väikese arvu väärtusi, selle jaotus on koondunud vähestesse punktidesse ning traditsioonilisi olulisuse tasemeid 0,05 ja 0,01 on võimatu kasutada.

Mõiste "statistiline kõrgtehnoloogia"... Mõistes "statistilised kõrgtehnoloogiad" on kõigil kolmel sõnal oma tähendus.

"Kõrge", nagu ka teistes valdkondades, tähendab, et tehnoloogia põhineb teooria ja praktika viimastel edusammudel, eelkõige tõenäosusteoorial ja rakenduslikul matemaatilisel statistikal. Samas tähendab "toetub kaasaegsetele teadussaavutustele" esiteks seda, et tehnoloogia matemaatiline alus vastava teadusharu raames saadi suhteliselt hiljuti ning teiseks, et arvutusalgoritmid töötati välja ja põhjendati vastavalt see (ja ei ole nn. "heuristiline"). Aja jooksul, kui uued lähenemised ja tulemused ei sunni tehnoloogia rakendatavuse ja võimaluste hindamist ümber vaatama, asendama seda kaasaegsemaga, muutub "kõrgökonomeetriline tehnoloogia" "klassikaliseks statistikatehnoloogiaks". Nagu näiteks vähimruutude meetod... Seega on kõrged statistilised tehnoloogiad hiljutiste tõsiste teadusuuringute viljad. Siin on kaks võtmemõistet - tehnoloogia "noorus" (igal juhul mitte vanem kui 50 aastat ja parem mitte vanem kui 10 või 30 aastat vana) ja toetumine "kõrgteadusele".

Mõiste "statistika" on tuttav, kuid sellel on palju tähendusi. Teada on üle 200 mõiste "statistika" definitsiooni.

Lõpuks kasutatakse mõistet "tehnoloogia" seoses statistikaga suhteliselt harva. Andmeanalüüs sisaldab reeglina mitmeid protseduure ja algoritme, mida tehakse järjestikku, paralleelselt või keerulisemas skeemis. Eelkõige saab eristada järgmisi tüüpilisi etappe:

  • statistilise uuringu planeerimine;
  • andmete kogumise korraldamine optimaalse või vähemalt ratsionaalse programmi järgi (valimi planeerimine, organisatsiooni struktuuri loomine ja spetsialistide meeskonna valimine, andmeid koguma hakkava personali, samuti andmetöötlejate koolitamine jne);
  • andmete otsene kogumine ja fikseerimine teatud andmekandjatele (koos kogumise kvaliteedikontrolliga ja ekslike andmete tagasilükkamine teemavaldkonnast tulenevalt);
  • andmete esmane kirjeldus (erinevate valimikarakteristikute arvutamine, jaotusfunktsioonid, mitteparameetrilised tiheduse hinnangud, histogrammide koostamine, korrelatsiooniväljad, erinevad tabelid ja diagrammid jne),
  • jaotuste teatud arvuliste või mittenumbriliste karakteristikute ja parameetrite hindamine (näiteks variatsioonikordaja mitteparameetriline intervallhinnang või vastuse ja tegurite vahelise seose taastamine, st funktsiooni hindamine),
  • statistiliste hüpoteeside (mõnikord nende ahelate) testimine - pärast eelmise hüpoteesi kontrollimist otsustatakse üht või teist järgnevat hüpoteesi testida,
  • põhjalikumat uurimist, s.o. erinevate algoritmide kasutamine mitme muutujaga statistiliseks analüüsiks, diagnoosimise ja klassifikatsiooni koostamise algoritmid, mittenumbriliste ja intervallandmete statistika, aegridade analüüs jne;
  • hinnangute ja järelduste stabiilsuse kontrollimine lähteandmete lubatud hälvete ja kasutatud tõenäosus-statistiliste mudelite eelduste, mõõteskaalade lubatud teisenduste kohta, eelkõige hinnangute omaduste uurimine korrutamise meetodil. proovid;
  • saadud statistiliste tulemuste rakendamine rakenduslikel eesmärkidel (näiteks konkreetsete materjalide diagnoosimiseks, prognooside tegemiseks, investeerimisprojekti valimiseks pakutud võimaluste hulgast, tehnoloogilise protsessi elluviimiseks optimaalse režiimi leidmiseks, tehniliste seadmete näidiste testimise tulemuste kokkuvõtmiseks, jne.),
  • lõpparuannete koostamine, eelkõige mõeldud neile, kes ei ole andmeanalüüsi ökonomeetriliste ja statistiliste meetodite eksperdid, sh juhtkonnale – "otsustajatele".

Võimalik on ka muu statistiliste tehnoloogiate struktureerimine. Oluline on rõhutada, et statistiliste meetodite kvalifitseeritud ja tõhus rakendamine ei ole mingil juhul ühe eraldiseisva statistilise hüpoteesi testimine ega ühe kindla jaotuse parameetrite hindamine kindlast perekonnast. Seda tüüpi toimingud on vaid ehitusplokid, mis moodustavad statistilise tehnoloogia ülesehitamise. Samal ajal räägivad statistika ja ökonomeetria õpikud ja monograafiad tavaliselt üksikutest ehitusplokkidest, kuid ei käsitle nende rakenduslikuks kasutamiseks mõeldud tehnoloogiaks organiseerimise probleeme. Üleminek ühelt statistiliselt protseduurilt teisele jääb varju.

Erilist tähelepanu nõuab statistiliste algoritmide "dokkimise" probleem, kuna eelmise algoritmi kasutamise tulemusena rikutakse sageli järgmise rakendamistingimusi. Eelkõige võivad vaatlustulemused lakata olemast sõltumatud, muutuda nende jaotus jne.

Näiteks statistiliste hüpoteeside testimisel on oluline olulisuse tase ja võimsus. Nende arvutamise ja ühe hüpoteesi kontrollimise meetodid on tavaliselt hästi teada. Kui testitakse esmalt ühte hüpoteesi ja seejärel selle testimise tulemusi arvesse võttes teist, siis lõplikku protseduuri, mida võib pidada ka mõne (keerukama) statistilise hüpoteesi testimiseks, on tunnused (olulisuse ja võimsuse tase). ), mida reeglina ei saa olla lihtne väljendada kahe moodustava hüpoteesi omadustega ja seetõttu on need tavaliselt teadmata. Seetõttu ei saa lõplikku protseduuri pidada teaduslikult põhjendatuks, see kuulub heuristiliste algoritmide hulka. Muidugi võib see pärast asjakohast uurimist, näiteks Monte Carlo meetodil, saada üheks rakendusstatistika teaduslikult põhjendatud protseduuriks.

Seega on andmete ökonomeetrilise või statistilise analüüsi protseduur informatiivne tehnoloogiline protsess ehk see või teine ​​infotehnoloogia. Praegu oleks kergemeelne rääkida kogu ökonomeetrilise (statistilise) andmeanalüüsi protsessi automatiseerimisest, kuna liiga palju on lahendamata probleeme, mis tekitavad spetsialistide seas arutelu.

Kogu praegu kasutatavate statistiliste meetodite arsenali saab jagada kolme voogu:

  • kõrged statistilised tehnoloogiad;
  • klassikalised statistikatehnoloogiad,
  • madala statistilise tehnoloogiaga.

Tuleb tagada, et konkreetsetes uuringutes kasutatakse ainult kahte esimest tüüpi tehnoloogiaid.... Samas peame klassikaliste statistikatehnoloogiate all silmas auväärse ajastu tehnoloogiaid, mis on säilitanud oma teadusliku väärtuse ja olulisuse kaasaegse statistikapraktika jaoks. Sellised on vähimruutude meetod, Kolmogorovi, Smirnovi statistika, oomega-ruut, Spearmani ja Kendalli mitteparameetrilised korrelatsioonikordajad ja paljud teised.

Meil on ökonomeetrikuid suurusjärgu võrra vähem kui USA-s ja Suurbritannias (Ameerika statistikaliidus on üle 20 000 liikme). Venemaal on vaja koolitada uusi spetsialiste – ökonomeetriat.

Ükskõik, milliseid uusi teadustulemusi saadakse, kui need jäävad õpilastele teadmata, siis on uus põlvkond teadlasi ja insenere sunnitud neid üksi tegutsedes valdama või isegi uuesti avastama. Mõnevõrra umbkaudselt võib öelda nii: need lähenemised, ideed, tulemused, faktid, algoritmid, mis koolitustele ja vastavatesse õpikutesse sattusid, salvestatakse ja kasutatakse järeltulijate poolt, need, mis sinna ei jõudnud, kaovad raamatukogude tolmu.

Kasvupunktid... Kaasaegne rakendusstatistika areneb viis asjakohast valdkonda, s.o. viis "kasvupunkti": mitteparameetriline, robustsus, alglaadimine, intervallstatistika, mittenumbriliste objektide statistika. Käsitleme lühidalt neid aktuaalseid valdkondi.

Mitteparameetriline ehk mitteparameetriline statistika võimaldab teha statistilisi järeldusi, hinnata jaotuskarakteristikuid, testida statistilisi hüpoteese ilma nõrgalt põhjendatud eeldusteta, et valimi elementide jaotusfunktsioon on osa konkreetsest parameetrilisest perekonnast. Näiteks on levinud arvamus, et statistika järgib sageli normaaljaotust. Konkreetsete vaatlustulemuste, eelkõige mõõtmisvigade analüüs näitab aga, et valdaval enamusel juhtudel erinevad reaalsed jaotused tavalistest oluliselt. Normaalsuse hüpoteesi kriitikavaba kasutamine toob sageli kaasa olulisi vigu, näiteks kõrvalekallete (outliers) tagasilükkamisel, statistilises kvaliteedikontrollis ja muudel juhtudel. Seetõttu on soovitatav kasutada mitteparameetrilisi meetodeid, kus vaatlustulemuste jaotusfunktsioonidele esitatakse ainult väga nõrgad nõuded. Tavaliselt eeldatakse, et need ei ole pidevad. Nüüdseks on mitteparameetriliste meetodite abil võimalik lahendada praktiliselt sama hulk probleeme, mida varem lahendati parameetriliste meetoditega.

Töökindluse (stabiilsuse) töö põhiidee: järeldused peaksid vähe muutuma algandmete väikeste muudatuste ja mudeli eeldustest kõrvalekallete korral. Siin on kaks muret. Üks on levinud andmekaeve algoritmide töökindluse uurimine. Teine on kindlate algoritmide otsimine teatud probleemide lahendamiseks.

Iseenesest ei oma mõiste "robustsus" üheselt mõistetavat tähendust. Alati on vaja märkida konkreetne tõenäosus-statistiline mudel. Kuid Tukey-Huber-Hampeli "pistikupesa" mudelist pole tavaliselt praktiliselt kasu. See on keskendunud "sabade kaalumisele" ja reaalsetes olukordades lõigatakse sabad ära a priori piirangutega vaatlustulemustele, mis on seotud näiteks kasutatavate mõõteriistadega.

Bootstrap on mitteparameetrilise statistika suund, mis põhineb infotehnoloogiate intensiivsel kasutamisel. Põhiidee on "proovide korrutamine", st. paljude proovide komplekti saamisel, mis on sarnane katses saadud prooviga. Seda komplekti saab kasutada erinevate statistiliste protseduuride omaduste hindamiseks. Lihtsaim viis valimi "korrutamiseks" on jätta sellest välja üks vaatlustulemus. Välistame esimese vaatluse, saame originaaliga sarnase valimi, mille maht on vähendatud 1 võrra. Seejärel tagastame esimese vaatluse välistatud tulemuse, kuid välistame teise vaatluse. Saame teise proovi, mis sarnaneb originaaliga. Seejärel tagastame teise vaatluse tulemuse jne. Proovide "korrutamiseks" on ka teisi võimalusi. Näiteks on võimalik algsest valimist koostada üks või teine ​​jaotusfunktsiooni hinnang ja seejärel statistiliste testide meetodil simuleerida elementidest mitmeid valimeid, rakendusstatistikas on tegemist valimiga, s.o. sõltumatute identselt jaotatud juhuslike elementide kogum. Mis on nende elementide olemus? Klassikalises matemaatilises statistikas on valimiteks arvud või vektorid. Ja mittenumbrilises statistikas on näidiselemendid mittenumbrilise iseloomuga objektid, mida ei saa arvudega liita ja korrutada. Teisisõnu, mittenumbrilised objektid asuvad ruumides, millel puudub vektorstruktuur.