Metode statističkog rješavanja. Probabilistički i statistički modeli odlučivanja II. tematsko planiranje

2. OPIS NESIGURNOSTI U TEORIJI ODLUČIVANJA

2.2. Probabilističke i statističke metode za opisivanje nesigurnosti u teoriji odlučivanja

2.2.1. Teorija vjerojatnosti i matematička statistika u odlučivanju

Kako se koriste teorija vjerojatnosti i matematička statistika? Ove discipline temelj su probabilističke statističke metode odlučivanje. Za korištenje njihovog matematičkog aparata potrebno je probleme odlučivanja izraziti u terminima probabilističko-statističkih modela. Primjena određene vjerojatnosno-statističke metode odlučivanja sastoji se od tri faze:

Prijelaz iz ekonomske, upravljačke, tehnološke stvarnosti u apstraktnu matematičku i statističku shemu, tj. konstrukcija vjerojatnosnog modela upravljačkog sustava, tehnološkog procesa, postupka odlučivanja, posebice na temelju rezultata statističkog upravljanja i sl.

Izvođenje proračuna i izvođenje zaključaka korištenjem čisto matematičkih sredstava u okviru vjerojatnosnog modela;

Tumačenje matematičkih i statističkih zaključaka u odnosu na stvarno stanje i donošenje odgovarajuće odluke (primjerice, o sukladnosti ili nesukladnosti kvalitete proizvoda s utvrđenim zahtjevima, potrebi prilagodbe tehnološkog procesa i sl.), posebice, zaključke (o udjelu neispravnih jedinica proizvoda u šarži, o specifičnom obliku zakonitosti raspodjele kontroliranih parametara tehnološkog procesa i dr.).

Matematička statistika koristi koncepte, metode i rezultate teorije vjerojatnosti. Razmotrimo glavna pitanja izgradnje vjerojatnosnih modela donošenja odluka u ekonomskim, upravljačkim, tehnološkim i drugim situacijama. Za aktivno i ispravno korištenje regulatornih, tehničkih i uputnih dokumenata o probabilističkim i statističkim metodama odlučivanja potrebno je prethodno znanje. Stoga je potrebno znati pod kojim uvjetima treba koristiti pojedini dokument, koje je početne podatke potrebno imati za njegov odabir i primjenu, koje odluke treba donijeti na temelju rezultata obrade podataka itd.

Primjeri primjene teorija vjerojatnosti i matematička statistika. Razmotrimo nekoliko primjera vjerojatnosti statistički modeli dobro su sredstvo za rješavanje upravljačkih, proizvodnih, gospodarskih i narodnoekonomskih problema. Tako se, na primjer, u romanu A. N. Tolstoja “Hod kroz muke” (tom 1) kaže: “radionica proizvodi dvadeset i tri posto otpadaka, vi se držite ove brojke”, rekao je Strukov Ivanu Iljiču.

Postavlja se pitanje kako razumjeti ove riječi u razgovoru direktora tvornice, jer jedna jedinica proizvodnje ne može biti 23% neispravna. Može biti ili dobar ili neispravan. Strukov je vjerojatno mislio da velika serija sadrži približno 23% neispravnih jedinica proizvodnje. Postavlja se pitanje što znači "otprilike"? Neka se od 100 testiranih proizvodnih jedinica 30 pokaže neispravnim, ili od 1000 - 300, ili od 100.000 - 30.000 itd., treba li Strukova optužiti za laž?

Ili drugi primjer. Novčić koji se koristi kao lot mora biti "simetričan", tj. kada ga bacate, u prosjeku bi se u polovici slučajeva trebao pojaviti grb, au polovici slučajeva - hash (repovi, broj). Ali što znači "u prosjeku"? Ako provodite mnogo serija od 10 bacanja u svakoj seriji, tada ćete često naići na serije u kojima novčić pada kao grb 4 puta. Za simetrični novčić to će se dogoditi u 20,5% izvođenja. A ako nakon 100.000 bacanja ima 40.000 grbova, može li se novčić smatrati simetričnim? Postupak donošenja odluka temelji se na teoriji vjerojatnosti i matematičkoj statistici.

Primjer o kojem je riječ možda se ne čini dovoljno ozbiljnim. Međutim, nije. Ždrijeb se široko koristi u organizaciji industrijskih tehničkih i ekonomskih eksperimenata, na primjer, pri obradi rezultata mjerenja pokazatelja kvalitete (momenta trenja) ležajeva ovisno o različitim tehnološkim čimbenicima (utjecaj okoliša za očuvanje, metode pripreme ležajeva prije mjerenja). , utjecaj nosivih opterećenja tijekom procesa mjerenja itd.). Recimo, potrebno je usporediti kvalitetu ležajeva ovisno o rezultatima njihovog skladištenja u različitim konzervacijskim uljima, tj. u sastavu ulja A I U. Prilikom planiranja takvog eksperimenta postavlja se pitanje koje ležajeve treba staviti u ulje sastava A, a koje - u sastavu ulja U, ali na način da se izbjegne subjektivnost i osigura objektivnost donesene odluke.

Odgovor na ovo pitanje moguće je dobiti ždrijebom. Sličan primjer može se dati s kontrolom kvalitete bilo kojeg proizvoda. Da bi se odlučilo zadovoljava li kontrolirana serija proizvoda utvrđene zahtjeve ili ne, iz nje se odabire uzorak. Na temelju rezultata kontrole uzorka donosi se zaključak o cijeloj seriji. U ovom slučaju vrlo je važno izbjeći subjektivnost pri formiranju uzorka, odnosno potrebno je da svaka jedinica proizvoda u kontroliranoj seriji ima jednaku vjerojatnost odabira za uzorak. U proizvodnim uvjetima odabir jedinica proizvoda za uzorak obično se ne provodi žrebom, već posebnim tablicama slučajnih brojeva ili pomoću računalnih senzora slučajnih brojeva.

Slični problemi osiguranja objektivnosti usporedbe javljaju se prilikom uspoređivanja različitih shema organizacije proizvodnje, nagrađivanja, tijekom natječaja i natječaja te odabira kandidata za upražnjena mjesta i tako dalje. Svugdje nam treba ždrijeb ili slične procedure. Pojasnimo na primjeru određivanja najjače i druge najjače momčadi pri organizaciji turnira po olimpijskom sustavu (poraženi ispada). Neka uvijek jači tim pobijedi slabijeg. Jasno je da će najjača momčad sigurno postati prvak. Druga najjača momčad izborit će finale ako i samo ako prije finala nema utakmice s budućim prvakom. Bude li takva utakmica planirana, druga najjača ekipa neće proći u finale. Onaj tko planira turnir može drugu po snazi ​​momčad ili prije roka “izbaciti” s turnira, suprotstavljajući je vodećoj u prvom susretu, ili joj osigurati drugo mjesto osiguravajući susrete sa slabijim ekipama sve do konačni. Radi izbjegavanja subjektivnosti, provodi se ždrijeb. Za turnir s 8 momčadi, vjerojatnost da će se dvije najbolje momčadi sastati u finalu je 4/7. Sukladno tome, s vjerojatnošću od 3/7, druga najjača momčad prijevremeno će napustiti turnir.

Svako mjerenje jedinica proizvoda (pomoću kalibra, mikrometra, ampermetra itd.) sadrži pogreške. Da bi se utvrdilo postoje li sustavne pogreške, potrebno je ponavljati mjerenja jedinice proizvoda čija su svojstva poznata (primjerice, standardni uzorak). Treba imati na umu da osim sustavne pogreške postoji i slučajna pogreška.

Stoga se postavlja pitanje kako iz rezultata mjerenja saznati postoji li sustavna pogreška. Ako samo zabilježimo je li pogreška dobivena pri sljedećem mjerenju pozitivna ili negativna, tada se ovaj zadatak može svesti na prethodni. Doista, usporedimo mjerenje s bacanjem novčića, pozitivnu pogrešku s gubitkom grba, negativnu pogrešku s mrežom (nulta pogreška s dovoljnim brojem podjeljaka na ljestvici se gotovo nikad ne pojavljuje). Tada je provjera nepostojanja sustavne pogreške jednaka provjeri simetrije kovanice.

Svrha ovih razmatranja je svesti problem provjere nepostojanja sustavne pogreške na problem provjere simetrije kovanice. Gornje razmišljanje dovodi do takozvanog "kriterija predznaka" u matematičkoj statistici.

U statističkoj regulaciji tehnoloških procesa, na temelju metoda matematičke statistike, razvijaju se pravila i planovi za statističko upravljanje procesima, usmjereni na pravodobno uočavanje problema u tehnološkim procesima i poduzimanje mjera za njihovu prilagodbu i sprječavanje izlaska proizvoda koji ne zadovoljiti utvrđene zahtjeve. Ove mjere imaju za cilj smanjenje troškova proizvodnje i gubitaka od nabave jedinica niske kvalitete. Tijekom statističke prijemne kontrole, temeljene na metodama matematičke statistike, izrađuju se planovi kontrole kvalitete analizom uzoraka iz proizvodnih serija. Poteškoća je u tome što je moguće pravilno izgraditi vjerojatnosno-statističke modele odlučivanja na temelju kojih se može odgovoriti na gore postavljena pitanja. U matematičkoj statistici u tu svrhu razvijeni su probabilistički modeli i metode za provjeru hipoteza, posebice hipoteza da je udio neispravnih jedinica proizvodnje jednak određenom broju. p 0, Na primjer, p 0= 0,23 (sjetite se Strukovljevih riječi iz romana A.N. Tolstoja).

Zadaci za ocjenjivanje. U nizu upravljačkih, proizvodnih, gospodarskih i narodnoekonomskih situacija javljaju se problemi drugačijeg tipa - problemi procjene karakteristika i parametara distribucija vjerojatnosti.

Pogledajmo primjer. Neka serija od N električne svjetiljke Iz ove serije, uzorak od n električne svjetiljke Postavlja se niz prirodnih pitanja. Kako odrediti prosječni vijek trajanja električnih svjetiljki na temelju rezultata ispitivanja uzoraka elemenata i s kojom se točnošću može procijeniti ova karakteristika? Kako će se promijeniti točnost ako uzmemo veći uzorak? Na koji broj sati T može se jamčiti da će najmanje 90% električnih svjetiljki trajati T i više sati?

Pretpostavimo da prilikom testiranja veličine uzorka n pokazalo se da su električne lampe neispravne x električne svjetiljke Tada se nameću sljedeća pitanja. Koje se granice mogu odrediti za broj? D neispravne žarulje u seriji, za stupanj neispravnosti D/ N i tako dalje.?

Ili, kada se statistički analizira točnost i stabilnost tehnoloških procesa, potrebno je procijeniti takve pokazatelje kvalitete kao što su prosječna vrijednost kontroliranog parametra i stupanj njegove raspršenosti u procesu koji se razmatra. Prema teoriji vjerojatnosti, preporučljivo je koristiti njezino matematičko očekivanje kao prosječnu vrijednost slučajne varijable, a disperziju, standardnu ​​devijaciju ili koeficijent varijacije kao statističku karakteristiku raspona. To postavlja pitanje: kako procijeniti ove statističke karakteristike iz podataka uzorka i s kojom točnošću se to može učiniti? Mnogo je sličnih primjera koji se mogu navesti. Ovdje je bilo važno pokazati kako se mogu koristiti teorija vjerojatnosti i matematička statistika upravljanje proizvodnjom pri donošenju odluka u području upravljanja kvalitetom statističkih proizvoda.

Što je "matematička statistika"? Pod matematičkom statistikom podrazumijeva se “grana matematike posvećena matematičkim metodama prikupljanja, sistematiziranja, obrade i tumačenja statističkih podataka, kao i njihova korištenja za znanstvene ili praktične zaključke. Pravila i postupci matematičke statistike temelje se na teoriji vjerojatnosti, što nam omogućuje procjenu točnosti i pouzdanosti zaključaka dobivenih u svakom problemu na temelju dostupnog statističkog materijala.” U ovom slučaju, statistički podaci odnose se na informacije o broju predmeta u bilo kojoj manje ili više opsežnoj zbirci koji imaju određene karakteristike.

Ovisno o vrsti problema koji se rješavaju, matematička statistika se obično dijeli na tri dijela: opis podataka, procjena i testiranje hipoteza.

Na temelju vrste statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri područja:

Univarijatna statistika (statistika slučajnih varijabli), u kojoj se rezultat promatranja opisuje realnim brojem;

Multivarijantna statistička analiza, gdje se rezultat promatranja objekta opisuje s nekoliko brojeva (vektor);

Statistika slučajnih procesa i vremenskih serija, gdje je rezultat promatranja funkcija;

Statistika objekata nenumeričke prirode, u kojoj je rezultat opažanja nenumeričke prirode, na primjer, to je skup (geometrijski lik), poredak ili dobiven kao rezultat mjerenja na temelju po kvalitativnom kriteriju.

Povijesno su se prva pojavila neka područja statistike objekata nenumeričke prirode (osobito problemi procjene udjela nedostataka i testiranje hipoteza o tome) i jednodimenzionalna statistika. Njima je matematički aparat jednostavniji, pa se na njihovom primjeru obično demonstriraju osnovne ideje matematičke statistike.

Samo one metode obrade podataka, tj. matematička statistika temelji se na dokazima, koji se temelje na probabilističkim modelima relevantnih stvarnih pojava i procesa. Riječ je o modelima ponašanja potrošača, nastanka rizika, funkcioniranja tehnološka oprema, dobivanje rezultata pokusa, tijek bolesti i sl. Vjerojatnosni model stvarne pojave treba se smatrati konstruiranim ako su veličine koje se razmatraju i veze među njima izražene u terminima teorije vjerojatnosti. Korespondencija probabilističkom modelu stvarnosti, tj. njegova primjerenost potkrijepljena je, posebice, korištenjem statističkih metoda za provjeru hipoteza.

Neprobabilističke metode obrade podataka su eksplorativne, mogu se koristiti samo u preliminarnoj analizi podataka, jer ne omogućuju procjenu točnosti i pouzdanosti zaključaka dobivenih na temelju ograničenog statističkog materijala.

Probabilističke i statističke metode primjenjive su gdje god je moguće konstruirati i opravdati probabilistički model neke pojave ili procesa. Njihova je uporaba obavezna kada se zaključci izvedeni iz podataka uzorka prenose na cjelokupnu populaciju (na primjer, s uzorka na cijelu seriju proizvoda).

U pojedinim područjima primjene koriste se kako probabilističke i statističke metode opće primjene, tako i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama upravljanja kvalitetom proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Njegovim metodama provodi se statistička analiza točnosti i stabilnosti tehnoloških procesa te statistička procjena kvalitete. Specifične metode uključuju metode statističke kontrole prihvatljivosti kvalitete proizvoda, statističke regulacije tehnoloških procesa, ocjene i kontrole pouzdanosti i dr.

Primijenjene probabilističke i statističke discipline kao što su teorija pouzdanosti i teorija čekanja u redu su u širokoj upotrebi. Sadržaj prvog od njih jasan je iz naziva, drugi se bavi proučavanjem sustava kao što je telefonska centrala, koja prima pozive u nasumično vrijeme - zahtjevima pretplatnika koji biraju brojeve na svojim telefonskim aparatima. Trajanje servisiranja ovih zahtjeva, tj. trajanje razgovora također je modelirano slučajnim varijablama. Veliki doprinos razvoju ovih disciplina dao je dopisni član Akademije znanosti SSSR-a A.Ya. Khinchin (1894-1959), akademik Akademije znanosti Ukrajinske SSR B.V. Gnedenko (1912-1995) i drugi domaći znanstvenici.

Ukratko o povijesti matematičke statistike. Matematička statistika kao znanost počinje radovima poznatog njemačkog matematičara Carla Friedricha Gaussa (1777.-1855.), koji je na temelju teorije vjerojatnosti istražio i opravdao metodu najmanjih kvadrata koju je stvorio 1795. godine i koristio se za obradu astronomskih podataka ( kako bi se pojasnila orbita malog planeta Ceres). Jedna od najpopularnijih distribucija vjerojatnosti, normalna, često se zove po njemu, au teoriji slučajnih procesa glavni predmet proučavanja su Gaussovi procesi.

U potkraj XIX V. - početak 20. stoljeća Veliki doprinos matematičkoj statistici dali su engleski istraživači, prvenstveno K. Pearson (1857.-1936.) i R. A. Fisher (1890.-1962.). Konkretno, Pearson je razvio hi-kvadrat test za testiranje statističkih hipoteza, a Fisher je razvio analizu varijance, teoriju eksperimentalnog dizajna i metodu maksimalne vjerojatnosti za procjenu parametara.

U 30-im godinama XX. stoljeća. Poljak Jerzy Neyman (1894-1977) i Englez E. Pearson razvili su opća teorija provjeravajući statističke hipoteze, a sovjetski matematičari akademik A.N. Kolmogorov (1903.-1987.) i dopisni član Akademije znanosti SSSR-a N.V. Smirnov (1900.-1966.) postavili su temelje neparametarske statistike. Četrdesetih godina XX. stoljeća. Rumunj A. Wald (1902-1950) izgradio je teoriju sekvencijalne statističke analize.

Matematička statistika se u današnje vrijeme ubrzano razvija. Tako se u proteklih 40 godina mogu razlikovati četiri temeljno nova područja istraživanja:

Razvoj i implementacija matematičke metode planiranje eksperimenata;

Razvoj statistike objekata nenumeričke prirode kao samostalan smjer u primijenjenoj matematičkoj statistici;

Razvoj statističkih metoda koje su otporne na mala odstupanja od korištenog probabilističkog modela;

Široki razvoj rada na izradi računalnih programskih paketa namijenjenih statističkoj analizi podataka.

Probabilističko-statističke metode i optimizacija. Ideja optimizacije prožima modernu primijenjenu matematičku statistiku i druge statističke metode. Naime, metode planiranja pokusa, statističke kontrole prihvatljivosti, statističke regulacije tehnoloških procesa itd. S druge strane, optimizacijske formulacije u teoriji odlučivanja, primjerice primijenjena teorija optimizacije kvalitete proizvoda i standardnih zahtjeva, osiguravaju široka uporaba probabilističkih statističkih metoda, prvenstveno primijenjene matematičke statistike.

Posebno je u upravljanju proizvodnjom, pri optimizaciji kvalitete proizvoda i standardnih zahtjeva, posebno važna primjena statističkih metoda u početnoj fazi životnog ciklusa proizvoda, tj. u fazi istraživanja priprema eksperimentalnog razvoja dizajna (razvoj obećavajućih zahtjeva za proizvode, idejni dizajn, projektni zadatak za eksperimentalni razvoj). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost. Statističke metode treba koristiti u svim fazama rješavanja optimizacijskog problema - kod skaliranja varijabli, razvoja matematičkih modela funkcioniranja proizvoda i sustava, provođenja tehničkih i ekonomskih eksperimenata itd.

U problemima optimizacije, uključujući optimizaciju kvalitete proizvoda i standardnih zahtjeva, koriste se sva područja statistike. Naime, statistika slučajnih varijabli, multivarijatna statistička analiza, statistika slučajnih procesa i vremenskih serija, statistika objekata nenumeričke prirode. Preporučljivo je odabrati statističku metodu za analizu pojedinih podataka u skladu s preporukama.

Prethodno

Pošaljite svoj dobar rad u bazu znanja jednostavno je. Koristite obrazac u nastavku

Studenti, diplomanti, mladi znanstvenici koji koriste bazu znanja u svom studiju i radu bit će vam vrlo zahvalni.

Objavljeno na http://www.allbest.ru/

[Unesite tekst]

Uvod

1. Teorija vjerojatnosti i matematička statistika u odlučivanju

1.1 Kako se koriste teorija vjerojatnosti i matematička statistika

1.2. Primjeri primjene teorije vjerojatnosti i matematičke statistike

1.3 Ciljevi ocjenjivanja

1.4 Što je "matematička statistika"

1.5 Ukratko o povijesti matematičke statistike

1.6 Probabilističko-statističke metode i optimizacija

2. Tipični praktični problemi vjerojatnosno-statističkog odlučivanja i metode za njihovo rješavanje

2.1 Statistika i primijenjena statistika

2.2 Zadaci statističke analize točnosti i stabilnosti tehnoloških procesa i kvalitete proizvoda

2.3 Problemi jednodimenzionalne statistike (statistike slučajnih varijabli)

2.4 Multivarijantna statistička analiza

2.5 Statistika slučajnih procesa i vremenskih serija

2.6 Statistika objekata nenumeričke prirode

3. Primjena probabilističkih i statističkih metoda odlučivanja u rješavanju ekonomskih problema

Zaključak

Reference

Uvod

Probabilističko-statističke metode odlučivanja koriste se u slučaju kada učinkovitost donesenih odluka ovisi o čimbenicima koji su slučajne varijable za koje su poznati zakoni distribucije vjerojatnosti i druge statističke karakteristike. Štoviše, svaka odluka može dovesti do jednog od mnogih mogućih ishoda, a svaki ishod ima određenu vjerojatnost pojavljivanja koja se može izračunati. Pokazatelji koji karakteriziraju problematična situacija, također se opisuju korištenjem probabilističkih karakteristika. U ovakvim zadacima odlučivanja donositelj odluke uvijek se izlaže riziku da dobije rezultat koji nije onaj na koji se orijentirao pri odabiru optimalnog rješenja na temelju usrednjenih statističkih karakteristika slučajnih faktora, odnosno odluka se donosi pod uvjeti rizika.

U praksi se često koriste probabilističke i statističke metode kada se zaključci izvedeni iz podataka uzorka prenose na cjelokupnu populaciju (na primjer, s uzorka na cijelu seriju proizvoda). No, u svakoj konkretnoj situaciji prvo treba procijeniti temeljnu mogućnost dobivanja dovoljno pouzdanih probabilističkih i statističkih podataka.

Pri korištenju ideja i rezultata teorije vjerojatnosti i matematičke statistike pri donošenju odluka temelj je matematički model u kojem su objektivni odnosi izraženi teorijom vjerojatnosti. Vjerojatnosti se prvenstveno koriste za opisivanje slučajnosti koje se moraju uzeti u obzir pri donošenju odluka. To se odnosi kako na nepoželjne prilike (rizike), tako i na one privlačne („sretna prilika”).

Bit probabilističko-statističkih metoda odlučivanja je korištenje probabilističkih modela koji se temelje na procjeni i testiranju hipoteza korištenjem karakteristika uzorka.

Logika korištenja karakteristika uzorka za donošenje odluka temeljenih na teorijskim modelima uključuje istovremenu upotrebu dvaju paralelnih nizova koncepata – onih koji se odnose na teoriju (probabilistički model) i onih koji se odnose na praksu (uzorkovanje rezultata promatranja). Na primjer, teorijska vjerojatnost odgovara učestalosti dobivenoj iz uzorka. Matematičko očekivanje (teorijska serija) odgovara aritmetičkoj sredini uzorka (praktična serija). Tipično, karakteristike uzorka su procjene teorijskih karakteristika.

Prednosti korištenja ovih metoda uključuju mogućnost uzimanja u obzir različitih scenarija razvoja događaja i njihove vjerojatnosti. Nedostatak ovih metoda je da je vrijednosti vjerojatnosti za scenarije koji se koriste u izračunima obično vrlo teško dobiti u praksi.

Primjena određene vjerojatnosno-statističke metode odlučivanja sastoji se od tri faze:

Prijelaz iz ekonomske, upravljačke, tehnološke stvarnosti u apstraktnu matematičku i statističku shemu, tj. izgradnja vjerojatnosnog modela upravljačkog sustava, tehnološkog procesa, postupka odlučivanja, posebice na temelju rezultata statističkog upravljanja i dr.;

Vjerojatnosni model stvarne pojave treba se smatrati konstruiranim ako su veličine koje se razmatraju i veze među njima izražene u terminima teorije vjerojatnosti. Adekvatnost probabilističkog modela posebno se potkrepljuje korištenjem statističkih metoda za provjeru hipoteza.

Ovisno o vrsti problema koji se rješava, matematička statistika obično se dijeli na tri dijela: opis podataka, procjena i testiranje hipoteza. Na temelju vrste statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri područja:

Primjer kada je uputno koristiti probabilističko-statističke modele.

Prilikom kontrole kakvoće bilo kojeg proizvoda, iz njega se odabire uzorak kako bi se odlučilo zadovoljava li serija proizvoda koja se proizvodi postavljenim zahtjevima. Na temelju rezultata kontrole uzorka donosi se zaključak o cijeloj seriji. U ovom slučaju vrlo je važno izbjeći subjektivnost pri formiranju uzorka, odnosno potrebno je da svaka jedinica proizvoda u kontroliranoj seriji ima jednaku vjerojatnost odabira za uzorak. Odabir na temelju ždrijeba u takvoj situaciji nije dovoljno objektivan. Stoga se u proizvodnim uvjetima odabir jedinica proizvoda za uzorak obično ne provodi ždrijebom, već posebnim tablicama slučajnih brojeva ili pomoću računalnih senzora slučajnih brojeva.

U statističkoj regulaciji tehnoloških procesa, na temelju metoda matematičke statistike, razvijaju se pravila i planovi za statističko upravljanje procesima, usmjereni na pravodobno uočavanje problema u tehnološkim procesima i poduzimanje mjera za njihovu prilagodbu i sprječavanje izlaska proizvoda koji ne zadovoljiti utvrđene zahtjeve. Ove mjere imaju za cilj smanjenje troškova proizvodnje i gubitaka od nabave jedinica niske kvalitete. Tijekom statističke prijemne kontrole, temeljene na metodama matematičke statistike, izrađuju se planovi kontrole kvalitete analizom uzoraka iz proizvodnih serija. Poteškoća je u tome što je moguće pravilno izgraditi vjerojatnosno-statističke modele odlučivanja na temelju kojih se može odgovoriti na gore postavljena pitanja. U matematičkoj su statistici u tu svrhu razvijeni probabilistički modeli i metode za provjeru hipoteza.

Osim toga, u nizu upravljačkih, proizvodnih, gospodarskih i narodnoekonomskih situacija javljaju se problemi drugačijeg tipa - problemi procjene karakteristika i parametara distribucija vjerojatnosti.

Ili, kada se statistički analizira točnost i stabilnost tehnoloških procesa, potrebno je procijeniti takve pokazatelje kvalitete kao što su prosječna vrijednost kontroliranog parametra i stupanj njegove raspršenosti u procesu koji se razmatra. Prema teoriji vjerojatnosti, preporučljivo je koristiti njezino matematičko očekivanje kao prosječnu vrijednost slučajne varijable, a disperziju, standardnu ​​devijaciju ili koeficijent varijacije kao statističku karakteristiku raspona. To postavlja pitanje: kako procijeniti ove statističke karakteristike iz podataka uzorka i s kojom točnošću se to može učiniti? Mnogo je sličnih primjera u literaturi. Svi oni pokazuju kako se teorija vjerojatnosti i matematička statistika mogu koristiti u upravljanju proizvodnjom pri donošenju odluka u području upravljanja kvalitetom statističkih proizvoda.

U pojedinim područjima primjene koriste se kako probabilističke i statističke metode opće primjene, tako i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama upravljanja kvalitetom proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Njegovim metodama provodi se statistička analiza točnosti i stabilnosti tehnoloških procesa te statistička procjena kvalitete. Specifične metode uključuju metode statističke kontrole prihvatljivosti kvalitete proizvoda, statističke regulacije tehnoloških procesa, ocjene i kontrole pouzdanosti.
i tako dalje.

Posebno je u upravljanju proizvodnjom, kada se optimizira kvaliteta proizvoda i osigurava usklađenost sa zahtjevima standarda, posebno važna primjena statističkih metoda u početnoj fazi životnog ciklusa proizvoda, tj. u fazi istraživanja priprema razvoja eksperimentalnog dizajna (razvoj zahtjeva za obećavajući proizvod, idejni projekt, tehničke specifikacije za razvoj eksperimentalnog dizajna). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost.

Najčešće probabilističke statističke metode su regresijska analiza, faktorska analiza, analiza varijance, statističke metode za procjenu rizika, metoda scenarija itd. Područje statističkih metoda posvećeno analizi statističkih podataka nenumeričke prirode, tj. postaje sve važnije. rezultati mjerenja temeljeni na kvalitativnim i različitim vrstama karakteristika. Jedna od glavnih primjena statistike objekata nenumeričke prirode je teorija i praksa stručnih procjena povezanih s teorijom statističkih odluka i problema glasanja.

Uloga osobe pri rješavanju problema metodama teorije statističkih rješenja je da postavi problem, odnosno da stvarni problem svede na odgovarajući standardni, da odredi vjerojatnosti događaja na temelju statističkih podataka, te da odobriti dobiveno optimalno rješenje.

1. Teorija vjerojatnosti i matematička statistika u odlučivanju

1.1 Kako se koristi teorija vjerojatnostii matematičke statistike

Ove discipline temelj su probabilističkih i statističkih metoda odlučivanja. Za korištenje njihovog matematičkog aparata potrebno je probleme odlučivanja izraziti u terminima probabilističko-statističkih modela. Primjena određene vjerojatnosno-statističke metode odlučivanja sastoji se od tri faze:

Prijelaz iz ekonomske, upravljačke, tehnološke stvarnosti u apstraktnu matematičku i statističku shemu, tj. konstrukcija vjerojatnosnog modela upravljačkog sustava, tehnološkog procesa, postupka odlučivanja, posebice na temelju rezultata statističkog upravljanja i sl.

Izvođenje proračuna i izvođenje zaključaka korištenjem čisto matematičkih sredstava u okviru vjerojatnosnog modela;

Tumačenje matematičkih i statističkih zaključaka u odnosu na stvarno stanje i donošenje odgovarajuće odluke (primjerice, o sukladnosti ili nesukladnosti kvalitete proizvoda s utvrđenim zahtjevima, potrebi prilagodbe tehnološkog procesa i sl.), posebice, zaključke (o udjelu neispravnih jedinica proizvoda u šarži, o specifičnom obliku zakonitosti raspodjele kontroliranih parametara tehnološkog procesa i dr.).

Matematička statistika koristi koncepte, metode i rezultate teorije vjerojatnosti. Razmotrimo glavna pitanja izgradnje vjerojatnosnih modela donošenja odluka u ekonomskim, upravljačkim, tehnološkim i drugim situacijama. Za aktivno i ispravno korištenje regulatornih, tehničkih i uputnih dokumenata o probabilističkim i statističkim metodama odlučivanja potrebno je prethodno znanje. Stoga je potrebno znati pod kojim uvjetima treba koristiti pojedini dokument, koje je početne podatke potrebno imati za njegov odabir i primjenu, koje odluke treba donijeti na temelju rezultata obrade podataka itd.

1.2 Primjeri primjene teorije vjerojatnostii matematičke statistike

Razmotrimo nekoliko primjera u kojima su vjerojatnosno-statistički modeli dobar alat za rješavanje problema upravljanja, proizvodnje, gospodarstva i nacionalne ekonomije. Tako se, na primjer, u romanu A. N. Tolstoja “Hod kroz muke” (tom 1) kaže: “radionica proizvodi dvadeset i tri posto otpadaka, vi se držite ove brojke”, rekao je Strukov Ivanu Iljiču.

Postavlja se pitanje kako razumjeti ove riječi u razgovoru direktora tvornice, jer jedna jedinica proizvodnje ne može biti 23% neispravna. Može biti ili dobar ili neispravan. Strukov je vjerojatno mislio da velika serija sadrži približno 23% neispravnih jedinica proizvodnje. Postavlja se pitanje što znači "otprilike"? Neka se od 100 testiranih proizvodnih jedinica 30 pokaže neispravnim, ili od 1000 - 300, ili od 100.000 - 30.000 itd., treba li optuživati ​​Strukova da laže?

Ili drugi primjer. Novčić koji se koristi kao lot mora biti "simetričan", tj. prilikom bacanja, u prosjeku, u pola slučajeva treba ispasti grb, au polovici slučajeva - hash (repovi, broj). Ali što znači "u prosjeku"? Ako provodite mnogo serija od 10 bacanja u svakoj seriji, tada ćete često naići na serije u kojima novčić pada kao grb 4 puta. Za simetrični novčić to će se dogoditi u 20,5% izvođenja. A ako nakon 100.000 bacanja ima 40.000 grbova, može li se novčić smatrati simetričnim? Postupak donošenja odluka temelji se na teoriji vjerojatnosti i matematičkoj statistici.

Primjer o kojem je riječ možda se ne čini dovoljno ozbiljnim. Međutim, nije. Ždrijeb se široko koristi u organizaciji industrijskih tehničkih i ekonomskih eksperimenata, na primjer, pri obradi rezultata mjerenja pokazatelja kvalitete (momenta trenja) ležajeva ovisno o različitim tehnološkim čimbenicima (utjecaj okoliša za očuvanje, metode pripreme ležajeva prije mjerenja). , utjecaj nosivih opterećenja tijekom procesa mjerenja itd.). Recimo, potrebno je usporediti kvalitetu ležajeva ovisno o rezultatima njihovog skladištenja u različitim konzervacijskim uljima, tj. u uljima sastava A i B. Prilikom planiranja ovakvog eksperimenta postavlja se pitanje koje ležajeve staviti u ulje sastava A, a koje u ulje sastava B, ali tako da se izbjegne subjektivnost. te osigurati objektivnost donesene odluke.

Odgovor na ovo pitanje moguće je dobiti ždrijebom. Sličan primjer može se dati s kontrolom kvalitete bilo kojeg proizvoda. Da bi se odlučilo zadovoljava li kontrolirana serija proizvoda utvrđene zahtjeve ili ne, iz nje se odabire uzorak. Na temelju rezultata kontrole uzorka donosi se zaključak o cijeloj seriji. U ovom slučaju vrlo je važno izbjeći subjektivnost pri formiranju uzorka, odnosno potrebno je da svaka jedinica proizvoda u kontroliranoj seriji ima jednaku vjerojatnost odabira za uzorak. U proizvodnim uvjetima odabir jedinica proizvoda za uzorak obično se ne provodi žrebom, već posebnim tablicama slučajnih brojeva ili pomoću računalnih senzora slučajnih brojeva.

Slični problemi osiguranja objektivnosti usporedbe javljaju se pri usporedbi različitih shema organizacije proizvodnje, nagrađivanja, tijekom natječaja i natječaja, odabira kandidata za slobodna radna mjesta itd. Svugdje nam treba ždrijeb ili slične procedure. Pojasnimo na primjeru određivanja najjače i druge najjače momčadi pri organizaciji turnira po olimpijskom sustavu (poraženi ispada). Neka uvijek jači tim pobijedi slabijeg. Jasno je da će najjača momčad sigurno postati prvak. Druga najjača momčad izborit će finale ako i samo ako prije finala nema utakmice s budućim prvakom. Bude li takva utakmica planirana, druga najjača ekipa neće proći u finale. Onaj tko planira turnir može drugu po snazi ​​momčad ili prije roka “izbaciti” s turnira, suprotstavljajući je vodećoj u prvom susretu, ili joj osigurati drugo mjesto osiguravajući susrete sa slabijim ekipama sve do konačni. Radi izbjegavanja subjektivnosti, provodi se ždrijeb. Za turnir s 8 momčadi, vjerojatnost da će se dvije najbolje momčadi sastati u finalu je 4/7. Sukladno tome, s vjerojatnošću od 3/7, druga najjača momčad prijevremeno će napustiti turnir.

Svako mjerenje jedinica proizvoda (pomoću kalibra, mikrometra, ampermetra itd.) sadrži pogreške. Da bi se utvrdilo postoje li sustavne pogreške, potrebno je ponavljati mjerenja jedinice proizvoda čija su svojstva poznata (primjerice, standardni uzorak). Treba imati na umu da osim sustavne pogreške postoji i slučajna pogreška.

Stoga se postavlja pitanje kako iz rezultata mjerenja saznati postoji li sustavna pogreška. Ako samo zabilježimo je li pogreška dobivena pri sljedećem mjerenju pozitivna ili negativna, tada se ovaj zadatak može svesti na prethodni. Doista, usporedimo mjerenje s bacanjem novčića, pozitivnu pogrešku s gubitkom grba, a negativnu pogrešku s mrežom (nulta pogreška s dovoljnim brojem podjeljaka gotovo se nikad ne pojavljuje). Tada je provjera nepostojanja sustavne pogreške jednaka provjeri simetrije kovanice.

Svrha ovih razmatranja je svesti problem provjere nepostojanja sustavne pogreške na problem provjere simetrije kovanice. Gornje razmišljanje dovodi do takozvanog "kriterija predznaka" u matematičkoj statistici.

U statističkoj regulaciji tehnoloških procesa, na temelju metoda matematičke statistike, razvijaju se pravila i planovi za statističko upravljanje procesima, usmjereni na pravodobno uočavanje problema u tehnološkim procesima i poduzimanje mjera za njihovu prilagodbu i sprječavanje izlaska proizvoda koji ne zadovoljiti utvrđene zahtjeve. Ove mjere imaju za cilj smanjenje troškova proizvodnje i gubitaka od nabave jedinica niske kvalitete. Tijekom statističke prijemne kontrole, temeljene na metodama matematičke statistike, izrađuju se planovi kontrole kvalitete analizom uzoraka iz proizvodnih serija. Poteškoća je u tome što je moguće pravilno izgraditi vjerojatnosno-statističke modele odlučivanja na temelju kojih se može odgovoriti na gore postavljena pitanja. U matematičkoj statistici u tu svrhu razvijeni su probabilistički modeli i metode za provjeru hipoteza, posebice hipoteza da je udio neispravnih jedinica proizvodnje jednak određenom broju p0, na primjer, p0 = 0,23 (sjetimo se riječi Strukova iz romana A.N.Tolstoja).

1.3 Ciljevi ocjenjivanja

U nizu upravljačkih, proizvodnih, gospodarskih i narodnoekonomskih situacija javljaju se problemi drugačijeg tipa - problemi procjene karakteristika i parametara distribucija vjerojatnosti.

Pogledajmo primjer. Neka serija od N električnih svjetiljki stigne na pregled. Uzorak od n električnih žarulja nasumično je odabran iz ove serije. Postavlja se niz prirodnih pitanja. Kako odrediti prosječni vijek trajanja električnih svjetiljki na temelju rezultata ispitivanja uzoraka elemenata i s kojom se točnošću može procijeniti ova karakteristika? Kako će se promijeniti točnost ako uzmemo veći uzorak? Za koji se broj sati T može jamčiti da će najmanje 90% električnih žarulja trajati T ili više sati?

Pretpostavimo da se prilikom ispitivanja uzorka od n električnih žarulja pokazalo da je X električnih žarulja neispravno. Tada se nameću sljedeća pitanja. Koja se ograničenja mogu odrediti za broj D neispravnih električnih žarulja u seriji, za razinu neispravnosti D/N itd.?

Ili, kada se statistički analizira točnost i stabilnost tehnoloških procesa, potrebno je procijeniti takve pokazatelje kvalitete kao što su prosječna vrijednost kontroliranog parametra i stupanj njegove raspršenosti u procesu koji se razmatra. Prema teoriji vjerojatnosti, preporučljivo je koristiti njezino matematičko očekivanje kao prosječnu vrijednost slučajne varijable, a disperziju, standardnu ​​devijaciju ili koeficijent varijacije kao statističku karakteristiku raspona. To postavlja pitanje: kako procijeniti ove statističke karakteristike iz podataka uzorka i s kojom točnošću se to može učiniti? Mnogo je sličnih primjera koji se mogu navesti. Ovdje je bilo važno pokazati kako se teorija vjerojatnosti i matematička statistika mogu koristiti u upravljanju proizvodnjom pri donošenju odluka u području statističkog upravljanja kvalitetom proizvoda.

1.4 Što je "matematička statistika"

Pod matematičkom statistikom podrazumijeva se “grana matematike posvećena matematičkim metodama prikupljanja, sistematiziranja, obrade i tumačenja statističkih podataka, kao i njihova korištenja za znanstvene ili praktične zaključke. Pravila i postupci matematičke statistike temelje se na teoriji vjerojatnosti, što nam omogućuje procjenu točnosti i pouzdanosti zaključaka dobivenih u svakom problemu na temelju dostupnog statističkog materijala.” U ovom slučaju, statistički podaci odnose se na informacije o broju predmeta u bilo kojoj manje ili više opsežnoj zbirci koji imaju određene karakteristike.

Ovisno o vrsti problema koji se rješavaju, matematička statistika se obično dijeli na tri dijela: opis podataka, procjena i testiranje hipoteza.

Na temelju vrste statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri područja:

Univarijatna statistika (statistika slučajnih varijabli), u kojoj se rezultat promatranja opisuje realnim brojem;

Multivarijantna statistička analiza, gdje se rezultat promatranja objekta opisuje s nekoliko brojeva (vektor);

Statistika slučajnih procesa i vremenskih serija, gdje je rezultat promatranja funkcija;

Statistika objekata nenumeričke prirode, u kojoj je rezultat opažanja nenumeričke prirode, na primjer, to je skup (geometrijski lik), poredak ili dobiven kao rezultat mjerenja na temelju po kvalitativnom kriteriju.

Povijesno su se prva pojavila neka područja statistike objekata nenumeričke prirode (osobito problemi procjene udjela nedostataka i testiranje hipoteza o tome) i jednodimenzionalna statistika. Njima je matematički aparat jednostavniji, pa se na njihovom primjeru obično demonstriraju osnovne ideje matematičke statistike.

Samo one metode obrade podataka, tj. matematička statistika temelji se na dokazima, koji se temelje na probabilističkim modelima relevantnih stvarnih pojava i procesa. Riječ je o modelima ponašanja potrošača, pojavi rizika, funkcioniranju tehnološke opreme, dobivanju eksperimentalnih rezultata, tijeku bolesti itd. Vjerojatnosni model stvarne pojave treba se smatrati konstruiranim ako su veličine koje se razmatraju i veze među njima izražene u terminima teorije vjerojatnosti. Korespondencija probabilističkom modelu stvarnosti, tj. njegova primjerenost potkrijepljena je, posebice, korištenjem statističkih metoda za provjeru hipoteza.

Neprobabilističke metode obrade podataka su eksplorativne, mogu se koristiti samo u preliminarnoj analizi podataka, jer ne omogućuju procjenu točnosti i pouzdanosti zaključaka dobivenih na temelju ograničenog statističkog materijala.

Probabilističke i statističke metode primjenjive su gdje god je moguće konstruirati i opravdati probabilistički model neke pojave ili procesa. Njihova je uporaba obavezna kada se zaključci izvedeni iz podataka uzorka prenose na cjelokupnu populaciju (na primjer, s uzorka na cijelu seriju proizvoda).

U pojedinim područjima primjene koriste se kako probabilističke i statističke metode opće primjene, tako i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama upravljanja kvalitetom proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Njegovim metodama provodi se statistička analiza točnosti i stabilnosti tehnoloških procesa te statistička procjena kvalitete. Specifične metode uključuju metode statističke kontrole prihvatljivosti kvalitete proizvoda, statističke regulacije tehnoloških procesa, ocjene i kontrole pouzdanosti i dr.

Primijenjene probabilističke i statističke discipline kao što su teorija pouzdanosti i teorija čekanja u redu su u širokoj upotrebi. Sadržaj prvog od njih jasan je iz naziva, drugi se bavi proučavanjem sustava kao što je telefonska centrala, koja prima pozive u nasumično vrijeme - zahtjevima pretplatnika koji biraju brojeve na svojim telefonskim aparatima. Trajanje servisiranja ovih zahtjeva, tj. trajanje razgovora također je modelirano slučajnim varijablama. Veliki doprinos razvoju ovih disciplina dao je dopisni član Akademije znanosti SSSR-a A.Ya. Khinchin (1894-1959), akademik Akademije znanosti Ukrajinske SSR B.V. Gnedenko (1912-1995) i drugi domaći znanstvenici.

1.5 Ukratko o povijesti matematičke statistike

Matematička statistika kao znanost počinje radovima poznatog njemačkog matematičara Carla Friedricha Gaussa (1777.-1855.), koji je na temelju teorije vjerojatnosti istražio i opravdao metodu najmanjih kvadrata koju je stvorio 1795. godine i koristio se za obradu astronomskih podataka ( kako bi se pojasnila orbita malog planeta Ceres). Jedna od najpopularnijih distribucija vjerojatnosti, normalna, često se zove po njemu, au teoriji slučajnih procesa glavni predmet proučavanja su Gaussovi procesi.

Krajem 19.st. - početak 20. stoljeća Veliki doprinos matematičkoj statistici dali su engleski istraživači, prvenstveno K. Pearson (1857.-1936.) i R. A. Fisher (1890.-1962.). Konkretno, Pearson je razvio hi-kvadrat test za testiranje statističkih hipoteza, a Fisher je razvio analizu varijance, teoriju eksperimentalnog dizajna i metodu maksimalne vjerojatnosti za procjenu parametara.

U 30-im godinama XX. stoljeća. Poljak Jerzy Neumann (1894.-1977.) i Englez E. Pearson razvili su opću teoriju provjere statističkih hipoteza, a sovjetski matematičari akademik A.N. Kolmogorov (1903.-1987.) i dopisni član Akademije znanosti SSSR-a N.V. Smirnov (1900.-1966.) postavili su temelje neparametarske statistike. Četrdesetih godina XX. stoljeća. Rumunj A. Wald (1902-1950) izgradio je teoriju sekvencijalne statističke analize.

Matematička statistika se u današnje vrijeme ubrzano razvija. Tako se u proteklih 40 godina mogu razlikovati četiri temeljno nova područja istraživanja:

Razvoj i implementacija matematičkih metoda za planiranje pokusa;

Razvoj statistike objekata nenumeričke prirode kao samostalnog smjera u primijenjenoj matematičkoj statistici;

Razvoj statističkih metoda koje su otporne na mala odstupanja od korištenog probabilističkog modela;

Široki razvoj rada na izradi računalnih programskih paketa namijenjenih statističkoj analizi podataka.

1.6 Probabilističko-statističke metode i optimizacija

Ideja optimizacije prožima modernu primijenjenu matematičku statistiku i druge statističke metode. Naime, metode planiranja pokusa, statističke kontrole prihvatljivosti, statističke regulacije tehnoloških procesa itd. S druge strane, optimizacijske formulacije u teoriji odlučivanja, primjerice primijenjena teorija optimizacije kvalitete proizvoda i standardnih zahtjeva, osiguravaju široka uporaba probabilističkih statističkih metoda, prvenstveno primijenjene matematičke statistike.

Posebno je u upravljanju proizvodnjom, pri optimizaciji kvalitete proizvoda i standardnih zahtjeva, posebno važna primjena statističkih metoda u početnoj fazi životnog ciklusa proizvoda, tj. u fazi istraživanja priprema razvoja eksperimentalnog dizajna (razvoj zahtjeva za obećavajući proizvod, idejni projekt, tehničke specifikacije za razvoj eksperimentalnog dizajna). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost. Statističke metode treba koristiti u svim fazama rješavanja optimizacijskog problema - kod skaliranja varijabli, razvoja matematičkih modela funkcioniranja proizvoda i sustava, provođenja tehničkih i ekonomskih eksperimenata itd.

U problemima optimizacije, uključujući optimizaciju kvalitete proizvoda i standardnih zahtjeva, koriste se sva područja statistike. Naime, statistika slučajnih varijabli, multivarijatna statistička analiza, statistika slučajnih procesa i vremenskih serija, statistika objekata nenumeričke prirode. Preporučljivo je odabrati statističku metodu za analizu pojedinih podataka prema preporukama.

2. Tipični praktični problemi vjerojatnosti-statističko odlučivanjei metode za njihovo rješavanje

2.1 Statistika i primijenjena statistika

Pod primijenjenom statistikom podrazumijeva se dio matematičke statistike koji se bavi metodama obrade stvarnih statističkih podataka, kao i odgovarajućim matematičkim i softver. Stoga čisto matematički problemi nisu uključeni u primijenjenu statistiku.

Statistički podaci podrazumijevaju numeričke ili nenumeričke vrijednosti kontroliranih parametara (znakova) predmeta koji se proučavaju, koji su dobiveni kao rezultat promatranja (mjerenja, analiza, testova, eksperimenata itd.) određenog broja znakovi za svaku jedinicu uključenu u studiju. Metode dobivanja statističkih podataka i veličine uzoraka utvrđuju se na temelju formulacije specifičnog primijenjenog problema temeljenog na metodama matematičke teorije planiranja eksperimenata.

Rezultat opažanja xi proučavane karakteristike X (ili skupa proučavanih karakteristika X) yi-te jedinice uzorkovanja odražava kvantitativna i/ili kvalitativna svojstva ispitivane jedinice s brojem i (ovdje i = 1, 2, . .., n, gdje je n veličina uzorka).

Rezultati opažanja x1, x2,…, xn, gdje je xi rezultat opažanja i-te jedinice uzorkovanja, ili rezultati opažanja za više uzoraka, obrađuju se metodama primijenjene statistike koje odgovaraju zadatku. Obično se koristi analitičke metode, tj. metode temeljene na numeričkim proračunima (objekti nenumeričke prirode opisuju se brojevima). U nekim slučajevima dopušteno je koristiti grafičke metode(vizualna analiza).

2.2 Zadaci statističke analize točnosti i stabilnosti tehnoloških procesa i kvalitete proizvoda

Statističkim metodama posebno se analizira točnost i stabilnost tehnoloških procesa i kvaliteta proizvoda. Cilj je pripremiti rješenja koja osiguravaju učinkovito funkcioniranje tehnoloških cjelina te poboljšavaju kvalitetu i konkurentnost proizvedenih proizvoda. Statističke metode treba koristiti u svim slučajevima kada je na temelju rezultata ograničenog broja promatranja potrebno utvrditi razloge poboljšanja ili pogoršanja točnosti i stabilnosti tehnološke opreme. Točnost tehnološkog procesa shvaća se kao svojstvo tehnološkog procesa koje određuje blizinu stvarnih i nominalnih vrijednosti parametara proizvedenog proizvoda. Stabilnost tehnološkog procesa shvaća se kao svojstvo tehnološkog procesa koje određuje postojanost distribucije vjerojatnosti za njegove parametre u određenom vremenskom razdoblju bez vanjske intervencije.

Ciljevi primjene statističkih metoda za analizu točnosti i stabilnosti tehnoloških procesa i kvalitete proizvoda u fazama razvoja, proizvodnje i pogona (potrošnje) proizvoda su posebice:

* određivanje stvarnih pokazatelja točnosti i stabilnosti tehnološkog procesa, opreme ili kvalitete proizvoda;

* utvrđivanje usklađenosti kvalitete proizvoda sa zahtjevima regulatorne i tehničke dokumentacije;

* provjera poštivanja tehnološke discipline;

* proučavanje slučajnih i sustavnih čimbenika koji mogu dovesti do nedostataka;

* utvrđivanje proizvodnih i tehnoloških rezervi;

* opravdanje tehnički standardi i odobrenja proizvoda;

* procjena rezultata ispitivanja prototipova pri opravdavanju zahtjeva proizvoda i standarda za njih;

* opravdanost izbora tehnološke opreme i mjernih i ispitnih instrumenata;

* usporedba različitih uzoraka proizvoda;

* opravdanost zamjene kontinuirane kontrole statističkom kontrolom;

* utvrđivanje mogućnosti uvođenja statističkih metoda za upravljanje kvalitetom proizvoda i sl.

Da biste postigli gore navedene ciljeve, koristite razne metode opisivanje podataka, procjena i testiranje hipoteza. Navedimo primjere iskaza problema.

2.3 Problemi jednodimenzionalne statistike (statistike slučajnih varijabli)

Usporedba matematičkih očekivanja provodi se u slučajevima kada je potrebno utvrditi podudarnost pokazatelja kvalitete proizvedenog proizvoda i referentnog uzorka. Ovo je zadatak testiranja hipoteze:

H0: M(X) = m0,

gdje je m0 vrijednost koja odgovara referentnom uzorku; X je slučajna varijabla koja modelira rezultate opažanja. Ovisno o formuliranju vjerojatnosnog modela situacije i alternativne hipoteze, usporedba matematičkih očekivanja provodi se parametarskim ili neparametrijskim metodama.

Usporedba disperzija provodi se kada je potrebno utvrditi razliku između disperzije pokazatelja kvalitete i nazivne. Da bismo to učinili, testiramo hipotezu:

Ne manje važni od problema provjere hipoteza su i problemi estimacije parametara. Oni se, kao i problemi testiranja hipoteza, dijele na parametarske i neparametarske ovisno o korištenom probabilističkom modelu situacije.

U problemima parametarske estimacije usvojen je probabilistički model, prema kojem se rezultati opažanja x1, x2,..., xn smatraju realizacijama n neovisnih slučajnih varijabli s funkcijom distribucije F(x;u). Ovdje i je nepoznati parametar koji leži u prostoru parametara specificiranom korištenim probabilističkim modelom. Zadatak procjene je odrediti bodovne procjene i granice pouzdanosti (ili područje pouzdanosti) za parametar i.

Parametar i je ili broj ili vektor fiksne konačne dimenzije. Dakle, za normalnu distribuciju i = (m, y2) je dvodimenzionalni vektor, za binomnu distribuciju i = p je broj, za gama distribuciju
i = (a, b, c) je trodimenzionalni vektor, itd.

U modernoj matematičkoj statistici postoji niz uobičajene metode određivanje procjena i granica pouzdanosti - metoda momenata, metoda maksimalne vjerojatnosti, metoda procjene u jednom koraku, metoda stabilne (robustne) procjene, metoda nepristrane procjene itd.

Osvrnimo se ukratko na prva tri od njih.

Metoda momenata temelji se na korištenju izraza za momente promatranih slučajnih varijabli kroz parametre njihovih funkcija distribucije. Procjene metode momenata dobivaju se zamjenom uzoraka momenata umjesto teoretskih u funkcije koje izražavaju parametre u terminima momenata.

U metodi maksimalne vjerojatnosti, koju je uglavnom razvio R.A. Fisher, vrijednost u* za koju je takozvana funkcija vjerojatnosti maksimalna uzima se kao procjena parametra u

f(x1, u) f(x2, u) … f(xn, u),

gdje su x1, x2,…, xn rezultati promatranja; f(x, u) je njihova gustoća distribucije, ovisno o parametru u, koji treba procijeniti.

Procjenitelji maksimalne vjerojatnosti obično su učinkoviti (ili asimptotski učinkoviti) i imaju manju varijancu od procjenitelja metode trenutaka. U nekim slučajevima, formule za njih su ispisane eksplicitno (normalna distribucija, eksponencijalna distribucija bez pomaka). Međutim, češće je za njihovo pronalaženje potrebno numerički riješiti sustav transcendentalnih jednadžbi (Weibull-Gnedenko distribucije, gama). U takvim slučajevima, preporučljivo je koristiti ne procjene maksimalne vjerojatnosti, već druge vrste procjena, prvenstveno procjene u jednom koraku.

U neparametarskim problemima procjene, usvaja se probabilistički model, u kojem se rezultati opažanja x1, x2,..., xn smatraju realizacijama n neovisnih slučajnih varijabli s funkcijom distribucije F(x) opći pogled. F(x) je potreban samo za ispunjavanje određenih uvjeta kao što su kontinuitet, postojanje matematičkog očekivanja i disperzije, itd. Takvi uvjeti nisu tako strogi kao uvjet pripadnosti određenoj parametarskoj obitelji.

U neparametarskoj postavci procjenjuju se ili karakteristike slučajne varijable (matematičko očekivanje, disperzija, koeficijent varijacije) ili njena funkcija distribucije, gustoća itd. Dakle, na temelju zakona velikih brojeva, aritmetička sredina uzorka je dosljedna procjena matematičkog očekivanja M(X) (za bilo koju funkciju distribucije F(x) rezultata promatranja za koju postoji matematičko očekivanje). Pomoću teorema o središnjoj granici određuju se asimptotske granice pouzdanosti

(M(X))H = , (M(X))B = .

gdje je r - povjerenje vjerojatnost, - kvantil reda standardne normalne distribucije N(0;1) s nultim matematičkim očekivanjem i jediničnom varijancom, - aritmetička sredina uzorka, s - standardna devijacija uzorka. Izraz "asimptotske granice pouzdanosti" znači da vjerojatnosti

P((M(X))H< M(X)}, P{(M(X))B >M(X)),

P((M(X))H< M(X) < (M(X))B}

teže, i r, odnosno, za n > ?, ali, općenito govoreći, nisu jednake ovim vrijednostima za konačne n. U praksi, asimptotske granice pouzdanosti daju dovoljnu točnost za n reda 10.

Drugi primjer neparametarske procjene je procjena funkcije distribucije. Prema Glivenkovom teoremu, empirijska funkcija distribucije Fn(x) je konzistentna procjena funkcije distribucije F(x). Ako je F(x) kontinuirana funkcija, tada su, na temelju Kolmogorova teorema, granice pouzdanosti za funkciju distribucije F(x) navedene u obliku

(F(x))N = max, (F(x))B = min,

gdje je k(r,n) kvantil reda r distribucije Kolmogorovljeve statistike za veličinu uzorka n (podsjetimo se da distribucija ove statistike ne ovisi o F(x)).

Pravila za određivanje procjena i granica pouzdanosti u parametarskom slučaju temelje se na parametarskoj obitelji distribucija F(x;u). Pri obradi stvarnih podataka postavlja se pitanje odgovaraju li ti podaci prihvaćenom probabilističkom modelu? Oni. statistička hipoteza da rezultati promatranja imaju funkciju distribucije iz obitelji (F(x;u) i U) za neki u = u0? Takve se hipoteze nazivaju hipotezama slaganja, a kriteriji za njihovo testiranje nazivaju se kriterijima slaganja.

Ako je poznata stvarna vrijednost parametra u = u0, funkcija distribucije F(x; u0) je kontinuirana, tada se Kolmogorov test, temeljen na statistici, često koristi za testiranje hipoteze o prilagodbi

gdje je Fn(x) empirijska funkcija distribucije.

Ako je prava vrijednost parametra u0 nepoznata, na primjer, kada se testira hipoteza o normalnosti distribucije rezultata promatranja (tj. kada se testira pripada li ta distribucija obitelji normalnih distribucija), tada se ponekad koristi statistika

Razlikuje se od Kolmogorove statistike Dn po tome što je umjesto prave vrijednosti parametra u0 zamijenjena njegovom procjenom u*.

Distribucija Dn(u*) statistike jako se razlikuje od distribucije Dn statistike. Kao primjer, razmotrite test normalnosti kada je u = (m, y2) i u* = (, s2). Za ovaj slučaj, kvantili distribucija statistike Dn i Dn(u*) dani su u tablici 1. Dakle, kvantili se razlikuju otprilike 1,5 puta.

Tablica 1 - Kvantili statistike Dn i Dn(i*) pri provjeri normalnosti

Tijekom početne obrade statističkih podataka važan je zadatak isključiti rezultate promatranja dobivene kao rezultat grubih pogrešaka i promašaja. Primjerice, pri pregledu podataka o težini (u kilogramima) novorođene djece uz brojeve 3.500, 2.750, 4.200 može se pojaviti i broj 35,00. Jasno je da se radi o pogrešci, a pogrešan broj je dobiven zbog pogrešnog snimanja - decimalna točka je pomaknuta za jedan znak, kao rezultat toga, rezultat promatranja je pogrešno povećan za 10 puta.

Statističke metode za isključivanje outliera temelje se na pretpostavci da takva opažanja imaju distribucije koje se oštro razlikuju od onih koje se proučavaju i stoga ih treba isključiti iz uzorka.

Najjednostavniji vjerojatnosni model je ovaj. Pod nultom hipotezom, rezultati promatranja se smatraju realizacijama neovisnih identično raspodijeljenih slučajnih varijabli X1, X2, Xn s funkcijom distribucije F(x). Pod alternativnom hipotezom, X1, X2, Xn-1 su isti kao i pod nultom hipotezom, a Xn odgovara gruboj pogrešci i ima funkciju raspodjele G(x) = F(x - c), gdje je c velik. Zatim s vjerojatnošću blizu 1 (točnije, teži 1 kako se veličina uzorka povećava),

Xn = max (X1, X2, Xn) = Xmax,

oni. Kada se opisuju podaci, Xmax treba smatrati mogućom greškom. Kritično područje ima oblik

Š = (x: x > d).

Kritična vrijednost d = d(b,n) odabire se ovisno o razini značajnosti b i veličini uzorka n iz uvjeta

P(Xmax > d | H0) = b (1)

Uvjet (1) je ekvivalentan sljedećem za veliko n i malo b:

Ako je poznata funkcija distribucije rezultata opažanja F(x), tada se kritična vrijednost d nalazi iz relacije (2). Ako je F(x) poznat do parametara, na primjer, poznato je da je F(x) - normalna funkcija distribucije, tada su razvijena i pravila za testiranje hipoteze koja se razmatra.

Međutim, često oblik funkcije distribucije rezultata promatranja nije poznat apsolutno točno i ne do točnosti parametara, već samo s određenom pogreškom. Tada relacija (2) postaje praktički beskorisna, budući da mala pogreška u određivanju F(x), kao što se može pokazati, dovodi do velike pogreške u određivanju kritične vrijednosti d iz uvjeta (2), a za fiksni d razina značaj kriterija može značajno odstupati od nominalnog .

Stoga, u situaciji u kojoj nema potpunih informacija o F(x), ali su poznati matematičko očekivanje M(X) i varijanca y2 = D(X) rezultata promatranja X1, X2, Xn, neparametrijska pravila odbijanja temeljena na Čebiševljevoj nejednakosti može se koristiti. Koristeći ovu nejednakost, nalazimo kritičnu vrijednost d = d(b,n) tako da je

tada će relacija (3) biti zadovoljena ako

Čebiševljevom nejednakošću

dakle, da bi (4) bilo zadovoljeno dovoljno je izjednačiti desne strane formula (4) i (5), tj. odredi d iz uvjeta

Pravilo odbijanja, temeljeno na kritičnoj vrijednosti d izračunatoj pomoću formule (6), koristi minimalne informacije o funkciji distribucije F(x) i stoga isključuje samo rezultate promatranja koji su jako udaljeni od mase. Drugim riječima, vrijednost d1 dana relacijom (1) obično je puno manja od vrijednosti d2 dane relacijom (6).

2.4 Multivarijantna statistička analiza

Multivarijantna statistička analiza koristi se za rješavanje sljedećih problema:

* proučavanje ovisnosti između znakova;

* klasifikacija objekata ili značajki specificiranih vektorima;

* smanjenje dimenzije prostora značajke.

U ovom slučaju, rezultat opažanja je vektor vrijednosti fiksnog broja kvantitativnih, a ponekad i kvalitativnih karakteristika izmjerenih u objektu. Kvantitativno obilježje je obilježje mjerne jedinice koje se može izravno izraziti brojem i mjernom jedinicom. Kvantitativnom obilježju suprotstavlja se kvalitativno obilježje - obilježje promatrane jedinice, određeno svrstavanjem u jednu od dvije ili više uvjetnih kategorija (ako postoje točno dvije kategorije, tada se obilježje naziva alternativno). Statistička analiza kvalitativnih karakteristika dio je statistike objekata nenumeričke prirode. Kvantitativna obilježja dijele se na obilježja mjerena na ljestvicama intervala, omjera, razlika i apsoluta.

I one kvalitativne - za karakteristike mjerene na ljestvici imena i ordinalnoj ljestvici. Metode obrade podataka moraju biti u skladu s ljestvicama u kojima se mjere predmetne karakteristike.

Ciljevi proučavanja ovisnosti između obilježja su dokazati postojanje veze između obilježja i proučavati tu povezanost. Za dokazivanje postojanja veze između dviju slučajnih varijabli X i Y koristi se korelacijska analiza. Ako je zajednička raspodjela X i Y normalna, tada se statistički zaključci temelje na koeficijentu linearne korelacije uzorka, u ostalim slučajevima koriste se koeficijenti korelacije ranga Kendall i Spearman, a za kvalitativne karakteristike koristi se hi-kvadrat test.

Regresijskom analizom proučava se funkcionalna ovisnost kvantitativnog svojstva Y o kvantitativnim svojstvima x(1), x(2), ..., x(k). Ta se ovisnost naziva regresija ili kraće regresija. Najjednostavniji probabilistički model regresijske analize (u slučaju k = 1) koristi kao početnu informaciju skup parova rezultata opažanja (xi, yi), i = 1, 2, … , n, i ima oblik

yi = axi + b + ei, i = 1, 2, …, n,

gdje su ei pogreške opažanja. Ponekad se pretpostavlja da su ei nezavisne slučajne varijable s istom normalnom distribucijom N(0, y2). Budući da se distribucija pogrešaka opažanja obično razlikuje od normalne, preporučljivo je razmotriti regresijski model u neparametarskoj formulaciji, tj. s proizvoljnom raspodjelom ei.

Glavni zadatak regresijske analize je procjena nepoznatih parametara a i b, koji definiraju linearnu ovisnost y o x. Za rješavanje ovog problema koristi se metoda najmanjih kvadrata koju je razvio K. Gauss 1794. godine, tj. pronaći procjene nepoznatih parametara modela a i b iz uvjeta minimiziranja zbroja kvadrata

po varijablama a i b.

Analiza varijance koristi se za proučavanje utjecaja kvalitativnih karakteristika na kvantitativnu varijablu. Na primjer, neka postoji k uzoraka rezultata mjerenja kvantitativni pokazatelj kvaliteta jedinica proizvoda proizvedenih na k strojeva, tj. skup brojeva (x1(j), x2(j), …, xn(j)), gdje je j broj stroja, j = 1, 2, …, k, a n je veličina uzorka. U uobičajenoj formulaciji analize varijance, pretpostavlja se da su rezultati mjerenja neovisni i da u svakom uzorku imaju normalnu distribuciju N(m(j), y2) s istom varijancom.

Provjera ujednačenosti kvalitete proizvoda, tj. nepostojanje utjecaja broja stroja na kvalitetu proizvoda, svodi se na provjeru hipoteze

H0: m(1) = m(2) = … = m(k).

Analiza varijance je razvila metode za testiranje takvih hipoteza.

Hipoteza H0 se testira u odnosu na alternativnu hipotezu H1, prema kojoj barem jedna od navedenih jednakosti nije zadovoljena. Test ove hipoteze temelji se na sljedećoj "dekompoziciji varijance" koju je naveo R. A. Fisher:

gdje je s2 varijanca uzorka u skupnom uzorku, tj.

Dakle, prvi član na desnoj strani formule (7) odražava disperziju unutar grupe. Konačno, postoji međugrupna varijanca,

Područje primijenjene statistike povezano s proširenjima varijance poput formule (7) naziva se analiza varijance. Kao primjer analize problema varijance, razmotrite testiranje gornje hipoteze H0 pod pretpostavkom da su rezultati mjerenja neovisni i da u svakom uzorku imaju normalnu distribuciju N(m(j), y2) s istom varijancom. Ako je H0 točno, prvi član na desnoj strani formule (7), podijeljen s y2, ima hi-kvadrat distribuciju s k(n-1) stupnjeva slobode, a drugi član, podijeljen s y2, također ima hi-kvadrat distribucija, ali s (k-1) stupnjevima slobode, pri čemu su prvi i drugi član neovisni kao slučajne varijable. Stoga slučajna varijabla

ima Fisherovu distribuciju s (k-1) brojnicima stupnjeva slobode i k(n-1) nazivnicima stupnjeva slobode. Hipoteza H0 je prihvaćena ako je F< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

Razvijene su neparametrijske metode za rješavanje klasičnih problema analize varijance, posebice za testiranje hipoteze H0.

Sljedeći tip problema multivarijatne statističke analize su problemi klasifikacije. U osnovi se dijele na tri različite vrste- diskriminantna analiza, klaster analiza, problemi grupiranja.

Zadatak diskriminativne analize je pronaći pravilo za svrstavanje promatranog objekta u jednu od prethodno opisanih klasa. U ovom slučaju, objekti su opisani u matematičkom modelu pomoću vektora, čije su koordinate rezultat promatranja niza značajki u svakom objektu. Nastava se opisuje ili izravno matematičkim terminima ili korištenjem uzoraka obuke. Skup za obuku je uzorak za svaki element za koji je naznačeno kojoj klasi pripada.

...

Slični dokumenti

    Povijest ekonometrije i primijenjene statistike. Primijenjena statistika u nacionalno gospodarstvo. Točke rasta. Neparametarska statistika. Statistika objekata nenumeričke prirode dio je primijenjene statistike.

    sažetak, dodan 01.08.2009

    Strukturne komponente determinističke komponente. Glavna svrha statističke analize vremenskih serija. Ekstrapolacijsko predviđanje ekonomskih procesa. Identifikacija anomalnih opažanja, kao i konstrukcija modela vremenskih serija.

    kolegij, dodan 03/11/2014

    Statistički modeli odlučivanja. Opis modela s poznatom distribucijom vjerojatnosti stanja okoliša. Obzir najjednostavnija shema dinamički proces donošenja odluka. Provođenje proračuna vjerojatnosti modifikacije poduzeća.

    test, dodan 07.11.2011

    Statističke metode za analizu jednodimenzionalnih vremenskih nizova, rješavanje problema analize i predviđanja, crtanje grafa promatranog pokazatelja. Kriteriji za identifikaciju komponenti serije, testiranje hipoteze o slučajnosti serije i vrijednosti standardnih pogrešaka.

    test, dodan 13.08.2010

    Uloga statističkih metoda u objektivnoj procjeni kvantitativnih i kvalitativnih karakteristika procesa upravljanja. Korištenje alata kvalitete u analizi procesa i parametara proizvoda. Diskretne slučajne varijable. Teorija vjerojatnosti.

    kolegij, dodan 01.11.2015

    Matematička teorija optimalno donošenje odluka. Tabularna simpleks metoda. Formulacija i rješenje problema dualnog linearnog programiranja. Matematički model transportni problem. Analiza izvedivosti proizvodnje u poduzeću.

    test, dodan 13.06.2012

    Opća, ogledna populacija. Metodološke osnove probabilističko-statistička analiza. MathCad funkcije dizajnirane za rješavanje problema matematičke statistike. Rješavanje zadataka u MS Excelu korištenjem formula i korištenjem izbornika "Analiza podataka".

    kolegij, dodan 20.01.2014

    Obračun visine troškova za plan proizvodnje. Koeficijenti linearne jednadžbe uparene regresije. Karakteristike grafičke interpretacije rezultata. Razvoj gospodarskih procesa. Značajke ekonometrijskog modeliranja vremenskih serija.

    test, dodan 22.02.2011

    Osnovni elementi ekonometrijske analize vremenskih serija. Zadaci analize i njihova početna obrada. Rješavanje problema kratkoročnog i srednjoročnog predviđanja vrijednosti vremenskih serija. Metode za pronalaženje parametara jednadžbe trenda. Metoda najmanjeg kvadrata.

    test, dodan 03.06.2009

    Elementarni pojmovi o slučajnim događajima, veličinama i funkcijama. Numeričke karakteristike slučajnih varijabli. Vrste distribucijske asimetrije. Statistička procjena distribucije slučajnih varijabli. Rješavanje problema strukturno-parametarske identifikacije.

Kako se pristupi, ideje i rezultati teorije vjerojatnosti i matematičke statistike koriste u donošenju odluka?

Osnova je probabilistički model stvarne pojave ili procesa, tj. matematički model u kojem su objektivni odnosi izraženi u terminima teorije vjerojatnosti. Vjerojatnosti se prvenstveno koriste za opisivanje neizvjesnosti koje se moraju uzeti u obzir pri donošenju odluka. To se odnosi kako na nepoželjne prilike (rizike), tako i na one privlačne („sretna prilika”). Ponekad se slučajnost namjerno uvodi u situaciju, na primjer, prilikom izvlačenja ždrijeba, nasumičnog odabira jedinica za kontrolu, provođenja lutrije ili anketiranja potrošača.

Teorija vjerojatnosti dopušta korištenje jedne vjerojatnosti za izračun drugih od interesa za istraživača. Na primjer, koristeći vjerojatnost dobivanja grba, možete izračunati vjerojatnost da ćete u 10 bacanja novčića dobiti najmanje 3 grba. Takav se izračun temelji na probabilističkom modelu, prema kojem su bacanja novčića opisana uzorkom neovisnih pokušaja; osim toga, grb i hash su jednako mogući, pa je stoga vjerojatnost svakog od ovih događaja jednaka do ½. Složeniji model je onaj koji razmatra provjeru kvalitete jedinice proizvodnje umjesto bacanja novčića. Odgovarajući probabilistički model temelji se na pretpostavci da je kontrola kvalitete različitih jedinica proizvodnje opisana nezavisnom shemom testiranja. Za razliku od modela bacanja novčića, potrebno je uvesti novi parametar - vjerojatnost p da je jedinica proizvodnje neispravna. Model će biti u potpunosti opisan ako pretpostavimo da sve proizvodne jedinice imaju istu vjerojatnost da budu neispravne. Ako je posljednja pretpostavka netočna, tada se broj parametara modela povećava. Na primjer, možete pretpostaviti da svaka jedinica proizvodnje ima vlastitu vjerojatnost da će biti neispravna.

Raspravljajmo o modelu kontrole kvalitete s vjerojatnošću neispravnosti p zajedničkom za sve jedinice proizvodnje. Da bi se “došlo do brojke” pri analizi modela potrebno je p zamijeniti nekom specifičnom vrijednošću. Da bi se to postiglo, potrebno je izaći iz okvira probabilističkog modela i okrenuti se podacima dobivenim tijekom kontrole kvalitete.

Matematička statistika rješava obrnuti problem u odnosu na teoriju vjerojatnosti. Cilj mu je na temelju rezultata opažanja (mjerenja, analiza, testova, eksperimenata) doći do zaključaka o vjerojatnostima na kojima se temelji probabilistički model. Na primjer, na temelju učestalosti pojavljivanja neispravnih proizvoda tijekom pregleda, mogu se izvući zaključci o vjerojatnosti neispravnosti (vidi Bernoullijev teorem gore).

Na temelju Chebyshevljeve nejednakosti izvedeni su zaključci o podudarnosti učestalosti pojavljivanja neispravnih proizvoda s hipotezom da vjerojatnost neispravnosti ima određenu vrijednost.

Dakle, primjena matematičke statistike temelji se na vjerojatnosnom modelu neke pojave ili procesa. Koriste se dva paralelna niza pojmova - oni koji se odnose na teoriju (probabilistički model) i oni koji se odnose na praksu (uzorkovanje rezultata promatranja). Na primjer, teorijska vjerojatnost odgovara učestalosti dobivenoj iz uzorka. Matematičko očekivanje (teorijska serija) odgovara aritmetičkoj sredini uzorka (praktična serija). Karakteristike uzorka u pravilu su procjene teoretskih. Istovremeno, količine vezane uz teorijski niz “nalaze se u glavama istraživača”, odnose se na svijet ideja (prema starogrčkom filozofu Platonu) i nisu dostupne za izravno mjerenje. Istraživači imaju samo ogledne podatke s kojima pokušavaju utvrditi svojstva teorijskog probabilističkog modela koji ih zanimaju.

Zašto nam je potreban probabilistički model? Činjenica je da se samo uz njegovu pomoć svojstva utvrđena analizom određenog uzorka mogu prenijeti na druge uzorke, kao i na cjelokupnu tzv. opću populaciju. Izraz "populacija" koristi se kada se govori o velikoj, ali ograničenoj zbirci jedinica koje se proučavaju. Na primjer, o ukupnosti svih stanovnika Rusije ili ukupnosti svih potrošača instant kave u Moskvi. Cilj marketinških ili socioloških istraživanja je prijenos izjava dobivenih na uzorku od stotina ili tisuća ljudi na populacije od nekoliko milijuna ljudi. U kontroli kvalitete, serija proizvoda djeluje kao opća populacija.

Za prijenos zaključaka iz uzorka na veću populaciju potrebne su neke pretpostavke o odnosu karakteristika uzorka sa karakteristikama ove veće populacije. Ove pretpostavke temelje se na odgovarajućem probabilističkom modelu.

Naravno, moguće je obraditi uzorke podataka bez korištenja jednog ili drugog probabilističkog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, brojati učestalost ispunjavanja određenih uvjeta itd. Međutim, rezultati izračuna odnosit će se samo na određeni uzorak; prijenos zaključaka dobivenih uz njihovu pomoć na bilo koju drugu populaciju je netočan. Ova se aktivnost ponekad naziva "analiza podataka". U usporedbi s probabilističko-statističkim metodama, analiza podataka ima ograničenu obrazovnu vrijednost.

Dakle, primjena probabilističkih modela temeljenih na procjeni i testiranju hipoteza korištenjem karakteristika uzorka bit je probabilističko-statističkih metoda odlučivanja.

Naglašavamo da logika korištenja karakteristika uzorka za donošenje odluka temeljenih na teorijskim modelima uključuje istovremenu upotrebu dva paralelna niza koncepata, od kojih jedan odgovara probabilističkim modelima, a drugi podacima uzorka. Nažalost, u brojnim literaturnim izvorima, najčešće zastarjelim ili pisanim recepturama, ne pravi se razlika između uzorka i teorijskih karakteristika, što čitatelje dovodi u zabunu i pogreške u praktičnoj uporabi statističkih metoda.

Metode za donošenje odluka u uvjetima rizika također su razvijene i opravdane u okviru tzv. teorije statističkih odluka. Statistička teorija odlučivanja je teorija provođenja statistička opažanja, obrađivanje tih zapažanja i njihovo korištenje. Kao što je poznato, zadatak ekonomskog istraživanja je razumjeti prirodu ekonomskog objekta i otkriti mehanizam odnosa između njegovih najvažnijih varijabli. Ovo nam razumijevanje omogućuje razvoj i implementaciju potrebne mjere za upravljanje ovim objektom, odn ekonomska politika. Da bismo to učinili, potrebne su nam metode primjerene zadatku koje uzimaju u obzir prirodu i specifičnost ekonomskih podataka koji služe kao temelj za kvalitativne i kvantitativne izjave o ekonomskom objektu ili pojavi koja se proučava.

Svaki ekonomski podatak predstavlja kvantitativne karakteristike bilo kojeg ekonomskog objekta. Nastaju pod utjecajem mnogih čimbenika, od kojih nisu svi dostupni vanjskoj kontroli. Čimbenici koji se ne mogu kontrolirati mogu preuzeti slučajne vrijednosti iz nekog skupa vrijednosti i time uzrokovati da podaci koje definiraju budu slučajni. Stohastička priroda ekonomskih podataka zahtijeva korištenje njima primjerenih posebnih statističkih metoda za njihovu analizu i obradu.

Kvantitativna procjena rizika poslovanja, neovisno o sadržaju konkretnog zadatka, moguća je u pravilu metodama matematičke statistike. Glavni alati ove metode procjene su disperzija, standardna devijacija i koeficijent varijacije.

Tipični dizajni koji se temelje na mjerama varijabilnosti ili vjerojatnosti uvjeta rizika naširoko se koriste u primjenama. Tako se financijski rizici uzrokovani fluktuacijama rezultata oko očekivane vrijednosti, primjerice učinkovitosti, procjenjuju pomoću disperzije ili očekivanog apsolutnog odstupanja od prosjeka. U problemima upravljanja kapitalom, uobičajena mjera stupnja rizika je vjerojatnost gubitaka ili gubitka prihoda u usporedbi s predviđenom opcijom.

Kako bismo procijenili veličinu rizika (stupanj rizika), usredotočit ćemo se na sljedeće kriterije:

  • 1) prosječna očekivana vrijednost;
  • 2) fluktuacija (varijabilnost) mogućeg rezultata.

Za statističko uzorkovanje

Gdje Xj - očekivana vrijednost za svaki slučaj promatranja (/" = 1, 2,...), l, - broj slučajeva promatranja (učestalost) vrijednost l:, x=E - prosječna očekivana vrijednost, st - varijanca,

V - koeficijent varijacije, imamo:

Razmotrimo problem procjene rizika po poslovnim ugovorima. Interproduct doo odlučuje sklopiti ugovor o nabavi prehrambenih proizvoda iz jedne od tri baze. Nakon prikupljenih podataka o uvjetima plaćanja robe po ovim bazama (tablica 6.7), potrebno je, nakon procjene rizika, prilikom sklapanja ugovora o nabavi proizvoda odabrati bazu koja robu plaća u što kraćem roku. .

Tablica 6.7

Rokovi plaćanja u danima

Broj promatranih slučajeva P

HP

(x-x)

(x-x ) 2

(x-x) 2 str

Za prvu bazu, na temelju formula (6.4.1):

Za drugu bazu

Za treću bazu

Koeficijent varijacije za prvu bazu je najmanji, što ukazuje na uputnost sklapanja ugovora o nabavi proizvoda s ovom bazom.

Razmotreni primjeri pokazuju da rizik ima matematički izraženu vjerojatnost gubitka, koja se temelji na statističkim podacima i može se izračunati s prilično visokim stupnjem točnosti. Pri odabiru najprihvatljivijeg rješenja korišteno je pravilo optimalne vjerojatnosti rezultata koje se sastoji u tome da se među mogućim rješenjima izabere ono pri kojem je vjerojatnost rezultata prihvatljiva za poduzetnika.

U praksi se primjena pravila optimalne vjerojatnosti rezultata obično kombinira s pravilom optimalne varijabilnosti rezultata.

Kao što je poznato, varijabilnost pokazatelja izražava se njihovom disperzijom, standardnom devijacijom i koeficijentom varijacije. Bit pravila optimalne fluktuacije rezultata je da se od mogućih rješenja odabere ono u kojem vjerojatnosti dobitka i gubitka za isto rizično ulaganje kapitala imaju mali jaz, tj. najmanji iznos varijance, standardna devijacija varijacije. U razmatranim problemima izbor optimalnih rješenja izvršen je korištenjem ova dva pravila.

ovisno o vrsti podatka “na ulazu”:

2.1. Brojke.

2.2. Konačnodimenzionalni vektori.

2.3. Funkcije (vremenske serije).

2.4. Objekti nenumeričke prirode.

Najzanimljivija klasifikacija temelji se na onim problemima kontrolinga za koje se koriste ekonometrijske metode. Ovim pristupom blokovi se mogu dodijeliti:

3.1. Podrška predviđanju i planiranju.

3.2. Praćenje kontrolirani parametri i otkrivanje anomalija.

3.3. podrška odlučivanje, i tako dalje.

Koji čimbenici određuju učestalost korištenja pojedinih alata ekonometrijskog kontrolinga? Kao i kod drugih primjena ekonometrije, postoje dvije glavne skupine čimbenika - zadaci koji se rješavaju i kvalifikacije stručnjaka.

Na praktična aplikacija ekonometrijskih metoda u radu regulatora potrebno je primijeniti odgovarajuće programski sustavi. Opći statistički sustavi poput SPSS, Statgraphics, Statistica, ADDA, i više specijaliziranih Statcon, SPC, NADIS, REST(prema statistici podataka intervala), Matrixer i mnogi drugi. Masovno uvođenje jednostavnog za korištenje softverski proizvodi, uključujući suvremene ekonometrijske alate za analizu specifičnih ekonomskih podataka, može se smatrati jednim od učinkovite načine ubrzanje znanstveni i tehnološki napredak, širenje suvremenih ekonometrijskih znanja.

Ekonometrija se stalno razvija. Primijenjena istraživanja dovode do potrebe za dubljom analizom klasičnih metoda.

Dobar primjer za raspravu su metode za ispitivanje homogenosti dva uzorka. Postoje dva agregata, a mi moramo odlučiti jesu li različiti ili isti. Da bi se to postiglo, iz svakog od njih uzima se uzorak i koristi se jedna ili druga statistička metoda za provjeru homogenosti. Prije otprilike 100 godina predložena je Studentova metoda koja se i danas široko koristi. Međutim, ima čitavu hrpu nedostataka. Prvo, prema Studentu, distribucije elemenata uzorka moraju biti normalne (Gaussove). U pravilu to nije tako. Drugo, nije usmjerena na provjeru homogenosti općenito (tzv. apsolutna homogenost, tj. podudarnost funkcija distribucije koje odgovaraju dvjema populacijama), već samo na provjeru jednakosti matematičkih očekivanja. No, treće, nužno je pretpostaviti da se varijance za elemente dvaju uzoraka podudaraju. Međutim, provjera jednakosti varijanci, a posebno normalnosti, puno je teža od jednakosti matematičkih očekivanja. Stoga se Studentov t test obično koristi bez provođenja takvih provjera. I onda zaključci temeljeni na Studentovom kriteriju vise u zraku.

Teorijski napredniji stručnjaci okreću se drugim kriterijima, na primjer, Wilcoxonovom testu. Neparametarski je, tj. ne oslanja se na pretpostavku normalnosti. Ali nije bez nedostataka. Ne može se koristiti za provjeru apsolutne homogenosti (podudarnosti funkcija distribucije koje odgovaraju dvjema populacijama). To se može učiniti samo pomoću tzv. dosljedni kriteriji, posebno Smirnovljevi kriteriji i tip omega-kvadrata.

S praktičnog gledišta, Smirnovljev kriterij ima nedostatak - njegova statistika ima samo mali broj vrijednosti, distribucija mu je koncentrirana u malom broju točaka i nije moguće koristiti tradicionalne razine značajnosti od 0,05 i 0,01. .

Pojam "visoke statističke tehnologije". U pojmu “visoke statističke tehnologije” svaka od tri riječi ima svoje značenje.

“Visoka”, kao iu drugim područjima, znači da se tehnologija temelji na suvremenim dostignućima teorije i prakse, posebice teorije vjerojatnosti i primijenjene matematičke statistike. Istodobno, "temeljeno na suvremenim znanstvenim dostignućima" znači, prvo, da je matematička osnova tehnologije u okviru relevantne znanstvene discipline dobivena relativno nedavno, i drugo, da su algoritmi proračuna razvijeni i opravdani u skladu s to (i nisu tzv. "heuristički"). S vremenom, ako novi pristupi i rezultati ne natjeraju na preispitivanje procjene primjenjivosti i mogućnosti tehnologije ili njezinu zamjenu suvremenijom, “visoka ekonometrijska tehnologija” prelazi u “klasičnu statističku tehnologiju”. Kao npr metoda najmanjih kvadrata. Dakle, visoke statističke tehnologije plod su nedavnih ozbiljnih znanstveno istraživanje. Ovdje su dvije ključni koncepti- “mladost” tehnologije (u svakom slučaju ne starija od 50 godina, a bolje ne starija od 10 ili 30 godina) i oslanjanje na “visoku znanost”.

Izraz "statistički" je poznat, ali ima mnogo nijansi. Postoji više od 200 definicija pojma "statistika".

Konačno, pojam “tehnologija” se relativno rijetko koristi u odnosu na statistiku. Analiza podataka obično uključuje niz postupaka i algoritama koji se izvode uzastopno, paralelno ili na složeniji način. Konkretno, mogu se razlikovati sljedeće tipične faze:

  • planiranje statističke studije;
  • organiziranje prikupljanja podataka prema optimalnom ili barem racionalnom programu (planiranje uzorkovanja, kreiranje organizacijska struktura te odabir tima stručnjaka, obuka osoblja koje će prikupljati podatke, kao i voditelja obrade podataka itd.);
  • neposredno prikupljanje podataka i njihovo bilježenje na određene medije (uz kontrolu kvalitete prikupljanja i odbacivanje pogrešnih podataka iz razloga predmetnog područja);
  • primarni opis podataka (izračun različitih karakteristika uzorka, funkcija distribucije, neparametarske procjene gustoće, izrada histograma, korelacijskih polja, raznih tablica i dijagrama itd.),
  • procjena određenih numeričkih ili nenumeričkih karakteristika i parametara distribucija (primjerice, neparametarska intervalna procjena koeficijenta varijacije ili ponovno uspostavljanje odnosa između odziva i faktora, tj. procjena funkcije),
  • testiranje statističkih hipoteza (ponekad njihovih lanaca - nakon testiranja prethodne hipoteze, donosi se odluka o testiranju jedne ili druge sljedeće hipoteze),
  • dublje proučavanje, tj. primjena različitih algoritama za multivarijantnu statističku analizu, dijagnostičkih i klasifikacijskih algoritama, statistika nenumeričkih i intervalnih podataka, analiza vremenskih serija itd.;
  • provjera stabilnosti dobivenih procjena i zaključaka o dopuštenim odstupanjima početnih podataka i premisa korištenih vjerojatnosno-statističkih modela, dopuštene transformacije mjernih ljestvica, posebice proučavanje svojstava procjena metodom množenja uzoraka ;
  • primjena dobivenih statističkih rezultata u primijenjene svrhe (npr. za dijagnosticiranje određenih materijala, izradu prognoza, odabir investicijski projekt od predloženih opcija, pronalaženje optimalnog načina za provedbu tehnološkog procesa, zbrajanje rezultata ispitivanja uzoraka tehnički uređaji i tako dalje.),
  • izrada završnih izvješća, posebno namijenjenih onima koji nisu stručnjaci za ekonometrijske i statističke metode analize podataka, uključujući i menadžment – ​​“donositelje odluka”.

Moguće je i drugačije strukturiranje statističkih tehnologija. Važno je naglasiti da kvalificirana i učinkovita uporaba statističkih metoda nipošto nije testiranje jedne pojedinačne statističke hipoteze ili procjena parametara jedne dane distribucije iz fiksne obitelji. Ovakav operacije su samo građevni blokovi statističke tehnologije. S druge strane, udžbenici i monografije statistike i ekonometrije obično govore o pojedinačnim gradivnim blokovima, ali ne raspravljaju o problemima njihovog organiziranja u tehnologiju namijenjenu primijenjenoj uporabi. Prijelaz s jednog statističkog postupka na drugi ostaje u sjeni.

Problem "spajanja" statističkih algoritama zahtijeva posebno razmatranje, jer se kao rezultat korištenja prethodnog algoritma često krše uvjeti primjenjivosti sljedećeg. Konkretno, rezultati promatranja mogu prestati biti neovisni, njihova distribucija se može promijeniti itd.

Na primjer, kada se testiraju statističke hipoteze, razina značajnosti i snaga su od velike važnosti. Metode za njihovo izračunavanje i njihovo korištenje za testiranje jedne hipoteze obično su dobro poznate. Ako se najprije testira jedna hipoteza, a zatim, uzimajući u obzir rezultate njezina testiranja, druga, tada konačni postupak, koji se može smatrati i testiranjem neke (složenije) statističke hipoteze, ima karakteristike (razinu značajnosti i moć) koje se u pravilu ne mogu jednostavno izraziti u smislu karakteristika dvokomponentnih hipoteza, pa su stoga obično nepoznate. Zbog toga se konačni postupak ne može smatrati znanstveno utemeljenim, već se odnosi na heurističke algoritme. Naravno, nakon odgovarajućeg proučavanja, primjerice, metodom Monte Carlo, to može postati jedan od znanstveno utemeljenih postupaka primijenjene statistike.

Dakle, postupak ekonometrijske ili statističke analize podataka je informacija tehnološki proces , drugim riječima, jedna ili druga informacijska tehnologija. U ovom trenutku bilo bi neozbiljno govoriti o automatizaciji cjelokupnog procesa ekonometrijske (statističke) analize podataka, jer postoji previše neriješenih problema koji izazivaju rasprave među stručnjacima.

Cijeli arsenal trenutno korištenih statističkih metoda može se podijeliti u tri toka:

  • visoke statističke tehnologije;
  • klasične statističke tehnologije,
  • niske statističke tehnologije.

Potrebno je osigurati da se u određenim studijama koriste samo prve dvije vrste tehnologija. Pritom pod klasičnim statističkim tehnologijama podrazumijevamo tehnologije časne starosti koje su zadržale svoju znanstvenu vrijednost i značaj za suvremenu statističku praksu. Ovi su metoda najmanjih kvadrata, Kolmogorova, Smirnovljeva statistika, omega kvadrat, neparametarski Spearmanov i Kendallov koeficijent korelacije i mnogi drugi.

Imamo red veličine manje ekonometričara nego u SAD-u i Velikoj Britaniji (American Statistical Association ima više od 20.000 članova). Rusiji je potrebna obuka novih stručnjaka - ekonometričara.

Do kakvih god novih znanstvenih rezultata došlo, ako oni ostanu nepoznati studentima, nova generacija istraživača i inženjera prisiljena je njima ovladati, djelujući sama, ili ih čak ponovno otkriti. Ugrubo rečeno, možemo reći sljedeće: oni pristupi, ideje, rezultati, činjenice, algoritmi koji su bili uključeni u tečajeve i odgovarajuće nastavna sredstva- čuvaju i koriste potomci, oni koji nisu uključeni nestaju u prahu knjižnica.

Točke rasta. Ima ih pet trenutni trendovi, u kojem se razvija moderna primijenjena statistika, t.j. pet “točaka rasta”: neparametrija, robusnost, bootstrap, intervalna statistika, statistika objekata nenumeričke prirode. Ukratko raspravimo ove trenutne trendove.

Neparametrija ili neparametrijska statistika omogućuje vam izvlačenje statističkih zaključaka, procjenu karakteristika distribucije i testiranje statističkih hipoteza bez slabo potkrijepljenih pretpostavki da je funkcija distribucije elemenata uzorka dio određene parametarske obitelji. Na primjer, rašireno je uvjerenje da statistika često slijedi normalnu distribuciju. Međutim, analiza specifičnih rezultata opažanja, posebice pogrešaka mjerenja, pokazuje da se u velikoj većini slučajeva stvarne distribucije značajno razlikuju od normalnih. Nekritičko korištenje hipoteze normalnosti često dovodi do značajnih pogrešaka, na primjer, kada se odbacuju outlieri, tijekom statističke kontrole kvalitete iu drugim slučajevima. Stoga je preporučljivo koristiti neparametarske metode u kojima se na funkcije distribucije rezultata promatranja postavljaju samo vrlo slabi zahtjevi. Obično se pretpostavlja samo njihov kontinuitet. Do danas je korištenjem neparametarskih metoda moguće riješiti gotovo isti raspon problema koji su prethodno rješavani parametrijskim metodama.

Glavna ideja rada na robusnosti (stabilnosti): zaključci bi se trebali malo mijenjati s malim promjenama u početnim podacima i odstupanjima od pretpostavki modela. Ovdje postoje dvije skupine zadataka. Jedan je proučavanje robusnosti uobičajenih algoritama za rudarenje podataka. Drugi je potraga za robusnim algoritmima za rješavanje određenih problema.

Sam pojam „robustnost” nema jasno značenje. Uvijek je potrebno specificirati određeni probabilističko-statistički model. Međutim, Tukey-Huber-Hampelov model "začepljenja" obično nije praktično koristan. Usmjeren je na “vaganje repova”, au stvarnim situacijama “repovi su odsječeni” apriornim ograničenjima rezultata promatranja povezanih, primjerice, s korištenim mjernim instrumentima.

Bootstrap je grana neparametarske statistike koja se oslanja na intenzivnu upotrebu informacijske tehnologije. Glavna ideja je "množenje uzoraka", tj. u dobivanju skupa mnogih uzoraka nalik onome dobivenom u eksperimentu. Pomoću ovog skupa mogu se procijeniti svojstva različitih statističkih postupaka. Najjednostavniji način"množenje uzorka" sastoji se od isključivanja jednog rezultata promatranja iz njega. Isključimo prvo promatranje, dobivamo uzorak sličan izvornom, ali s veličinom smanjenom za 1. Zatim vraćamo isključeni rezultat prvog promatranja, ali isključujemo drugo promatranje. Dobivamo drugi uzorak, sličan originalnom. Zatim vraćamo rezultat drugog promatranja, i tako dalje. Postoje i drugi načini "reprodukcije uzoraka". Na primjer, možete koristiti izvorni uzorak za konstruiranje jedne ili druge procjene distribucijske funkcije, a zatim koristiti statističke testove za simulaciju niza uzoraka iz elemenata u primijenjenoj statistici to je uzorak, tj. skup nezavisnih identično raspoređenih slučajnih elemenata. Koja je priroda ovih elemenata? U klasičnoj matematičkoj statistici elementi uzorka su brojevi ili vektori. A u nenumeričkoj statistici, elementi uzorka su objekti nenumeričke prirode koji se ne mogu zbrajati i množiti brojevima. Drugim riječima, objekti nenumeričke prirode leže u prostorima koji nemaju vektorsku strukturu.