روش های تصمیم گیری آماری. مدل های تصمیم گیری احتمالی و آماری II برنامه ریزی موضوعی

2. توصیف عدم قطعیت در تئوری تصمیم گیری

2.2. روش‌های آماری احتمالی برای توصیف عدم قطعیت‌ها در نظریه تصمیم‌گیری

2.2.1. نظریه احتمال و آمار ریاضی در تصمیم گیری

چگونه از آمار احتمالات و ریاضی استفاده می شود؟این رشته ها اساس احتمالات هستند روش های آماریتصمیم گیری. برای استفاده از دستگاه ریاضی آنها باید مسائل تصمیم گیری را بر اساس مدل های احتمالی-آماری بیان کرد. بکارگیری یک روش خاص تصمیم گیری احتمالی-آماری شامل سه مرحله است:

گذار از واقعیت اقتصادی، مدیریتی، فناوری به یک طرح انتزاعی ریاضی و آماری، یعنی. ساخت یک مدل احتمالی از یک سیستم کنترل، یک فرآیند تکنولوژیکی، یک روش تصمیم گیری، به ویژه بر اساس نتایج کنترل آماری و غیره.

انجام محاسبات و به دست آوردن نتیجه‌گیری با ابزارهای کاملاً ریاضی در چارچوب یک مدل احتمالی.

تفسیر نتایج ریاضی و آماری در رابطه با وضعیت واقعی و اتخاذ تصمیم مناسب (مثلاً در مورد انطباق یا عدم انطباق کیفیت محصول با الزامات تعیین شده، نیاز به تنظیم فرآیند فناوری و غیره)، به ویژه، نتیجه گیری (در مورد نسبت واحدهای معیوب محصولات در یک دسته، در مورد شکل خاصی از قوانین توزیع پارامترهای کنترل شده فرآیند فن آوری و غیره).

آمار ریاضی از مفاهیم، ​​روش ها و نتایج نظریه احتمال استفاده می کند. بیایید مسائل اصلی ساخت مدل های تصمیم گیری احتمالی را در موقعیت های اقتصادی، مدیریتی، فناوری و غیره در نظر بگیریم. برای استفاده فعال و صحیح از اسناد هنجاری-فنی و آموزنده- روشی در مورد روش های احتمالی-آماری تصمیم گیری، به دانش اولیه نیاز است. بنابراین، لازم است بدانیم که در چه شرایطی باید از یک سند استفاده شود، چه اطلاعات اولیه ای برای انتخاب و کاربرد آن لازم است، چه تصمیماتی باید بر اساس نتایج پردازش داده ها اتخاذ شود و غیره.

نمونه های کاربردی نظریه احتمال و آمار ریاضی.اجازه دهید چندین مثال را در نظر بگیریم که مدل‌های آماری-احتمالی ابزار مناسبی برای حل مشکلات مدیریتی، صنعتی، اقتصادی و اقتصادی ملی هستند. بنابراین، به عنوان مثال، در رمان A.N. تولستوی "راه رفتن در عذاب ها" (جلد 1) می گوید: "کارگاه بیست و سه درصد ازدواج را می دهد، شما این رقم را نگه دارید."

این سوال پیش می آید که چگونه می توان این سخنان را در گفتگوی مدیران کارخانه فهمید، چرا که یک واحد تولیدی نمی تواند 23 درصد معیوب باشد. می تواند خوب یا معیوب باشد. شاید منظور استروکوف این بود که یک دسته بزرگ تقریباً 23 درصد از واحدهای معیوب را شامل می شود. سپس این سوال پیش می آید که «درباره» به چه معناست؟ بگذارید 30 واحد از 100 واحد آزمایش شده محصول معیوب باشد یا از 1000 - 300 یا از 100000 - 30000 و غیره، آیا استروکوف باید متهم به دروغگویی شود؟

یا مثال دیگری. سکه ای که زیاد استفاده می شود باید «متقارن» باشد، یعنی. هنگامی که پرتاب می شود، به طور متوسط، در نیمی از موارد، نشان باید بیرون بیفتد، و در نیمی از موارد - شبکه (دم، شماره). اما «متوسط» به چه معناست؟ اگر در هر سری سری های 10 تایی پرتاب کنید، اغلب سری هایی وجود خواهد داشت که در آن یک سکه 4 بار با یک نشان بیرون می افتد. برای یک سکه متقارن، این اتفاق در 20.5 درصد از سری خواهد افتاد. و اگر 40000 نشان برای 100000 پرتاب وجود داشته باشد، آیا می توان سکه را متقارن دانست؟ روش تصمیم گیری بر اساس تئوری احتمالات و آمار ریاضی است.

مثال مورد بررسی ممکن است به اندازه کافی جدی به نظر نرسد. با این حال، اینطور نیست. کشش به طور گسترده ای در سازماندهی آزمایش های امکان سنجی صنعتی استفاده می شود، به عنوان مثال، هنگام پردازش نتایج اندازه گیری شاخص کیفیت (لحظه اصطکاک) یاتاقان ها بسته به عوامل مختلف تکنولوژیکی (تأثیر یک محیط حفاظتی، روش های آماده سازی یاتاقان ها قبل از اندازه گیری، اثر تحمل بار در فرآیند اندازه گیری و غیره). فرض کنید لازم است کیفیت یاتاقان ها را بسته به نتایج ذخیره سازی آنها در روغن های حفاظتی مختلف مقایسه کنیم، یعنی. در روغن های ترکیبی آو که در. هنگام برنامه ریزی چنین آزمایشی، این سوال مطرح می شود که کدام بلبرینگ ها باید در ترکیب روغن قرار گیرند آ، و کدام - در ترکیب روغن که در، اما به گونه ای که از ذهنیت اجتناب شود و عینیت تصمیم را تضمین کند.

پاسخ این سوال را می توان با قرعه کشی به دست آورد. مثال مشابهی را می توان با کنترل کیفیت هر محصول ارائه داد. برای تصمیم گیری در مورد اینکه آیا یک دسته از محصولات بازرسی شده الزامات تعیین شده را برآورده می کند یا خیر، نمونه ای از آن گرفته می شود. بر اساس نتایج کنترل نمونه، در مورد کل دسته نتیجه گیری می شود. در این مورد، اجتناب از ذهنیت در شکل گیری نمونه بسیار مهم است، یعنی لازم است هر واحد محصول در لات کنترل شده احتمال یکسانی برای انتخاب در نمونه داشته باشد. در شرایط تولید، انتخاب واحدهای تولید در نمونه معمولاً نه به صورت قرعه‌کشی، بلکه با جداول ویژه اعداد تصادفی یا با کمک مولدهای اعداد تصادفی رایانه‌ای انجام می‌شود.

مشکلات مشابه حصول اطمینان از عینیت مقایسه هنگام مقایسه طرح های مختلف برای سازماندهی تولید، پاداش، هنگام برگزاری مناقصات و مسابقات، انتخاب نامزدها ایجاد می شود. موقعیت های اشغال نشدهو غیره همه جا به قرعه کشی یا مراحل مشابه نیاز دارید. اجازه دهید با استفاده از مثال شناسایی قوی ترین و دومین تیم قوی در برگزاری مسابقات بر اساس سیستم المپیک (بازنده حذف می شود) توضیح دهیم. بگذارید تیم قوی تر همیشه بر تیم ضعیف تر پیروز شود. مشخص است که قوی ترین تیم قطعا قهرمان می شود. دومین تیم قدرتمند در صورتی به فینال خواهد رسید که قبل از فینال هیچ بازی با قهرمان آینده نداشته باشد. اگر چنین بازی ای برنامه ریزی شود، دومین تیم قدرتمند به فینال نمی رسد. کسی که تورنمنت را برنامه ریزی می کند می تواند زودتر از موعد مقرر، دومین تیم قدرتمند را از مسابقات حذف کند، در اولین دیدار با رهبر تیم را پایین بیاورد، یا از کسب مقام دوم اطمینان حاصل کند، و از دیدار با تیم های ضعیف تر تا فینال اطمینان حاصل کند. برای جلوگیری از ذهنیت، قرعه کشی کنید. برای یک تورنمنت 8 تیمی، احتمال دیدار دو تیم قدرتمند در فینال 4/7 است. بر این اساس با احتمال 3/7 دومین تیم قدرتمند زودتر از موعد مسابقات را ترک خواهد کرد.

در هر اندازه گیری واحدهای محصول (با استفاده از کولیس، میکرومتر، آمپرمتر و ...) خطاهایی وجود دارد. برای پی بردن به وجود خطاهای سیستماتیک، لازم است اندازه گیری های مکرر واحد محصولی که ویژگی های آن مشخص است (مثلاً یک نمونه استاندارد) انجام شود. لازم به یادآوری است که علاوه بر خطای سیستماتیک، یک خطای تصادفی نیز وجود دارد.

بنابراین، این سوال مطرح می شود که چگونه می توان از نتایج اندازه گیری ها متوجه شد که آیا خطای سیستماتیک وجود دارد یا خیر. اگر فقط توجه داشته باشیم که آیا خطای بدست آمده در اندازه گیری بعدی مثبت یا منفی است، این مشکل را می توان به خطای قبلی کاهش داد. در واقع، بیایید اندازه گیری را با پرتاب یک سکه، خطای مثبت - با از دست دادن نشان رسمی، منفی - با شبکه مقایسه کنیم (خطای صفر با تعداد کافی تقسیم مقیاس تقریباً هرگز رخ نمی دهد). سپس بررسی عدم وجود خطای سیستماتیک معادل بررسی تقارن سکه است.

هدف از این ملاحظات کاهش مشکل بررسی عدم وجود یک خطای سیستماتیک به مشکل بررسی تقارن یک سکه است. استدلال فوق منجر به به اصطلاح "معیار نشانه ها" در آمار ریاضی می شود.

در تنظیم آماری فرآیندهای فناوری مبتنی بر روش‌های آمار ریاضی، قوانین و برنامه‌هایی برای کنترل آماری فرآیندها با هدف تشخیص به موقع اختلالات فرآیندهای فناوری و اتخاذ تدابیری برای تعدیل آنها و جلوگیری از انتشار محصولاتی که انجام می‌دهند تدوین می‌شود. الزامات تعیین شده را برآورده نمی کند. این اقدامات با هدف کاهش هزینه های تولید و زیان های ناشی از عرضه محصولات بی کیفیت انجام می شود. با کنترل پذیرش آماری، بر اساس روش‌های آمار ریاضی، طرح‌های کنترل کیفیت با تجزیه و تحلیل نمونه‌هایی از دسته‌های محصول تهیه می‌شود. مشکل این است که بتوانیم به درستی مدل های تصمیم گیری احتمالی-آماری بسازیم، که بر اساس آن می توان به سوالات مطرح شده در بالا پاسخ داد. در آمار ریاضی، مدل‌ها و روش‌های احتمالی برای آزمون فرضیه‌ها برای این امر ایجاد شده است، به ویژه فرضیه‌هایی مبنی بر اینکه نسبت واحدهای تولید معیوب برابر با تعداد معینی است. p 0، مثلا، p 0= 0.23 (کلمات استروکوف را از رمان A.N. Tolstoy به یاد بیاورید).

وظایف ارزیابیدر تعدادی از موقعیت های مدیریتی، صنعتی، اقتصادی، اقتصادی ملی، مشکلاتی از نوع متفاوت ایجاد می شود - مشکلات تخمین ویژگی ها و پارامترهای توزیع احتمال.

یک مثال را در نظر بگیرید. اجازه دهید یک مهمانی از نلامپ های برقی از این مقدار، نمونه ای از nلامپ های برقی تعدادی سوال طبیعی مطرح می شود. چگونه می توان میانگین عمر مفید لامپ های الکتریکی را از نتایج آزمایش المان های نمونه تعیین کرد و با چه دقتی می توان این مشخصه را تخمین زد؟ اگر نمونه بزرگتری گرفته شود دقت چگونه تغییر می کند؟ در چند ساعت تیمی توان تضمین کرد که حداقل 90٪ از لامپ های الکتریکی دوام می آورند تییا ساعت بیشتر؟

اجازه دهید هنگام آزمایش یک نمونه با حجم فرض کنیم nلامپ ها معیوب هستند ایکسلامپ های برقی سپس سوالات زیر مطرح می شود. چه محدودیت هایی را می توان برای یک عدد مشخص کرد Dلامپ های الکتریکی معیوب در یک دسته، برای سطح نقص D/ نو غیره.

یا در تجزیه و تحلیل آماری دقت و پایداری فرآیندهای فناورانه، لازم است شاخص‌های کیفی مانند میانگین مقدار پارامتر کنترل‌شده و میزان گسترش آن در فرآیند مورد بررسی ارزیابی شود. با توجه به تئوری احتمال، توصیه می شود از انتظارات ریاضی آن به عنوان مقدار میانگین یک متغیر تصادفی و از واریانس، انحراف معیار یا ضریب تغییرات به عنوان مشخصه آماری اسپرد استفاده شود. این سؤال را ایجاد می کند: چگونه می توان این ویژگی های آماری را از داده های نمونه تخمین زد و با چه دقتی می توان این کار را انجام داد؟ نمونه های مشابه زیادی وجود دارد. در اینجا مهم بود که نشان دهیم چگونه می توان از نظریه احتمال و آمار ریاضی استفاده کرد مدیریت تولیدهنگام تصمیم گیری در زمینه مدیریت کیفیت آماری محصول.

«آمار ریاضی» چیست؟آمار ریاضی به عنوان «بخشی از ریاضیات است که به روش‌های ریاضی برای جمع‌آوری، نظام‌بندی، پردازش و تفسیر داده‌های آماری و همچنین استفاده از آنها برای نتیجه‌گیری علمی یا عملی اختصاص دارد. قواعد و رویه های آمار ریاضی مبتنی بر تئوری احتمال است که امکان ارزیابی دقت و پایایی نتایج به دست آمده در هر مسئله را بر اساس مواد آماری موجود فراهم می کند. در عین حال، داده های آماری به اطلاعاتی در مورد تعداد اشیاء در هر مجموعه کم و بیش گسترده ای اشاره دارد که دارای ویژگی های خاصی است.

با توجه به نوع مسائل حل شده، آمار ریاضی معمولاً به سه بخش تقسیم می شود: توصیف داده ها، تخمین و آزمون فرضیه.

با توجه به نوع داده های آماری مورد پردازش، آمار ریاضی به چهار حوزه تقسیم می شود:

آمار تک بعدی (آمار متغیرهای تصادفی) که در آن نتیجه یک مشاهده با یک عدد واقعی توصیف می شود.

تجزیه و تحلیل آماری چند متغیره، که در آن نتیجه مشاهده یک شی با چندین عدد (بردار) توصیف می شود.

آمار فرآیندهای تصادفی و سری های زمانی، که در آن نتیجه مشاهده یک تابع است.

آمار اجسام غیر عددی که در آنها نتیجه مشاهده ماهیتی غیر عددی دارد، به عنوان مثال، یک مجموعه (شکل هندسی)، یک مرتبه یا در نتیجه اندازه گیری به دست آمده است. یک ویژگی کیفی

از نظر تاریخی، برخی از حوزه‌های آماری از اشیاء غیر عددی (به ویژه مشکلات تخمین درصد محصولات معیوب و آزمایش فرضیه‌های مربوط به آن) و آمارهای تک بعدی اولین مواردی بودند که ظاهر شدند. دستگاه ریاضی برای آنها ساده تر است، بنابراین، با مثال آنها، آنها معمولا ایده های اصلی آمار ریاضی را نشان می دهند.

فقط آن روش های پردازش داده ها، یعنی. آمارهای ریاضی مبتنی بر شواهد هستند که بر اساس مدل‌های احتمالی پدیده‌ها و فرآیندهای واقعی مرتبط هستند. ما در مورد مدل های رفتار مصرف کننده، ظهور خطرات، عملکرد صحبت می کنیم تجهیزات تکنولوژیکی، به دست آوردن نتایج آزمایش، سیر بیماری و غیره. یک مدل احتمالی از یک پدیده واقعی باید ساخته شده در نظر گرفته شود که مقادیر مورد بررسی و روابط بین آنها بر اساس نظریه احتمال بیان شود. مطابقت با مدل احتمالی واقعیت، یعنی. کفایت آن به ویژه با کمک روش های آماری برای آزمون فرضیه ها اثبات می شود.

روش‌های پردازش داده‌های باورنکردنی اکتشافی هستند، آنها فقط می‌توانند در تجزیه و تحلیل داده‌های اولیه مورد استفاده قرار گیرند، زیرا ارزیابی دقت و قابلیت اطمینان نتایج به‌دست‌آمده بر اساس مواد آماری محدود را امکان‌پذیر نمی‌سازند.

روش های احتمالی و آماری در هر جایی که امکان ساخت و اثبات مدل احتمالی یک پدیده یا فرآیند وجود داشته باشد، قابل استفاده است. استفاده از آنها زمانی اجباری است که نتایج حاصل از داده های نمونه به کل جمعیت منتقل شود (به عنوان مثال، از یک نمونه به یک دسته کامل از محصولات).

در حوزه های کاربردی خاص، هم از روش های احتمالی-آماری با کاربرد گسترده و هم از روش های خاص استفاده می شود. به عنوان مثال، در بخش مدیریت تولید که به روش های آماری مدیریت کیفیت محصول اختصاص دارد، از آمار ریاضی کاربردی (از جمله طراحی آزمایش ها) استفاده می شود. با کمک روش های آن، تجزیه و تحلیل آماری از دقت و ثبات فرآیندهای تکنولوژیکی و ارزیابی آماری کیفیت انجام می شود. روش‌های خاص شامل روش‌های کنترل آماری پذیرش کیفیت محصول، تنظیم آماری فرآیندهای فناوری، ارزیابی و کنترل قابلیت اطمینان و غیره است.

چنین رشته های کاربردی آماری احتمالاتی مانند نظریه قابلیت اطمینان و نظریه صف به طور گسترده استفاده می شود. محتوای مورد اول از عنوان مشخص است، دومی به مطالعه سیستم هایی مانند یک مبادله تلفنی می پردازد که تماس ها را در زمان های تصادفی دریافت می کند - الزامات مشترکینی که شماره های تلفن خود را شماره گیری می کنند. مدت زمان خدمت این الزامات، یعنی. مدت زمان مکالمات نیز با متغیرهای تصادفی مدل‌سازی می‌شود. کمک بزرگی به توسعه این رشته ها توسط عضو مسئول آکادمی علوم اتحاد جماهیر شوروی A.Ya انجام شد. خینچین (1894-1959)، آکادمی آکادمی علوم اوکراین SSR B.V. Gnedenko (1912-1995) و سایر دانشمندان داخلی.

مختصری در مورد تاریخچه آمار ریاضی.آمار ریاضی به عنوان یک علم با آثار ریاضیدان مشهور آلمانی کارل فردریش گاوس (1777-1855) آغاز می شود که بر اساس نظریه احتمال، روش حداقل مربعات را که در سال 1795 ایجاد کرد و در پردازش به کار برد، بررسی و اثبات کرد. داده های نجومی (به منظور روشن شدن مدار سیاره کوچک سرس). یکی از محبوب ترین توزیع های احتمال، نرمال، اغلب به نام او نام گذاری می شود و در نظریه فرآیندهای تصادفی، موضوع اصلی مطالعه فرآیندهای گاوسی است.

که در اواخر نوزدهم V. - آغاز قرن بیستم. سهم عمده ای در آمار ریاضی توسط محققان انگلیسی، در درجه اول K. Pearson (1857-1936) و R. A. Fisher (1890-1962) انجام شد. به طور خاص، پیرسون آزمون کای دو را برای آزمایش فرضیه های آماری توسعه داد و فیشر آنالیز واریانس، نظریه طراحی آزمایش و روش حداکثر درستنمایی را برای تخمین پارامترها توسعه داد.

در دهه 30 قرن بیستم. قطبی جرزی نویمان (1894-1977) و انگلیسی E. Pearson توسعه یافتند. نظریه عمومیآزمون فرضیه های آماری و ریاضیدانان شوروی آکادمیک A.N. کولموگروف (1903-1987) و عضو مسئول آکادمی علوم اتحاد جماهیر شوروی، N.V. Smirnov (1900-1966) پایه های آمار ناپارامتریک را پایه گذاری کردند. در دهه چهل قرن بیستم. رومانیایی A. Wald (1902-1950) تئوری تجزیه و تحلیل آماری سازگار را ساخت.

آمار ریاضی در حال حاضر به سرعت در حال توسعه است. بنابراین، در طول 40 سال گذشته، چهار حوزه اساساً جدید تحقیق را می توان متمایز کرد:

توسعه و اجرا روش های ریاضیآزمایش های برنامه ریزی؛

توسعه آمار اشیاء غیر عددی به عنوان جهت مستقلدر آمار ریاضی کاربردی;

توسعه روش های آماری مقاوم در برابر انحرافات کوچک از مدل احتمالی مورد استفاده.

توسعه گسترده کار بر روی ایجاد بسته های نرم افزاری کامپیوتری طراحی شده برای تجزیه و تحلیل آماری داده ها.

روش های احتمالی-آماری و بهینه سازی.ایده بهینه سازی در آمارهای کاربردی مدرن ریاضی و سایر روش های آماری نفوذ می کند. یعنی روش‌های برنامه‌ریزی آزمایش‌ها، کنترل پذیرش آماری، کنترل آماری فرآیندهای تکنولوژیکی و غیره. از سوی دیگر، فرمول‌های بهینه‌سازی در تئوری تصمیم‌گیری، به عنوان مثال، تئوری کاربردی بهینه‌سازی کیفیت محصول و الزامات استاندارد، امکان استفاده گسترده از روش های احتمالی-آماری، در درجه اول آمار ریاضی کاربردی.

در مدیریت تولید، به‌ویژه، هنگام بهینه‌سازی کیفیت محصول و الزامات استاندارد، استفاده از روش‌های آماری در مرحله اولیه چرخه عمر محصول از اهمیت ویژه‌ای برخوردار است. در مرحله آماده سازی تحقیقاتی تحولات طراحی تجربی (توسعه الزامات امیدوارکننده برای محصولات، طراحی اولیه، شرایط مرجعبرای کار توسعه). این به دلیل اطلاعات محدود موجود در مرحله اولیه چرخه عمر محصول و نیاز به پیش بینی امکانات فنی و وضعیت اقتصادی برای آینده است. روش های آماری باید در تمام مراحل حل یک مسئله بهینه سازی - هنگام مقیاس بندی متغیرها، توسعه مدل های ریاضی برای عملکرد محصولات و سیستم ها، انجام آزمایش های فنی و اقتصادی و غیره - اعمال شوند.

در مسائل بهینه سازی، از جمله بهینه سازی کیفیت محصول و الزامات استاندارد، از تمامی حوزه های آمار استفاده می شود. یعنی آمار متغیرهای تصادفی، تجزیه و تحلیل آماری چند متغیره، آمار فرآیندهای تصادفی و سری های زمانی، آمار اشیاء با ماهیت غیر عددی. انتخاب یک روش آماری برای تجزیه و تحلیل داده های خاص باید طبق توصیه ها انجام شود.

قبلی

ارسال کار خوب خود در پایگاه دانش ساده است. از فرم زیر استفاده کنید

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

نوشته شده در http://www.allbest.ru/

[متن را وارد کنید]

معرفی

1. نظریه احتمالات و آمار ریاضی در تصمیم گیری

1.1 نحوه استفاده از احتمال و آمار

1.2 مثال های کاربردی نظریه احتمال و آمار ریاضی

1.3 اهداف ارزیابی

1.4 "آمار ریاضی" چیست؟

1.5 مختصری در مورد تاریخچه آمار ریاضی

1.6 روش های احتمالی-آماری و بهینه سازی

2. مسائل عملی معمول تصمیم گیری احتمالی - آماری و روش های حل آنها

2.1 آمار و آمار کاربردی

2.2 وظایف تجزیه و تحلیل آماری دقت و پایداری فرآیندهای تکنولوژیکی و کیفیت محصول

2.3 مسائل آمار تک بعدی (آمار متغیرهای تصادفی)

2.4 تجزیه و تحلیل آماری چند متغیره

2.5 آمار فرآیندهای تصادفی و سری های زمانی

2.6 آمار اشیاء غیر عددی

3. کاربرد روش های تصمیم گیری احتمالی- آماری در حل مسائل اقتصادی

نتیجه

منابع

معرفی

روش‌های تصمیم‌گیری احتمالی-آماری زمانی استفاده می‌شوند که اثربخشی تصمیم‌های گرفته شده به عواملی بستگی دارد که متغیرهای تصادفی هستند که قوانین توزیع احتمال و سایر ویژگی‌های آماری برای آنها شناخته شده است. علاوه بر این، هر تصمیم می تواند به یکی از بسیاری از نتایج ممکن منجر شود و هر نتیجه احتمال وقوع خاصی دارد که می تواند محاسبه شود. شاخص های مشخص کننده وضعیت مشکل، همچنین با استفاده از ویژگی های احتمالی توصیف می شوند. با چنین مشکلات تصمیم گیری، تصمیم گیرنده همیشه در معرض خطر گرفتن نتیجه اشتباه قرار می گیرد که با هدایت آن تصمیم بهینه را بر اساس میانگین ویژگی های آماری عوامل تصادفی انتخاب می کند، یعنی تصمیم در شرایط ریسک گرفته می شود. .

در عمل، روش‌های احتمالی و آماری اغلب زمانی استفاده می‌شوند که نتایج حاصل از داده‌های نمونه به کل جامعه (مثلاً از یک نمونه به یک دسته کامل از محصولات) منتقل شود. با این حال، در این مورد، در هر موقعیت خاص، ابتدا باید امکان اساسی دستیابی به داده های احتمالی و آماری به اندازه کافی قابل اعتماد را ارزیابی کرد.

هنگام استفاده از ایده ها و نتایج نظریه احتمالات و آمار ریاضی در تصمیم گیری، مبنا یک مدل ریاضی است که در آن روابط عینی بر حسب نظریه احتمال بیان می شود. احتمالات در درجه اول برای توصیف تصادفی که باید در هنگام تصمیم گیری در نظر گرفته شود استفاده می شود. این هم به فرصت های نامطلوب (خطرات) و هم به فرصت های جذاب ("شانس خوش شانس") اشاره دارد.

ماهیت روش‌های تصمیم‌گیری احتمالی-آماری، استفاده از مدل‌های احتمالی مبتنی بر تخمین و آزمون فرضیه‌ها با استفاده از ویژگی‌های نمونه است.

منطق استفاده از ویژگی های نمونه برای تصمیم گیری بر اساس مدل های نظری شامل استفاده همزمان از دو سری مفاهیم موازی است - مفاهیم مربوط به نظریه (یک مدل احتمالی) و مفاهیم مربوط به عمل (نمونه ای از نتایج مشاهده). به عنوان مثال، احتمال نظری با فرکانس یافت شده از نمونه مطابقت دارد. انتظارات ریاضی (سری نظری) با میانگین حسابی نمونه (سری عملی) مطابقت دارد. به عنوان یک قاعده، ویژگی های نمونه برآورد ویژگی های نظری است.

از مزایای استفاده از این روش ها می توان به قابلیت در نظر گرفتن سناریوهای مختلف برای توسعه رویدادها و احتمالات آنها اشاره کرد. عیب این روش ها این است که احتمالات سناریویی مورد استفاده در محاسبات معمولاً در عمل بسیار دشوار است.

بکارگیری یک روش خاص تصمیم گیری احتمالی-آماری شامل سه مرحله است:

گذار از واقعیت اقتصادی، مدیریتی، فناوری به یک طرح انتزاعی ریاضی و آماری، یعنی. ایجاد یک مدل احتمالی از یک سیستم کنترل، یک فرآیند تکنولوژیکی، یک روش تصمیم گیری، به ویژه بر اساس نتایج کنترل آماری، و غیره.

یک مدل احتمالی از یک پدیده واقعی باید ساخته شده در نظر گرفته شود که مقادیر مورد بررسی و روابط بین آنها بر اساس نظریه احتمال بیان شود. کفایت مدل احتمالی به ویژه با استفاده از روش های آماری برای آزمون فرضیه ها اثبات می شود.

آمار ریاضی معمولاً با توجه به نوع مسائلی که باید حل شوند به سه بخش تقسیم می شوند: توصیف داده ها، تخمین و آزمون فرضیه. با توجه به نوع داده های آماری مورد پردازش، آمار ریاضی به چهار حوزه تقسیم می شود:

نمونه ای از زمانی که استفاده از مدل های احتمالی-آماری توصیه می شود.

هنگام کنترل کیفیت هر محصول، نمونه ای از آن گرفته می شود تا تصمیم بگیرد که آیا دسته ای از محصولات تولید شده مطابق با الزامات تعیین شده است یا خیر. بر اساس نتایج کنترل نمونه، در مورد کل دسته نتیجه گیری می شود. در این مورد، اجتناب از ذهنیت در شکل گیری نمونه بسیار مهم است، یعنی لازم است هر واحد محصول در لات کنترل شده احتمال یکسانی برای انتخاب در نمونه داشته باشد. انتخاب بر اساس قرعه در چنین شرایطی به اندازه کافی عینی نیست. بنابراین، در شرایط تولید، انتخاب واحدهای تولیدی در نمونه معمولاً نه به صورت قرعه، بلکه با جداول ویژه اعداد تصادفی یا با کمک مولدهای اعداد تصادفی رایانه ای انجام می شود.

در تنظیم آماری فرآیندهای فناوری مبتنی بر روش‌های آمار ریاضی، قوانین و برنامه‌هایی برای کنترل آماری فرآیندها با هدف تشخیص به موقع اختلالات فرآیندهای فناوری و اتخاذ تدابیری برای تعدیل آنها و جلوگیری از انتشار محصولاتی که انجام می‌دهند تدوین می‌شود. الزامات تعیین شده را برآورده نمی کند. این اقدامات با هدف کاهش هزینه های تولید و زیان های ناشی از عرضه محصولات بی کیفیت انجام می شود. با کنترل پذیرش آماری، بر اساس روش‌های آمار ریاضی، طرح‌های کنترل کیفیت با تجزیه و تحلیل نمونه‌هایی از دسته‌های محصول تهیه می‌شود. مشکل این است که بتوانیم به درستی مدل های تصمیم گیری احتمالی-آماری بسازیم، که بر اساس آن می توان به سوالات مطرح شده در بالا پاسخ داد. در آمار ریاضی، مدل‌ها و روش‌های احتمالی برای آزمون فرضیه‌ها برای این امر ابداع شده است.

علاوه بر این، در تعدادی از موقعیت های مدیریتی، صنعتی، اقتصادی، اقتصادی ملی، مشکلاتی از نوع متفاوت ایجاد می شود - مشکلات تخمین ویژگی ها و پارامترهای توزیع احتمال.

یا در تجزیه و تحلیل آماری دقت و پایداری فرآیندهای فناورانه، لازم است شاخص‌های کیفی مانند میانگین مقدار پارامتر کنترل‌شده و میزان گسترش آن در فرآیند مورد بررسی ارزیابی شود. با توجه به تئوری احتمال، توصیه می شود از انتظارات ریاضی آن به عنوان مقدار متوسط ​​یک متغیر تصادفی و از واریانس، انحراف معیار یا ضریب تغییرات به عنوان مشخصه آماری اسپرد استفاده شود. این سؤال را ایجاد می کند: چگونه می توان این ویژگی های آماری را از داده های نمونه تخمین زد و با چه دقتی می توان این کار را انجام داد؟ نمونه های مشابه زیادی در ادبیات وجود دارد. همه آنها نشان می دهند که چگونه می توان از تئوری احتمال و آمار ریاضی در مدیریت تولید هنگام تصمیم گیری در زمینه مدیریت کیفیت محصول آماری استفاده کرد.

در حوزه های کاربردی خاص، هم از روش های احتمالی-آماری با کاربرد گسترده و هم از روش های خاص استفاده می شود. به عنوان مثال، در بخش مدیریت تولید که به روش های آماری مدیریت کیفیت محصول اختصاص دارد، از آمار ریاضی کاربردی (از جمله طراحی آزمایش ها) استفاده می شود. با کمک روش های آن، تجزیه و تحلیل آماری از دقت و ثبات فرآیندهای تکنولوژیکی و ارزیابی آماری کیفیت انجام می شود. روش‌های خاص شامل روش‌های کنترل آماری پذیرش کیفیت محصول، تنظیم آماری فرآیندهای فناوری، ارزیابی و کنترل قابلیت اطمینان است.
و غیره.

در مدیریت تولید، به‌ویژه، هنگام بهینه‌سازی کیفیت محصول و اطمینان از انطباق با استانداردها، استفاده از روش‌های آماری در مرحله اولیه چرخه عمر محصول از اهمیت ویژه‌ای برخوردار است. در مرحله آماده سازی تحقیقاتی تحولات طراحی آزمایشی (توسعه الزامات امیدوارکننده برای محصولات، طراحی اولیه، شرایط مرجع برای توسعه طراحی آزمایشی). این به دلیل اطلاعات محدود موجود در مرحله اولیه چرخه عمر محصول و نیاز به پیش بینی امکانات فنی و وضعیت اقتصادی برای آینده است.

رایج ترین روش های احتمالی-آماری عبارتند از: تحلیل رگرسیون، تحلیل عاملی، تحلیل واریانس، روش های آماری ارزیابی ریسک، روش سناریو و غیره. حوزه روش های آماری که به تجزیه و تحلیل داده های آماری ماهیت غیر عددی اختصاص دارد، روز به روز اهمیت بیشتری پیدا می کند. نتایج اندازه گیری بر روی ویژگی های کیفی و ناهمگن است. یکی از کاربردهای اصلی آمار اشیاء غیر عددی، تئوری و عمل ارزیابی های تخصصی مربوط به نظریه است. تصمیمات آماریو مسائل رای گیری

نقش یک فرد در حل مسائل با استفاده از روش های تئوری تصمیمات آماری این است که مسئله را فرموله کند، یعنی مشکل واقعی را به مدل مربوطه برساند، احتمالات رویدادها را بر اساس داده های آماری تعیین کند، و همچنین راه حل بهینه حاصل را تایید کنید.

1. نظریه احتمالات و آمار ریاضی در تصمیم گیری

1.1 نحوه استفاده از احتمالو آمار ریاضی

این رشته ها اساس روش های تصمیم گیری احتمالی – آماری هستند. برای استفاده از دستگاه ریاضی آنها باید مسائل تصمیم گیری را بر اساس مدل های احتمالی-آماری بیان کرد. بکارگیری یک روش خاص تصمیم گیری احتمالی-آماری شامل سه مرحله است:

گذار از واقعیت اقتصادی، مدیریتی، فناوری به یک طرح انتزاعی ریاضی و آماری، یعنی. ساخت یک مدل احتمالی از یک سیستم کنترل، یک فرآیند تکنولوژیکی، یک روش تصمیم گیری، به ویژه بر اساس نتایج کنترل آماری و غیره.

انجام محاسبات و به دست آوردن نتیجه‌گیری با ابزارهای کاملاً ریاضی در چارچوب یک مدل احتمالی.

تفسیر نتایج ریاضی و آماری در رابطه با وضعیت واقعی و اتخاذ تصمیم مناسب (مثلاً در مورد انطباق یا عدم انطباق کیفیت محصول با الزامات تعیین شده، نیاز به تنظیم فرآیند فناوری و غیره)، به ویژه، نتیجه گیری (در مورد نسبت واحدهای معیوب محصولات در یک دسته، در مورد شکل خاصی از قوانین توزیع پارامترهای کنترل شده فرآیند فن آوری و غیره).

آمار ریاضی از مفاهیم، ​​روش ها و نتایج نظریه احتمال استفاده می کند. بیایید مسائل اصلی ساخت مدل های تصمیم گیری احتمالی را در موقعیت های اقتصادی، مدیریتی، فناوری و غیره در نظر بگیریم. برای استفاده فعال و صحیح از اسناد هنجاری-فنی و آموزنده- روشی در مورد روش های احتمالی-آماری تصمیم گیری، به دانش اولیه نیاز است. بنابراین، لازم است بدانیم که در چه شرایطی باید از یک سند استفاده شود، چه اطلاعات اولیه ای برای انتخاب و کاربرد آن لازم است، چه تصمیماتی باید بر اساس نتایج پردازش داده ها اتخاذ شود و غیره.

1.2 مثال های کاربردی نظریه احتمالو آمار ریاضی

اجازه دهید چندین مثال را در نظر بگیریم که مدل‌های آماری-احتمالی ابزار مناسبی برای حل مشکلات مدیریتی، صنعتی، اقتصادی و اقتصادی ملی هستند. بنابراین، به عنوان مثال، در رمان A.N. تولستوی "راه رفتن در عذاب ها" (جلد 1) می گوید: "کارگاه بیست و سه درصد ازدواج را می دهد، شما این رقم را نگه دارید."

این سوال پیش می آید که چگونه می توان این سخنان را در گفتگوی مدیران کارخانه فهمید، چرا که یک واحد تولیدی نمی تواند 23 درصد معیوب باشد. می تواند خوب یا معیوب باشد. شاید منظور استروکوف این بود که یک دسته بزرگ تقریباً 23 درصد از واحدهای معیوب را شامل می شود. سپس این سوال پیش می آید که «درباره» به چه معناست؟ فرض کنید 30 واحد از 100 واحد تولیدی آزمایش شده معیوب باشد یا از 1000 - 300 یا از 100000 - 30000 و غیره، آیا استروکوف باید متهم به دروغگویی شود؟

یا مثال دیگری. سکه ای که زیاد استفاده می شود باید «متقارن» باشد، یعنی. هنگامی که پرتاب می شود، به طور متوسط، در نیمی از موارد، نشان باید بیرون بیفتد، و در نیمی از موارد - شبکه (دم، شماره). اما «متوسط» به چه معناست؟ اگر در هر سری سری های 10 تایی پرتاب کنید، اغلب سری هایی وجود خواهد داشت که در آن یک سکه 4 بار با یک نشان بیرون می افتد. برای یک سکه متقارن، این اتفاق در 20.5 درصد از سری خواهد افتاد. و اگر 40000 نشان برای 100000 پرتاب وجود داشته باشد، آیا می توان سکه را متقارن دانست؟ روش تصمیم گیری بر اساس تئوری احتمالات و آمار ریاضی است.

مثال مورد بررسی ممکن است به اندازه کافی جدی به نظر نرسد. با این حال، اینطور نیست. کشش به طور گسترده ای در سازماندهی آزمایش های امکان سنجی صنعتی استفاده می شود، به عنوان مثال، هنگام پردازش نتایج اندازه گیری شاخص کیفیت (لحظه اصطکاک) یاتاقان ها بسته به عوامل مختلف تکنولوژیکی (تأثیر یک محیط حفاظتی، روش های آماده سازی یاتاقان ها قبل از اندازه گیری، اثر تحمل بار در فرآیند اندازه گیری و غیره). فرض کنید لازم است کیفیت یاتاقان ها را بسته به نتایج ذخیره سازی آنها در روغن های حفاظتی مختلف مقایسه کنیم، یعنی. در روغن‌های ترکیب A و B. هنگام برنامه‌ریزی چنین آزمایشی، این سوال مطرح می‌شود که کدام بلبرینگ‌ها باید در ترکیب روغن A قرار داده شوند و کدام - در ترکیب روغن B، اما به گونه‌ای که از ذهنیت اجتناب شود و از عینیت بودن اطمینان حاصل شود. تصمیم گیری

پاسخ این سوال را می توان با قرعه کشی به دست آورد. مثال مشابهی را می توان با کنترل کیفیت هر محصول ارائه داد. برای تصمیم گیری در مورد اینکه آیا یک دسته از محصولات بازرسی شده الزامات تعیین شده را برآورده می کند یا خیر، نمونه ای از آن گرفته می شود. بر اساس نتایج کنترل نمونه، در مورد کل دسته نتیجه گیری می شود. در این مورد، اجتناب از ذهنیت در شکل گیری نمونه بسیار مهم است، یعنی لازم است هر واحد محصول در لات کنترل شده احتمال یکسانی برای انتخاب در نمونه داشته باشد. در شرایط تولید، انتخاب واحدهای تولید در نمونه معمولاً نه به صورت قرعه‌کشی، بلکه با جداول ویژه اعداد تصادفی یا با کمک مولدهای اعداد تصادفی رایانه‌ای انجام می‌شود.

مشکلات مشابه حصول اطمینان از عینیت مقایسه هنگام مقایسه طرح های مختلف برای سازماندهی تولید، پاداش، هنگام برگزاری مناقصات و مسابقات، انتخاب نامزدها برای موقعیت های خالی و غیره ایجاد می شود. همه جا به قرعه کشی یا مراحل مشابه نیاز دارید. اجازه دهید با استفاده از مثال شناسایی قوی ترین و دومین تیم قوی در برگزاری مسابقات بر اساس سیستم المپیک (بازنده حذف می شود) توضیح دهیم. بگذارید تیم قوی تر همیشه بر تیم ضعیف تر پیروز شود. مشخص است که قوی ترین تیم قطعا قهرمان می شود. دومین تیم قدرتمند در صورتی به فینال خواهد رسید که قبل از فینال هیچ بازی با قهرمان آینده نداشته باشد. اگر چنین بازی ای برنامه ریزی شود، دومین تیم قدرتمند به فینال نمی رسد. کسی که تورنمنت را برنامه ریزی می کند می تواند زودتر از موعد مقرر، دومین تیم قدرتمند را از مسابقات حذف کند، در اولین دیدار با رهبر تیم را پایین بیاورد، یا از کسب مقام دوم اطمینان حاصل کند، و از دیدار با تیم های ضعیف تر تا فینال اطمینان حاصل کند. برای جلوگیری از ذهنیت، قرعه کشی کنید. برای یک تورنمنت 8 تیمی، احتمال دیدار دو تیم قدرتمند در فینال 4/7 است. بر این اساس با احتمال 3/7 دومین تیم قدرتمند زودتر از موعد مسابقات را ترک خواهد کرد.

در هر اندازه گیری واحدهای محصول (با استفاده از کولیس، میکرومتر، آمپرمتر و ...) خطاهایی وجود دارد. برای پی بردن به وجود خطاهای سیستماتیک، لازم است اندازه گیری های مکرر واحد محصولی که ویژگی های آن مشخص است (مثلاً یک نمونه استاندارد) انجام شود. لازم به یادآوری است که علاوه بر خطای سیستماتیک، یک خطای تصادفی نیز وجود دارد.

بنابراین، این سوال مطرح می شود که چگونه می توان از نتایج اندازه گیری متوجه شد که آیا خطای سیستماتیک وجود دارد یا خیر. اگر فقط توجه داشته باشیم که آیا خطای بدست آمده در اندازه گیری بعدی مثبت یا منفی است، این مشکل را می توان به خطای قبلی کاهش داد. در واقع، بیایید اندازه گیری را با پرتاب یک سکه، خطای مثبت - با از دست دادن نشان رسمی، منفی - با شبکه مقایسه کنیم (خطای صفر با تعداد کافی تقسیم مقیاس تقریباً هرگز رخ نمی دهد). سپس بررسی عدم وجود خطای سیستماتیک معادل بررسی تقارن سکه است.

هدف از این ملاحظات کاهش مشکل بررسی عدم وجود یک خطای سیستماتیک به مشکل بررسی تقارن یک سکه است. استدلال فوق منجر به به اصطلاح "معیار نشانه ها" در آمار ریاضی می شود.

در تنظیم آماری فرآیندهای فناوری مبتنی بر روش‌های آمار ریاضی، قوانین و برنامه‌هایی برای کنترل آماری فرآیندها با هدف تشخیص به موقع اختلالات فرآیندهای فناوری و اتخاذ تدابیری برای تعدیل آنها و جلوگیری از انتشار محصولاتی که انجام می‌دهند تدوین می‌شود. الزامات تعیین شده را برآورده نمی کند. این اقدامات با هدف کاهش هزینه های تولید و زیان های ناشی از عرضه محصولات بی کیفیت انجام می شود. با کنترل پذیرش آماری، بر اساس روش‌های آمار ریاضی، طرح‌های کنترل کیفیت با تجزیه و تحلیل نمونه‌هایی از دسته‌های محصول تهیه می‌شود. مشکل این است که بتوانیم به درستی مدل های تصمیم گیری احتمالی-آماری بسازیم، که بر اساس آن می توان به سوالات مطرح شده در بالا پاسخ داد. در آمارهای ریاضی، مدل‌ها و روش‌های احتمالی برای آزمایش فرضیه‌ها برای این کار ایجاد شده است، به ویژه فرضیه‌هایی مبنی بر اینکه نسبت واحدهای تولید معیوب برابر با عدد معینی p0 است، به عنوان مثال، p0 = 0.23 (به یاد داشته باشید کلمات Strukov از رمان A.N. تولستوی).

1.3 اهداف ارزیابی

در تعدادی از موقعیت های مدیریتی، صنعتی، اقتصادی، اقتصادی ملی، مشکلاتی از نوع متفاوت ایجاد می شود - مشکلات تخمین ویژگی ها و پارامترهای توزیع احتمال.

یک مثال را در نظر بگیرید. اجازه دهید دسته ای از لامپ های الکتریکی N تحت کنترل قرار گیرند. نمونه ای از n لامپ الکتریکی به طور تصادفی از این دسته انتخاب شد. تعدادی سوال طبیعی مطرح می شود. چگونه می توان میانگین عمر مفید لامپ های الکتریکی را از نتایج آزمایش المان های نمونه تعیین کرد و با چه دقتی می توان این مشخصه را تخمین زد؟ اگر نمونه بزرگتری گرفته شود دقت چگونه تغییر می کند؟ در چند ساعت T می توان تضمین کرد که حداقل 90 درصد لامپ های الکتریکی T ساعت یا بیشتر دوام می آورند؟

فرض کنید هنگام آزمایش نمونه ای از n لامپ الکتریکی، لامپ های الکتریکی X معیوب هستند. سپس سوالات زیر مطرح می شود. چه محدودیت هایی برای تعداد D لامپ های الکتریکی معیوب در یک دسته، برای سطح نقص D/N و غیره می توان تعیین کرد؟

یا در تجزیه و تحلیل آماری دقت و پایداری فرآیندهای فناورانه، لازم است شاخص‌های کیفی مانند میانگین مقدار پارامتر کنترل‌شده و میزان گسترش آن در فرآیند مورد بررسی ارزیابی شود. با توجه به تئوری احتمال، توصیه می شود از انتظارات ریاضی آن به عنوان مقدار متوسط ​​یک متغیر تصادفی و از واریانس، انحراف معیار یا ضریب تغییرات به عنوان مشخصه آماری اسپرد استفاده شود. این سؤال را ایجاد می کند: چگونه می توان این ویژگی های آماری را از داده های نمونه تخمین زد و با چه دقتی می توان این کار را انجام داد؟ نمونه های مشابه زیادی وجود دارد. در اینجا مهم بود که نشان دهیم چگونه می توان از تئوری احتمال و آمار ریاضی در مدیریت تولید هنگام تصمیم گیری در زمینه مدیریت کیفیت محصول آماری استفاده کرد.

1.4 "آمار ریاضی" چیست؟

آمار ریاضی به عنوان «بخشی از ریاضیات است که به روش‌های ریاضی برای جمع‌آوری، نظام‌بندی، پردازش و تفسیر داده‌های آماری و همچنین استفاده از آنها برای نتیجه‌گیری علمی یا عملی اختصاص دارد. قواعد و رویه های آمار ریاضی مبتنی بر تئوری احتمال است که امکان ارزیابی دقت و پایایی نتایج به دست آمده در هر مسئله را بر اساس مواد آماری موجود فراهم می کند. در عین حال، داده های آماری به اطلاعاتی در مورد تعداد اشیاء در هر مجموعه کم و بیش گسترده ای اشاره دارد که دارای ویژگی های خاصی است.

با توجه به نوع مسائل حل شده، آمار ریاضی معمولاً به سه بخش تقسیم می شود: توصیف داده ها، تخمین و آزمون فرضیه.

با توجه به نوع داده های آماری مورد پردازش، آمار ریاضی به چهار حوزه تقسیم می شود:

آمار تک بعدی (آمار متغیرهای تصادفی) که در آن نتیجه یک مشاهده با یک عدد واقعی توصیف می شود.

تجزیه و تحلیل آماری چند متغیره، که در آن نتیجه مشاهده یک شی با چندین عدد (بردار) توصیف می شود.

آمار فرآیندهای تصادفی و سری های زمانی، که در آن نتیجه مشاهده یک تابع است.

آمار اجسام غیر عددی که در آنها نتیجه مشاهده ماهیتی غیر عددی دارد، به عنوان مثال، یک مجموعه (شکل هندسی)، یک مرتبه یا در نتیجه اندازه گیری به دست آمده است. یک ویژگی کیفی

از نظر تاریخی، برخی از حوزه‌های آماری از اشیاء غیر عددی (به ویژه مشکلات تخمین درصد محصولات معیوب و آزمایش فرضیه‌های مربوط به آن) و آمارهای تک بعدی اولین مواردی بودند که ظاهر شدند. دستگاه ریاضی برای آنها ساده تر است، بنابراین، با مثال آنها، آنها معمولا ایده های اصلی آمار ریاضی را نشان می دهند.

فقط آن روش های پردازش داده ها، یعنی. آمارهای ریاضی مبتنی بر شواهد هستند که بر اساس مدل‌های احتمالی پدیده‌ها و فرآیندهای واقعی مرتبط هستند. ما در مورد مدل های رفتار مصرف کننده، وقوع خطرات، عملکرد تجهیزات تکنولوژیکی، به دست آوردن نتایج یک آزمایش، دوره یک بیماری و غیره صحبت می کنیم. یک مدل احتمالی از یک پدیده واقعی باید ساخته شده در نظر گرفته شود که مقادیر مورد بررسی و روابط بین آنها بر اساس نظریه احتمال بیان شود. مطابقت با مدل احتمالی واقعیت، یعنی. کفایت آن به ویژه با کمک روش های آماری برای آزمون فرضیه ها اثبات می شود.

روش‌های پردازش داده‌های باورنکردنی اکتشافی هستند، آنها فقط می‌توانند در تجزیه و تحلیل داده‌های اولیه مورد استفاده قرار گیرند، زیرا ارزیابی دقت و قابلیت اطمینان نتایج به‌دست‌آمده بر اساس مواد آماری محدود را امکان‌پذیر نمی‌سازند.

روش های احتمالی و آماری در هر جایی که امکان ساخت و اثبات مدل احتمالی یک پدیده یا فرآیند وجود داشته باشد، قابل استفاده است. استفاده از آنها زمانی اجباری است که نتایج حاصل از داده های نمونه به کل جمعیت منتقل شود (به عنوان مثال، از یک نمونه به یک دسته کامل از محصولات).

در حوزه های کاربردی خاص، هم از روش های احتمالی-آماری با کاربرد گسترده و هم از روش های خاص استفاده می شود. به عنوان مثال، در بخش مدیریت تولید که به روش های آماری مدیریت کیفیت محصول اختصاص دارد، از آمار ریاضی کاربردی (از جمله طراحی آزمایش ها) استفاده می شود. با کمک روش های آن، تجزیه و تحلیل آماری از دقت و ثبات فرآیندهای تکنولوژیکی و ارزیابی آماری کیفیت انجام می شود. روش‌های خاص شامل روش‌های کنترل آماری پذیرش کیفیت محصول، تنظیم آماری فرآیندهای فناوری، ارزیابی و کنترل قابلیت اطمینان و غیره است.

چنین رشته های کاربردی آماری احتمالاتی مانند نظریه قابلیت اطمینان و نظریه صف به طور گسترده استفاده می شود. محتوای مورد اول از عنوان مشخص است، دومی به مطالعه سیستم هایی مانند یک مبادله تلفنی می پردازد که تماس ها را در زمان های تصادفی دریافت می کند - الزامات مشترکینی که شماره های تلفن خود را شماره گیری می کنند. مدت زمان خدمت این الزامات، یعنی. مدت زمان مکالمات نیز با متغیرهای تصادفی مدل‌سازی می‌شود. کمک بزرگی به توسعه این رشته ها توسط عضو مسئول آکادمی علوم اتحاد جماهیر شوروی A.Ya انجام شد. خینچین (1894-1959)، آکادمی آکادمی علوم اوکراین SSR B.V. Gnedenko (1912-1995) و سایر دانشمندان داخلی.

1.5 مختصری در مورد تاریخچه آمار ریاضی

آمار ریاضی به عنوان یک علم با آثار ریاضیدان مشهور آلمانی کارل فردریش گاوس (1777-1855) آغاز می شود که بر اساس نظریه احتمال، روش حداقل مربعات را که در سال 1795 ایجاد کرد و در پردازش به کار برد، بررسی و اثبات کرد. داده های نجومی (به منظور روشن شدن مدار سیاره کوچک سرس). یکی از پرطرفدارترین توزیع‌های احتمال، توزیع نرمال، اغلب به نام او نام‌گذاری می‌شود و در نظریه فرآیندهای تصادفی، موضوع اصلی مطالعه فرآیندهای گاوسی است.

در پایان قرن نوزدهم. - آغاز قرن بیستم. سهم عمده ای در آمار ریاضی توسط محققان انگلیسی، در درجه اول K. Pearson (1857-1936) و R. A. Fisher (1890-1962) انجام شد. به طور خاص، پیرسون آزمون کای دو را برای آزمایش فرضیه های آماری توسعه داد و فیشر آنالیز واریانس، نظریه برنامه ریزی آزمایش و روش حداکثر درستنمایی را برای تخمین پارامترها توسعه داد.

در دهه 30 قرن بیستم. Pole Jerzy Neumann (1894-1977) و انگلیسی E. Pearson تئوری کلی آزمایش فرضیه های آماری را توسعه دادند و ریاضیدانان شوروی، آکادمیک A.N. کولموگروف (1903-1987) و عضو مسئول آکادمی علوم اتحاد جماهیر شوروی، N.V. Smirnov (1900-1966) پایه های آمار ناپارامتریک را پایه گذاری کردند. در دهه چهل قرن بیستم. رومانیایی A. Wald (1902-1950) تئوری تجزیه و تحلیل آماری سازگار را ساخت.

آمار ریاضی در حال حاضر به سرعت در حال توسعه است. بنابراین، در طول 40 سال گذشته، چهار حوزه اساساً جدید تحقیق را می توان متمایز کرد:

توسعه و اجرای روش های ریاضی برای برنامه ریزی آزمایش ها.

توسعه آمار اشیاء غیر عددی به عنوان یک جهت مستقل در آمار ریاضی کاربردی.

توسعه روش های آماری مقاوم در برابر انحرافات کوچک از مدل احتمالی مورد استفاده.

توسعه گسترده کار بر روی ایجاد بسته های نرم افزاری کامپیوتری طراحی شده برای تجزیه و تحلیل آماری داده ها.

1.6 روش های احتمالی-آماری و بهینه سازی

ایده بهینه سازی در آمارهای کاربردی مدرن ریاضی و سایر روش های آماری نفوذ می کند. یعنی روش‌های برنامه‌ریزی آزمایش‌ها، کنترل پذیرش آماری، کنترل آماری فرآیندهای تکنولوژیکی و غیره. از سوی دیگر، فرمول‌های بهینه‌سازی در تئوری تصمیم‌گیری، به عنوان مثال، تئوری کاربردی بهینه‌سازی کیفیت محصول و الزامات استاندارد، امکان استفاده گسترده از روش های احتمالی-آماری، در درجه اول آمار ریاضی کاربردی.

در مدیریت تولید، به‌ویژه، هنگام بهینه‌سازی کیفیت محصول و الزامات استاندارد، استفاده از روش‌های آماری در مرحله اولیه چرخه عمر محصول از اهمیت ویژه‌ای برخوردار است. در مرحله آماده سازی تحقیقاتی تحولات طراحی آزمایشی (توسعه الزامات امیدوارکننده برای محصولات، طراحی اولیه، شرایط مرجع برای توسعه طراحی آزمایشی). این به دلیل اطلاعات محدود موجود در مرحله اولیه چرخه عمر محصول و نیاز به پیش بینی امکانات فنی و وضعیت اقتصادی برای آینده است. روش های آماری باید در تمام مراحل حل یک مسئله بهینه سازی - هنگام مقیاس بندی متغیرها، توسعه مدل های ریاضی برای عملکرد محصولات و سیستم ها، انجام آزمایش های فنی و اقتصادی و غیره - اعمال شوند.

در مسائل بهینه سازی، از جمله بهینه سازی کیفیت محصول و الزامات استاندارد، از تمامی حوزه های آمار استفاده می شود. یعنی آمار متغیرهای تصادفی، تجزیه و تحلیل آماری چند متغیره، آمار فرآیندهای تصادفی و سری های زمانی، آمار اشیاء با ماهیت غیر عددی. انتخاب یک روش آماری برای تجزیه و تحلیل داده های خاص باید طبق توصیه ها انجام شود.

2. مسائل عملی معمولی احتمالاتیتصمیم گیری اتیستیکو روش های حل آنها

2.1 آمار و آمار کاربردی

آمار کاربردی به عنوان بخشی از آمار ریاضی که به روش های پردازش داده های آماری واقعی و همچنین ریاضیات و نرم افزارهای مربوطه اختصاص دارد درک می شود. بنابراین، مسائل صرفاً ریاضی در آمار کاربردی گنجانده نشده است.

داده های آماری به عنوان مقادیر عددی یا غیر عددی پارامترهای کنترل شده (ویژگی ها) اشیاء مورد مطالعه درک می شود که در نتیجه مشاهدات (اندازه گیری، تجزیه و تحلیل، آزمایش، آزمایش و غیره) تعداد معینی از موارد به دست آمده است. ویژگی های هر واحد موجود در مطالعه روش های به دست آوردن داده های آماری و حجم نمونه بر اساس فرمول بندی یک مسئله کاربردی خاص بر اساس روش های نظریه ریاضی برنامه ریزی آزمایش ایجاد می شود.

نتیجه مشاهدات xi صفت مورد مطالعه X (یا مجموعه صفات مورد مطالعه X) از واحد نمونه i منعکس کننده خصوصیات کمی و/یا کیفی واحد بررسی شده با عدد i است (در اینجا i = 1, 2, . ..، n، که در آن n حجم نمونه است).

نتایج مشاهدات x1، x2،…، xn، که در آن xi نتیجه مشاهدات واحد نمونه i است، یا نتایج مشاهدات برای چندین نمونه، با استفاده از روش‌های آماری کاربردی متناسب با کار پردازش می‌شوند. معمولا استفاده می شوند روش های تحلیلی، یعنی روش های مبتنی بر محاسبات عددی (اشیاء غیر عددی با استفاده از اعداد توصیف می شوند). در برخی موارد امکان استفاده وجود دارد روش های گرافیکی(تحلیل بصری).

2.2 وظایف تجزیه و تحلیل آماری دقت و ثبات فرآیندهای تکنولوژیکی و کیفیت محصول

روش های آماری به ویژه برای تجزیه و تحلیل دقت و پایداری فرآیندهای تکنولوژیکی و کیفیت محصول استفاده می شود. هدف تهیه راه حل هایی است که عملکرد کارآمد واحدهای فناورانه را تضمین کند و کیفیت و رقابت محصولات را بهبود بخشد. در تمام مواردی که بر اساس نتایج تعداد محدودی از مشاهدات، لازم است دلایل بهبود یا بدتر شدن دقت و پایداری تجهیزات تکنولوژیکی مشخص شود، باید از روش‌های آماری استفاده شود. تحت دقت فرآیند فن آوری، ویژگی فرآیند فن آوری درک می شود که نزدیکی مقادیر واقعی و اسمی پارامترهای محصولات تولیدی را تعیین می کند. تحت ثبات فرآیند تکنولوژیکی، ویژگی فرآیند تکنولوژیکی درک می شود که ثبات توزیع احتمال را برای پارامترهای آن در یک دوره زمانی معین بدون دخالت خارجی تعیین می کند.

اهداف استفاده از روش های آماری برای تجزیه و تحلیل دقت و پایداری فرآیندهای تکنولوژیکی و کیفیت محصول در مراحل توسعه، تولید و بهره برداری (مصرف) محصولات به ویژه عبارتند از:

* تعیین شاخص های واقعی دقت و ثبات فرآیند فن آوری، تجهیزات یا کیفیت محصول؛

* ایجاد انطباق کیفیت محصول با الزامات اسناد نظارتی و فنی؛

* تأیید انطباق با نظم فنی؛

* مطالعه عوامل تصادفی و سیستماتیک که می تواند منجر به ظهور نقص شود.

* شناسایی ذخایر تولید و فناوری؛

* توجیه استانداردهای فنیو تاییدیه های محصول

* ارزیابی نتایج آزمایش نمونه های اولیه در اثبات الزامات محصولات و استانداردهای آن.

* اثبات انتخاب تجهیزات تکنولوژیکی و ابزار اندازه گیری و آزمایش؛

* مقایسه نمونه های مختلف محصول؛

* اثبات جایگزینی کنترل مداوم با آماری.

* شناسایی امکان معرفی روش های آماری مدیریت کیفیت محصول و غیره.

برای دستیابی به اهداف فوق، روش های مختلفتوصیف داده ها، ارزیابی و آزمون فرضیه ها. اجازه دهید مثال هایی از بیان مسئله ارائه دهیم.

2.3 مسائل آمار تک بعدی (آمار متغیرهای تصادفی)

مقایسه انتظارات ریاضی در مواردی انجام می شود که لازم است مطابقت بین شاخص های کیفیت محصولات تولیدی و نمونه مرجع ایجاد شود. این وظیفه آزمایش فرضیه است:

H0: M(X) = m0،

که در آن m0 مقدار مربوط به نمونه مرجع است. X یک متغیر تصادفی است که نتایج مشاهدات را شبیه سازی می کند. بسته به فرمول بندی مدل احتمالی موقعیت و فرضیه جایگزین، مقایسه انتظارات ریاضی به دو روش پارامتریک یا ناپارامتریک انجام می شود.

مقایسه واریانس ها زمانی انجام می شود که لازم باشد تفاوت بین پراکندگی شاخص کیفیت و اسمی مشخص شود. برای انجام این کار، این فرضیه آزمایش می شود:

مهمتر از مسائل آزمون فرضیه ها، مسائل تخمین پارامتر هستند. آنها مانند وظایف آزمون فرضیه ها، بسته به مدل احتمالی مورد استفاده موقعیت، به پارامتری و ناپارامتریک تقسیم می شوند.

در مسائل تخمین پارامتریک، یک مدل احتمالی اتخاذ می شود که بر اساس آن نتایج مشاهدات x1، x2، ...، xn به عنوان تحقق n متغیر تصادفی مستقل با تابع توزیع F(x;u) در نظر گرفته می شود. در اینجا و یک پارامتر ناشناخته است که در فضای پارامتر قرار دارد و توسط مدل احتمالی استفاده شده ارائه می شود. وظیفه تخمین تعیین تخمین نقطه ای و حدود اطمینان (یا منطقه اطمینان) برای پارامتر و.

پارامتر و یا یک عدد یا بردار یک بعد محدود ثابت است. بنابراین، برای توزیع نرمال، u = (m، y2) یک بردار دو بعدی است، برای توزیع دو جمله ای، u = p یک عدد است، برای توزیع گاما
و = (a, b, c) یک بردار سه بعدی است و غیره.

در آمارهای ریاضی مدرن تعدادی از روش های رایجتعیین تخمین ها و حدود اطمینان - روش گشتاورها، روش حداکثر احتمال، روش تخمین های یک مرحله ای، روش برآوردهای پایدار (محکم)، روش برآوردهای بی طرفانه و غیره.

بیایید نگاهی گذرا به سه مورد اول بیاندازیم.

روش گشتاورها بر اساس استفاده از عباراتی برای ممان متغیرهای تصادفی در نظر گرفته شده از نظر پارامترهای توابع توزیع آنها است. تخمین روش گشتاورها با جایگزینی گشتاورهای نمونه به جای گشتاورهای نظری در توابعی که پارامترها را بر حسب ممان بیان می کنند به دست می آید.

در روش حداکثر درستنمایی که عمدتاً توسط R.A. Fisher توسعه یافته است، به عنوان تخمین پارامتر و مقدار u* در نظر گرفته شده است که به اصطلاح تابع درستنمایی حداکثر است.

f(x1، u) f(x2، u) … f(xn، u)،

که در آن x1، x2،…، xn نتایج مشاهدات هستند. f(x,u) چگالی توزیع آنها است، بسته به پارامتر u که باید تخمین زده شود.

برآوردگرهای حداکثر درستنمایی عموماً کارآمد (یا مجانبی کارآمد) هستند و واریانس کمتری نسبت به روش برآوردگرهای گشتاور دارند. در برخی موارد، فرمول های آنها به صراحت نوشته می شود (توزیع عادی، توزیع نمایی بدون تغییر). با این حال، اغلب برای یافتن آنها، حل عددی یک سیستم معادلات ماورایی (توزیع های Weibull-Gnedenko، گاما) ضروری است. در چنین مواردی، توصیه می‌شود از تخمین‌های احتمال حداکثری استفاده نکنید، بلکه از انواع دیگر تخمین‌ها، عمدتاً تخمین‌های یک مرحله‌ای استفاده کنید.

در مسائل برآورد ناپارامتری، یک مدل احتمالی اتخاذ می شود که در آن نتایج مشاهدات x1، x2،…، xn به عنوان تحقق n متغیر تصادفی مستقل با تابع توزیع F(x) در نظر گرفته می شود. نمای کلی. F(x) فقط برای تحقق شرایط خاصی مانند تداوم، وجود انتظار و پراکندگی ریاضی و غیره مورد نیاز است. چنین شرایطی به سختی شرط تعلق به یک خانواده پارامتری خاص نیست.

در یک فرمول ناپارامتریک، یا ویژگی های یک متغیر تصادفی (انتظار ریاضی، واریانس، ضریب تغییرات) و یا تابع توزیع، چگالی و ... برآورد می شود. بنابراین، به موجب قانون اعداد بزرگ، میانگین نمونه حسابی یک تخمین ثابت از انتظار ریاضی M(X) است (برای هر تابع توزیع F(x) از نتایج مشاهداتی که انتظار ریاضی برای آن وجود دارد). با کمک قضیه حد مرکزی، مرزهای اطمینان مجانبی تعیین می شوند

(M(X))H = , (M(X))B = .

جایی که g - سطح اطمینان، - چندک از ترتیب توزیع نرمال استاندارد N(0;1) با انتظار ریاضی صفر و واریانس واحد، - میانگین حسابی نمونه، s - انحراف استاندارد نمونه. اصطلاح "محدوده های اطمینان مجانبی" به این معنی است که احتمالات

P((M(X))H< M(X)}, P{(M(X))B >M(X))

P((M(X))H< M(X) < (M(X))B}

تمایل به، و r، به ترتیب، برای n > ?، اما، به طور کلی، با این مقادیر برای n محدود برابر نیستند. در عمل، کران اطمینان مجانبی دقت کافی برای n از مرتبه 10 می دهد.

دومین مثال از تخمین ناپارامتریک، تخمین تابع توزیع است. با قضیه گلیونکو، تابع توزیع تجربی Fn(x) یک تخمین ثابت از تابع توزیع F(x) است. اگر F(x) یک تابع پیوسته باشد، بر اساس قضیه کولموگروف، حدود اطمینان برای تابع توزیع F(x) به صورت داده شده است.

(F(x))Н = حداکثر، (F(x))B = حداقل،

که در آن k(r,n) مرتبه توزیع آماره کلموگروف برای اندازه نمونه n است (به یاد بیاورید که توزیع این آمار به F(x) بستگی ندارد).

قوانین تعیین تخمین ها و محدودیت های اطمینان در حالت پارامتریک بر اساس خانواده پارامتری توزیع F(x;u) است. هنگام پردازش داده های واقعی، این سوال مطرح می شود - آیا این داده ها با مدل احتمالی پذیرفته شده مطابقت دارند؟ آن ها فرضیه آماری که نتایج مشاهدات دارای تابع توزیع از خانواده (F(x; u)، u) برای برخی u = u0 است؟ به این گونه فرضیه ها، فرضیه های برازندگی و معیارهای تأیید آن ها را «خوب بودن برازش» می گویند.

اگر مقدار واقعی پارامتر u = u0 مشخص باشد، تابع توزیع F(x; u0) پیوسته است، در این صورت از آزمون کولموگروف بر اساس آمار اغلب برای آزمون فرضیه برازش استفاده می شود.

که در آن Fn(x) تابع توزیع تجربی است.

اگر مقدار واقعی پارامتر u0 ناشناخته باشد، به عنوان مثال، هنگام آزمایش فرضیه در مورد نرمال بودن توزیع نتایج مشاهدات (به عنوان مثال، هنگام بررسی اینکه آیا این توزیع به خانواده توزیع های نرمال تعلق دارد)، گاهی اوقات از آمار استفاده می شود.

تفاوت آن با آمار کلموگروف Dn در این است که به جای مقدار واقعی پارامتر u0، تخمین آن u* جایگزین می شود.

توزیع آمار Dn(u*) بسیار متفاوت از توزیع آمار Dn است. به عنوان مثال، زمانی که u = (m, y2) و u* = (, s2) بررسی نرمال بودن را در نظر بگیرید. برای این مورد، کمیت های توزیع آمار Dn و Dn(u*) در جدول 1 آورده شده است. بنابراین، چندک ها حدود 1.5 برابر متفاوت هستند.

جدول 1 - کمیت های آمار Dn و Dn(u*) هنگام تست نرمال بودن

در پردازش اولیه داده های آماری، یک وظیفه مهم حذف نتایج مشاهدات به دست آمده در نتیجه خطاها و اشتباهات فاحش است. به عنوان مثال، هنگام مشاهده داده های وزن (به کیلوگرم) نوزادان به همراه اعداد 3500، 2750، 4200، ممکن است عدد 35.00 ظاهر شود. واضح است که این اشتباه است و با یک ورودی اشتباه یک عدد اشتباه به دست آمد - کاما با یک علامت جابه جا شد، در نتیجه مشاهده، نتیجه مشاهده به اشتباه 10 برابر افزایش یافت.

روش‌های آماری برای حذف موارد پرت مبتنی بر این فرض است که چنین مشاهداتی دارای توزیع‌هایی هستند که به شدت با مشاهدات مورد مطالعه متفاوت است و بنابراین باید از نمونه حذف شوند.

ساده ترین مدل احتمالی به شرح زیر است. بر اساس فرضیه صفر، نتایج مشاهدات به عنوان تحقق متغیرهای تصادفی مستقل با توزیع یکسان X1، X2، Xn با تابع توزیع F(x) در نظر گرفته می شود. تحت فرضیه جایگزین، X1، X2، Xn-1 مانند فرضیه صفر هستند و Xn مربوط به یک خطای فاحش است و تابع توزیع G(x) = F(x - c) دارد، که در آن c بزرگ است. سپس، با احتمال نزدیک به 1 (به طور دقیق تر، با افزایش حجم نمونه، تمایل به 1 وجود دارد)،

Xn = حداکثر (X1، X2، Xn) = Xmax،

آن ها هنگام توصیف داده ها، Xmax باید به عنوان یک خطای فاحش احتمالی در نظر گرفته شود. منطقه بحرانی شکل دارد

W \u003d (x: x\u003e d).

مقدار بحرانی d = d(b, n) بسته به سطح معنی‌داری b و اندازه نمونه n از شرایط انتخاب می‌شود.

P(Xmax > d | H0) = b (1)

شرط (1) برای n بزرگ و b کوچک معادل زیر است:

اگر تابع توزیع نتایج مشاهدات F(x) مشخص باشد، مقدار بحرانی d از رابطه (2) بدست می آید. مثلاً اگر F(x) تا پارامترها شناخته شود، معلوم می شود که F(x) است عملکرد عادیتوزیع، سپس قواعد آزمون فرضیه مورد بررسی نیز تدوین می شود.

با این حال، اغلب شکل تابع توزیع نتایج مشاهدات نه کاملاً دقیق و نه به اندازه پارامترها، بلکه فقط با مقداری خطا شناخته می شود. سپس رابطه (2) عملاً بی فایده می شود، زیرا یک خطای کوچک در تعیین F(x)، همانطور که نشان داده می شود، منجر به خطای بزرگ در تعیین مقدار بحرانی d از شرط (2) می شود، و در d ثابت، اهمیت سطح معیار ممکن است به طور قابل توجهی با اسمی متفاوت باشد.

بنابراین، در شرایطی که اطلاعات کاملی در مورد F(x) وجود ندارد، اما انتظار ریاضی M(X) و واریانس y2 = D(X) نتایج مشاهدات X1، X2، Xn مشخص است، قوانین رد ناپارامتریک بر اساس نابرابری چبیشف می توان استفاده کرد. با استفاده از این نابرابری، مقدار بحرانی d = d(b, n) را به گونه ای می یابیم که

آنگاه رابطه (3) ارضا خواهد شد اگر

با نابرابری چبیشف

بنابراین، برای برآورده شدن (4) کافی است که سمت راست فرمول های (4) و (5) را برابر کنیم، یعنی. d را از شرط تعیین کنید

قاعده رد بر اساس مقدار بحرانی d محاسبه شده با فرمول (6) از حداقل اطلاعات مربوط به تابع توزیع F(x) استفاده می کند و بنابراین فقط مشاهداتی را که بسیار دور از جرم اصلی هستند حذف می کند. به عبارت دیگر، مقدار d1 داده شده توسط رابطه (1) معمولاً بسیار کوچکتر از مقدار d2 داده شده توسط رابطه (6) است.

2.4 تجزیه و تحلیل آماری چند متغیره

برای حل مسائل زیر از تحلیل آماری چند متغیره استفاده می شود:

* مطالعه رابطه بین ویژگی ها.

* طبقه بندی اشیا یا ویژگی های داده شده توسط بردارها.

* کاهش ابعاد فضای ویژگی.

در این مورد، نتیجه مشاهدات بردار مقادیر تعداد ثابتی از ویژگی های کمی و گاهی کیفی اندازه گیری شده در یک شی است. علامت کمی نشانه یک واحد مشاهده شده است که می تواند مستقیماً با یک عدد و یک واحد اندازه گیری بیان شود. یک ویژگی کمی با یک ویژگی کیفی مخالف است - یک ویژگی یک واحد مشاهده شده که با انتساب به یکی از دو یا چند دسته شرطی تعیین می شود (اگر دقیقاً دو دسته وجود داشته باشد، آن خصیصه جایگزین نامیده می شود). تجزیه و تحلیل آماری ویژگی های کیفی بخشی از آمار اشیاء غیر عددی است. علائم کمی به علائم اندازه گیری شده در مقیاس های فواصل، نسبت ها، تفاوت ها، مطلق تقسیم می شوند.

و کیفی - در علائم اندازه گیری شده در مقیاس نام ها و مقیاس ترتیبی. روش های پردازش داده ها باید با مقیاس هایی که ویژگی های در نظر گرفته شده در آنها اندازه گیری می شود، سازگار باشد.

اهداف مطالعه رابطه بین ویژگی ها اثبات وجود رابطه بین ویژگی ها و بررسی این رابطه است. برای اثبات وجود ارتباط بین دو متغیر تصادفی X و Y از تحلیل همبستگی استفاده می شود. اگر توزیع مشترک X و Y نرمال باشد، استنباط های آماری بر اساس ضریب همبستگی خطی نمونه، در سایر موارد از ضرایب همبستگی رتبه کندال و اسپیرمن و برای ویژگی های کیفی از آزمون کای دو استفاده می شود. .

از تحلیل رگرسیون برای مطالعه وابستگی عملکردی صفت کمی Y به صفات کمی x(1)، x(2)، ...، x(k) استفاده می شود. این وابستگی را رگرسیون یا به طور خلاصه رگرسیون می نامند. ساده ترین مدل احتمالی تحلیل رگرسیون (در مورد k = 1) از مجموعه ای از جفت نتایج مشاهده (xi, yi) به عنوان اطلاعات اولیه استفاده می کند، i = 1، 2، ...، n، و دارای شکل

yi = محور + b + ei، i = 1، 2، …، n،

جایی که ei خطاهای مشاهده است. گاهی اوقات فرض می شود که ei متغیرهای تصادفی مستقل با توزیع نرمال یکسان N(0, y2) هستند. از آنجایی که توزیع خطاهای مشاهده معمولاً با نرمال متفاوت است، توصیه می شود که مدل رگرسیون را در یک فرمول ناپارامتریک در نظر بگیرید. برای توزیع دلخواه ei.

وظیفه اصلی تحلیل رگرسیون تخمین پارامترهای مجهول a و b است که وابستگی خطی y به x را تعیین می کند. برای حل این مشکل از روش حداقل مربعات توسعه یافته توسط K. Gauss در سال 1794 استفاده می شود، i.e. تخمین پارامترهای مدل ناشناخته a و b را از شرط کمینه کردن مجموع مربعات پیدا کنید

برای متغیرهای a و b.

از تحلیل واریانس برای مطالعه تاثیر ویژگی های کیفی بر یک متغیر کمی استفاده می شود. به عنوان مثال، اجازه دهید k نمونه از نتایج اندازه گیری وجود داشته باشد شاخص کمیکیفیت واحدهای محصول تولید شده بر روی k ماشین ها، یعنی. مجموعه ای از اعداد (x1(j)، x2(j)، ...، xn(j))، که j عدد ماشین است، j = 1، 2، …، k، و n اندازه نمونه است. در یک فرمول رایج تحلیل واریانس، فرض می شود که نتایج اندازه گیری مستقل هستند و در هر نمونه دارای توزیع نرمال N(m(j)، y2) با واریانس یکسان است.

بررسی یکنواختی کیفیت محصول، به عنوان مثال. عدم تأثیر عدد ماشین بر کیفیت محصول، به آزمایش فرضیه ختم می شود

H0: m(1) = m(2) = … = m(k).

در تجزیه و تحلیل پراکندگی، روش هایی برای آزمایش چنین فرضیه هایی توسعه یافته است.

فرضیه H0 در برابر فرضیه جایگزین H1 آزمایش می شود که طبق آن حداقل یکی از برابری های نشان داده شده برآورده نمی شود. تأیید این فرضیه بر اساس "تجزیه واریانس ها" زیر است که توسط R.A. Fisher نشان داده شده است:

که در آن s2 واریانس نمونه در نمونه تلفیقی است، یعنی.

بنابراین، اولین عبارت در سمت راست فرمول (7) پراکندگی درون گروهی را نشان می دهد. در نهایت، واریانس بین گروهی،

حوزه آمارهای کاربردی مرتبط با بسط واریانس نوع فرمول (7) را تحلیل واریانس می گویند. به عنوان نمونه ای از مسئله تحلیل واریانس، آزمون فرضیه H0 فوق را با این فرض در نظر بگیرید که نتایج اندازه گیری مستقل هستند و در هر نمونه توزیع نرمال N(m(j)، y2) با واریانس یکسان دارند. اگر H0 درست باشد، جمله اول در سمت راست فرمول (7)، تقسیم بر y2، دارای توزیع کای دو با k(n-1) درجه آزادی است، و جمله دوم، تقسیم بر y2، نیز توزیع کای دو، اما با (k-1) درجه آزادی، و جمله اول و دوم به عنوان متغیرهای تصادفی مستقل هستند. بنابراین متغیر تصادفی

دارای توزیع فیشر با درجه آزادی صورتگر (k-1) و درجه آزادی مخرج k(n-1). فرضیه H0 پذیرفته می شود اگر F< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

روش های ناپارامتریک برای حل مسائل کلاسیک تجزیه و تحلیل پراکندگی، به ویژه، آزمایش فرضیه H0، توسعه یافته است.

نوع بعدی مسائل تحلیل آماری چند متغیره، مسائل طبقه بندی است. آنها اساساً به سه دسته تقسیم می شوند نوع متفاوت- تجزیه و تحلیل متمایز، تجزیه و تحلیل خوشه ای، مشکلات گروه بندی.

وظیفه تجزیه و تحلیل متمایز یافتن قاعده ای برای تخصیص یک شی مشاهده شده به یکی از کلاس های توصیف شده قبلی است. در این حالت، اشیاء در یک مدل ریاضی با استفاده از بردارهایی توصیف می شوند که مختصات آنها حاصل مشاهده تعدادی ویژگی برای هر جسم است. کلاس ها یا مستقیماً با شرایط ریاضی یا با استفاده از نمونه های آموزشی توصیف می شوند. نمونه آموزشی نمونه ای است که برای هر عنصر مشخص می شود که به کدام کلاس تعلق دارد.

...

اسناد مشابه

    تاریخچه اقتصاد سنجی و آمار کاربردی. آمار کاربردی در اقتصاد ملی. نقاط رشد آمار ناپارامتریک آمار اشیاء غیر عددی بخشی از آمار کاربردی است.

    چکیده، اضافه شده در 01/08/2009

    اجزای ساختاری جزء قطعی. هدف اصلی تحلیل آماری سری های زمانی. پیش‌بینی برون‌یابی فرآیندهای اقتصادی. شناسایی مشاهدات غیرعادی و همچنین ساخت مدل های سری زمانی.

    مقاله ترم، اضافه شده 03/11/2014

    مدل های آماری تصمیم گیری توصیف مدل‌هایی با توزیع احتمال شناخته شده وضعیت محیط. توجه ساده ترین مدارفرآیند تصمیم گیری پویا انجام محاسبه احتمال تغییر شرکت.

    کار کنترل، اضافه شده در 11/07/2011

    روش های آماری برای تحلیل سری های زمانی تک بعدی، حل مسائل تحلیل و پیش بینی، رسم نمودار شاخص مورد مطالعه. معیارهای شناسایی اجزای سری، آزمون فرضیه تصادفی بودن سری و مقادیر خطاهای استاندارد.

    کار کنترل، اضافه شده 08/13/2010

    نقش روش های آماری در ارزیابی عینی ویژگی های کمی و کیفی فرآیند مدیریت. استفاده از ابزارهای کیفی در تجزیه و تحلیل فرآیندها و پارامترهای محصول. متغیرهای تصادفی گسسته نظریه احتمال.

    مقاله ترم، اضافه شده 01/11/2015

    نظریه ریاضیتصمیم گیری بهینه روش سیمپلکس جدولی فرمول بندی و حل مسئله دوگانه برنامه ریزی خطی. مدل ریاضی وظیفه حمل و نقل. تجزیه و تحلیل امکان سنجی تولید محصولات در شرکت.

    کار کنترل، اضافه شده در 2012/06/13

    جمعیت عمومی، انتخابی. مبانی روش شناختیتحلیل آماری احتمالی توابع MathCad طراحی شده برای حل مسائل آمار ریاضی. حل مسائل در MS Excel با استفاده از فرمول ها و با استفاده از منوی "تجزیه و تحلیل داده ها".

    مقاله ترم، اضافه شده در 2014/01/20

    محاسبه میزان هزینه های طرح تولید. ضرایب معادله خطی رگرسیون زوجی. ویژگی های تفسیر گرافیکی نتایج. توسعه فرآیندهای اقتصادی ویژگی های مدل سازی اقتصادسنجی سری های زمانی.

    تست، اضافه شده در 2011/02/22

    عناصر اساسی تحلیل اقتصاد سنجی سری های زمانی. وظایف تجزیه و تحلیل و پردازش اولیه آنها. حل مسائل پیش بینی کوتاه مدت و میان مدت مقادیر سری زمانی. روشهای یافتن پارامترهای معادله روند. روش حداقل مربعات

    کار کنترل، اضافه شده در 06/03/2009

    مفاهیم اولیه در مورد رویدادهای تصادفی، کمیت ها و توابع. ویژگی های عددی متغیرهای تصادفی انواع عدم تقارن توزیع ها. ارزیابی آماری توزیع متغیرهای تصادفی. حل مسائل شناسایی ساختاری-پارامتری.

رویکردها، ایده‌ها و نتایج تئوری احتمالات و آمار ریاضی چگونه در تصمیم‌گیری استفاده می‌شوند؟

پایه یک مدل احتمالی از یک پدیده یا فرآیند واقعی است، به عنوان مثال. یک مدل ریاضی که در آن روابط عینی بر حسب نظریه احتمال بیان می شود. احتمالات عمدتاً برای توصیف عدم قطعیت هایی که باید در هنگام تصمیم گیری در نظر گرفته شوند استفاده می شود. این هم به فرصت های نامطلوب (خطرات) و هم به فرصت های جذاب ("شانس خوش شانس") اشاره دارد. گاهی اوقات تصادفی بودن به طور عمدی وارد وضعیت می شود، به عنوان مثال، هنگام قرعه کشی، انتخاب تصادفی واحدها برای کنترل، انجام قرعه کشی یا نظرسنجی مصرف کنندگان.

نظریه احتمال به فرد امکان می دهد تا احتمالات دیگری را که مورد علاقه محقق است محاسبه کند. به عنوان مثال، با احتمال افتادن یک نشان، می توانید احتمال افتادن حداقل 3 نشان را در 10 پرتاب سکه محاسبه کنید. چنین محاسبه ای مبتنی بر یک مدل احتمالی است که بر اساس آن پرتاب سکه توسط طرحی از آزمایشات مستقل توصیف می شود، علاوه بر این، نشان و شبکه به یک اندازه محتمل هستند و بنابراین احتمال هر یک از این رویدادها برابر است با ½. مدلی پیچیده تر است که به جای پرتاب سکه، کیفیت یک واحد خروجی را بررسی می کند. مدل احتمالی مربوطه بر این فرض استوار است که کنترل کیفیت واحدهای مختلف تولید با طرحی از آزمایش‌های مستقل توصیف می‌شود. در مقایسه با مدل پرتاب سکه، یک پارامتر جدید باید معرفی شود - احتمال p که یک واحد تولید معیوب است. اگر فرض بر این باشد که احتمال معیوب بودن همه واحدهای تولیدی یکسان است، مدل به طور کامل تشریح خواهد شد. اگر آخرین فرض نادرست باشد، تعداد پارامترهای مدل افزایش می یابد. به عنوان مثال، می توان فرض کرد که هر واحد تولیدی احتمال معیوب بودن خود را دارد.

اجازه دهید در مورد یک مدل کنترل کیفیت با احتمال عیب مشترک p برای همه واحدهای تولید بحث کنیم. برای "دستیابی به عدد" در هنگام تجزیه و تحلیل مدل، لازم است که مقدار خاصی را با p جایگزین کنید. برای این کار باید از چارچوب یک مدل احتمالی فراتر رفت و به داده های به دست آمده در حین کنترل کیفیت روی آورد.

آمار ریاضی مشکل معکوس را با توجه به نظریه احتمال حل می کند. هدف آن نتیجه گیری در مورد احتمالات زیربنایی مدل احتمالی بر اساس نتایج مشاهدات (اندازه گیری ها، تجزیه و تحلیل ها، آزمون ها، آزمایش ها) است. برای مثال، بر اساس فراوانی وقوع محصولات معیوب در حین کنترل، می توان در مورد احتمال نقص نتیجه گیری کرد (به قضیه برنولی در بالا مراجعه کنید).

بر اساس نابرابری چبیشف، نتایجی در مورد مطابقت فراوانی وقوع محصولات معیوب با این فرضیه که احتمال نقص مقدار معینی می گیرد، به دست آمد.

بنابراین، کاربرد آمار ریاضی بر اساس مدل احتمالی یک پدیده یا فرآیند است. از دو سری مفاهیم موازی استفاده می شود - مفاهیم مربوط به نظریه (یک مدل احتمالی) و مفاهیم مربوط به عمل (نمونه ای از نتایج مشاهده). به عنوان مثال، احتمال نظری با فرکانس یافت شده از نمونه مطابقت دارد. انتظارات ریاضی (سری نظری) با میانگین حسابی نمونه (سری عملی) مطابقت دارد. به عنوان یک قاعده، ویژگی های نمونه تخمین هایی از موارد نظری است. در عین حال، کمیت های مربوط به مجموعه نظری "در ذهن محققین است"، به دنیای ایده ها (به گفته فیلسوف یونان باستان افلاطون) اشاره دارد و برای اندازه گیری مستقیم در دسترس نیست. محققان فقط داده های انتخابی دارند که با کمک آنها سعی می کنند ویژگی های یک مدل احتمالی نظری را که مورد علاقه آنها است ایجاد کنند.

چرا به یک مدل احتمالی نیاز داریم؟ واقعیت این است که فقط با کمک آن می توان خواص ایجاد شده توسط نتایج تجزیه و تحلیل یک نمونه خاص را به نمونه های دیگر و همچنین به کل به اصطلاح عمومی منتقل کرد. اصطلاح "جمعیت" برای اشاره به جمعیت بزرگ اما محدودی از واحدهای مورد مطالعه استفاده می شود. به عنوان مثال، در مورد کل همه ساکنان روسیه یا کل مصرف کنندگان قهوه فوری در مسکو. هدف از بازاریابی یا نظرسنجی های جامعه شناختی انتقال اظهارات دریافتی از نمونه ای متشکل از صدها یا هزاران نفر به جمعیت های عمومی چند میلیون نفری است. در کنترل کیفیت، دسته ای از محصولات به عنوان یک جمعیت عمومی عمل می کنند.

برای انتقال استنباط از یک نمونه به یک جامعه بزرگتر، برخی از فرضیات در مورد رابطه ویژگی های نمونه با ویژگی های این جمعیت بزرگتر مورد نیاز است. این مفروضات بر اساس یک مدل احتمالی مناسب است.

البته پردازش داده های نمونه بدون استفاده از یک مدل احتمالی دیگر امکان پذیر است. به عنوان مثال، می توانید میانگین حسابی نمونه را محاسبه کنید، فراوانی تحقق شرایط خاص و غیره را محاسبه کنید. با این حال، نتایج محاسبات فقط برای یک نمونه خاص اعمال می شود؛ انتقال نتایج به دست آمده با کمک آنها به هر مجموعه دیگری نادرست است. این فعالیت گاهی اوقات به عنوان "تحلیل داده" نامیده می شود. در مقایسه با روش های احتمالی-آماری، تحلیل داده ها ارزش شناختی محدودی دارد.

بنابراین، استفاده از مدل‌های احتمالی مبتنی بر تخمین و آزمون فرضیه‌ها با کمک ویژگی‌های نمونه، جوهره روش‌های تصمیم‌گیری احتمالی-آماری است.

اجازه دهید تأکید کنیم که منطق استفاده از ویژگی‌های نمونه برای تصمیم‌گیری بر اساس مدل‌های نظری، شامل استفاده همزمان از دو سری مفهومی موازی است که یکی از آنها مربوط به مدل‌های احتمالی و دیگری مربوط به داده‌های نمونه است. متأسفانه در تعدادی از منابع ادبی که معمولاً منسوخ یا با روحیه نسخه‌نویسی نوشته شده‌اند، بین ویژگی‌های گزینشی و نظری تمایزی قائل نشده‌اند که خوانندگان را در استفاده عملی از روش‌های آماری دچار سردرگمی و اشتباه می‌کند.

روش‌های تصمیم‌گیری در شرایط ریسک نیز در چارچوب نظریه تصمیم‌گیری آماری توسعه یافته و توجیه می‌شوند. تئوری تصمیم گیری آماری نظریه هدایت است مشاهدات آماری، پردازش این مشاهدات و استفاده از آنها. همانطور که می دانید، وظیفه تحقیقات اقتصادی درک ماهیت شی اقتصادی، آشکار ساختن مکانیسم رابطه بین مهم ترین متغیرهای آن است. این درک امکان توسعه و پیاده سازی را فراهم می کند اقدامات لازمبرای مدیریت این شی، یا سیاست اقتصادی. این امر مستلزم روش‌های مناسب برای کار است، با در نظر گرفتن ماهیت و ویژگی‌های داده‌های اقتصادی که به عنوان مبنایی برای اظهارات کمی و کیفی در مورد موضوع یا پدیده اقتصادی مورد مطالعه عمل می‌کند.

هر داده اقتصادی ویژگی های کمی هر شی اقتصادی است. آنها تحت تأثیر عوامل بسیاری تشکیل می شوند که همه آنها در دسترس کنترل خارجی نیستند. عوامل غیرقابل کنترل می توانند مقادیر تصادفی را از مجموعه ای از مقادیر بگیرند و در نتیجه باعث تصادفی بودن داده هایی که تعیین می کنند شوند. ماهیت تصادفی داده‌های اقتصادی، استفاده از روش‌های آماری ویژه مناسب برای تحلیل و پردازش آنها را ضروری می‌سازد.

ارزیابی کمی از ریسک کارآفرینی، صرف نظر از محتوای یک کار خاص، معمولاً با استفاده از روش های آمار ریاضی امکان پذیر است. ابزارهای اصلی این روش تخمین واریانس، انحراف معیار، ضریب تغییرات است.

برنامه ها از ساختارهای عمومی بر اساس معیارهای تغییرپذیری یا احتمال حالت های مخاطره آمیز استفاده گسترده ای می کنند. بنابراین، ریسک‌های مالی ناشی از نوسانات در نتیجه حول مقدار مورد انتظار، برای مثال، کارایی، با استفاده از واریانس یا انحراف مطلق مورد انتظار از میانگین برآورد می‌شوند. در مسائل مدیریت پول، معیار رایج درجه ریسک، احتمال ضرر یا کسری درآمد در مقایسه با گزینه پیش بینی شده است.

برای ارزیابی میزان ریسک (درجه خطر)، بر معیارهای زیر تمرکز خواهیم کرد:

  • 1) میانگین ارزش مورد انتظار؛
  • 2) نوسان (تغییرپذیری) یک نتیجه ممکن.

برای نمونه آماری

جایی که Xj - مقدار مورد انتظار برای هر مورد مشاهده (/" = 1، 2، ...)، n، - تعداد موارد مشاهده (فرکانس) مقدار n:، x=E - میانگین مقدار مورد انتظار، st - واریانس،

V - ضریب تغییرات، داریم:

مشکل ارزیابی ریسک برای قراردادهای تجاری را در نظر بگیرید. LLC "Interproduct" تصمیم می گیرد قراردادی را برای تامین مواد غذایی از یکی از سه پایگاه منعقد کند. با جمع‌آوری داده‌های مربوط به زمان پرداخت کالا توسط این پایگاه‌ها (جدول 6.7)، لازم است پس از ارزیابی ریسک، هنگام انعقاد قرارداد برای عرضه محصولات، مبنایی را انتخاب کنید که در کوتاه‌ترین زمان ممکن هزینه کالا را پرداخت کند. .

جدول 6.7

شرایط پرداخت در روز

تعداد موارد مشاهده پ

اسب بخار

(x-x)

(x-x ) 2

(x-x) 2 p

برای پایه اول، بر اساس فرمول (6.4.1):

برای پایه دوم

برای پایه سوم

ضریب تغییرات برای پایه اول کوچکترین است که نشان دهنده مصلحت انعقاد قرارداد برای عرضه محصولات با این پایه است.

مثال‌های در نظر گرفته شده نشان می‌دهند که ریسک دارای احتمال زیان بیان شده ریاضی است که بر اساس داده‌های آماری است و می‌تواند با دقت نسبتاً بالایی محاسبه شود. هنگام انتخاب قابل قبول ترین راه حل، از قانون احتمال بهینه نتیجه استفاده می شود که عبارت است از این که از بین راه حل های ممکن، یکی انتخاب می شود که در آن احتمال نتیجه برای کارآفرین قابل قبول باشد.

در عمل، اعمال قاعده احتمال نتیجه مطلوب معمولاً با قانون تغییرپذیری نتیجه مطلوب ترکیب می شود.

همانطور که می دانید، نوسان شاخص ها با واریانس، انحراف معیار و ضریب تغییرات آنها بیان می شود. جوهر قاعده نوسان بهینه نتیجه این است که از بین راه حل های ممکن، راه حلی انتخاب می شود که در آن احتمال برد و باخت برای همان سرمایه گذاری پرخطر سرمایه دارای شکاف کوچکی باشد، یعنی. کوچکترین مقدار واریانس، انحراف استاندارد تغییرات. در مسائل مورد بررسی، انتخاب راه حل های بهینه با استفاده از این دو قانون صورت گرفت.

با توجه به اینکه چه نوع داده ای "در ورودی" است:

2.1. شماره.

2.2. بردارهای با ابعاد محدود.

2.3. توابع (سری زمانی).

2.4. اشیاء غیر عددی.

جالب ترین طبقه بندی بر اساس آن دسته از وظایف کنترل است که برای حل آنها از روش های اقتصادسنجی استفاده می شود. با این رویکرد، بلوک ها را می توان تخصیص داد:

3.1. پشتیبانی از پیش بینی و برنامه ریزی

3.2. ردیابی پارامترهای کنترل شدهو تشخیص انحرافات

3.3. حمایت کردن تصمیم گیری، و غیره.

چه عواملی فراوانی استفاده از برخی ابزارهای کنترلی اقتصادسنجی را تعیین می کند؟ مانند سایر کاربردهای اقتصادسنجی، دو گروه اصلی از عوامل وجود دارد - اینها وظایفی هستند که باید حل شوند و صلاحیت متخصصان.

در کاربرد عملیروش های اقتصاد سنجی در عملکرد کنترل کننده، لازم است که مناسب اعمال شود سیستم های نرم افزاری. سیستم های آماری عمومی مانند SPSS، Statgraphics، Statistica، ADDA، و تخصصی تر Statcon، SPC، NADIS، REST(طبق آمار داده های بازه ای)، ماتریکسرو خیلی های دیگر. پذیرش انبوه آسان برای استفاده محصولات نرم افزاریکه شامل ابزارهای مدرن اقتصادسنجی برای تجزیه و تحلیل داده های اقتصادی خاص می باشد، می تواند به عنوان یکی از موارد مورد توجه قرار گیرد راه های موثرشتاب پیشرفت علمی و فناوری، اشاعه دانش اقتصاد سنجی مدرن.

اقتصاد سنجی دائما در حال تحول است. تحقیقات کاربردی منجر به نیاز به تحلیل عمیق‌تر روش‌های کلاسیک می‌شود.

یک مثال خوب برای بحث، روش هایی برای آزمایش همگنی دو نمونه است. دو مجموعه وجود دارد و باید تصمیم گرفت که آیا آنها متفاوت هستند یا یکسان هستند. برای انجام این کار، از هر یک از آنها نمونه برداری می شود و از یک روش آماری دیگر برای بررسی همگنی استفاده می شود. حدود 100 سال پیش روش Student مطرح شد که امروزه بسیار مورد استفاده قرار می گیرد. با این حال، یک دسته کامل از کاستی ها دارد. ابتدا، طبق گفته Student، توزیع نمونه باید نرمال (گاوسی) باشد. به عنوان یک قاعده، این مورد نیست. ثانیاً، هدف آن بررسی نه همگنی به طور کلی (به اصطلاح همگنی مطلق، به عنوان مثال، همزمانی توابع توزیع مربوط به دو جمعیت)، بلکه فقط بررسی برابری انتظارات ریاضی است. اما، ثالثاً، لزوماً فرض می شود که واریانس برای عناصر دو نمونه یکسان است. با این حال، بررسی برابری واریانس ها، و حتی بیشتر از آن نرمال بودن، بسیار دشوارتر از برابری انتظارات ریاضی است. بنابراین معمولاً آزمون t Student بدون انجام چنین بررسی هایی اعمال می شود. و سپس نتیجه گیری بر اساس معیار دانشجویی در هوا معلق است.

در تئوری پیشرفته تر، متخصصان به معیارهای دیگر روی می آورند، به عنوان مثال، به معیار Wilcoxon. ناپارامتریک است، یعنی. بر فرض عادی بودن تکیه نمی کند. اما او بدون نقص نیست. نمی توان از آن برای بررسی همگنی مطلق (تصادف توابع توزیع مربوط به دو جمعیت) استفاده کرد. این فقط با کمک به اصطلاح قابل انجام است. معیارهای سازگار، به ویژه، معیارهای اسمیرنوف و نوع امگا مربع.

از نقطه نظر عملی، معیار اسمیرنوف یک اشکال دارد - آمار آن فقط تعداد کمی از مقادیر را می گیرد، توزیع آن در تعداد کمی از نقاط متمرکز است و نمی توان از سطوح معنی داری سنتی 0.05 و 0.01 استفاده کرد. .

اصطلاح "فناوری های آماری بالا". در اصطلاح "فناوری های آماری بالا" هر یک از سه کلمه معنای خاص خود را دارد.

"بالا"، مانند سایر زمینه ها، به این معنی است که این فناوری مبتنی بر دستاوردهای مدرن در تئوری و عمل، به ویژه، نظریه احتمال و آمار ریاضی کاربردی است. در عین حال، "بر اساس دستاوردهای علمی مدرن" اولاً به این معنی است که پایه ریاضی فناوری در چارچوب رشته علمی مربوطه نسبتاً اخیراً به دست آمده است و ثانیاً الگوریتم‌های محاسباتی توسعه یافته و توجیه شده است. مطابق با آن (و به اصطلاح "ابتکاری" نیستند). با گذشت زمان، اگر رویکردها و نتایج جدید ما را مجبور به تجدید نظر در ارزیابی کاربرد و قابلیت‌های فناوری نکند، آن را با فناوری مدرن‌تر جایگزین کنیم، «فناوری اقتصاد سنجی بالا» به «فناوری آماری کلاسیک» تبدیل می‌شود. مانند روش حداقل مربع. بنابراین، فن آوری های آماری بالا از ثمرات جدی اخیر است تحقیق علمی. در اینجا دو مفاهیم کلیدی- «جوانی» فناوری (در هر حال نه بیشتر از 50 سال یا بهتر - نه بیشتر از 10 یا 30 سال) و تکیه بر «علم عالی».

اصطلاح «آماری» آشناست، اما معانی زیادی دارد. بیش از 200 تعریف از اصطلاح "آمار" شناخته شده است.

در نهایت، اصطلاح "تکنولوژی" نسبتاً به ندرت در رابطه با آمار استفاده می شود. تجزیه و تحلیل داده ها، به عنوان یک قاعده، شامل تعدادی روش و الگوریتم است که به صورت متوالی، موازی یا در یک طرح پیچیده تر انجام می شود. به طور خاص، مراحل معمول زیر را می توان متمایز کرد:

  • برنامه ریزی یک مطالعه آماری؛
  • سازماندهی جمع آوری داده ها بر اساس یک برنامه بهینه یا حداقل منطقی (برنامه ریزی نمونه گیری، ایجاد ساختار سازمانیو انتخاب یک تیم از متخصصان، آموزش پرسنلی که در جمع آوری داده ها مشغول به کار خواهند بود، و همچنین کنترل کننده های داده و غیره).
  • جمع آوری مستقیم داده ها و تثبیت آنها بر روی رسانه های مختلف (با کنترل کیفی جمع آوری و رد داده های اشتباه به دلایل حوزه موضوعی).
  • توصیف اولیه داده ها (محاسبه ویژگی های مختلف نمونه، توابع توزیع، تخمین چگالی ناپارامتری، ساخت هیستوگرام، فیلدهای همبستگی، جداول و نمودارهای مختلف و غیره)
  • تخمین مشخصه ها و پارامترهای عددی یا غیرعددی معینی از توزیع ها (به عنوان مثال، تخمین بازه ناپارامتریک ضریب تغییرات یا بازیابی رابطه بین پاسخ و عوامل، به عنوان مثال تخمین تابع)،
  • آزمایش فرضیه های آماری (گاهی اوقات زنجیره آنها - پس از آزمایش فرضیه قبلی، تصمیم به آزمایش یک یا آن فرضیه بعدی گرفته می شود)
  • مطالعه عمیق تر، یعنی استفاده از الگوریتم های مختلف برای تجزیه و تحلیل آماری چند متغیره، الگوریتم های تشخیصی و طبقه بندی، آمار داده های غیر عددی و فاصله ای، تجزیه و تحلیل سری های زمانی و غیره؛
  • بررسی پایداری تخمین‌ها و نتیجه‌گیری‌های به‌دست‌آمده در مورد انحراف‌های مجاز داده‌های اولیه و مفروضات مدل‌های احتمالی-آماری مورد استفاده، تبدیل‌های مجاز مقیاس‌های اندازه‌گیری، به‌ویژه، مطالعه ویژگی‌های تخمین‌ها به روش ضرب نمونه؛
  • استفاده از نتایج آماری به‌دست‌آمده برای اهداف کاربردی (مثلاً برای تشخیص مواد خاص، انجام پیش‌بینی، انتخاب پروژه سرمایه گذاریاز گزینه های پیشنهادی، یافتن حالت بهینه برای اجرای فرآیند فن آوری، جمع بندی نتایج آزمایش نمونه ها دستگاه های فنیو غیره.)،
  • تهیه گزارش های نهایی، به ویژه برای کسانی که متخصص در روش های اقتصاد سنجی و آماری تجزیه و تحلیل داده ها نیستند، از جمله برای مدیریت - "تصمیم گیرندگان" در نظر گرفته شده است.

ساختارهای دیگر فناوری های آماری امکان پذیر است. تاکید بر این نکته ضروری است که کاربرد واجد شرایط و کارآمد روش های آماری به هیچ وجه آزمایش یک فرضیه آماری واحد یا تخمین پارامترهای یک توزیع معین از یک خانواده ثابت نیست. این نوععملیات فقط بلوک های سازنده فناوری آماری هستند. در همین حال، کتاب های درسی و تک نگاری های آمار و اقتصاد سنجی معمولاً در مورد بلوک های سازنده فردی صحبت می کنند، اما مشکلات سازمان خود را به یک فناوری در نظر گرفته شده برای استفاده کاربردی مورد بحث قرار نمی دهند. انتقال از یک روش آماری به روش دیگر در سایه باقی می ماند.

مشکل "تطبیق" الگوریتم های آماری مستلزم توجه ویژه است، زیرا استفاده از الگوریتم قبلی اغلب شرایط کاربردی برای الگوریتم بعدی را نقض می کند. به ویژه، نتایج مشاهدات ممکن است مستقل نباشند، توزیع آنها ممکن است تغییر کند و غیره.

به عنوان مثال، هنگام آزمون فرضیه های آماری، سطح معناداری و قدرت از اهمیت بالایی برخوردار است. روش های محاسبه آنها و استفاده از آنها برای آزمون یک فرضیه معمولاً به خوبی شناخته شده است. اگر ابتدا یک فرضیه مورد آزمایش قرار گیرد و سپس با در نظر گرفتن نتایج تأیید آن، فرضیه دوم، روش نهایی، که می تواند به عنوان آزمون برخی فرضیه های آماری (پیچیده تر) نیز در نظر گرفته شود، دارای ویژگی هایی است (سطح معناداری و قدرت). ) که قاعدتاً نمی توان از نظر ویژگی های دو فرضیه جزء ساده بیان کرد و بنابراین معمولاً ناشناخته هستند. در نتیجه، رویه نهایی را نمی توان مبتنی بر علمی دانست، بلکه متعلق به الگوریتم های اکتشافی است. البته پس از مطالعه مناسب، مثلاً به روش مونت کارلو، می تواند به یکی از رویه های مبتنی بر علمی آمار کاربردی تبدیل شود.

بنابراین، روش تحلیل داده های اقتصادسنجی یا آماری، اطلاعاتی است فرآیند تکنولوژیکی به عبارت دیگر، این یا آن فناوری اطلاعات. در حال حاضر، صحبت در مورد خودکارسازی کل فرآیند تحلیل داده های اقتصادسنجی (آماری) جدی نخواهد بود، زیرا مشکلات حل نشده زیادی وجود دارد که باعث بحث در بین متخصصان می شود.

کل زرادخانه روش های آماری مورد استفاده در حال حاضر را می توان به سه جریان تقسیم کرد:

  • فن آوری های آماری بالا؛
  • فن آوری های آماری کلاسیک،
  • فناوری های آماری پایین

لازم است اطمینان حاصل شود که تنها دو نوع اول فن آوری در مطالعات خاص استفاده می شود.. در عین حال، منظور از فناوری‌های آماری کلاسیک، فناوری‌هایی با سن ارجمند است که ارزش علمی و اهمیت خود را برای عملکرد آماری مدرن حفظ کرده‌اند. اینها هستند روش حداقل مربع، آمار کلموگروف، اسمیرنوف، امگا مربع، ضرایب همبستگی ناپارامتری اسپیرمن و کندال و بسیاری دیگر.

ما نسبت به ایالات متحده و بریتانیای کبیر اقتصاددانان به مراتب کمتری داریم (انجمن آماری آمریکا شامل بیش از 20000 عضو است). روسیه به آموزش متخصصان جدید - اقتصاد سنجی نیاز دارد.

نتایج علمی جدیدی که به دست می‌آید، اگر برای دانشجویان ناشناخته بماند، نسل جدیدی از محققان و مهندسان مجبور می‌شوند به آن‌ها تسلط پیدا کنند، به تنهایی عمل کنند یا حتی دوباره آن‌ها را کشف کنند. تا حدودی خشن می توان گفت: آن رویکردها، ایده ها، نتایج، حقایق، الگوریتم هایی که در دوره های آموزشی و موارد مربوطه گنجانده شده است. راهنمای مطالعه- ذخیره شده و توسط فرزندان استفاده می شود، کسانی که دریافت نکرده اند - در گرد و غبار کتابخانه ها ناپدید می شوند.

نقاط رشد. پنج را اختصاص دهید روندهای فعلی، که در آن آمار کاربردی مدرن در حال توسعه است، i.e. پنج "نقطه رشد": ناپارامتریک، استحکام، بوت استرپ، آمار فاصله، آمار اشیاء غیر عددی. اجازه دهید به طور خلاصه در مورد این روندهای فعلی بحث کنیم.

آمار ناپارامتریک یا ناپارامتریک به شما امکان می دهد نتیجه های آماری بگیرید، ویژگی های توزیع را ارزیابی کنید، فرضیه های آماری را بدون فرضیات ضعیف اثبات شده که تابع توزیع عناصر نمونه در یک یا آن خانواده پارامتری گنجانده شده است، آزمایش کنید. به عنوان مثال، این باور عمومی وجود دارد که آمار اغلب از توزیع نرمال پیروی می کند. با این حال، تجزیه و تحلیل نتایج خاص مشاهدات، به ویژه، خطاهای اندازه گیری، نشان می دهد که در اکثریت قریب به اتفاق موارد، توزیع های واقعی به طور قابل توجهی با توزیع های عادی متفاوت است. استفاده غیرانتقادی از فرضیه نرمال بودن اغلب منجر به خطاهای قابل توجهی می شود، به عنوان مثال، در هنگام رد موارد پرت مشاهدات (پرت)، در کنترل کیفیت آماری، و در موارد دیگر. بنابراین، استفاده از روش‌های ناپارامتریک، که در آن‌ها فقط الزامات بسیار ضعیفی بر توابع توزیع نتایج مشاهدات تحمیل می‌شود، به مصلحت است. معمولاً فقط تداوم آنها فرض می شود. تا به امروز، با کمک روش های ناپارامتریک، می توان تقریباً همان محدوده ای از مسائل را حل کرد که قبلاً با روش های پارامتریک حل می شد.

ایده اصلی کار در مورد استحکام (پایداری): نتیجه گیری باید با تغییرات کوچک در داده های اولیه و انحراف از مفروضات مدل کمی تغییر کند. در اینجا دو زمینه نگرانی وجود دارد. یکی مطالعه استحکام الگوریتم های رایج تجزیه و تحلیل داده ها است. دوم جستجو برای الگوریتم های قوی برای حل مسائل خاص است.

اصطلاح «استقامت» به خودی خود معنای روشنی ندارد. همیشه لازم است یک مدل احتمالی-آماری مشخص مشخص شود. در عین حال، مدل «گرفتگی» Tukey-Huber-Hampel معمولاً عملاً مفید نیست. جهت گیری آن به سمت "وزن دادن دم ها" است و در موقعیت های واقعی "دم" با محدودیت های پیشینی در مورد نتایج مشاهدات، به عنوان مثال، با ابزار اندازه گیری مورد استفاده، قطع می شود.

بوت استرپ شاخه ای از آمار ناپارامتری است که بر اساس استفاده فشرده از فناوری اطلاعات. ایده اصلی این است که "نمونه ها را ضرب کنیم"، یعنی. در به دست آوردن مجموعه ای از نمونه های بسیار مشابه نمونه به دست آمده در آزمایش. از این مجموعه می توان برای ارزیابی ویژگی های رویه های آماری مختلف استفاده کرد. ساده ترین راه"تولید مجدد نمونه" شامل حذف یک نتیجه از مشاهده از آن است. مشاهده اول را حذف می‌کنیم، نمونه‌ای شبیه نمونه اولیه می‌گیریم، اما با کاهش حجم 1. سپس نتیجه حذف شده مشاهده اول را برمی‌گردانیم، اما مشاهده دوم را حذف می‌کنیم. نمونه دومی مشابه نمونه اصلی دریافت می کنیم. سپس نتیجه مشاهده دوم را برمی گردانیم و به همین ترتیب. راه های دیگری نیز برای «تکثیر نمونه ها» وجود دارد. به عنوان مثال، می توان تخمینی از تابع توزیع را از نمونه اولیه ساخت و سپس با استفاده از روش آزمون های آماری، مجموعه ای از نمونه های عناصر را مدل کرد. در آمار کاربردی، یک نمونه است، یعنی. مجموعه ای از عناصر تصادفی مستقل با توزیع یکسان. ماهیت این عناصر چیست؟ در آمار ریاضی کلاسیک، عناصر یک نمونه اعداد یا بردارها هستند. و در آمار غیر عددی عناصر نمونه اشیایی غیر عددی هستند که قابل جمع و ضرب در اعداد نیستند. به عبارت دیگر، اشیاء غیر عددی در فضاهایی قرار دارند که ساختار برداری ندارند.