روش های تصمیم گیری آماری. مدل های تصمیم گیری احتمالی و آماری II برنامه ریزی موضوعی

2. توصیف عدم قطعیت در نظریه تصمیم گیری

2.2. روش های آماری احتمالی برای توصیف عدم قطعیت ها در نظریه تصمیم گیری

2.2.1. تئوری احتمال و آمار ریاضی در تصمیم گیری

چگونه از آمار احتمالات و ریاضی استفاده می شود؟این رشته ها اساس روش های تصمیم گیری احتمالی – آماری هستند. برای استفاده از دستگاه ریاضی آنها باید مسائل تصمیم گیری را بر اساس مدل های احتمالی-آماری بیان کرد. بکارگیری یک روش خاص تصمیم گیری احتمالی-آماری شامل سه مرحله است:

گذار از واقعیت اقتصادی، مدیریتی، فناوری به یک طرح انتزاعی ریاضی و آماری، یعنی. ساخت یک مدل احتمالی از یک سیستم کنترل، یک فرآیند تکنولوژیکی، یک روش تصمیم گیری، به ویژه بر اساس نتایج کنترل آماری و غیره.

انجام محاسبات و به دست آوردن نتیجه‌گیری با ابزارهای کاملاً ریاضی در چارچوب یک مدل احتمالی.

تفسیر نتایج ریاضی و آماری در رابطه با وضعیت واقعی و اتخاذ تصمیم مناسب (به عنوان مثال در مورد انطباق یا عدم انطباق کیفیت محصول با الزامات تعیین شده، نیاز به تنظیم فرآیند تکنولوژیکی و غیره) به ویژه، نتیجه گیری (در مورد نسبت واحدهای معیوب محصولات در یک دسته، در مورد شکل خاصی از قوانین توزیع پارامترهای کنترل شده فرآیند فن آوری و غیره).

آمار ریاضی از مفاهیم، ​​روش ها و نتایج نظریه احتمال استفاده می کند. بیایید مسائل اصلی ساخت مدل های تصمیم گیری احتمالی را در موقعیت های اقتصادی، مدیریتی، فناوری و غیره در نظر بگیریم. برای استفاده فعال و صحیح از اسناد هنجاری- فنی و آموزنده- روشی در مورد روش های احتمالی- آماری تصمیم گیری، نیاز به دانش اولیه است. بنابراین، باید دانست که در چه شرایطی باید یک یا آن سند را اعمال کرد، چه اطلاعات اولیه ای برای انتخاب و کاربرد آن لازم است، چه تصمیماتی باید بر اساس نتایج پردازش داده ها اتخاذ شود و غیره.

نمونه های کاربردی نظریه احتمال و آمار ریاضی.اجازه دهید چندین مثال را در نظر بگیریم که مدل‌های آماری-احتمالی ابزار مناسبی برای حل مشکلات مدیریتی، صنعتی، اقتصادی و اقتصادی ملی هستند. بنابراین، به عنوان مثال، در رمان A.N. تولستوی "راه رفتن در عذاب ها" (جلد 1) می گوید: "کارگاه بیست و سه درصد ازدواج را می دهد، شما این رقم را نگه دارید."

این سوال پیش می آید که چگونه می توان این سخنان را در گفتگوی مدیران کارخانه فهمید، چرا که یک واحد تولیدی نمی تواند 23 درصد معیوب باشد. می تواند خوب یا معیوب باشد. شاید منظور استروکوف این بود که یک دسته بزرگ تقریباً 23 درصد از واحدهای معیوب را در خود دارد. سپس این سوال پیش می آید که «درباره» به چه معناست؟ بگذارید 30 واحد از 100 واحد آزمایش شده محصول معیوب باشد یا از 1000 - 300 یا از 100000 - 30000 و غیره، آیا استروکوف باید متهم به دروغگویی شود؟

یا مثال دیگری. سکه ای که زیاد استفاده می شود باید «متقارن» باشد، یعنی. هنگامی که پرتاب می شود، به طور متوسط، در نیمی از موارد، نشان باید بیرون بیفتد، و در نیمی از موارد - شبکه (دم، شماره). اما «متوسط» به چه معناست؟ اگر در هر سری سری های 10 تایی پرتاب کنید، اغلب سری هایی وجود خواهد داشت که در آن یک سکه 4 بار با یک نشان بیرون می افتد. برای یک سکه متقارن، این اتفاق در 20.5 درصد از سری خواهد افتاد. و اگر 40000 نشان برای 100000 پرتاب وجود داشته باشد، آیا می توان سکه را متقارن دانست؟ روش تصمیم گیری بر اساس تئوری احتمالات و آمار ریاضی است.

مثال مورد بررسی ممکن است به اندازه کافی جدی به نظر نرسد. با این حال، اینطور نیست. قرعه کشی به طور گسترده در سازماندهی آزمایش های امکان سنجی صنعتی استفاده می شود، به عنوان مثال، هنگام پردازش نتایج اندازه گیری شاخص کیفیت (لمان اصطکاک) یاتاقان ها بسته به عوامل مختلف تکنولوژیکی (تأثیر محیط حفاظتی، روش های آماده سازی یاتاقان ها قبل از اندازه گیری). ، تأثیر باربری در فرآیند اندازه گیری و ...) ص). فرض کنید لازم است کیفیت یاتاقان ها بسته به نتایج ذخیره سازی آنها در روغن های حفاظتی مختلف مقایسه شود، یعنی. در روغن های ترکیبی آو V. هنگام برنامه ریزی چنین آزمایشی، این سوال مطرح می شود که کدام بلبرینگ ها باید در ترکیب روغن قرار گیرند آ، و کدام - در ترکیب روغن V، اما به گونه ای که از ذهنیت اجتناب شود و عینیت تصمیم تضمین شود.

پاسخ این سوال را می توان با قرعه کشی به دست آورد. مثال مشابهی را می توان با کنترل کیفیت هر محصول ارائه داد. برای تصمیم گیری در مورد اینکه آیا یک دسته از محصولات بازرسی شده مطابق با الزامات تعیین شده است یا خیر، نمونه ای از آن گرفته می شود. بر اساس نتایج کنترل نمونه، در مورد کل دسته نتیجه گیری می شود. در این مورد، اجتناب از ذهنیت در شکل گیری نمونه بسیار مهم است، یعنی لازم است هر واحد محصول در لات کنترل شده احتمال یکسانی برای انتخاب در نمونه داشته باشد. در شرایط تولید، انتخاب واحدهای تولیدی در نمونه معمولاً نه به صورت قرعه، بلکه با جداول ویژه اعداد تصادفی یا با کمک مولدهای اعداد تصادفی رایانه ای انجام می شود.

مشکلات مشابه حصول اطمینان از عینیت مقایسه هنگام مقایسه طرح های مختلف برای سازماندهی تولید، پاداش، هنگام برگزاری مناقصات و مسابقات، انتخاب نامزدها برای موقعیت های خالی و غیره ایجاد می شود. همه جا به قرعه کشی یا مراحل مشابه نیاز دارید. اجازه دهید با استفاده از مثال شناسایی قوی ترین و دومین تیم قوی در برگزاری مسابقات بر اساس سیستم المپیک (بازنده حذف می شود) توضیح دهیم. بگذار همیشه تیم قوی‌تر بر تیم ضعیف‌تر پیروز شود. مشخص است که قوی ترین تیم قطعا قهرمان می شود. دومین تیم قدرتمند در صورتی به فینال خواهد رسید که قبل از فینال هیچ بازی با قهرمان آینده نداشته باشد. اگر چنین بازی ای برنامه ریزی شود، دومین تیم قدرتمند به فینال نمی رسد. کسی که تورنمنت را برنامه ریزی می کند، می تواند زودتر از موعد مقرر، دومین تیم قدرتمند را از مسابقات حذف کند، در اولین دیدار با رهبر، آن را پایین بیاورد، یا از کسب مقام دوم اطمینان حاصل کند، و اطمینان حاصل کند که تا فینال با تیم های ضعیف تر دیدار خواهد کرد. برای جلوگیری از ذهنیت، قرعه کشی کنید. برای یک تورنمنت 8 تیمی، احتمال دیدار دو تیم قدرتمند در فینال 4/7 است. بر این اساس با احتمال 3/7 دومین تیم قدرتمند زودتر از موعد مقرر مسابقات را ترک خواهد کرد.

در هر اندازه گیری واحدهای محصول (با استفاده از کولیس، میکرومتر، آمپرمتر و ...) خطاهایی وجود دارد. برای پی بردن به وجود خطاهای سیستماتیک، لازم است اندازه گیری های مکرر از یک واحد تولید که ویژگی های آن مشخص است (به عنوان مثال، یک نمونه استاندارد) انجام شود. لازم به یادآوری است که علاوه بر خطای سیستماتیک، یک خطای تصادفی نیز وجود دارد.

بنابراین، این سوال مطرح می شود که چگونه می توان از نتایج اندازه گیری ها متوجه شد که آیا خطای سیستماتیک وجود دارد یا خیر. اگر فقط توجه داشته باشیم که آیا خطای بدست آمده در اندازه گیری بعدی مثبت یا منفی است، این مشکل را می توان به خطای قبلی کاهش داد. در واقع، بیایید اندازه گیری را با پرتاب یک سکه، خطای مثبت - با از دست دادن نشان رسمی، منفی - با شبکه مقایسه کنیم (خطای صفر با تعداد کافی تقسیم مقیاس تقریباً هرگز رخ نمی دهد). سپس بررسی عدم وجود خطای سیستماتیک معادل بررسی تقارن سکه است.

هدف از این ملاحظات کاهش مشکل بررسی عدم وجود خطای سیستماتیک به مشکل بررسی تقارن یک سکه است. استدلال فوق منجر به به اصطلاح "معیار نشانه ها" در آمار ریاضی می شود.

در تنظیم آماری فرآیندهای فناورانه، بر اساس روش‌های آمار ریاضی، قوانین و طرح‌هایی برای کنترل آماری فرآیندها با هدف تشخیص به موقع اختلالات فرآیندهای فناوری و اتخاذ تدابیری برای تعدیل آنها و جلوگیری از انتشار محصولاتی که انجام می‌دهند، تدوین می‌شود. الزامات تعیین شده را برآورده نمی کند. این اقدامات با هدف کاهش هزینه های تولید و زیان های ناشی از عرضه محصولات بی کیفیت انجام می شود. با کنترل پذیرش آماری، بر اساس روش‌های آمار ریاضی، طرح‌های کنترل کیفیت با تجزیه و تحلیل نمونه‌هایی از دسته‌های محصول تدوین می‌شود. مشکل در ساخت صحیح مدل‌های تصمیم‌گیری احتمالی-آماری است که بر اساس آن می‌توان به سؤالات مطرح شده در بالا پاسخ داد. در آمار ریاضی، مدل‌ها و روش‌های احتمالی برای آزمون فرضیه‌ها برای این امر ایجاد شده است، به ویژه فرضیه‌هایی مبنی بر اینکه نسبت واحدهای تولید معیوب برابر با تعداد معینی است. p 0، مثلا، p 0= 0.23 (کلمات استروکوف را از رمان A.N. Tolstoy به یاد بیاورید).

وظایف ارزیابیدر تعدادی از موقعیت های مدیریتی، صنعتی، اقتصادی، اقتصادی ملی، مشکلاتی از نوع متفاوت ایجاد می شود - مشکلات تخمین ویژگی ها و پارامترهای توزیع احتمال.

یک مثال را در نظر بگیرید. اجازه دهید یک مهمانی از نلامپ های برقی از این مقدار، نمونه ای از nلامپ های برقی تعدادی سوال طبیعی مطرح می شود. چگونه می توان میانگین عمر مفید لامپ های الکتریکی را از نتایج آزمایش المان های نمونه تعیین کرد و با چه دقتی می توان این مشخصه را تخمین زد؟ اگر نمونه بزرگتری گرفته شود دقت چگونه تغییر می کند؟ در چند ساعت تیمی توان تضمین کرد که حداقل 90٪ از لامپ های الکتریکی دوام می آورند تییا ساعت بیشتر؟

اجازه دهید هنگام آزمایش یک نمونه با حجم فرض کنیم nلامپ ها معیوب هستند ایکسلامپ های برقی سپس سوالات زیر مطرح می شود. چه محدودیت هایی را می توان برای یک عدد مشخص کرد دیلامپ های الکتریکی معیوب در یک دسته، برای سطح نقص دی/ نو غیره.؟

یا در تجزیه و تحلیل آماری دقت و پایداری فرآیندهای فناورانه، لازم است شاخص‌های کیفی مانند میانگین مقدار پارامتر کنترل‌شده و میزان گسترش آن در فرآیند مورد بررسی ارزیابی شود. با توجه به تئوری احتمال، توصیه می شود از انتظارات ریاضی آن به عنوان مقدار میانگین یک متغیر تصادفی و از واریانس، انحراف معیار یا ضریب تغییرات به عنوان مشخصه آماری اسپرد استفاده شود. این سؤال را ایجاد می کند: چگونه می توان این ویژگی های آماری را از داده های نمونه تخمین زد و با چه دقتی می توان این کار را انجام داد؟ نمونه های مشابه زیادی وجود دارد. در اینجا مهم بود که نشان دهیم چگونه می توان از تئوری احتمال و آمار ریاضی در مدیریت تولید هنگام تصمیم گیری در زمینه مدیریت کیفیت محصول آماری استفاده کرد.

"آمار ریاضی" چیست؟آمار ریاضی به عنوان «شاخه‌ای از ریاضیات است که به روش‌های ریاضی جمع‌آوری، نظام‌بندی، پردازش و تفسیر داده‌های آماری و همچنین استفاده از آنها برای نتیجه‌گیری علمی یا عملی اختصاص دارد. قواعد و رویه های آمار ریاضی مبتنی بر تئوری احتمال است که امکان ارزیابی دقت و پایایی نتایج به دست آمده در هر مسئله را بر اساس مواد آماری موجود فراهم می کند. در عین حال، داده های آماری به اطلاعاتی در مورد تعداد اشیاء در هر مجموعه کم و بیش گسترده ای اشاره دارد که دارای ویژگی های خاصی است.

با توجه به نوع مسائل حل شده، آمار ریاضی معمولاً به سه بخش تقسیم می شود: توصیف داده ها، تخمین و آزمون فرضیه.

با توجه به نوع داده های آماری مورد پردازش، آمار ریاضی به چهار حوزه تقسیم می شود:

آمار تک بعدی (آمار متغیرهای تصادفی) که در آن نتیجه یک مشاهده با یک عدد واقعی توصیف می شود.

تجزیه و تحلیل آماری چند متغیره، که در آن نتیجه مشاهده یک شی با چندین عدد (بردار) توصیف می شود.

آمار فرآیندهای تصادفی و سری های زمانی، که در آن نتیجه مشاهده یک تابع است.

آمار اجسام غیر عددی که در آنها نتیجه مشاهده ماهیتی غیر عددی دارد، به عنوان مثال، یک مجموعه (شکل هندسی)، یک مرتبه یا در نتیجه اندازه گیری به دست آمده است. یک ویژگی کیفی

از نظر تاریخی، برخی از حوزه های آمار اشیاء غیر عددی (به ویژه مشکلات تخمین درصد محصولات معیوب و آزمایش فرضیه ها در مورد آن) و آمارهای تک بعدی اولین مواردی بودند که ظاهر شدند. دستگاه ریاضی برای آنها ساده تر است، بنابراین، با مثال آنها، آنها معمولا ایده های اصلی آمار ریاضی را نشان می دهند.

فقط آن روش های پردازش داده ها، یعنی. آمارهای ریاضی مبتنی بر شواهد هستند که بر اساس مدل‌های احتمالی پدیده‌ها و فرآیندهای واقعی مرتبط هستند. ما در مورد مدل های رفتار مصرف کننده، وقوع خطرات، عملکرد تجهیزات تکنولوژیکی، به دست آوردن نتایج یک آزمایش، دوره یک بیماری و غیره صحبت می کنیم. یک مدل احتمالی از یک پدیده واقعی باید ساخته شده در نظر گرفته شود که مقادیر مورد بررسی و روابط بین آنها بر اساس نظریه احتمال بیان شود. مطابقت با مدل احتمالی واقعیت، یعنی. کفایت آن به ویژه با کمک روش های آماری برای آزمون فرضیه ها اثبات می شود.

روش‌های پردازش داده‌های باورنکردنی اکتشافی هستند، آنها فقط می‌توانند در تجزیه و تحلیل داده‌های اولیه استفاده شوند، زیرا ارزیابی صحت و قابلیت اطمینان نتایج به‌دست‌آمده بر اساس مواد آماری محدود را امکان‌پذیر نمی‌سازند.

روش‌های احتمالی و آماری در هر جایی که امکان ساخت و اثبات مدل احتمالی یک پدیده یا فرآیند وجود داشته باشد، قابل استفاده است. استفاده از آنها زمانی اجباری است که نتیجه گیری از داده های نمونه به کل جمعیت منتقل شود (به عنوان مثال، از یک نمونه به یک دسته کامل از محصولات).

در حوزه های کاربردی خاص، هم از روش های احتمالی-آماری کاربرد گسترده و هم از روش های خاص استفاده می شود. به عنوان مثال، در بخش مدیریت تولید که به روش های آماری کنترل کیفیت محصول اختصاص دارد، از آمار ریاضی کاربردی (از جمله طراحی آزمایش ها) استفاده می شود. با کمک روش های آن، تجزیه و تحلیل آماری از دقت و ثبات فرآیندهای تکنولوژیکی و ارزیابی آماری کیفیت انجام می شود. روش‌های خاص شامل روش‌های کنترل آماری پذیرش کیفیت محصول، تنظیم آماری فرآیندهای فناوری، ارزیابی و کنترل قابلیت اطمینان و غیره است.

چنین رشته های کاربردی آماری احتمالی مانند نظریه قابلیت اطمینان و نظریه صف به طور گسترده استفاده می شود. محتوای مورد اول از عنوان مشخص است، دومی به مطالعه سیستم‌هایی مانند مبادله تلفنی می‌پردازد که تماس‌ها را در زمان‌های تصادفی دریافت می‌کند - الزامات مشترکینی که شماره‌های تلفن خود را شماره‌گیری می‌کنند. مدت زمان خدمت این الزامات، یعنی. مدت زمان مکالمات نیز با متغیرهای تصادفی مدل‌سازی می‌شود. کمک بزرگی به توسعه این رشته ها توسط عضو مسئول آکادمی علوم اتحاد جماهیر شوروی A.Ya انجام شد. خینچین (1894-1959)، آکادمی آکادمی علوم اوکراین SSR B.V. Gnedenko (1912-1995) و سایر دانشمندان داخلی.

مختصری در مورد تاریخچه آمار ریاضی.آمار ریاضی به عنوان یک علم با آثار ریاضیدان مشهور آلمانی کارل فردریش گاوس (1777-1855) آغاز می شود که بر اساس نظریه احتمال، روش حداقل مربعات را که در سال 1795 ایجاد کرد و برای پردازش های نجومی به کار برد، بررسی و اثبات کرد. داده ها (به منظور روشن شدن مدار یک سیاره کوچک سرس). یکی از پرطرفدارترین توزیع‌های احتمال، توزیع نرمال، اغلب به نام او نامگذاری می‌شود و در نظریه فرآیندهای تصادفی، موضوع اصلی مطالعه فرآیندهای گاوسی است.

در پایان قرن نوزدهم. - آغاز قرن بیستم. سهم عمده ای در آمار ریاضی توسط محققان انگلیسی، در درجه اول K. Pearson (1857-1936) و R. A. Fisher (1890-1962) انجام شد. به طور خاص، پیرسون آزمون کای دو را برای آزمایش فرضیه های آماری توسعه داد و فیشر آنالیز واریانس، نظریه طراحی آزمایش و روش حداکثر درستنمایی را برای تخمین پارامترها توسعه داد.

در دهه 30 قرن بیستم. Pole Jerzy Neumann (1894-1977) و انگلیسی E. Pearson تئوری کلی آزمایش فرضیه های آماری را توسعه دادند و ریاضیدانان شوروی، آکادمیک A.N. کولموگروف (1903-1987) و عضو مسئول آکادمی علوم اتحاد جماهیر شوروی، N.V. Smirnov (1900-1966) پایه های آمار ناپارامتریک را پایه گذاری کردند. در دهه چهل قرن بیستم. رومانیایی A. Wald (1902-1950) تئوری تجزیه و تحلیل آماری سازگار را ساخت.

آمار ریاضی در حال حاضر به سرعت در حال توسعه است. بنابراین، در طول 40 سال گذشته، چهار حوزه اساساً جدید تحقیق را می توان متمایز کرد:

توسعه و اجرای روش های ریاضی برای برنامه ریزی آزمایش ها.

توسعه آمار اشیاء غیر عددی به عنوان یک جهت مستقل در آمار ریاضی کاربردی.

توسعه روش های آماری مقاوم در برابر انحرافات کوچک از مدل احتمالی مورد استفاده.

توسعه گسترده کار بر روی ایجاد بسته های نرم افزاری کامپیوتری طراحی شده برای تجزیه و تحلیل آماری داده ها.

روش های احتمالی-آماری و بهینه سازی.ایده بهینه سازی در آمارهای کاربردی مدرن ریاضی و سایر روش های آماری نفوذ می کند. یعنی روش‌های برنامه‌ریزی آزمایش‌ها، کنترل پذیرش آماری، کنترل آماری فرآیندهای تکنولوژیکی و غیره. از سوی دیگر، فرمول‌های بهینه‌سازی در تئوری تصمیم‌گیری، به عنوان مثال، تئوری کاربردی بهینه‌سازی کیفیت محصول و الزامات استاندارد، امکان استفاده گسترده از روش های آماری احتمالی، در درجه اول آمار ریاضی کاربردی.

در مدیریت تولید، به‌ویژه، هنگام بهینه‌سازی کیفیت محصول و الزامات استاندارد، استفاده از روش‌های آماری در مرحله اولیه چرخه عمر محصول از اهمیت ویژه‌ای برخوردار است. در مرحله آماده سازی تحقیقاتی تحولات طراحی آزمایشی (توسعه الزامات امیدوارکننده برای محصولات، طراحی اولیه، شرایط مرجع برای توسعه طراحی آزمایشی). این به دلیل اطلاعات محدود موجود در مرحله اولیه چرخه عمر محصول و نیاز به پیش بینی امکانات فنی و وضعیت اقتصادی برای آینده است. روش های آماری باید در تمام مراحل حل یک مسئله بهینه سازی - هنگام مقیاس بندی متغیرها، توسعه مدل های ریاضی برای عملکرد محصولات و سیستم ها، انجام آزمایش های فنی و اقتصادی و غیره - اعمال شود.

در مسائل بهینه سازی از جمله بهینه سازی کیفیت محصول و الزامات استاندارد، از تمامی حوزه های آمار استفاده می شود. یعنی آمار متغیرهای تصادفی، تحلیل آماری چند متغیره، آمار فرآیندهای تصادفی و سری‌های زمانی، آمار اشیاء غیر عددی. انتخاب یک روش آماری برای تجزیه و تحلیل داده های خاص باید طبق توصیه ها انجام شود.

قبلی

ارسال کار خوب خود را در پایگاه دانش ساده است. از فرم زیر استفاده کنید

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

نوشته شده در http://www.allbest.ru/

[متن را وارد کنید]

معرفی

1. نظریه احتمالات و آمار ریاضی در تصمیم گیری

1.1 نحوه استفاده از احتمال و آمار

1.2 مثال های کاربردی نظریه احتمال و آمار ریاضی

1.3 اهداف ارزیابی

1.4 "آمار ریاضی" چیست؟

1.5 مختصری در مورد تاریخچه آمار ریاضی

1.6 روش های احتمالی-آماری و بهینه سازی

2. مسائل عملی معمول تصمیم گیری احتمالی - آماری و روش های حل آنها

2.1 آمار و آمار کاربردی

2.2 وظایف تجزیه و تحلیل آماری دقت و پایداری فرآیندهای تکنولوژیکی و کیفیت محصول

2.3 مسائل آمار تک بعدی (آمار متغیرهای تصادفی)

2.4 تجزیه و تحلیل آماری چند متغیره

2.5 آمار فرآیندهای تصادفی و سری های زمانی

2.6 آمار اشیاء غیر عددی

3. کاربرد روش های تصمیم گیری احتمالی- آماری در حل مسائل اقتصادی

نتیجه

منابع

معرفی

روش‌های تصمیم‌گیری احتمالی-آماری زمانی استفاده می‌شوند که اثربخشی تصمیم‌های گرفته شده به عواملی بستگی دارد که متغیرهای تصادفی هستند که قوانین توزیع احتمال و سایر ویژگی‌های آماری برای آنها شناخته شده است. علاوه بر این، هر تصمیم می تواند به یکی از بسیاری از نتایج ممکن منجر شود و هر نتیجه احتمال وقوع خاصی دارد که می توان آن را محاسبه کرد. شاخص هایی که وضعیت مشکل را مشخص می کنند نیز با استفاده از ویژگی های احتمالی توصیف می شوند. با چنین مشکلات تصمیم گیری، تصمیم گیرنده همیشه در معرض خطر گرفتن نتیجه اشتباه قرار می گیرد که با هدایت آن تصمیم بهینه را بر اساس میانگین ویژگی های آماری عوامل تصادفی انتخاب می کند، یعنی تصمیم تحت ریسک گرفته می شود. شرایط

در عمل، روش‌های احتمالی و آماری اغلب زمانی استفاده می‌شوند که نتایج حاصل از داده‌های نمونه به کل جامعه (مثلاً از یک نمونه به یک دسته کامل از محصولات) منتقل شود. با این حال، در این مورد، در هر موقعیت خاص، ابتدا باید امکان اساسی دستیابی به داده های احتمالی و آماری به اندازه کافی قابل اعتماد را ارزیابی کرد.

هنگام استفاده از ایده ها و نتایج نظریه احتمالات و آمار ریاضی در تصمیم گیری، مبنا یک مدل ریاضی است که در آن روابط عینی بر حسب نظریه احتمال بیان می شود. از احتمالات در درجه اول برای توصیف تصادفی استفاده می شود که باید هنگام تصمیم گیری در نظر گرفته شود. این هم به فرصت های نامطلوب (خطرات) و هم به فرصت های جذاب ("شانس خوش شانس") اشاره دارد.

ماهیت روش‌های تصمیم‌گیری احتمالی-آماری، استفاده از مدل‌های احتمالی مبتنی بر تخمین و آزمون فرضیه‌ها با استفاده از ویژگی‌های نمونه است.

منطق استفاده از ویژگی‌های نمونه برای تصمیم‌گیری بر اساس مدل‌های نظری شامل استفاده همزمان از دو سری مفاهیم موازی است - مفاهیم مربوط به نظریه (مدل احتمالی) و مفاهیم مربوط به عمل (نمونه نتایج مشاهده). به عنوان مثال، احتمال نظری با فرکانس یافت شده از نمونه مطابقت دارد. انتظارات ریاضی (سری نظری) با میانگین حسابی نمونه (سری عملی) مطابقت دارد. به عنوان یک قاعده، ویژگی های نمونه برآورد ویژگی های نظری است.

از مزایای استفاده از این روش ها می توان به قابلیت در نظر گرفتن سناریوهای مختلف برای توسعه رویدادها و احتمالات آنها اشاره کرد. عیب این روش ها این است که احتمالات سناریویی مورد استفاده در محاسبات معمولاً در عمل بسیار دشوار است.

بکارگیری یک روش خاص تصمیم گیری احتمالی-آماری شامل سه مرحله است:

گذار از واقعیت اقتصادی، مدیریتی، فناوری به یک طرح انتزاعی ریاضی و آماری، یعنی. ساخت یک مدل احتمالی از یک سیستم کنترل، یک فرآیند تکنولوژیکی، یک روش تصمیم گیری، به ویژه بر اساس نتایج کنترل آماری، و غیره.

یک مدل احتمالی از یک پدیده واقعی باید ساخته شده در نظر گرفته شود که مقادیر مورد بررسی و روابط بین آنها بر اساس نظریه احتمال بیان شود. کفایت مدل احتمالی به ویژه با استفاده از روش های آماری برای آزمون فرضیه ها اثبات می شود.

آمار ریاضی معمولاً با توجه به نوع مسائلی که باید حل شوند به سه بخش تقسیم می‌شوند: توصیف داده‌ها، تخمین و آزمون فرضیه. با توجه به نوع داده های آماری مورد پردازش، آمار ریاضی به چهار حوزه تقسیم می شود:

نمونه ای از زمانی که استفاده از مدل های احتمالی-آماری توصیه می شود.

هنگام کنترل کیفیت هر محصول، نمونه ای از آن گرفته می شود تا تصمیم بگیرد که آیا دسته ای از محصولات تولید شده مطابق با الزامات تعیین شده است یا خیر. بر اساس نتایج کنترل نمونه، در مورد کل دسته نتیجه گیری می شود. در این مورد، اجتناب از ذهنیت در شکل گیری نمونه بسیار مهم است، یعنی لازم است هر واحد محصول در لات کنترل شده احتمال یکسانی برای انتخاب در نمونه داشته باشد. انتخاب بر اساس قرعه در چنین شرایطی به اندازه کافی عینی نیست. بنابراین، در شرایط تولید، انتخاب واحدهای تولیدی در نمونه معمولاً نه به صورت قرعه‌کشی، بلکه با جداول ویژه اعداد تصادفی یا با استفاده از مولدهای اعداد تصادفی رایانه‌ای انجام می‌شود.

در تنظیم آماری فرآیندهای فناورانه، بر اساس روش‌های آمار ریاضی، قوانین و طرح‌هایی برای کنترل آماری فرآیندها با هدف تشخیص به موقع اختلالات فرآیندهای فناوری و اتخاذ تدابیری برای تعدیل آنها و جلوگیری از انتشار محصولاتی که انجام می‌دهند، تدوین می‌شود. الزامات تعیین شده را برآورده نمی کند. این اقدامات با هدف کاهش هزینه های تولید و زیان های ناشی از عرضه محصولات بی کیفیت انجام می شود. با کنترل پذیرش آماری، بر اساس روش‌های آمار ریاضی، طرح‌های کنترل کیفیت با تجزیه و تحلیل نمونه‌هایی از دسته‌های محصول تدوین می‌شود. مشکل در ساخت صحیح مدل‌های تصمیم‌گیری احتمالی-آماری است که بر اساس آن می‌توان به سؤالات مطرح شده در بالا پاسخ داد. در آمار ریاضی، مدل‌ها و روش‌های احتمالی برای آزمون فرضیه‌ها برای این امر ابداع شده است.

علاوه بر این، در تعدادی از موقعیت های مدیریتی، صنعتی، اقتصادی، اقتصادی ملی، مشکلاتی از نوع متفاوت ایجاد می شود - مشکلات تخمین ویژگی ها و پارامترهای توزیع احتمال.

یا در تجزیه و تحلیل آماری دقت و پایداری فرآیندهای فناورانه، لازم است شاخص‌های کیفی مانند میانگین مقدار پارامتر کنترل‌شده و میزان گسترش آن در فرآیند مورد بررسی ارزیابی شود. با توجه به تئوری احتمال، توصیه می شود از انتظارات ریاضی آن به عنوان مقدار میانگین یک متغیر تصادفی و از واریانس، انحراف معیار یا ضریب تغییرات به عنوان مشخصه آماری اسپرد استفاده شود. این سؤال را ایجاد می کند: چگونه می توان این ویژگی های آماری را از داده های نمونه تخمین زد و با چه دقتی می توان این کار را انجام داد؟ نمونه های مشابه زیادی در ادبیات وجود دارد. همه آنها نشان می دهند که چگونه می توان از تئوری احتمال و آمار ریاضی در مدیریت تولید هنگام تصمیم گیری در زمینه مدیریت کیفیت محصول آماری استفاده کرد.

در حوزه های کاربردی خاص، هم از روش های احتمالی-آماری کاربرد گسترده و هم از روش های خاص استفاده می شود. به عنوان مثال، در بخش مدیریت تولید که به روش های آماری کنترل کیفیت محصول اختصاص دارد، از آمار ریاضی کاربردی (از جمله طراحی آزمایش ها) استفاده می شود. با کمک روش های آن، تجزیه و تحلیل آماری از دقت و ثبات فرآیندهای تکنولوژیکی و ارزیابی آماری کیفیت انجام می شود. روش‌های خاص شامل روش‌های کنترل آماری پذیرش کیفیت محصول، تنظیم آماری فرآیندهای فناوری، ارزیابی و کنترل قابلیت اطمینان است.
و غیره.

در مدیریت تولید، به ویژه، هنگام بهینه سازی کیفیت محصول و اطمینان از انطباق با استانداردها، استفاده از روش های آماری در مرحله اولیه چرخه عمر محصول، به ویژه مهم است. در مرحله آماده سازی تحقیقاتی تحولات طراحی آزمایشی (توسعه الزامات امیدوارکننده برای محصولات، طراحی اولیه، شرایط مرجع برای توسعه طراحی آزمایشی). این به دلیل اطلاعات محدود موجود در مرحله اولیه چرخه عمر محصول و نیاز به پیش بینی امکانات فنی و وضعیت اقتصادی برای آینده است.

رایج ترین روش های احتمالی-آماری عبارتند از: تحلیل رگرسیون، تحلیل عاملی، تحلیل واریانس، روش های آماری ارزیابی ریسک، روش سناریو و غیره. حوزه روش های آماری که به تجزیه و تحلیل داده های آماری ماهیت غیر عددی اختصاص دارد، روز به روز اهمیت بیشتری پیدا می کند. نتایج اندازه گیری بر روی ویژگی های کیفی و ناهمگن است. یکی از کاربردهای اصلی آمار اشیاء غیر عددی، تئوری و عمل ارزیابی های کارشناسی مربوط به نظریه تصمیم گیری های آماری و مشکلات رای گیری است.

نقش یک فرد در حل مسائل با استفاده از روش های تئوری تصمیمات آماری این است که مسئله را فرموله کند، یعنی مشکل واقعی را به مدل مربوطه برساند، احتمالات رویدادها را بر اساس داده های آماری تعیین کند و همچنین راه حل بهینه حاصل را تایید کنید.

1. نظریه احتمالات و آمار ریاضی در تصمیم گیری

1.1 نحوه استفاده از احتمالو آمار ریاضی

این رشته ها اساس روش های تصمیم گیری احتمالی – آماری هستند. برای استفاده از دستگاه ریاضی آنها باید مسائل تصمیم گیری را بر اساس مدل های احتمالی-آماری بیان کرد. بکارگیری یک روش خاص تصمیم گیری احتمالی-آماری شامل سه مرحله است:

گذار از واقعیت اقتصادی، مدیریتی، فناوری به یک طرح انتزاعی ریاضی و آماری، یعنی. ساخت یک مدل احتمالی از یک سیستم کنترل، یک فرآیند تکنولوژیکی، یک روش تصمیم گیری، به ویژه بر اساس نتایج کنترل آماری و غیره.

انجام محاسبات و به دست آوردن نتیجه‌گیری با ابزارهای کاملاً ریاضی در چارچوب یک مدل احتمالی.

تفسیر نتایج ریاضی و آماری در رابطه با وضعیت واقعی و اتخاذ تصمیم مناسب (به عنوان مثال در مورد انطباق یا عدم انطباق کیفیت محصول با الزامات تعیین شده، نیاز به تنظیم فرآیند تکنولوژیکی و غیره) به ویژه، نتیجه گیری (در مورد نسبت واحدهای معیوب محصولات در یک دسته، در مورد شکل خاصی از قوانین توزیع پارامترهای کنترل شده فرآیند فن آوری و غیره).

آمار ریاضی از مفاهیم، ​​روش ها و نتایج نظریه احتمال استفاده می کند. بیایید مسائل اصلی ساخت مدل های تصمیم گیری احتمالی را در موقعیت های اقتصادی، مدیریتی، فناوری و غیره در نظر بگیریم. برای استفاده فعال و صحیح از اسناد هنجاری- فنی و آموزنده- روشی در مورد روش های احتمالی- آماری تصمیم گیری، نیاز به دانش اولیه است. بنابراین، باید دانست که در چه شرایطی باید یک یا آن سند را اعمال کرد، چه اطلاعات اولیه ای برای انتخاب و کاربرد آن لازم است، چه تصمیماتی باید بر اساس نتایج پردازش داده ها اتخاذ شود و غیره.

1.2 مثال های کاربردی نظریه احتمالو آمار ریاضی

اجازه دهید چندین مثال را در نظر بگیریم که مدل‌های آماری-احتمالی ابزار مناسبی برای حل مشکلات مدیریتی، صنعتی، اقتصادی و اقتصادی ملی هستند. بنابراین، به عنوان مثال، در رمان A.N. تولستوی "راه رفتن در عذاب ها" (جلد 1) می گوید: "کارگاه بیست و سه درصد ازدواج را می دهد، شما این رقم را نگه دارید."

این سوال پیش می آید که چگونه می توان این سخنان را در گفتگوی مدیران کارخانه فهمید، چرا که یک واحد تولیدی نمی تواند 23 درصد معیوب باشد. می تواند خوب یا معیوب باشد. شاید منظور استروکوف این بود که یک دسته بزرگ تقریباً 23 درصد از واحدهای معیوب را در خود دارد. سپس این سوال پیش می آید که «درباره» به چه معناست؟ فرض کنید 30 واحد از 100 واحد تولیدی آزمایش شده معیوب باشد یا از 1000 - 300 یا از 100000 - 30000 و غیره، آیا استروکوف باید به دروغگویی متهم شود؟

یا مثال دیگری. سکه ای که زیاد استفاده می شود باید «متقارن» باشد، یعنی. هنگامی که پرتاب می شود، به طور متوسط، در نیمی از موارد، نشان باید بیرون بیفتد، و در نیمی از موارد - شبکه (دم، شماره). اما «متوسط» به چه معناست؟ اگر در هر سری سری های 10 تایی پرتاب کنید، اغلب سری هایی وجود خواهد داشت که در آن یک سکه 4 بار با یک نشان بیرون می افتد. برای یک سکه متقارن، این اتفاق در 20.5 درصد از سری خواهد افتاد. و اگر 40000 نشان برای 100000 پرتاب وجود داشته باشد، آیا می توان سکه را متقارن دانست؟ روش تصمیم گیری بر اساس تئوری احتمالات و آمار ریاضی است.

مثال مورد بررسی ممکن است به اندازه کافی جدی به نظر نرسد. با این حال، اینطور نیست. قرعه کشی به طور گسترده در سازماندهی آزمایش های امکان سنجی صنعتی استفاده می شود، به عنوان مثال، هنگام پردازش نتایج اندازه گیری شاخص کیفیت (لمان اصطکاک) یاتاقان ها بسته به عوامل مختلف تکنولوژیکی (تأثیر محیط حفاظتی، روش های آماده سازی یاتاقان ها قبل از اندازه گیری). ، تأثیر باربری در فرآیند اندازه گیری و ...) ص). فرض کنید لازم است کیفیت یاتاقان ها بسته به نتایج ذخیره سازی آنها در روغن های حفاظتی مختلف مقایسه شود، یعنی. در روغن‌های ترکیب A و B. هنگام برنامه‌ریزی چنین آزمایشی، این سؤال مطرح می‌شود که کدام بلبرینگ‌ها باید در ترکیب روغن A قرار داده شوند، و کدام - در ترکیب روغن B، اما به گونه‌ای که از ذهنیت اجتناب شود و از عینیت بودن اطمینان حاصل شود. تصمیم گیری

پاسخ این سوال را می توان با قرعه کشی به دست آورد. مثال مشابهی را می توان با کنترل کیفیت هر محصول ارائه داد. برای تصمیم گیری در مورد اینکه آیا یک دسته از محصولات بازرسی شده مطابق با الزامات تعیین شده است یا خیر، نمونه ای از آن گرفته می شود. بر اساس نتایج کنترل نمونه، در مورد کل دسته نتیجه گیری می شود. در این مورد، اجتناب از ذهنیت در شکل گیری نمونه بسیار مهم است، یعنی لازم است هر واحد محصول در لات کنترل شده احتمال یکسانی برای انتخاب در نمونه داشته باشد. در شرایط تولید، انتخاب واحدهای تولیدی در نمونه معمولاً نه به صورت قرعه، بلکه با جداول ویژه اعداد تصادفی یا با کمک مولدهای اعداد تصادفی رایانه ای انجام می شود.

مشکلات مشابه حصول اطمینان از عینیت مقایسه هنگام مقایسه طرح های مختلف برای سازماندهی تولید، پاداش، هنگام برگزاری مناقصات و مسابقات، انتخاب نامزدها برای موقعیت های خالی و غیره ایجاد می شود. همه جا به قرعه کشی یا مراحل مشابه نیاز دارید. اجازه دهید با استفاده از مثال شناسایی قوی ترین و دومین تیم قوی در برگزاری مسابقات بر اساس سیستم المپیک (بازنده حذف می شود) توضیح دهیم. بگذار همیشه تیم قوی‌تر بر تیم ضعیف‌تر پیروز شود. مشخص است که قوی ترین تیم قطعا قهرمان می شود. دومین تیم قدرتمند در صورتی به فینال خواهد رسید که قبل از فینال هیچ بازی با قهرمان آینده نداشته باشد. اگر چنین بازی ای برنامه ریزی شود، دومین تیم قدرتمند به فینال نمی رسد. کسی که تورنمنت را برنامه ریزی می کند، می تواند زودتر از موعد مقرر، دومین تیم قدرتمند را از مسابقات حذف کند، در اولین دیدار با رهبر، آن را پایین بیاورد، یا از کسب مقام دوم اطمینان حاصل کند، و اطمینان حاصل کند که تا فینال با تیم های ضعیف تر دیدار خواهد کرد. برای جلوگیری از ذهنیت، قرعه کشی کنید. برای یک تورنمنت 8 تیمی، احتمال دیدار دو تیم قدرتمند در فینال 4/7 است. بر این اساس با احتمال 3/7 دومین تیم قدرتمند زودتر از موعد مقرر مسابقات را ترک خواهد کرد.

در هر اندازه گیری واحدهای محصول (با استفاده از کولیس، میکرومتر، آمپرمتر و ...) خطاهایی وجود دارد. برای پی بردن به وجود خطاهای سیستماتیک، لازم است اندازه گیری های مکرر از یک واحد تولید که ویژگی های آن مشخص است (به عنوان مثال، یک نمونه استاندارد) انجام شود. لازم به یادآوری است که علاوه بر خطای سیستماتیک، یک خطای تصادفی نیز وجود دارد.

بنابراین، این سوال مطرح می شود که چگونه می توان از نتایج اندازه گیری متوجه شد که آیا خطای سیستماتیک وجود دارد یا خیر. اگر فقط توجه داشته باشیم که آیا خطای بدست آمده در اندازه گیری بعدی مثبت یا منفی است، این مشکل را می توان به خطای قبلی کاهش داد. در واقع، بیایید اندازه گیری را با پرتاب یک سکه، خطای مثبت - با از دست دادن نشان رسمی، منفی - با شبکه مقایسه کنیم (خطای صفر با تعداد کافی تقسیم مقیاس تقریباً هرگز رخ نمی دهد). سپس بررسی عدم وجود خطای سیستماتیک معادل بررسی تقارن سکه است.

هدف از این ملاحظات کاهش مشکل بررسی عدم وجود خطای سیستماتیک به مشکل بررسی تقارن یک سکه است. استدلال فوق منجر به به اصطلاح "معیار نشانه ها" در آمار ریاضی می شود.

در تنظیم آماری فرآیندهای فناورانه، بر اساس روش‌های آمار ریاضی، قوانین و طرح‌هایی برای کنترل آماری فرآیندها با هدف تشخیص به موقع اختلالات فرآیندهای فناوری و اتخاذ تدابیری برای تعدیل آنها و جلوگیری از انتشار محصولاتی که انجام می‌دهند، تدوین می‌شود. الزامات تعیین شده را برآورده نمی کند. این اقدامات با هدف کاهش هزینه های تولید و زیان های ناشی از عرضه محصولات بی کیفیت انجام می شود. با کنترل پذیرش آماری، بر اساس روش‌های آمار ریاضی، طرح‌های کنترل کیفیت با تجزیه و تحلیل نمونه‌هایی از دسته‌های محصول تدوین می‌شود. مشکل در ساخت صحیح مدل‌های تصمیم‌گیری احتمالی-آماری است که بر اساس آن می‌توان به سؤالات مطرح شده در بالا پاسخ داد. در آمار ریاضی، مدل‌ها و روش‌های احتمالی برای آزمایش فرضیه‌ها برای این منظور ایجاد شده است، به ویژه فرضیه‌هایی مبنی بر اینکه نسبت واحدهای تولید معیوب برابر با عدد معینی p0 است، به عنوان مثال، p0 = 0.23 (به یاد داشته باشید سخنان استروکوف از رمان AN تولستوی).

1.3 اهداف ارزیابی

در تعدادی از موقعیت های مدیریتی، صنعتی، اقتصادی، اقتصادی ملی، مشکلاتی از نوع متفاوت ایجاد می شود - مشکلات تخمین ویژگی ها و پارامترهای توزیع احتمال.

یک مثال را در نظر بگیرید. اجازه دهید دسته ای از N لامپ های الکتریکی تحت کنترل قرار گیرند. نمونه ای از n لامپ الکتریکی به طور تصادفی از این دسته انتخاب شد. تعدادی سوال طبیعی مطرح می شود. چگونه می توان میانگین عمر مفید لامپ های الکتریکی را از نتایج آزمایش المان های نمونه تعیین کرد و با چه دقتی می توان این مشخصه را تخمین زد؟ اگر نمونه بزرگتری گرفته شود دقت چگونه تغییر می کند؟ در چند ساعت T می توان تضمین کرد که حداقل 90 درصد لامپ های الکتریکی T ساعت یا بیشتر دوام می آورند؟

فرض کنید هنگام آزمایش نمونه ای از n لامپ الکتریکی، لامپ های الکتریکی X معیوب هستند. سپس سوالات زیر مطرح می شود. چه محدودیت هایی می توان برای تعداد D لامپ های الکتریکی معیوب در یک دسته، برای سطح نقص D/N و غیره تعیین کرد؟

یا در تجزیه و تحلیل آماری دقت و پایداری فرآیندهای فناورانه، لازم است شاخص‌های کیفی مانند میانگین مقدار پارامتر کنترل‌شده و میزان گسترش آن در فرآیند مورد بررسی ارزیابی شود. با توجه به تئوری احتمال، توصیه می شود از انتظارات ریاضی آن به عنوان مقدار میانگین یک متغیر تصادفی و از واریانس، انحراف معیار یا ضریب تغییرات به عنوان مشخصه آماری اسپرد استفاده شود. این سؤال را ایجاد می کند: چگونه می توان این ویژگی های آماری را از داده های نمونه تخمین زد و با چه دقتی می توان این کار را انجام داد؟ نمونه های مشابه زیادی وجود دارد. در اینجا مهم بود که نشان دهیم چگونه می توان از تئوری احتمال و آمار ریاضی در مدیریت تولید هنگام تصمیم گیری در زمینه مدیریت کیفیت محصول آماری استفاده کرد.

1.4 "آمار ریاضی" چیست؟

آمار ریاضی به عنوان «شاخه‌ای از ریاضیات است که به روش‌های ریاضی جمع‌آوری، نظام‌بندی، پردازش و تفسیر داده‌های آماری و همچنین استفاده از آنها برای نتیجه‌گیری علمی یا عملی اختصاص دارد. قواعد و رویه های آمار ریاضی مبتنی بر تئوری احتمال است که امکان ارزیابی دقت و پایایی نتایج به دست آمده در هر مسئله را بر اساس مواد آماری موجود فراهم می کند. در عین حال، داده های آماری به اطلاعاتی در مورد تعداد اشیاء در هر مجموعه کم و بیش گسترده ای اشاره دارد که دارای ویژگی های خاصی است.

با توجه به نوع مسائل حل شده، آمار ریاضی معمولاً به سه بخش تقسیم می شود: توصیف داده ها، تخمین و آزمون فرضیه.

با توجه به نوع داده های آماری مورد پردازش، آمار ریاضی به چهار حوزه تقسیم می شود:

آمار تک بعدی (آمار متغیرهای تصادفی) که در آن نتیجه یک مشاهده با یک عدد واقعی توصیف می شود.

تجزیه و تحلیل آماری چند متغیره، که در آن نتیجه مشاهده یک شی با چندین عدد (بردار) توصیف می شود.

آمار فرآیندهای تصادفی و سری های زمانی، که در آن نتیجه مشاهده یک تابع است.

آمار اجسام غیر عددی که در آنها نتیجه مشاهده ماهیتی غیر عددی دارد، به عنوان مثال، یک مجموعه (شکل هندسی)، یک مرتبه یا در نتیجه اندازه گیری به دست آمده است. یک ویژگی کیفی

از نظر تاریخی، برخی از حوزه های آمار اشیاء غیر عددی (به ویژه مشکلات تخمین درصد محصولات معیوب و آزمایش فرضیه ها در مورد آن) و آمارهای تک بعدی اولین مواردی بودند که ظاهر شدند. دستگاه ریاضی برای آنها ساده تر است، بنابراین، با مثال آنها، آنها معمولا ایده های اصلی آمار ریاضی را نشان می دهند.

فقط آن روش های پردازش داده ها، یعنی. آمارهای ریاضی مبتنی بر شواهد هستند که بر اساس مدل‌های احتمالی پدیده‌ها و فرآیندهای واقعی مرتبط هستند. ما در مورد مدل های رفتار مصرف کننده، وقوع خطرات، عملکرد تجهیزات تکنولوژیکی، به دست آوردن نتایج یک آزمایش، دوره یک بیماری و غیره صحبت می کنیم. یک مدل احتمالی از یک پدیده واقعی باید ساخته شده در نظر گرفته شود که مقادیر مورد بررسی و روابط بین آنها بر اساس نظریه احتمال بیان شود. مطابقت با مدل احتمالی واقعیت، یعنی. کفایت آن به ویژه با کمک روش های آماری برای آزمون فرضیه ها اثبات می شود.

روش‌های پردازش داده‌های باورنکردنی اکتشافی هستند، آنها فقط می‌توانند در تجزیه و تحلیل داده‌های اولیه استفاده شوند، زیرا ارزیابی صحت و قابلیت اطمینان نتایج به‌دست‌آمده بر اساس مواد آماری محدود را امکان‌پذیر نمی‌سازند.

روش‌های احتمالی و آماری در هر جایی که امکان ساخت و اثبات مدل احتمالی یک پدیده یا فرآیند وجود داشته باشد، قابل استفاده است. استفاده از آنها زمانی اجباری است که نتیجه گیری از داده های نمونه به کل جمعیت منتقل شود (به عنوان مثال، از یک نمونه به یک دسته کامل از محصولات).

در حوزه های کاربردی خاص، هم از روش های احتمالی-آماری کاربرد گسترده و هم از روش های خاص استفاده می شود. به عنوان مثال، در بخش مدیریت تولید که به روش های آماری کنترل کیفیت محصول اختصاص دارد، از آمار ریاضی کاربردی (از جمله طراحی آزمایش ها) استفاده می شود. با کمک روش های آن، تجزیه و تحلیل آماری از دقت و ثبات فرآیندهای تکنولوژیکی و ارزیابی آماری کیفیت انجام می شود. روش‌های خاص شامل روش‌های کنترل آماری پذیرش کیفیت محصول، تنظیم آماری فرآیندهای فناوری، ارزیابی و کنترل قابلیت اطمینان و غیره است.

چنین رشته های کاربردی آماری احتمالی مانند نظریه قابلیت اطمینان و نظریه صف به طور گسترده استفاده می شود. محتوای مورد اول از عنوان مشخص است، دومی به مطالعه سیستم‌هایی مانند مبادله تلفنی می‌پردازد که تماس‌ها را در زمان‌های تصادفی دریافت می‌کند - الزامات مشترکینی که شماره‌های تلفن خود را شماره‌گیری می‌کنند. مدت زمان خدمت این الزامات، یعنی. مدت زمان مکالمات نیز با متغیرهای تصادفی مدل‌سازی می‌شود. کمک بزرگی به توسعه این رشته ها توسط عضو مسئول آکادمی علوم اتحاد جماهیر شوروی A.Ya انجام شد. خینچین (1894-1959)، آکادمی آکادمی علوم اوکراین SSR B.V. Gnedenko (1912-1995) و سایر دانشمندان داخلی.

1.5 مختصری در مورد تاریخچه آمار ریاضی

آمار ریاضی به عنوان یک علم با آثار ریاضیدان مشهور آلمانی کارل فردریش گاوس (1777-1855) آغاز می شود که بر اساس نظریه احتمال، روش حداقل مربعات را که در سال 1795 ایجاد کرد و برای پردازش های نجومی به کار برد، بررسی و اثبات کرد. داده ها (به منظور روشن شدن مدار یک سیاره کوچک سرس). یکی از پرطرفدارترین توزیع‌های احتمال، توزیع نرمال، اغلب به نام او نامگذاری می‌شود و در نظریه فرآیندهای تصادفی، موضوع اصلی مطالعه فرآیندهای گاوسی است.

در پایان قرن نوزدهم. - آغاز قرن بیستم. سهم عمده ای در آمار ریاضی توسط محققان انگلیسی، در درجه اول K. Pearson (1857-1936) و R. A. Fisher (1890-1962) انجام شد. به طور خاص، پیرسون آزمون کای دو را برای آزمایش فرضیه های آماری و فیشر آنالیز واریانس، تئوری برنامه ریزی آزمایش و روش حداکثر درستنمایی را برای تخمین پارامترها توسعه داد.

در دهه 30 قرن بیستم. Pole Jerzy Neumann (1894-1977) و انگلیسی E. Pearson تئوری کلی آزمایش فرضیه های آماری را توسعه دادند و ریاضیدانان شوروی، آکادمیک A.N. کولموگروف (1903-1987) و عضو مسئول آکادمی علوم اتحاد جماهیر شوروی، N.V. Smirnov (1900-1966) پایه های آمار ناپارامتریک را پایه گذاری کردند. در دهه چهل قرن بیستم. رومانیایی A. Wald (1902-1950) تئوری تجزیه و تحلیل آماری سازگار را ساخت.

آمار ریاضی در حال حاضر به سرعت در حال توسعه است. بنابراین، در طول 40 سال گذشته، چهار حوزه اساساً جدید تحقیق را می توان متمایز کرد:

توسعه و اجرای روش های ریاضی برای برنامه ریزی آزمایش ها.

توسعه آمار اشیاء غیر عددی به عنوان یک جهت مستقل در آمار ریاضی کاربردی.

توسعه روش های آماری مقاوم در برابر انحرافات کوچک از مدل احتمالی مورد استفاده.

توسعه گسترده کار بر روی ایجاد بسته های نرم افزاری کامپیوتری طراحی شده برای تجزیه و تحلیل آماری داده ها.

1.6 روش های احتمالی-آماری و بهینه سازی

ایده بهینه سازی در آمارهای کاربردی مدرن ریاضی و سایر روش های آماری نفوذ می کند. یعنی روش‌های برنامه‌ریزی آزمایش‌ها، کنترل پذیرش آماری، کنترل آماری فرآیندهای تکنولوژیکی و غیره. از سوی دیگر، فرمول‌های بهینه‌سازی در تئوری تصمیم‌گیری، به عنوان مثال، تئوری کاربردی بهینه‌سازی کیفیت محصول و الزامات استاندارد، امکان استفاده گسترده از روش های آماری احتمالی، در درجه اول آمار ریاضی کاربردی.

در مدیریت تولید، به‌ویژه، هنگام بهینه‌سازی کیفیت محصول و الزامات استاندارد، استفاده از روش‌های آماری در مرحله اولیه چرخه عمر محصول از اهمیت ویژه‌ای برخوردار است. در مرحله آماده سازی تحقیقاتی تحولات طراحی آزمایشی (توسعه الزامات امیدوارکننده برای محصولات، طراحی اولیه، شرایط مرجع برای توسعه طراحی آزمایشی). این به دلیل اطلاعات محدود موجود در مرحله اولیه چرخه عمر محصول و نیاز به پیش بینی امکانات فنی و وضعیت اقتصادی برای آینده است. روش های آماری باید در تمام مراحل حل یک مسئله بهینه سازی - هنگام مقیاس بندی متغیرها، توسعه مدل های ریاضی برای عملکرد محصولات و سیستم ها، انجام آزمایش های فنی و اقتصادی و غیره - اعمال شود.

در مسائل بهینه سازی از جمله بهینه سازی کیفیت محصول و الزامات استاندارد، از تمامی حوزه های آمار استفاده می شود. یعنی آمار متغیرهای تصادفی، تحلیل آماری چند متغیره، آمار فرآیندهای تصادفی و سری‌های زمانی، آمار اشیاء غیر عددی. انتخاب یک روش آماری برای تجزیه و تحلیل داده های خاص باید طبق توصیه ها انجام شود.

2. مسائل عملی معمولی احتمالاتیتصمیم گیری اتیستیکو روش های حل آنها

2.1 آمار و آمار کاربردی

آمار کاربردی به عنوان بخشی از آمار ریاضی که به روش های پردازش داده های آماری واقعی و همچنین ریاضیات و نرم افزارهای مربوطه اختصاص دارد درک می شود. بنابراین، مسائل صرفاً ریاضی در آمار کاربردی گنجانده نشده است.

داده های آماری به عنوان مقادیر عددی یا غیر عددی پارامترهای کنترل شده (ویژگی های) اشیاء مورد مطالعه درک می شود که در نتیجه مشاهدات (اندازه گیری، تجزیه و تحلیل، آزمایش، آزمایش و غیره) تعداد معینی از موارد به دست می آید. ویژگی های هر واحد موجود در مطالعه روش های به دست آوردن داده های آماری و حجم نمونه بر اساس فرمول بندی یک مسئله کاربردی خاص بر اساس روش های نظریه ریاضی برنامه ریزی آزمایش ایجاد می شود.

نتیجه مشاهده xi از صفت مورد مطالعه X (یا مجموع صفات مورد مطالعه X) از واحد نمونه i منعکس کننده خصوصیات کمی و / یا کیفی واحد بررسی شده با عدد i است (در اینجا i = 1, 2, ...، n، که n حجم نمونه است).

نتایج مشاهدات x1، x2،…، xn، که در آن xi نتیجه مشاهدات واحد نمونه i و یا نتایج مشاهدات برای چندین نمونه است، با استفاده از روش‌های آماری کاربردی متناسب با کار پردازش می‌شوند. به عنوان یک قاعده، از روش های تحلیلی استفاده می شود، یعنی. روش های مبتنی بر محاسبات عددی (اشیاء غیر عددی با استفاده از اعداد توصیف می شوند). در برخی موارد استفاده از روش های گرافیکی (تحلیل بصری) جایز است.

2.2 وظایف تجزیه و تحلیل آماری دقت و ثبات فرآیندهای تکنولوژیکی و کیفیت محصول

روش های آماری به ویژه برای تجزیه و تحلیل دقت و پایداری فرآیندهای تکنولوژیکی و کیفیت محصول استفاده می شود. هدف تهیه راه حل هایی است که عملکرد کارآمد واحدهای فناورانه را تضمین کند و کیفیت و رقابت محصولات را بهبود بخشد. در تمام مواردی که بر اساس نتایج تعداد محدودی از مشاهدات، لازم است دلایل بهبود یا بدتر شدن دقت و پایداری تجهیزات تکنولوژیکی مشخص شود، باید از روش‌های آماری استفاده شود. تحت دقت فرآیند فن آوری، ویژگی فرآیند فن آوری درک می شود که نزدیکی مقادیر واقعی و اسمی پارامترهای محصولات تولیدی را تعیین می کند. تحت ثبات فرآیند تکنولوژیکی، ویژگی فرآیند تکنولوژیکی درک می شود، که ثبات توزیع احتمال را برای پارامترهای آن در یک دوره زمانی معین بدون دخالت خارجی تعیین می کند.

اهداف استفاده از روش های آماری برای تجزیه و تحلیل دقت و پایداری فرآیندهای تکنولوژیکی و کیفیت محصول در مراحل توسعه، تولید و بهره برداری (مصرف) محصولات به ویژه عبارتند از:

* تعیین شاخص های واقعی دقت و ثبات فرآیند فن آوری، تجهیزات یا کیفیت محصول؛

* ایجاد انطباق کیفیت محصول با الزامات اسناد نظارتی و فنی؛

* تأیید انطباق با نظم فنی؛

* مطالعه عوامل تصادفی و سیستماتیک که می تواند منجر به ظهور نقص شود.

* شناسایی ذخایر تولید و فناوری؛

* اثبات هنجارهای فنی و تحمل برای محصولات؛

* ارزیابی نتایج آزمایش نمونه های اولیه در اثبات الزامات محصولات و استانداردهای آن.

* اثبات انتخاب تجهیزات تکنولوژیکی و ابزار اندازه گیری و آزمایش؛

* مقایسه نمونه های مختلف محصول؛

* اثبات جایگزینی کنترل مداوم توسط آماری.

* شناسایی امکان معرفی روش های آماری مدیریت کیفیت محصول و غیره.

برای دستیابی به اهداف فوق از روش های مختلف توصیف داده ها، برآورد و آزمون فرضیه ها استفاده می شود. اجازه دهید مثال هایی از بیان مسئله ارائه دهیم.

2.3 مسائل آمار تک بعدی (آمار متغیرهای تصادفی)

مقایسه انتظارات ریاضی در مواردی انجام می شود که لازم است مطابقت بین شاخص های کیفیت محصولات تولیدی و نمونه مرجع ایجاد شود. این وظیفه آزمایش فرضیه است:

H0: M(X) = m0،

که در آن m0 مقدار مربوط به نمونه مرجع است. X یک متغیر تصادفی است که نتایج مشاهدات را شبیه سازی می کند. بسته به فرمول‌بندی مدل احتمالی موقعیت و فرضیه جایگزین، مقایسه انتظارات ریاضی به دو روش پارامتریک یا ناپارامتریک انجام می‌شود.

مقایسه واریانس ها زمانی انجام می شود که لازم باشد تفاوت بین پراکندگی شاخص کیفیت و اسمی مشخص شود. برای انجام این کار، این فرضیه آزمایش می شود:

مهمتر از مسائل آزمون فرضیه ها، مسائل تخمین پارامتر است. آنها، مانند وظایف آزمون فرضیه ها، بسته به مدل احتمالی مورد استفاده موقعیت، به پارامتری و ناپارامتریک تقسیم می شوند.

در مسائل تخمین پارامتریک، یک مدل احتمالی اتخاذ می شود که بر اساس آن، نتایج مشاهدات x1، x2، ...، xn به عنوان تحقق n متغیر تصادفی مستقل با تابع توزیع F(x;u) در نظر گرفته می شود. در اینجا، و یک پارامتر ناشناخته است که در فضای پارامتر قرار دارد و توسط مدل احتمالی استفاده شده ارائه شده است. وظیفه تخمین تعیین تخمین نقطه ای و حدود اطمینان (یا منطقه اطمینان) برای پارامتر و.

پارامتر و یا یک عدد یا بردار یک بعد محدود ثابت است. بنابراین، برای توزیع نرمال، u = (m, y2) یک بردار دو بعدی است، برای توزیع دو جمله ای، u = p یک عدد است، برای توزیع گاما
و = (a, b, c) یک بردار سه بعدی است و غیره.

در آمارهای ریاضی مدرن، تعدادی روش کلی برای تعیین تخمین ها و محدودیت های اطمینان ایجاد شده است - روش لحظه ها، روش حداکثر احتمال، روش تخمین های یک مرحله ای، روش تخمین های پایدار (محکم)، روش تخمین های بی طرفانه و غیره

بیایید نگاهی گذرا به سه مورد اول بیاندازیم.

روش گشتاورها بر اساس استفاده از عباراتی برای ممان متغیرهای تصادفی در نظر گرفته شده از نظر پارامترهای توابع توزیع آنها است. تخمین روش گشتاورها با جایگزینی گشتاورهای نمونه به جای ممان های نظری در توابعی که پارامترها را بر حسب ممان بیان می کنند به دست می آید.

در روش حداکثر درستنمایی که عمدتاً توسط R.A. Fisher توسعه یافته است، به عنوان تخمین پارامتر و مقدار u* در نظر گرفته شده است که به اصطلاح تابع درستنمایی حداکثر است.

f(x1، u) f(x2، u) … f(xn، u)،

که در آن x1، x2،…، xn نتایج مشاهدات هستند. f(x,u) چگالی توزیع آنها است، بسته به پارامتر u که باید تخمین زده شود.

برآوردگرهای حداکثر درستنمایی عموماً کارآمد هستند (یا به طور مجانبی کارآمد) و واریانس کمتری نسبت به روش برآوردگرهای گشتاور دارند. در برخی موارد، فرمول های آنها به صراحت نوشته می شود (توزیع عادی، توزیع نمایی بدون تغییر). با این حال، بیشتر اوقات برای یافتن آنها، لازم است یک سیستم معادلات ماورایی را به صورت عددی حل کنیم (توزیع های Weibull-Gnedenko، گاما). در چنین مواردی، توصیه می شود از تخمین های حداکثر درستنمایی استفاده نکنید، بلکه از انواع دیگر تخمین ها، عمدتاً برآوردهای یک مرحله ای استفاده کنید.

در مسائل تخمین ناپارامتری، یک مدل احتمالی اتخاذ می شود که در آن نتایج مشاهدات x1، x2،...، xn به عنوان تحقق n متغیر تصادفی مستقل با تابع توزیع عمومی F(x) در نظر گرفته می شود. F(x) فقط برای تحقق شرایط خاصی مانند تداوم، وجود انتظار و پراکندگی ریاضی و غیره مورد نیاز است. چنین شرایطی به اندازه شرط تعلق به یک خانواده پارامتری خاص سختگیرانه نیست.

در یک فرمول ناپارامتریک، یا ویژگی های یک متغیر تصادفی (انتظار ریاضی، واریانس، ضریب تغییرات) و یا تابع توزیع، چگالی و ... برآورد می شود. بنابراین، به موجب قانون اعداد بزرگ، میانگین نمونه حسابی یک تخمین ثابت از انتظار ریاضی M(X) است (برای هر تابع توزیع F(x) از نتایج مشاهداتی که انتظار ریاضی برای آنها وجود دارد). با کمک قضیه حد مرکزی، مرزهای اطمینان مجانبی تعیین می شوند

(M(X))H = , (M(X))B = .

جایی که r احتمال اطمینان است، کمیت ترتیب توزیع نرمال استاندارد N(0;1) با انتظارات ریاضی صفر و واریانس واحد، میانگین حسابی نمونه است، s انحراف استاندارد نمونه است. اصطلاح "محدوده اطمینان مجانبی" به این معنی است که احتمالات

P((M(X))H< M(X)}, P{(M(X))B >M(X))

P((M(X))H< M(X) < (M(X))B}

تمایل به، و r، به ترتیب، برای n > ?، اما، به طور کلی، با این مقادیر برای n محدود برابر نیستند. در عمل، کران اطمینان مجانبی دقت کافی برای n از مرتبه 10 می دهد.

دومین مثال از تخمین ناپارامتریک، تخمین تابع توزیع است. با قضیه گلیونکو، تابع توزیع تجربی Fn(x) یک تخمین ثابت از تابع توزیع F(x) است. اگر F(x) یک تابع پیوسته باشد، بر اساس قضیه کولموگروف، حدود اطمینان تابع توزیع F(x) به صورت

(F(x))Н = حداکثر، (F(x))B = حداقل،

که در آن k(r,n) کمیت ترتیب توزیع آماره کلموگروف برای اندازه نمونه n است (به یاد بیاورید که توزیع این آمار به F(x) بستگی ندارد).

قوانین تعیین تخمین ها و حدود اطمینان در حالت پارامتریک بر اساس خانواده پارامتری توزیع F(x;u) است. هنگام پردازش داده های واقعی، این سوال مطرح می شود - آیا این داده ها با مدل احتمالی پذیرفته شده مطابقت دارند؟ آن ها فرضیه آماری که نتایج مشاهدات دارای تابع توزیع از خانواده (F(x; u)، u) برای برخی u = u0 است؟ این گونه فرضیه ها را فرضیه های برازندگی و معیارهای تأیید آن ها را «خوب بودن برازش» می نامند.

اگر مقدار واقعی پارامتر u = u0 مشخص باشد، تابع توزیع F(x; u0) پیوسته است، در این صورت از آزمون کولموگروف بر اساس آمار اغلب برای آزمون فرضیه برازش استفاده می شود.

که در آن Fn(x) تابع توزیع تجربی است.

اگر مقدار واقعی پارامتر u0 ناشناخته باشد، به عنوان مثال، هنگام آزمایش فرضیه در مورد نرمال بودن توزیع نتایج مشاهدات (یعنی هنگام بررسی اینکه آیا این توزیع به خانواده توزیع های نرمال تعلق دارد)، گاهی اوقات از آمار استفاده می شود.

تفاوت آن با آمار کلموگروف Dn در این است که به جای مقدار واقعی پارامتر u0، تخمین آن u* جایگزین می شود.

توزیع آمار Dn(u*) بسیار متفاوت از توزیع آمار Dn است. به عنوان مثال، زمانی که u = (m, y2) و u* = (, s2) بررسی نرمال بودن را در نظر بگیرید. برای این مورد، کمیت های توزیع آمار Dn و Dn(u*) در جدول 1 آورده شده است. بنابراین، چندک ها حدود 1.5 برابر متفاوت هستند.

جدول 1 - کمیت های آمار Dn و Dn(u*) هنگام تست نرمال بودن

در پردازش اولیه داده های آماری، یک وظیفه مهم حذف نتایج مشاهدات به دست آمده در نتیجه خطاها و اشتباهات فاحش است. به عنوان مثال، هنگام مشاهده داده های وزن (به کیلوگرم) نوزادان به همراه اعداد 3500، 2750، 4200، ممکن است عدد 35.00 ظاهر شود. واضح است که این اشتباه است و با یک ورودی اشتباه یک عدد اشتباه به دست آمد - کاما با یک علامت جابه جا شد، در نتیجه مشاهده، نتیجه مشاهده به اشتباه 10 برابر افزایش یافت.

روش‌های آماری برای حذف موارد پرت بر این فرض استوار است که چنین مشاهداتی دارای توزیع‌هایی هستند که به شدت با مشاهدات مورد مطالعه متفاوت است و بنابراین باید از نمونه حذف شوند.

ساده ترین مدل احتمالی به شرح زیر است. تحت فرض صفر، نتایج مشاهدات به عنوان تحقق متغیرهای تصادفی مستقل با توزیع یکسان X1، X2، Xn با تابع توزیع F(x) در نظر گرفته می شود. تحت فرضیه جایگزین، X1، X2، Xn-1 مانند فرضیه صفر هستند و Xn مربوط به یک خطای فاحش است و تابع توزیع G(x) = F(x - c) دارد، که در آن c بزرگ است. سپس، با احتمال نزدیک به 1 (به طور دقیق تر، گرایش به 1 با افزایش حجم نمونه)،

Xn = حداکثر (X1، X2، Xn) = Xmax،

آن ها هنگام توصیف داده ها، Xmax باید به عنوان یک خطای فاحش احتمالی در نظر گرفته شود. منطقه بحرانی شکل دارد

W \u003d (x: x\u003e d).

مقدار بحرانی d = d(b, n) بسته به سطح اهمیت b و اندازه نمونه n از شرایط انتخاب می شود.

P(Xmax > d | H0) = b (1)

شرط (1) برای n بزرگ و b کوچک معادل زیر است:

اگر تابع توزیع نتایج مشاهدات F(x) مشخص باشد، مقدار بحرانی d از رابطه (2) بدست می آید. اگر F(x) تا پارامترها شناخته شده باشد، به عنوان مثال، مشخص شود که F(x) یک تابع توزیع نرمال است، سپس قوانین آزمایش فرضیه مورد بررسی نیز ایجاد می شود.

با این حال، اغلب شکل تابع توزیع نتایج مشاهدات نه کاملاً دقیق و نه به اندازه پارامترها، بلکه فقط با مقداری خطا شناخته می شود. سپس رابطه (2) عملاً بی فایده می شود، زیرا یک خطای کوچک در تعیین F(x)، همانطور که نشان داده می شود، منجر به یک خطای بزرگ در تعیین مقدار بحرانی d از شرط (2) می شود، و در d ثابت، اهمیت سطح معیار ممکن است به طور قابل توجهی با اسمی متفاوت باشد.

بنابراین، در شرایطی که اطلاعات کاملی در مورد F(x) وجود ندارد، اما انتظار ریاضی M(X) و واریانس y2 = D(X) نتایج مشاهدات X1، X2، Xn مشخص است، قوانین رد ناپارامتریک بر اساس نابرابری چبیشف می توان استفاده کرد. با استفاده از این نابرابری، مقدار بحرانی d = d(b, n) را به گونه ای می یابیم که

آنگاه رابطه (3) ارضا خواهد شد اگر

با نابرابری چبیشف

بنابراین، برای برآورده شدن (4) کافی است که سمت راست فرمول های (4) و (5) را معادل سازی کنیم، یعنی. d را از شرط تعیین کنید

قاعده رد بر اساس مقدار بحرانی d محاسبه شده با فرمول (6) از حداقل اطلاعات مربوط به تابع توزیع F(x) استفاده می کند و بنابراین فقط مشاهداتی را که بسیار دور از جرم اصلی هستند حذف می کند. به عبارت دیگر، مقدار d1 داده شده توسط رابطه (1) معمولاً بسیار کوچکتر از مقدار d2 داده شده توسط رابطه (6) است.

2.4 تجزیه و تحلیل آماری چند متغیره

برای حل مسائل زیر از تحلیل آماری چند متغیره استفاده می شود:

* مطالعه رابطه بین ویژگی ها.

* طبقه بندی اشیا یا ویژگی های داده شده توسط بردارها.

* کاهش ابعاد فضای ویژگی.

در این مورد، نتیجه مشاهدات، بردار مقادیر تعداد ثابتی از ویژگی های کمی و گاهی کیفی اندازه گیری شده در یک شی است. علامت کمی نشانه یک واحد مشاهده شده است که می تواند مستقیماً با یک عدد و یک واحد اندازه گیری بیان شود. یک ویژگی کمی با یک صفت کیفی مخالف است - یک ویژگی یک واحد مشاهده شده، که با انتساب به یکی از دو یا چند دسته شرطی تعیین می شود (اگر دقیقاً دو دسته وجود داشته باشد، آن خصیصه جایگزین نامیده می شود). تجزیه و تحلیل آماری ویژگی های کیفی بخشی از آمار اشیاء غیر عددی است. علائم کمی به علائم اندازه گیری شده در مقیاس های فواصل، نسبت ها، تفاوت ها، مطلق تقسیم می شوند.

و کیفی - در علائم اندازه گیری شده در مقیاس نام ها و مقیاس ترتیبی. روش های پردازش داده ها باید با مقیاس هایی که ویژگی های در نظر گرفته شده در آنها اندازه گیری می شود، سازگار باشد.

هدف از مطالعه رابطه بین ویژگی ها، اثبات وجود رابطه بین ویژگی ها و بررسی این رابطه است. برای اثبات وجود ارتباط بین دو متغیر تصادفی X و Y از تحلیل همبستگی استفاده می شود. اگر توزیع مشترک X و Y نرمال باشد، استنباط های آماری بر اساس ضریب همبستگی خطی نمونه، در سایر موارد از ضرایب همبستگی رتبه کندال و اسپیرمن و برای ویژگی های کیفی از آزمون کای اسکوئر استفاده می شود.

برای مطالعه وابستگی عملکردی صفت کمی Y به صفات کمی x(1)، x(2)، ...، x(k) از تحلیل رگرسیون استفاده می شود. این وابستگی را رگرسیون یا به طور خلاصه رگرسیون می نامند. ساده ترین مدل احتمالی تحلیل رگرسیون (در مورد k = 1) از مجموعه ای از جفت نتایج مشاهدات (xi, yi) به عنوان اطلاعات اولیه استفاده می کند، i = 1، 2، ...، n، و دارای شکل است.

yi = محور + b + ei، i = 1، 2، ...، n،

جایی که ei خطاهای مشاهده است. گاهی اوقات فرض می شود که ei متغیرهای تصادفی مستقل با توزیع نرمال یکسان N(0, y2) هستند. از آنجایی که توزیع خطاهای مشاهده معمولاً با نرمال متفاوت است، توصیه می شود که مدل رگرسیون را در یک فرمول ناپارامتریک در نظر بگیرید، به عنوان مثال. برای توزیع دلخواه ei.

وظیفه اصلی تحلیل رگرسیون تخمین پارامترهای مجهول a و b است که وابستگی خطی y به x را تعیین می کند. برای حل این مشکل، از روش حداقل مربعات توسعه یافته توسط K. Gauss در سال 1794 استفاده می شود، i.e. تخمین پارامترهای مدل مجهول a و b را از شرط کمینه کردن مجموع مربعات پیدا کنید

برای متغیرهای a و b.

از تحلیل واریانس برای مطالعه تأثیر ویژگی های کیفی بر یک متغیر کمی استفاده می شود. به عنوان مثال، اجازه دهید k نمونه از نتایج اندازه گیری های شاخص کمی کیفیت واحدهای تولید تولید شده در k ماشین وجود داشته باشد، یعنی. مجموعه ای از اعداد (x1(j)، x2(j)، ...، xn(j))، که j عدد ماشین است، j = 1، 2، …، k، و n اندازه نمونه است. در یک فرمول رایج تحلیل واریانس، فرض می شود که نتایج اندازه گیری مستقل هستند و در هر نمونه دارای توزیع نرمال N(m(j)، y2) با واریانس یکسان است.

بررسی یکنواختی کیفیت محصول، به عنوان مثال. عدم تأثیر عدد ماشین بر کیفیت محصول، به آزمایش فرضیه ختم می شود

H0: m(1) = m(2) = … = m(k).

در تجزیه و تحلیل پراکندگی، روش هایی برای آزمایش چنین فرضیه هایی توسعه یافته است.

فرضیه H0 در برابر فرضیه جایگزین H1 مورد آزمایش قرار می گیرد که طبق آن حداقل یکی از برابری های نشان داده شده برآورده نمی شود. تأیید این فرضیه بر اساس "تجزیه واریانس ها" زیر است که توسط R.A. Fisher نشان داده شده است:

که در آن s2 واریانس نمونه در نمونه تلفیقی است، یعنی.

بنابراین، اولین عبارت در سمت راست فرمول (7) پراکندگی درون گروهی را منعکس می کند. در نهایت، واریانس بین گروهی،

حوزه آمارهای کاربردی مرتبط با بسط واریانس نوع فرمول (7) را تحلیل واریانس می گویند. به عنوان نمونه ای از مسئله تحلیل واریانس، آزمایش فرضیه H0 فوق را با این فرض در نظر بگیرید که نتایج اندازه گیری مستقل هستند و در هر نمونه دارای توزیع نرمال N(m(j)، y2) با واریانس یکسان است. اگر H0 درست باشد، جمله اول سمت راست فرمول (7)، تقسیم بر y2، دارای توزیع کای دو با k(n-1) درجه آزادی است و جمله دوم تقسیم بر y2 نیز یک توزیع خی دو، اما با (k-1) درجه آزادی، و جمله اول و دوم به عنوان متغیرهای تصادفی مستقل هستند. بنابراین متغیر تصادفی

دارای توزیع فیشر با درجه آزادی صورتگر (k-1) و درجه آزادی مخرج k(n-1). فرضیه H0 پذیرفته می شود اگر F< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

روش های ناپارامتریک برای حل مسائل کلاسیک تجزیه و تحلیل پراکندگی، به ویژه، آزمایش فرضیه H0، توسعه یافته است.

نوع بعدی مسائل تحلیل آماری چند متغیره، مسائل طبقه بندی است. آنها به سه نوع اساساً متفاوت تقسیم می شوند - تجزیه و تحلیل متمایز، تجزیه و تحلیل خوشه، مشکلات گروه بندی.

وظیفه تجزیه و تحلیل متمایز یافتن قاعده ای برای انتساب یک شی مشاهده شده به یکی از کلاس های توصیف شده قبلی است. در این حالت اجسام در یک مدل ریاضی با استفاده از بردارهایی توصیف می شوند که مختصات آنها حاصل مشاهده تعدادی ویژگی برای هر شی است. کلاس ها یا مستقیماً با عبارات ریاضی یا با استفاده از نمونه های آموزشی توصیف می شوند. نمونه آموزشی نمونه ای است که برای هر عنصر مشخص می شود که به کدام کلاس تعلق دارد.

...

اسناد مشابه

    تاریخچه اقتصاد سنجی و آمار کاربردی. آمار کاربردی در اقتصاد ملی نقاط رشد آمار ناپارامتریک آمار اشیاء غیر عددی بخشی از آمار کاربردی است.

    چکیده، اضافه شده در 01/08/2009

    اجزای ساختاری جزء قطعی. هدف اصلی تحلیل آماری سری های زمانی. پیش‌بینی برون‌یابی فرآیندهای اقتصادی. شناسایی مشاهدات غیرعادی و همچنین ساخت مدل های سری زمانی.

    مقاله ترم، اضافه شده 03/11/2014

    مدل های آماری تصمیم گیری توصیف مدل هایی با توزیع احتمال شناخته شده وضعیت محیط. در نظر گرفتن ساده ترین طرح فرآیند تصمیم گیری پویا. انجام محاسبه احتمال تغییر شرکت.

    کار کنترل، اضافه شده در 11/07/2011

    روش های آماری تحلیل سری های زمانی تک بعدی، حل مسائل تحلیل و پیش بینی، رسم نمودار شاخص مورد مطالعه. معیارهای شناسایی اجزای سری، آزمون فرضیه تصادفی بودن سری و مقادیر خطاهای استاندارد.

    کار کنترل، اضافه شده 08/13/2010

    نقش روش های آماری در ارزیابی عینی ویژگی های کمی و کیفی فرآیند مدیریت. استفاده از ابزارهای کیفی در تجزیه و تحلیل فرآیندها و پارامترهای محصول. متغیرهای تصادفی گسسته نظریه احتمال.

    مقاله ترم، اضافه شده 01/11/2015

    نظریه ریاضی تصمیم گیری بهینه. روش سیمپلکس جدولی فرمول بندی و حل مسئله دوگانه برنامه ریزی خطی. مدل ریاضی مسئله حمل و نقل. تجزیه و تحلیل امکان سنجی تولید محصولات در شرکت.

    کار کنترل، اضافه شده در 2012/06/13

    جمعیت عمومی، انتخابی. مبانی روش شناختی تحلیل احتمالی-آماری. توابع MathCad برای حل مسائل آمار ریاضی طراحی شده اند. حل مسائل در MS Excel با استفاده از فرمول ها و با استفاده از منوی "تجزیه و تحلیل داده ها".

    مقاله ترم، اضافه شده در 2014/01/20

    محاسبه میزان هزینه های طرح تولید. ضرایب معادله خطی رگرسیون زوجی. ویژگی های تفسیر گرافیکی نتایج. توسعه فرآیندهای اقتصادی ویژگی های مدل سازی اقتصادسنجی سری های زمانی.

    تست، اضافه شده در 2011/02/22

    عناصر اساسی تحلیل اقتصاد سنجی سری های زمانی. وظایف تجزیه و تحلیل و پردازش اولیه آنها. حل مسائل پیش بینی کوتاه مدت و میان مدت مقادیر سری زمانی. روشهای یافتن پارامترهای معادله روند. روش حداقل مربعات

    کار کنترل، اضافه شده 06/03/2009

    مفاهیم اولیه در مورد رویدادهای تصادفی، کمیت ها و توابع. ویژگی های عددی متغیرهای تصادفی انواع عدم تقارن توزیع ها. ارزیابی آماری توزیع متغیرهای تصادفی. حل مسائل شناسایی ساختاری-پارامتری.

رویکردها، ایده ها و نتایج تئوری احتمالات و آمار ریاضی چگونه در تصمیم گیری استفاده می شود؟

پایه یک مدل احتمالی از یک پدیده یا فرآیند واقعی است، به عنوان مثال. یک مدل ریاضی که در آن روابط عینی بر حسب نظریه احتمال بیان می شود. احتمالات عمدتاً برای توصیف عدم قطعیت هایی که باید در هنگام تصمیم گیری در نظر گرفته شوند استفاده می شود. این هم به فرصت های نامطلوب (خطرات) و هم به فرصت های جذاب ("شانس خوش شانس") اشاره دارد. گاهی اوقات تصادفی بودن به طور عمدی وارد وضعیت می شود، به عنوان مثال، هنگام قرعه کشی، انتخاب تصادفی واحدها برای کنترل، انجام قرعه کشی یا نظرسنجی مصرف کنندگان.

نظریه احتمال به فرد اجازه می دهد تا احتمالات دیگری را که مورد علاقه محقق است محاسبه کند. به عنوان مثال، با احتمال افتادن یک نشان، می توانید احتمال افتادن حداقل 3 نشان را در 10 پرتاب سکه محاسبه کنید. چنین محاسبه ای مبتنی بر یک مدل احتمالی است که بر اساس آن، پرتاب سکه توسط طرحی از آزمایشات مستقل توصیف می شود، علاوه بر این، نشان و مشبک به یک اندازه محتمل هستند، و بنابراین احتمال هر یک از این رویدادها برابر است با ½. مدلی پیچیده تر است که به جای پرتاب سکه، کیفیت یک واحد خروجی را بررسی می کند. مدل احتمالی مربوطه بر این فرض استوار است که کنترل کیفیت واحدهای مختلف تولید با طرحی از آزمایش‌های مستقل توصیف می‌شود. در مقایسه با مدل پرتاب سکه، یک پارامتر جدید باید معرفی شود - احتمال p که یک واحد تولید معیوب است. در صورتی که فرض بر این باشد که تمامی واحدهای تولیدی دارای احتمال یکسانی برای معیوب بودن هستند، مدل به طور کامل توضیح داده می شود. اگر آخرین فرض نادرست باشد، تعداد پارامترهای مدل افزایش می یابد. به عنوان مثال، می توان فرض کرد که هر واحد تولیدی احتمال معیوب بودن خود را دارد.

اجازه دهید در مورد یک مدل کنترل کیفیت با احتمال عیب مشترک p برای همه واحدهای تولید بحث کنیم. برای "دستیابی به عدد" در هنگام تجزیه و تحلیل مدل، لازم است که مقدار خاصی را جایگزین p کنید. برای این کار باید از چارچوب یک مدل احتمالی فراتر رفت و به داده های به دست آمده در حین کنترل کیفیت روی آورد.

آمار ریاضی مسئله معکوس را با توجه به نظریه احتمال حل می کند. هدف آن نتیجه گیری در مورد احتمالات زیربنایی مدل احتمالی بر اساس نتایج مشاهدات (اندازه گیری ها، تحلیل ها، آزمون ها، آزمایش ها) است. برای مثال، بر اساس فراوانی وقوع محصولات معیوب در حین کنترل، می توان در مورد احتمال نقص نتیجه گیری کرد (به قضیه برنولی در بالا مراجعه کنید).

بر اساس نابرابری چبیشف، نتایجی در مورد مطابقت فراوانی وقوع محصولات معیوب با این فرضیه که احتمال نقص مقدار معینی می گیرد، به دست آمد.

بنابراین، کاربرد آمار ریاضی بر اساس مدل احتمالی یک پدیده یا فرآیند است. دو سری از مفاهیم موازی استفاده می شود - مفاهیم مربوط به نظریه (یک مدل احتمالی) و مفاهیم مربوط به عمل (نمونه ای از نتایج مشاهده). به عنوان مثال، احتمال نظری با فرکانس یافت شده از نمونه مطابقت دارد. انتظارات ریاضی (سری نظری) با میانگین حسابی نمونه (سری عملی) مطابقت دارد. به عنوان یک قاعده، ویژگی های نمونه، برآوردهای نظری هستند. در عین حال، کمیت های مربوط به مجموعه نظری "در ذهن محققین است"، به دنیای ایده ها (به گفته فیلسوف یونان باستان افلاطون) اشاره دارد و برای اندازه گیری مستقیم در دسترس نیست. محققان فقط داده های انتخابی دارند که با کمک آنها سعی می کنند ویژگی های یک مدل احتمالی نظری را که مورد علاقه آنها است ایجاد کنند.

چرا به یک مدل احتمالی نیاز داریم؟ واقعیت این است که فقط با کمک آن می توان خواص ایجاد شده توسط نتایج تجزیه و تحلیل یک نمونه خاص را به نمونه های دیگر و همچنین به کل جمعیت به اصطلاح عمومی منتقل کرد. اصطلاح "جمعیت" برای اشاره به جمعیت بزرگ اما محدودی از واحدهای مورد مطالعه استفاده می شود. به عنوان مثال، در مورد کل همه ساکنان روسیه یا کل مصرف کنندگان قهوه فوری در مسکو. هدف از بازاریابی یا نظرسنجی های جامعه شناختی، انتقال اظهارات دریافتی از نمونه ای متشکل از صدها یا هزاران نفر به جمعیت های عمومی چند میلیون نفری است. در کنترل کیفیت، دسته ای از محصولات به عنوان یک جمعیت عمومی عمل می کنند.

برای انتقال استنباط از یک نمونه به یک جامعه بزرگتر، برخی فرضیات در مورد رابطه ویژگی های نمونه با ویژگی های این جمعیت بزرگتر مورد نیاز است. این مفروضات بر اساس یک مدل احتمالی مناسب است.

البته پردازش داده های نمونه بدون استفاده از یک مدل احتمالی دیگر امکان پذیر است. به عنوان مثال، می توانید میانگین حسابی نمونه را محاسبه کنید، فراوانی تحقق شرایط خاص و غیره را محاسبه کنید. با این حال، نتایج محاسبات فقط برای یک نمونه خاص اعمال می شود؛ انتقال نتایج به دست آمده با کمک آنها به هر مجموعه دیگری نادرست است. این فعالیت گاهی اوقات به عنوان "تحلیل داده" نامیده می شود. در مقایسه با روش‌های احتمالی-آماری، تحلیل داده‌ها ارزش شناختی محدودی دارد.

بنابراین استفاده از مدل‌های احتمالی مبتنی بر تخمین و آزمون فرضیه‌ها با کمک ویژگی‌های نمونه، جوهره روش‌های تصمیم‌گیری احتمالی-آماری است.

ما تأکید می کنیم که منطق استفاده از ویژگی های نمونه برای تصمیم گیری بر اساس مدل های نظری شامل استفاده همزمان از دو سری مفاهیم موازی است که یکی از آنها مربوط به مدل های احتمالی و دیگری مربوط به داده های نمونه است. متأسفانه در تعدادی از منابع ادبی که معمولاً منسوخ یا با روحیه نسخه‌نویسی نوشته شده‌اند، بین ویژگی‌های گزینشی و نظری تمایزی قائل نشده‌اند که خوانندگان را در استفاده عملی از روش‌های آماری دچار سردرگمی و اشتباه می‌کند.

روش‌های تصمیم‌گیری در شرایط ریسک نیز در چارچوب نظریه تصمیم‌گیری آماری توسعه یافته و توجیه می‌شوند. تئوری تصمیمات آماری، نظریه انجام مشاهدات آماری، پردازش این مشاهدات و استفاده از آنها است. همانطور که می دانید، وظیفه تحقیقات اقتصادی درک ماهیت شی اقتصادی، آشکار ساختن مکانیسم رابطه بین مهم ترین متغیرهای آن است. این درک به فرد اجازه می دهد تا اقدامات لازم برای مدیریت این شی یا سیاست اقتصادی را توسعه و اجرا کند. این امر مستلزم روش‌هایی است که با در نظر گرفتن ماهیت و ویژگی‌های داده‌های اقتصادی که به عنوان مبنایی برای اظهارات کمی و کیفی در مورد موضوع یا پدیده اقتصادی مورد مطالعه عمل می‌کنند، برای کار مناسب باشند.

هر داده اقتصادی ویژگی های کمی هر شی اقتصادی است. آنها تحت تأثیر عوامل بسیاری تشکیل می شوند که همه آنها در دسترس کنترل خارجی نیستند. عوامل غیرقابل کنترل می توانند مقادیر تصادفی را از مجموعه ای از مقادیر بگیرند و در نتیجه باعث تصادفی بودن داده هایی که تعیین می کنند شوند. ماهیت تصادفی داده‌های اقتصادی استفاده از روش‌های آماری ویژه مناسب برای تحلیل و پردازش آنها را ضروری می‌سازد.

ارزیابی کمی از ریسک کارآفرینی، صرف نظر از محتوای یک کار خاص، معمولاً با استفاده از روش های آمار ریاضی امکان پذیر است. ابزارهای اصلی این روش تخمین واریانس، انحراف معیار، ضریب تغییرات است.

برنامه ها از ساختارهای عمومی بر اساس معیارهای تغییرپذیری یا احتمال حالت های مخاطره آمیز استفاده گسترده ای می کنند. بنابراین، خطرات مالی ناشی از نوسانات در نتیجه حول مقدار مورد انتظار، به عنوان مثال، کارایی، با استفاده از واریانس یا انحراف مطلق مورد انتظار از میانگین برآورد می شود. در مسائل مدیریت پول، معیار رایج درجه ریسک، احتمال ضرر یا کسری درآمد در مقایسه با گزینه پیش بینی شده است.

برای ارزیابی میزان ریسک (درجه ریسک)، بر معیارهای زیر تمرکز خواهیم کرد:

  • 1) میانگین ارزش مورد انتظار؛
  • 2) نوسان (تغییرپذیری) یک نتیجه ممکن.

برای نمونه آماری

جایی که Xj - مقدار مورد انتظار برای هر مورد مشاهده (/" = 1، 2، ...)، n، - تعداد موارد مشاهده (فرکانس) مقدار n:، x=E - میانگین مقدار مورد انتظار، st - واریانس،

V - ضریب تغییرات، داریم:

مشکل ارزیابی ریسک برای قراردادهای تجاری را در نظر بگیرید. LLC "Interproduct" تصمیم به انعقاد قرارداد برای تامین مواد غذایی از یکی از سه پایگاه می گیرد. با جمع‌آوری داده‌های مربوط به زمان پرداخت کالا توسط این پایگاه‌ها (جدول 6.7)، لازم است پس از ارزیابی ریسک، هنگام انعقاد قرارداد برای عرضه محصولات، مبنایی را انتخاب کنید که در کوتاه‌ترین زمان ممکن هزینه کالا را پرداخت کند. .

جدول 6.7

شرایط پرداخت در روز

تعداد موارد مشاهده پ

اسب بخار

(x-x)

(x-x ) 2

(x-x) 2 p

برای پایه اول، بر اساس فرمول (6.4.1):

برای پایه دوم

برای پایه سوم

ضریب تغییرات برای پایه اول کوچکترین است که نشان دهنده مصلحت انعقاد قرارداد برای عرضه محصولات با این پایه است.

مثال‌های در نظر گرفته شده نشان می‌دهند که ریسک دارای احتمال زیان بیان شده ریاضی است که بر اساس داده‌های آماری است و می‌تواند با دقت نسبتاً بالایی محاسبه شود. هنگام انتخاب قابل قبول ترین راه حل، از قانون احتمال بهینه نتیجه استفاده می شود که شامل انتخاب راه حل های ممکن از بین راه حل های ممکن است که در آن احتمال نتیجه برای کارآفرین قابل قبول است.

در عمل، اعمال قاعده احتمال نتیجه بهینه معمولاً با قانون تغییرپذیری نتیجه مطلوب ترکیب می شود.

همانطور که می دانید، نوسان شاخص ها با واریانس، انحراف معیار و ضریب تغییرات آنها بیان می شود. جوهر قانون نوسان بهینه نتیجه این است که از بین راه حل های ممکن، راه حلی انتخاب می شود که در آن احتمال برد و باخت برای همان سرمایه گذاری پرخطر سرمایه، شکاف کوچکی داشته باشد، یعنی. کوچکترین مقدار واریانس، انحراف استاندارد تغییرات. در مسائل مورد بررسی، انتخاب راه حل های بهینه با استفاده از این دو قاعده صورت گرفت.

با توجه به اینکه چه نوع داده ای "در ورودی" است:

2.1. شماره.

2.2. بردارهای با ابعاد محدود.

2.3. توابع (سری زمانی).

2.4. اشیاء غیر عددی.

جالب ترین طبقه بندی بر اساس آن دسته از وظایف کنترل است که برای حل آنها از روش های اقتصادسنجی استفاده می شود. با این رویکرد، بلوک ها را می توان تخصیص داد:

3.1. پشتیبانی از پیش بینی و برنامه ریزی

3.2. ردیابی پارامترهای کنترل شدهو تشخیص انحرافات

3.3. حمایت کردن تصمیم گیری، و غیره.

چه عواملی فراوانی استفاده از برخی ابزارهای کنترلی اقتصادسنجی را تعیین می کند؟ مانند سایر کاربردهای اقتصادسنجی، دو گروه اصلی از عوامل وجود دارد - اینها وظایفی هستند که باید حل شوند و صلاحیت متخصصان.

در کاربرد عملی روش های اقتصادسنجی در عملکرد کنترلر، استفاده از سیستم های نرم افزاری مناسب ضروری است. سیستم های آماری عمومی مانند SPSS، Statgraphics، Statistica، ADDA، و تخصصی تر Statcon، SPC، NADIS، REST(طبق آمار داده های بازه ای)، ماتریکسرو خیلی های دیگر. معرفی انبوه محصولات نرم افزاری با کاربرد آسان، از جمله ابزارهای مدرن اقتصادسنجی برای تجزیه و تحلیل داده های اقتصادی خاص، را می توان یکی از راه های موثر برای تسریع پیشرفت علمی و فناوری و انتشار دانش اقتصاد سنجی مدرن دانست.

اقتصاد سنجی دائما در حال تحول است. تحقیقات کاربردی منجر به نیاز به تحلیل عمیق‌تر روش‌های کلاسیک می‌شود.

یک مثال خوب برای بحث، روش هایی برای آزمایش همگنی دو نمونه است. دو مجموعه وجود دارد و باید تصمیم گرفت که آیا آنها متفاوت هستند یا یکسان هستند. برای انجام این کار، از هر یک از آنها نمونه برداری شده و از یک روش آماری دیگر برای بررسی همگنی استفاده می شود. حدود 100 سال پیش روش Student مطرح شد که امروزه بسیار مورد استفاده قرار می گیرد. با این حال، یک دسته کامل از کاستی ها دارد. ابتدا، طبق گفته Student، توزیع نمونه باید نرمال (گاوسی) باشد. به عنوان یک قاعده، این مورد نیست. ثانیاً، هدف آن بررسی نه همگنی به طور کلی (به اصطلاح همگنی مطلق، به عنوان مثال، همزمانی توابع توزیع مربوط به دو جمعیت)، بلکه فقط بررسی برابری انتظارات ریاضی است. اما، ثالثاً، لزوماً فرض می‌شود که واریانس‌های عناصر دو نمونه یکسان است. با این حال، بررسی برابری واریانس ها، و حتی بیشتر از آن نرمال بودن، بسیار دشوارتر از برابری انتظارات ریاضی است. بنابراین معمولاً آزمون t Student بدون انجام چنین بررسی هایی اعمال می شود. و سپس نتیجه گیری بر اساس معیار دانشجویی در هوا معلق است.

از نظر تئوری پیشرفته تر، کارشناسان به معیارهای دیگر، به عنوان مثال، به معیار Wilcoxon روی می آورند. ناپارامتریک است، یعنی. بر فرض عادی بودن تکیه نمی کند. اما او بدون نقص نیست. نمی توان از آن برای بررسی همگنی مطلق (تصادف توابع توزیع مربوط به دو جمعیت) استفاده کرد. این فقط با کمک به اصطلاح قابل انجام است. معیارهای سازگار، به ویژه، معیارهای اسمیرنوف و نوع امگا مربع.

از نقطه نظر عملی، معیار اسمیرنوف یک اشکال دارد - آمار آن فقط تعداد کمی از مقادیر را می گیرد، توزیع آن در تعداد کمی از نقاط متمرکز است و نمی توان از سطوح معنی داری سنتی 0.05 و 0.01 استفاده کرد. .

اصطلاح "فناوری های آماری بالا". در اصطلاح "فناوری های آماری بالا" هر یک از این سه کلمه معنای خاص خود را دارد.

"بالا"، مانند سایر زمینه ها، به این معنی است که این فناوری مبتنی بر دستاوردهای مدرن در تئوری و عمل، به ویژه، نظریه احتمال و آمار ریاضی کاربردی است. در عین حال، "تکیه بر دستاوردهای علمی مدرن" اولاً به این معنی است که پایه ریاضی فناوری در چارچوب رشته علمی مربوطه نسبتاً اخیراً به دست آمده است و ثانیاً الگوریتم های محاسباتی توسعه یافته و توجیه شده است. مطابق با آن (و به اصطلاح نیستند. "اکتشافی"). با گذشت زمان، اگر رویکردها و نتایج جدید ما را مجبور به تجدید نظر در ارزیابی کاربردی بودن و قابلیت‌های فناوری نکند، آن را با فناوری مدرن‌تر جایگزین کنیم، «فناوری اقتصاد سنجی بالا» به «فناوری آماری کلاسیک» تبدیل می‌شود. مانند روش حداقل مربع. بنابراین، فن آوری های آماری بالا ثمره تحقیقات علمی جدی اخیر است. در اینجا دو مفهوم کلیدی وجود دارد - "جوانی" فناوری (در هر صورت، نه بیشتر از 50 سال، یا بهتر - نه بیشتر از 10 یا 30 سال) و اتکا به "علم عالی".

اصطلاح «آماری» آشناست، اما معانی زیادی دارد. بیش از 200 تعریف از اصطلاح "آمار" شناخته شده است.

در نهایت، اصطلاح "تکنولوژی" نسبتاً به ندرت در رابطه با آمار استفاده می شود. تجزیه و تحلیل داده ها، به عنوان یک قاعده، شامل تعدادی از روش ها و الگوریتم هایی است که به صورت متوالی، موازی یا در یک طرح پیچیده تر انجام می شوند. به طور خاص، مراحل معمولی زیر قابل تشخیص است:

  • برنامه ریزی یک مطالعه آماری؛
  • سازماندهی جمع آوری داده ها بر اساس یک برنامه بهینه یا حداقل منطقی (برنامه ریزی نمونه، ایجاد ساختار سازمانی و انتخاب تیم متخصص، آموزش پرسنلی که در جمع آوری داده ها مشارکت خواهند داشت و همچنین کنترل کننده های داده و ...) ;
  • جمع آوری مستقیم داده ها و تثبیت آنها بر روی رسانه های مختلف (با کنترل کیفی جمع آوری و رد داده های اشتباه به دلایل حوزه موضوعی).
  • توصیف اولیه داده ها (محاسبه ویژگی های مختلف نمونه، توابع توزیع، تخمین چگالی ناپارامتریک، ساخت هیستوگرام، فیلدهای همبستگی، جداول و نمودارهای مختلف و غیره)
  • تخمین مشخصه ها و پارامترهای عددی خاص یا غیرعددی توزیع ها (به عنوان مثال، تخمین بازه ناپارامتریک ضریب تغییرات یا بازیابی رابطه بین پاسخ و عوامل، به عنوان مثال تخمین تابع)،
  • آزمایش فرضیه های آماری (گاهی اوقات زنجیره آنها - پس از آزمایش فرضیه قبلی، تصمیم به آزمایش یک یا آن فرضیه بعدی گرفته می شود)
  • مطالعه عمیق تر، یعنی استفاده از الگوریتم های مختلف برای تجزیه و تحلیل آماری چند متغیره، الگوریتم های تشخیصی و طبقه بندی، آمار داده های غیر عددی و فاصله ای، تجزیه و تحلیل سری های زمانی و غیره.
  • بررسی پایداری تخمین‌ها و نتیجه‌گیری‌های به‌دست‌آمده در مورد انحراف‌های مجاز داده‌های اولیه و مفروضات مدل‌های احتمالی-آماری مورد استفاده، تبدیل‌های مجاز مقیاس‌های اندازه‌گیری، به‌ویژه، مطالعه ویژگی‌های تخمین‌ها توسط روش ضرب نمونه;
  • استفاده از نتایج آماری به‌دست‌آمده برای اهداف کاربردی (مثلاً برای تشخیص مواد خاص، انجام پیش‌بینی، انتخاب یک پروژه سرمایه‌گذاری از گزینه‌های پیشنهادی، یافتن حالت بهینه برای اجرای یک فرآیند فن‌آوری، جمع‌بندی نتایج آزمایش نمونه‌های دستگاه‌های فنی. ، و غیره.)،
  • تهیه گزارش های نهایی، به ویژه برای کسانی که در روش های اقتصادسنجی و آماری تجزیه و تحلیل داده ها متخصص نیستند، از جمله برای مدیریت - "تصمیم گیرندگان" در نظر گرفته شده است.

ساختارهای دیگر فناوری های آماری امکان پذیر است. تاکید بر این نکته ضروری است که کاربرد واجد شرایط و کارآمد روش های آماری به هیچ وجه آزمایش یک فرضیه آماری واحد یا تخمین پارامترهای یک توزیع معین از یک خانواده ثابت نیست. عملیات از این نوع فقط آجرهایی هستند که عمارت فناوری آماری را تشکیل می دهند. در همین حال، کتاب های درسی و تک نگاری های آمار و اقتصاد سنجی معمولاً در مورد واحدهای سازنده فردی صحبت می کنند، اما مشکلات سازمان خود را در یک فناوری در نظر گرفته شده برای استفاده کاربردی مورد بحث قرار نمی دهند. انتقال از یک روش آماری به روش دیگر در سایه باقی می ماند.

مشکل "تطبیق" الگوریتم های آماری مستلزم توجه ویژه است، زیرا استفاده از الگوریتم قبلی اغلب شرایط قابل اجرا برای الگوریتم بعدی را نقض می کند. به ویژه، نتایج مشاهدات ممکن است مستقل نباشند، توزیع آنها ممکن است تغییر کند و غیره.

به عنوان مثال، هنگام آزمون فرضیه های آماری، سطح معناداری و قدرت از اهمیت بالایی برخوردار است. روش های محاسبه آنها و استفاده از آنها برای آزمون یک فرضیه معمولاً به خوبی شناخته شده است. اگر ابتدا یک فرضیه مورد آزمایش قرار گیرد و سپس با در نظر گرفتن نتایج تأیید آن، فرضیه دوم، روش نهایی، که می تواند به عنوان آزمون برخی فرضیه های آماری (پیچیده تر) نیز در نظر گرفته شود، دارای ویژگی هایی (سطح معناداری و قدرت) است. ) که قاعدتاً نمی توان از نظر ویژگی های فرضیه های دو جزء ساده بیان کرد و بنابراین معمولاً ناشناخته هستند. در نتیجه، رویه نهایی را نمی توان مبتنی بر علمی دانست، بلکه متعلق به الگوریتم های اکتشافی است. البته پس از مطالعه مناسب مثلاً به روش مونت کارلو می تواند به یکی از رویه های مبتنی بر علمی آمار کاربردی تبدیل شود.

بنابراین، روش تحلیل داده های اقتصادسنجی یا آماری، اطلاعاتی است فرآیند تکنولوژیکیبه عبارت دیگر، این یا آن فناوری اطلاعات. در حال حاضر، صحبت در مورد خودکارسازی کل فرآیند تجزیه و تحلیل داده های اقتصادسنجی (آماری) جدی نخواهد بود، زیرا مشکلات حل نشده زیادی وجود دارد که باعث بحث در بین متخصصان می شود.

کل زرادخانه روش های آماری مورد استفاده در حال حاضر را می توان به سه جریان تقسیم کرد:

  • فن آوری های آماری بالا؛
  • فن آوری های آماری کلاسیک،
  • فن آوری های آماری پایین

لازم است اطمینان حاصل شود که تنها دو نوع اول فن آوری در مطالعات خاص استفاده می شود.. در عین حال، منظور از فناوری‌های آماری کلاسیک، فناوری‌هایی با سن ارجمند است که ارزش علمی و اهمیت خود را برای عملکرد آماری مدرن حفظ کرده‌اند. اینها هستند روش حداقل مربع، آمار کلموگروف، اسمیرنوف، امگا مربع، ضرایب همبستگی ناپارامتریک اسپیرمن و کندال و بسیاری دیگر.

ما نسبت به ایالات متحده و بریتانیای کبیر (انجمن آماری آمریکا شامل بیش از 20000 عضو) اقتصاددانان به مراتب کمتری داریم. روسیه به آموزش متخصصان جدید - اقتصاد سنجی نیاز دارد.

هر چه نتایج علمی جدید به دست آید، اگر برای دانشجویان ناشناخته بماند، نسل جدیدی از محققان و مهندسان مجبور می شوند به آنها تسلط پیدا کنند، به تنهایی عمل کنند یا حتی دوباره آنها را کشف کنند. تا حدودی خشن، می‌توانیم بگوییم: آن رویکردها، ایده‌ها، نتایج، حقایق، الگوریتم‌هایی که به دوره‌های آموزشی و وسایل کمک آموزشی مرتبط ختم شد، توسط فرزندان حفظ و استفاده می‌شوند، آن‌هایی که آن را در گرد و غبار کتابخانه‌ها ناپدید نکردند.

نقاط رشد. پنج حوزه موضوعی وجود دارد که در آنها آمار کاربردی مدرن در حال توسعه است، به عنوان مثال. پنج "نقطه رشد": ناپارامتریک، استحکام، بوت استرپ، آمار فاصله، آمار اشیاء غیر عددی. اجازه دهید به طور خلاصه در مورد این روندهای فعلی بحث کنیم.

آمارهای ناپارامتریک یا ناپارامتریک به شما امکان می دهد نتیجه گیری های آماری بگیرید، ویژگی های توزیع را ارزیابی کنید، فرضیه های آماری را بدون فرضیات ضعیف اثبات شده که تابع توزیع عناصر نمونه در یک یا آن خانواده پارامتری گنجانده شده است، آزمایش کنید. به عنوان مثال، این باور عمومی وجود دارد که آمار اغلب از توزیع نرمال پیروی می کند. با این حال، تجزیه و تحلیل نتایج خاص مشاهدات، به ویژه، خطاهای اندازه گیری، نشان می دهد که در اکثریت قریب به اتفاق موارد، توزیع های واقعی به طور قابل توجهی با توزیع های عادی متفاوت است. استفاده غیرانتقادی از فرضیه نرمال بودن اغلب منجر به خطاهای قابل توجهی می شود، به عنوان مثال، هنگام رد موارد پرت مشاهدات (غیرطبیعی)، در کنترل کیفیت آماری، و در موارد دیگر. بنابراین، توصیه می شود از روش های ناپارامتریک استفاده شود، که در آن فقط الزامات بسیار ضعیفی بر توابع توزیع نتایج مشاهدات تحمیل می شود. معمولاً فقط تداوم آنها فرض می شود. تا به امروز، با کمک روش های ناپارامتریک، می توان تقریباً همان محدوده ای از مسائل را حل کرد که قبلاً با روش های پارامتریک حل می شد.

ایده اصلی کار در مورد استحکام (پایداری): نتیجه گیری باید با تغییرات کوچک در داده های اولیه و انحراف از مفروضات مدل کمی تغییر کند. در اینجا دو زمینه نگرانی وجود دارد. یکی مطالعه استحکام الگوریتم های رایج تجزیه و تحلیل داده ها است. دوم جستجو برای الگوریتم های قوی برای حل مسائل خاص است.

اصطلاح «استواری» به خودی خود معنای روشنی ندارد. همیشه لازم است یک مدل احتمالی-آماری مشخص مشخص شود. در عین حال، مدل «گرفتگی» Tukey-Huber-Hampel معمولاً عملاً مفید نیست. جهت گیری آن به سمت "وزن دادن دم ها" است و در موقعیت های واقعی "دم ها" با محدودیت های پیشینی بر روی نتایج مشاهدات، به عنوان مثال، مرتبط با ابزار اندازه گیری مورد استفاده، قطع می شوند.

بوت استرپ شاخه ای از آمار ناپارامتریک است که مبتنی بر استفاده فشرده از فناوری اطلاعات است. ایده اصلی این است که "نمونه ها را ضرب کنیم"، یعنی. در به دست آوردن مجموعه ای از نمونه های بسیار مشابه نمونه به دست آمده در آزمایش. از این مجموعه می توان برای ارزیابی ویژگی های رویه های آماری مختلف استفاده کرد. ساده ترین راه برای "ضرب نمونه" این است که یک نتیجه از مشاهده را از آن حذف کنیم. مشاهده اول را حذف می‌کنیم، نمونه‌ای شبیه به نمونه اصلی می‌گیریم، اما با کاهش حجم 1. سپس نتیجه حذف شده مشاهده اول را برمی‌گردانیم، اما مشاهده دوم را حذف می‌کنیم. نمونه دومی مشابه نمونه اصلی دریافت می کنیم. سپس نتیجه مشاهده دوم را برمی گردانیم و به همین ترتیب. راه های دیگری نیز برای «تکثیر نمونه ها» وجود دارد. به عنوان مثال، می توان یک یا آن تخمین از تابع توزیع را از نمونه اولیه ساخت و سپس با استفاده از روش آزمون های آماری، مجموعه ای از نمونه های عناصر را مدل کرد. در آمار کاربردی، یک نمونه است، یعنی. مجموعه ای از عناصر تصادفی مستقل با توزیع یکسان. ماهیت این عناصر چیست؟ در آمار ریاضی کلاسیک، عناصر یک نمونه اعداد یا بردارها هستند. و در آمار غیر عددی عناصر نمونه اشیایی غیر عددی هستند که قابل جمع و ضرب در اعداد نیستند. به عبارت دیگر، اشیاء غیر عددی در فضاهایی قرار دارند که ساختار برداری ندارند.