روش های تحلیل کمی: تخمین فواصل اطمینان. احتمال اطمینان و فاصله اطمینان احتمال فاصله اطمینان چقدر است

اغلب ارزیاب باید بازار املاک و مستغلات بخشی را که شی ارزیابی در آن قرار دارد، تجزیه و تحلیل کند. اگر بازار توسعه یابد، تجزیه و تحلیل کل مجموعه اشیاء ارائه شده می تواند دشوار باشد، بنابراین از نمونه ای از اشیاء برای تجزیه و تحلیل استفاده می شود. این نمونه همیشه همگن نیست، گاهی اوقات لازم است آن را از افراط پاک کنید - پیشنهادات بازار خیلی زیاد یا خیلی کم. برای این منظور اعمال می شود فاصله اطمینان. هدف این مطالعه- تجزیه و تحلیل مقایسه ای دو روش برای محاسبه فاصله اطمینان انجام دهید و انتخاب کنید بهترین گزینهمحاسبه هنگام کار با نمونه های مختلف در سیستم estimatica.pro.

فاصله اطمینان - بر اساس نمونه، فاصله مقادیر مشخصه محاسبه می شود که با احتمال مشخصی حاوی پارامتر تخمینی جمعیت عمومی است.

منظور از محاسبه فاصله اطمینان ایجاد چنین فاصله ای بر اساس داده های نمونه است تا بتوان با احتمال معین ادعا کرد که مقدار پارامتر برآورد شده در این بازه است. به عبارت دیگر، فاصله اطمینان با احتمال معین حاوی مقدار مجهول کمیت برآورد شده است. هرچه این فاصله بیشتر باشد، عدم دقت بیشتر است.

روش های مختلفی برای تعیین فاصله اطمینان وجود دارد. در این مقاله 2 راه را در نظر خواهیم گرفت:

  • از طریق میانه و انحراف معیار؛
  • از طریق مقدار بحرانی آماره t (ضریب دانشجو).

مراحل تجزیه و تحلیل مقایسه ای روش های مختلف برای محاسبه CI:

1. یک نمونه داده تشکیل دهید.

2. آن را پردازش کنید روش های آماری: محاسبه میانگین، میانه، واریانس و غیره.

3. فاصله اطمینان را به دو صورت محاسبه می کنیم.

4. نمونه های تمیز شده و فواصل اطمینان به دست آمده را آنالیز کنید.

مرحله 1. نمونه گیری داده ها

نمونه با استفاده از سیستم estimatica.pro تشکیل شد. نمونه شامل 91 پیشنهاد برای فروش آپارتمان 1 اتاقه در منطقه قیمت 3 با نوع برنامه ریزی "خروشچف" بود.

جدول 1. نمونه اولیه

قیمت 1 متر مربع سی.

عکس. 1. نمونه اولیه



مرحله 2. پردازش نمونه اولیه

پردازش نمونه با روش های آماری مستلزم محاسبه مقادیر زیر است:

1. میانگین حسابی

2. میانه - عددی که نمونه را مشخص می کند: دقیقاً نیمی از عناصر نمونه بزرگتر از میانه هستند، نیمی دیگر کمتر از میانه است.

(برای نمونه ای با تعداد فرد مقادیر)

3. محدوده - تفاوت بین مقادیر حداکثر و حداقل در نمونه

4. واریانس - برای تخمین دقیق تر تغییرات در داده ها استفاده می شود

5. انحراف استاندارد برای نمونه (از این پس RSD نامیده می شود) رایج ترین شاخص پراکندگی مقادیر تنظیم حول میانگین حسابی است.

6. ضریب تغییرات - نشان دهنده میزان پراکندگی مقادیر تنظیم است

7. ضریب نوسان - نشان دهنده نوسان نسبی مقادیر شدید قیمت ها در نمونه حول میانگین است.

جدول 2. شاخص های آماری نمونه اصلی

ضریب تغییرات، که مشخص کننده همگنی داده ها است، 12.29٪ است، اما ضریب نوسان بسیار بزرگ است. بنابراین، می توانیم بگوییم که نمونه اصلی همگن نیست، بنابراین اجازه دهید به محاسبه فاصله اطمینان برویم.

مرحله 3. محاسبه فاصله اطمینان

روش 1. محاسبه از طریق میانه و انحراف معیار.

فاصله اطمینان به شرح زیر تعیین می شود: حداقل مقدار - انحراف استاندارد از میانه کسر می شود. حداکثر مقدار - انحراف استاندارد به میانه اضافه می شود.

بنابراین، فاصله اطمینان (47179 CU؛ 60689 CU)

برنج. 2. مقادیر در بازه اطمینان 1.



روش 2. ایجاد فاصله اطمینان از طریق مقدار بحرانی آماره t (ضریب دانشجو)

S.V. گریبوفسکی در کتاب " روش های ریاضیارزیابی ارزش دارایی» نحوه محاسبه فاصله اطمینان از طریق ضریب دانشجو را شرح می دهد. هنگام محاسبه با این روش، خود برآوردگر باید سطح اهمیت ∝ را تعیین کند که احتمال ایجاد فاصله اطمینان را تعیین می کند. معمولاً از سطوح معنی داری 0.1 استفاده می شود. 0.05 و 0.01. آنها با احتمال اطمینان 0.9 مطابقت دارند. 0.95 و 0.99. با این روش، مقادیر واقعی انتظارات و واریانس ریاضی عملاً ناشناخته در نظر گرفته می‌شوند (که تقریباً همیشه در حل مسائل ارزیابی عملی صادق است).

فرمول فاصله اطمینان:

n - اندازه نمونه؛

مقدار بحرانی آمار t (توزیع های دانشجویی) با سطح معنی داری ∝، تعداد درجات آزادی n-1، که توسط جداول آماری خاص یا با استفاده از MS Excel (← "آماری" → STUDRASPOBR تعیین می شود.

∝ - سطح معنی داری، 0.01 = ∝ را می گیریم.

برنج. 2. مقادیر در بازه اطمینان 2.

مرحله 4. تجزیه و تحلیل روش های مختلف برای محاسبه فاصله اطمینان

دو روش محاسبه فاصله اطمینان - از طریق میانه و ضریب دانشجو - به مقادیر متفاوتی از فواصل منجر شد. بر این اساس، دو نمونه خالص متفاوت به دست آمد.

جدول 3. شاخص های آماری برای سه نمونه.

فهرست مطالب

نمونه اولیه

1 گزینه

گزینه 2

مقدار متوسط

پراکندگی

Coef. تغییرات

Coef. نوسانات

تعداد اشیاء بازنشسته، عدد.

بر اساس محاسبات انجام شده می توان گفت که مقادیر فواصل اطمینان به دست آمده با روش های مختلف با هم تلاقی می کنند، بنابراین با صلاحدید ارزیاب می توانید از هر یک از روش های محاسباتی استفاده کنید.

با این حال، ما معتقدیم که هنگام کار در سیستم estimatica.pro، توصیه می شود بسته به درجه توسعه بازار، روشی را برای محاسبه فاصله اطمینان انتخاب کنید:

  • اگر بازار توسعه نیافته است، روش محاسبه را از طریق میانه و انحراف استاندارد اعمال کنید، زیرا تعداد اشیاء بازنشسته در این مورد کم است.
  • اگر بازار توسعه یافته است، محاسبه را از طریق مقدار بحرانی آماره t (ضریب دانشجویی) اعمال کنید، زیرا امکان تشکیل یک نمونه اولیه بزرگ وجود دارد.

در تهیه مقاله از:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. روش های ریاضی برای ارزیابی ارزش دارایی. مسکو، 2014

2. داده ها از سیستم estimatica.pro

فواصل اطمینان برای فرکانس ها و قطعات

© 2008

موسسه ملی بهداشت عمومی، اسلو، نروژ

این مقاله محاسبه فواصل اطمینان برای فرکانس‌ها و نسبت‌ها را با استفاده از روش‌های Wald، Wilson، Klopper-Pearson، با استفاده از تبدیل زاویه‌ای و روش Wald با تصحیح Agresti-Cowll توصیف و بحث می‌کند. مطالب ارائه شده می دهد اطلاعات کلیدر مورد روش‌های محاسبه فواصل اطمینان برای فرکانس‌ها و نسبت‌ها و قصد برانگیختن علاقه خوانندگان مجله را نه تنها در استفاده از فواصل اطمینان هنگام ارائه نتایج تحقیقات خود، بلکه در مطالعه ادبیات تخصصی قبل از شروع کار بر روی انتشارات بعدی نیز برانگیخت.

کلید واژه ها : فاصله اطمینان، فرکانس، نسبت

در یکی از نشریات قبلی، شرح داده های کیفی به اختصار ذکر شد و گزارش شد که برآورد فاصله زمانی آنها برای توصیف فراوانی وقوع مشخصه مورد مطالعه در جمعیت عمومی، ارجحیت دارد. در واقع، از آنجایی که مطالعات با استفاده از داده‌های نمونه انجام می‌شوند، پیش‌بینی نتایج بر روی جمعیت عمومی باید دارای عنصری از عدم دقت در برآورد نمونه باشد. فاصله اطمینان اندازه گیری دقت پارامتر برآورد شده است. جالب است که در برخی از کتاب های مبانی آمار برای پزشکان، موضوع فواصل اطمینان برای فرکانس ها کاملا نادیده گرفته شده است. در این مقاله چندین روش برای محاسبه فواصل اطمینان برای فرکانس ها با فرض ویژگی های نمونه مانند عدم تکرار و بازنمایی و همچنین مستقل بودن مشاهدات از یکدیگر در نظر خواهیم گرفت. فراوانی در این مقاله به عنوان یک عدد مطلق که نشان می دهد چند بار این یا آن مقدار در مجموع رخ می دهد درک نمی شود، بلکه یک مقدار نسبی است که نسبت شرکت کنندگان در مطالعه را که دارای ویژگی مورد مطالعه هستند، تعیین می کند.

در تحقیقات زیست پزشکی، از فواصل اطمینان 95 درصد بیشتر استفاده می شود. این فاصله اطمینان منطقه ای است که نسبت واقعی در 95٪ مواقع در آن قرار می گیرد. به عبارت دیگر می توان با اطمینان 95 درصد گفت که مقدار واقعی فراوانی وقوع یک صفت در جمعیت عمومی در فاصله اطمینان 95 درصد خواهد بود.

اکثر کتاب های درسی آماری برای محققان پزشکی گزارش می دهند که خطای فرکانس با استفاده از فرمول محاسبه می شود

که در آن p فراوانی وقوع ویژگی در نمونه است (مقدار از 0 تا 1). در اکثر مقالات علمی داخلی، مقدار فراوانی وقوع یک ویژگی در نمونه (p) و همچنین خطای آن (s) به صورت p ± s نشان داده شده است. با این حال، ارائه یک فاصله اطمینان 95% برای فراوانی وقوع یک صفت در جمعیت عمومی، که شامل مقادیری از

قبل از.

در برخی از کتاب های درسی برای نمونه های کوچک توصیه می شود که مقدار 1.96 را با مقدار t برای N - 1 درجه آزادی جایگزین کنید که N تعداد مشاهدات نمونه است. مقدار t در جداول توزیع t یافت می شود که تقریباً در تمام کتاب های درسی آمار موجود است. استفاده از توزیع t برای روش Wald مزایای قابل مشاهده ای را نسبت به سایر روش های مورد بحث در زیر ارائه نمی دهد و بنابراین مورد استقبال برخی از نویسندگان قرار نمی گیرد.

روش فوق برای محاسبه فواصل اطمینان برای فرکانس ها یا کسری ها به نام آبراهام والد (آبراهام والد، 1902-1950) نامگذاری شده است، زیرا پس از انتشار والد و ولفوویتز در سال 1939 به طور گسترده مورد استفاده قرار گرفت. با این حال، خود این روش توسط پیر سیمون لاپلاس (1749-1827) در اوایل سال 1812 پیشنهاد شد.

روش Wald بسیار محبوب است، اما کاربرد آن با مشکلات قابل توجهی همراه است. این روش برای نمونه های کوچک و همچنین در مواردی که فراوانی وقوع یک ویژگی به 0 یا 1 (0% یا 100%) تمایل دارد و برای فرکانس های 0 و 1 به سادگی امکان پذیر نیست، توصیه نمی شود. تقریب توزیع نرمال، که هنگام محاسبه خطا استفاده می شود، در مواردی که n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

از آنجایی که متغیر جدید دارای توزیع نرمال است، حد پایین و بالای فاصله اطمینان 95% برای متغیر φ φ-1.96 و φ+1.96 چپ خواهد بود">

به جای 1.96 برای نمونه های کوچک، توصیه می شود مقدار t را جایگزین N - 1 درجه آزادی کنید. این روش مقادیر منفی نمی دهد و به شما امکان می دهد فواصل اطمینان را برای فرکانس ها با دقت بیشتری نسبت به روش Wald تخمین بزنید. علاوه بر این، در بسیاری از کتب مرجع داخلی در مورد آمار پزشکی توضیح داده شده است، که با این حال، منجر به استفاده گسترده از آن در تحقیقات پزشکی نشد. محاسبه فواصل اطمینان با استفاده از تبدیل زاویه برای فرکانس های نزدیک به 0 یا 1 توصیه نمی شود.

اینجاست که معمولاً شرح روش‌های تخمین فواصل اطمینان در اکثر کتاب‌های مبانی آمار برای محققان پزشکی به پایان می‌رسد و این مشکل نه تنها برای ادبیات داخلی، بلکه برای ادبیات خارجی نیز معمول است. هر دو روش بر اساس قضیه حد مرکزی هستند که شامل یک نمونه بزرگ است.

با توجه به کاستی های برآورد فواصل اطمینان با استفاده از روش های فوق، کلپر (کلاپر) و پیرسون (پیرسون) در سال 1934 روشی را برای محاسبه فاصله اطمینان دقیق با در نظر گرفتن توزیع دو جمله ای صفت مورد مطالعه پیشنهاد کردند. این روش در بسیاری از ماشین‌حساب‌های آنلاین موجود است، با این حال، فواصل اطمینان به‌دست‌آمده از این طریق در بیشتر موارد بسیار گسترده است. در عین حال، این روش برای استفاده در مواردی که نیاز به تخمین محافظه کارانه است، توصیه می شود. درجه محافظه کاری روش با کاهش حجم نمونه افزایش می یابد، به ویژه برای N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

به گفته بسیاری از آماردانان، بهینه ترین برآورد فواصل اطمینان برای فرکانس ها با روش ویلسون انجام می شود، که در سال 1927 ارائه شد، اما عملاً در تحقیقات زیست پزشکی داخلی استفاده نمی شود. این روش نه تنها تخمین فواصل اطمینان را برای فرکانس های بسیار کوچک و بسیار بالا ممکن می سازد، بلکه برای تعداد کمی از مشاهدات نیز قابل استفاده است. که در نمای کلیفاصله اطمینان طبق فرمول ویلسون به شکل از



در جایی که هنگام محاسبه فاصله اطمینان 95% مقدار 1.96 را می گیرد، N تعداد مشاهدات و p فراوانی ویژگی در نمونه است. این روش در ماشین حساب های آنلاین موجود است، بنابراین کاربرد آن مشکلی ندارد. و استفاده از این روش را برای n p توصیه نکنید< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

علاوه بر روش ویلسون، روش والد تصحیح شده با Agresti-Caull نیز تخمین بهینه فاصله اطمینان را برای فرکانس ها ارائه می دهد. تصحیح Agresti-Coulle جایگزینی در فرمول Wald برای فراوانی وقوع یک صفت در نمونه (p) توسط p` است، در هنگام محاسبه که 2 به صورت و 4 به مخرج اضافه می شود. ، p` = (X + 2) / (N + 4)، که در آن X تعداد شرکت کنندگان در مطالعه است که دارای ویژگی مورد مطالعه هستند و N حجم نمونه است. این اصلاح نتایج بسیار شبیه به نتایج فرمول ویلسون ایجاد می کند، به جز زمانی که نرخ رویداد به 0٪ یا 100٪ نزدیک می شود و نمونه کوچک است. علاوه بر روش های فوق برای محاسبه فواصل اطمینان برای فرکانس ها، اصلاحات پیوستگی برای هر دو روش والد و روش ویلسون برای نمونه های کوچک پیشنهاد شده است، اما مطالعات نشان داده است که استفاده از آنها نامناسب است.

کاربرد روش های فوق را برای محاسبه فواصل اطمینان با استفاده از دو مثال در نظر بگیرید. در مورد اول، ما یک نمونه بزرگ از 1000 شرکت‌کننده مطالعه به‌طور تصادفی انتخاب شده را مطالعه می‌کنیم که از این تعداد 450 نفر دارای ویژگی مورد مطالعه (خواه یک عامل خطر، یک پیامد یا هر صفت دیگری) هستند که فراوانی 0.45 یا 45 درصد در مورد دوم، مطالعه با استفاده از یک نمونه کوچک، مثلاً فقط 20 نفر انجام می شود و تنها 1 شرکت کننده در مطالعه (5٪) دارای ویژگی مورد مطالعه است. فواصل اطمینان برای روش Wald، برای روش Wald با تصحیح Agresti-Coll، برای روش Wilson با استفاده از یک ماشین حساب آنلاین توسعه یافته توسط جف سائورو (http://www./wald.htm) محاسبه شد. فواصل اطمینان ویلسون تصحیح شده با پیوستگی با استفاده از ماشین حساب ارائه شده توسط Wassar Stats: Website for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html) محاسبه شد. محاسبات با استفاده از تبدیل زاویه ای فیشر به صورت دستی با استفاده از مقدار بحرانی t برای 19 و 999 درجه آزادی انجام شد. نتایج محاسبات در جدول برای هر دو مثال ارائه شده است.

فواصل اطمینان به شش روش مختلف برای دو مثال شرح داده شده در متن محاسبه شده است

روش محاسبه فاصله اطمینان

P=0.0500 یا 5%

95% CI برای X=450، N=1000، P=0.4500، یا 45%

–0,0455–0,2541

والدا با تصحیح Agresti-Coll

<,0001–0,2541

ویلسون با تصحیح تداوم

"روش دقیق" کلوپر-پیرسون

تبدیل زاویه ای

<0,0001–0,1967

همانطور که از جدول مشاهده می شود، برای مثال اول، فاصله اطمینان محاسبه شده با روش Wald "به طور کلی پذیرفته شده" به ناحیه منفی می رود، که نمی تواند برای فرکانس ها صادق باشد. متأسفانه، چنین حوادثی در ادبیات روسی غیر معمول نیست. روش سنتی نمایش داده ها به عنوان یک فرکانس و خطای آن تا حدی این مشکل را پنهان می کند. به عنوان مثال، اگر فراوانی وقوع یک صفت (بر حسب درصد) به صورت 1.4 ± 2.1 ارائه شود، آنگاه به اندازه 2.1٪ "تحریک کننده" نیست (95٪ CI: 0.7-؛ 4.9)، اگرچه و به همین معنی است. روش والد با تصحیح Agresti-Coulle و محاسبه با استفاده از تبدیل زاویه ای کران پایینی را به سمت صفر می دهد. روش ویلسون با تصحیح پیوستگی و "روش دقیق" فواصل اطمینان بیشتری نسبت به روش ویلسون می دهد. برای مثال دوم، همه روش ها تقریباً فواصل اطمینان یکسانی را ارائه می دهند (تفاوت ها فقط در هزارم ظاهر می شوند) که جای تعجب نیست، زیرا فراوانی رویداد در این مثال تفاوت زیادی با 50٪ ندارد و حجم نمونه بسیار بزرگ است. .

برای خوانندگان علاقه مند به این مشکل، می توانیم آثار R. G. Newcombe و Brown، Cai و Dasgupta را توصیه کنیم که به ترتیب مزایا و معایب استفاده از 7 و 10 روش مختلف را برای محاسبه فواصل اطمینان ارائه می دهند. از کتاب های راهنمای داخلی، کتاب و توصیه می شود که در آن علاوه بر شرح مفصل نظریه، روش های والد، ویلسون و همچنین روشی برای محاسبه فواصل اطمینان با در نظر گرفتن توزیع فرکانس دو جمله ای ارائه شده است. . علاوه بر ماشین حساب های آنلاین رایگان (http://www./wald.htm و http://faculty.vassar.edu/lowry/prop1.html)، فواصل اطمینان برای فرکانس ها (و نه تنها!) را می توان با استفاده از برنامه سیا (تحلیل فواصل اطمینان) که می توانید از http://www دانلود کنید. مدرسه پزشکی سوتون ac uk/cia/.

مقاله بعدی به روش های تک متغیره برای مقایسه داده های کیفی می پردازد.

کتابشناسی - فهرست کتب

آمار پزشکی به زبان ساده: یک دوره مقدماتی / A. Banerzhi. - م.: طب عملی، 2007. - 287 ص. آمار پزشکی / . - م. : آژانس اطلاعات پزشکی، 2007. - 475 ص. آمار پزشکی و بیولوژیکی / S. Glants. - م.: تمرین، 1998. انواع داده ها، تأیید توزیع و آمار توصیفی / // اکولوژی انسانی - 2008. - شماره 1. - ص 52-58. با. آمار پزشکی: کتاب درسی / . - Rostov n / D: Phoenix, 2007. - 160 p. آمار پزشکی کاربردی / , . - سنت پترزبورگ. : فولیو، 2003. - 428 ص. اف. بیومتریک / . - م. : دبیرستان، 1990. - 350 ص. آ. آمار ریاضی در پزشکی / , . - م.: امور مالی و آمار، 2007. - 798 ص. آمار ریاضی در تحقیقات بالینی / , . - M. : GEOTAR-MED، 2001. - 256 p. یونکروف وی. و. پردازش آماری پزشکی داده های تحقیقات پزشکی /،. - سنت پترزبورگ. : VmedA, 2002. - 266 p. آگرستی ا.تقریبی برای تخمین بازه‌ای نسبت‌های دوجمله‌ای بهتر از دقیق است / A. Agresti, B. Coull // آماردان آمریکایی. - 1998. - N 52. - S. 119-126. آلتمن دی.آمار با اطمینان // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 p. قهوه ای L.D.تخمین فاصله برای نسبت دو جمله ای / L. D. Brown, T. T. Cai, A. Dasgupta // علم آماری. - 2001. - N 2. - ص 101-133. کلاپر سی.جی.استفاده از محدودیت های اطمینان یا اعتباری نشان داده شده در مورد دو جمله ای / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - ص 404-413. گارسیا پرز ام. ای. در مورد فاصله اطمینان برای پارامتر دو جمله ای / M. A. Garcia-Perez // کیفیت و کمیت. - 2005. - N 39. - ص 467-481. موتولسکی اچ.آمار زیستی شهودی // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. نیوکمب آر.جی.فواصل اطمینان دو طرفه برای نسبت واحد: مقایسه هفت روش / R. G. Newcombe // آمار در پزشکی. - 1998. - N. 17. - P. 857–872. سائورو جی.برآورد نرخ تکمیل از نمونه‌های کوچک با استفاده از فواصل اطمینان دوجمله‌ای: مقایسه‌ها و توصیه‌ها / J. Sauro, J. R. Lewis // مجموعه مقالات انجمن عوامل انسانی و ارگونومی. - اورلاندو، فلوریدا، 2005. والد آ.محدودیت های اطمینان برای توابع توزیع پیوسته // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - P. 105–118. ویلسون ای بی. استنتاج احتمالی، قانون جانشینی و استنتاج آماری / E. B. Wilson // مجله انجمن آماری آمریکا. - 1927. - N 22. - ص 209-212.

فواصل اطمینان برای نسبت ها

آ. M. Gribovski

موسسه ملی بهداشت عمومی، اسلو، نروژ

در این مقاله چندین روش برای محاسبه فواصل اطمینان برای نسبت‌های دوجمله‌ای ارائه می‌شود، یعنی روش‌های Wald، Wilson، arcsine، Agresti-Coull و Clopper-Pearson دقیق. این مقاله تنها مقدمه ای کلی برای مسئله تخمین فاصله اطمینان یک نسبت دو جمله ای ارائه می دهد و هدف آن نه تنها تحریک خوانندگان به استفاده از فواصل اطمینان در هنگام ارائه نتایج فواصل تحقیقات تجربی خود است، بلکه تشویق آنها به مراجعه به کتاب های آمار قبل است. برای تجزیه و تحلیل داده های خود و تهیه نسخه های خطی.

کلید واژه ها: فاصله اطمینان، نسبت

اطلاعات تماس:

مشاور ارشد موسسه ملی بهداشت عمومی، اسلو، نروژ

در قسمت‌های فرعی قبل، سؤال تخمین پارامتر مجهول را در نظر گرفتیم آیک عدد. چنین ارزیابی "نقطه" نامیده می شود. در تعدادی از کارها، نه تنها برای یافتن پارامتر لازم است آمقدار عددی مناسب، بلکه دقت و قابلیت اطمینان آن را نیز ارزیابی کنید. لازم است بدانیم که تعویض پارامتر می تواند منجر به چه خطاهایی شود آتخمین نقطه ای آن آو با چه درجه ای از اطمینان می توانیم انتظار داشته باشیم که این خطاها از محدوده های شناخته شده فراتر نروند؟

مشکلاتی از این دست به ویژه برای تعداد کمی از مشاهدات، زمانی که تخمین نقطه ای انجام می شود، مرتبط هستند و درتا حد زیادی تصادفی است و جایگزینی تقریبی a با a می تواند منجر به خطاهای جدی شود.

برای ارائه ایده ای از دقت و قابلیت اطمینان تخمین آ,

در آمار ریاضی به اصطلاح از فواصل اطمینان و احتمالات اطمینان استفاده می شود.

اجازه دهید برای پارامتر آبرگرفته از تخمین بی طرفانه تجربه آ.می خواهیم خطای احتمالی را در این مورد تخمین بزنیم. اجازه دهید مقداری احتمال p به اندازه کافی بزرگ (مثلاً p = 0.9، 0.95 یا 0.99) را به گونه ای اختصاص دهیم که یک رویداد با احتمال p را عملاً قطعی در نظر بگیریم، و مقدار s را برای آن پیدا کنیم.

سپس محدوده مقادیر عملا ممکن خطا که هنگام جایگزینی رخ می دهد آبر آ، ± s خواهد بود. خطاهای مطلق بزرگ فقط با احتمال کوچک a = 1 - p ظاهر می شوند. بیایید (14.3.1) را به صورت زیر بازنویسی کنیم:

تساوی (14.3.2) به این معنی است که با احتمال p مقدار مجهول پارامتر است آدر فاصله زمانی قرار می گیرد

در این مورد باید به یک مورد توجه کرد. پیش از این، ما به طور مکرر احتمال سقوط یک متغیر تصادفی در یک بازه غیر تصادفی معین را در نظر می گرفتیم. در اینجا وضعیت متفاوت است: آتصادفی نیست، اما فاصله تصادفی / r. به طور تصادفی موقعیت آن بر روی محور x، با مرکز آن تعیین می شود آ; به طور کلی، طول بازه 2s نیز تصادفی است، زیرا مقدار s، به عنوان یک قاعده، از داده های تجربی محاسبه می شود. بنابراین، در این مورد، بهتر است مقدار p را به عنوان احتمال "ضربه" به نقطه تفسیر کنیم. آبه بازه / p، اما به عنوان احتمال اینکه یک بازه تصادفی / p نقطه را پوشش دهد آ(شکل 14.3.1).

برنج. 14.3.1

احتمال p نامیده می شود سطح اطمینان، و فاصله / p - فاصله اطمینان.مرزهای فاصله اگر a x \u003d a-شن a 2 = a +و نامیده می شوند مرزهای اعتماد

بیایید یک تفسیر دیگر برای مفهوم فاصله اطمینان ارائه دهیم: می توان آن را به عنوان فاصله ای از مقادیر پارامتر در نظر گرفت. آ،با داده های تجربی سازگار است و با آنها مغایرت ندارد. در واقع، اگر توافق کنیم که رویدادی با احتمال a = 1-p عملاً غیرممکن در نظر بگیریم، آنگاه مقادیر پارامتر a برای الف - الف> s باید به عنوان متناقض با داده های تجربی شناخته شوند، و آنهایی که برای آنها |a - آ a t na 2 .

اجازه دهید برای پارامتر آیک تخمین بی طرفانه وجود دارد آ.اگر قانون توزیع کمیت را می دانستیم آ، مشکل یافتن فاصله اطمینان بسیار ساده است: برای یافتن مقدار s کافی است که

مشکل در این واقعیت نهفته است که قانون توزیع برآورد آبه قانون توزیع کمیت بستگی دارد ایکسو در نتیجه، روی پارامترهای ناشناخته آن (به ویژه در خود پارامتر آ).

برای دور زدن این مشکل، می‌توان از ترفند تقریبی زیر استفاده کرد: پارامترهای مجهول در عبارت s را با تخمین نقطه‌ای آن‌ها جایگزین کنید. با تعداد نسبتاً زیادی آزمایش پ(حدود 20 ... 30) این تکنیک معمولاً از نظر دقت نتایج رضایت بخشی می دهد.

به عنوان مثال، مسئله فاصله اطمینان برای انتظارات ریاضی را در نظر بگیرید.

بگذارید تولید شود پ ایکس،که ویژگی های آن انتظار ریاضی است تیو واریانس D- ناشناخته. برای این پارامترها، برآوردهای زیر به دست آمد:

برای انتظارات ریاضی باید یک فاصله اطمینان / р مطابق با احتمال اطمینان р ایجاد کرد. تیمقادیر ایکس.

در حل این مشکل از این واقعیت استفاده می کنیم که کمیت تیجمع است پمتغیرهای تصادفی مستقل با توزیع یکسان X ساعتو با توجه به قضیه حد مرکزی برای اندازه کافی بزرگ پقانون توزیع آن نزدیک به نرمال است. در عمل، حتی با تعداد نسبتاً کمی از عبارت ها (از مرتبه 10 ... 20)، قانون توزیع مجموع را می توان تقریباً عادی در نظر گرفت. ما این مقدار را فرض خواهیم کرد تیطبق قانون عادی توزیع می شود. ویژگی های این قانون - انتظار ریاضی و واریانس - به ترتیب برابر است تیو

(به فصل 13 زیربخش 13.3 مراجعه کنید). بیایید فرض کنیم که ارزش Dما می دانیم و یک مقدار Ep برای آن پیدا می کنیم

با استفاده از فرمول (6.3.5) از فصل 6، احتمال سمت چپ (14.3.5) را بر حسب تابع توزیع نرمال بیان می کنیم.

انحراف استاندارد برآورد کجاست تی.

از معادله

مقدار S را پیدا کنید:

که در آن arg Ф* (x) تابع معکوس Ф* است (ایکس)،آن ها چنین مقداری از آرگومان که تابع توزیع نرمال برابر است با ایکس.

پراکندگی د،که از طریق آن مقدار بیان می شود آ 1P، ما دقیقا نمی دانیم. به عنوان مقدار تقریبی آن، می توانید از تخمین استفاده کنید D(14.3.4) و تقریباً قرار دهید:

بنابراین، مشکل ایجاد فاصله اطمینان تقریباً حل می شود که برابر است با:

که در آن gp با فرمول (14.3.7) تعریف می شود.

به منظور جلوگیری از درون یابی معکوس در جداول تابع Ф * (l) هنگام محاسبه s p، جمع آوری یک جدول خاص (جدول 14.3.1) راحت است که مقادیر کمیت را فهرست می کند.

بسته به r. مقدار (p برای قانون عادی تعداد انحرافات استاندارد را تعیین می کند که باید در سمت راست و چپ مرکز پراکندگی کنار گذاشته شود تا احتمال سقوط در ناحیه حاصل برابر با p باشد.

از طریق مقدار 7 p، فاصله اطمینان به صورت زیر بیان می شود:

جدول 14.3.1

مثال 1. 20 آزمایش بر روی مقدار انجام شد ایکس؛نتایج در جدول نشان داده شده است. 14.3.2.

جدول 14.3.2

لازم است تخمینی از انتظار ریاضی کمیت پیدا شود ایکسو یک فاصله اطمینان مربوط به سطح اطمینان p = 0.8 ایجاد کنید.

راه حل.ما داریم:

با انتخاب مبدا n: = 10، طبق فرمول سوم (14.2.14) برآورد بی طرفانه را پیدا می کنیم D :

طبق جدول 14.3.1 پیدا می کنیم

محدودیت های اعتماد:

فاصله اطمینان:

مقادیر پارامتر تی،نهفته در این فاصله با داده های تجربی ارائه شده در جدول سازگار است. 14.3.2.

به روشی مشابه، می توان یک فاصله اطمینان برای واریانس ایجاد کرد.

بگذارید تولید شود پآزمایشات مستقل روی یک متغیر تصادفی ایکسبا پارامترهای ناشناخته از و A و برای واریانس Dبرآورد بی طرفانه به دست می آید:

لازم است تقریباً یک فاصله اطمینان برای واریانس ایجاد شود.

از فرمول (14.3.11) می توان دریافت که مقدار Dنشان می دهد

میزان پمتغیرهای تصادفی فرم . این مقادیر نیستند

مستقل است، زیرا هر یک از آنها مقدار را شامل می شود تی،وابسته به بقیه با این حال، می توان نشان داد که به عنوان پقانون توزیع مجموع آنها نیز نزدیک به نرمال است. تقریبا در پ= 20...30 در حال حاضر می توان آن را عادی در نظر گرفت.

بیایید فرض کنیم که اینطور است و ویژگی های این قانون را پیدا کنیم: انتظار و واریانس ریاضی. از آنجایی که نمره D- پس بی طرفانه M[D] = D.

محاسبه واریانس DDبا محاسبات نسبتاً پیچیده همراه است، بنابراین ما بیان آن را بدون مشتق ارائه می دهیم:

جایی که c 4 - چهارمین لحظه مرکزی کمیت است ایکس.

برای استفاده از این عبارت، باید مقادیر 4 و را در آن جایگزین کنید. D(حداقل تقریبی). بجای Dمی توانید از ارزیابی استفاده کنید D.در اصل، چهارمین لحظه مرکزی را می توان با تخمین آن، به عنوان مثال، با مقدار شکل جایگزین کرد:

اما چنین جایگزینی دقت بسیار پایینی را به همراه خواهد داشت، زیرا به طور کلی، با تعداد محدودی آزمایش، ممان های مرتبه بالا با خطاهای بزرگ تعیین می شوند. با این حال، در عمل اغلب اتفاق می افتد که شکل قانون توزیع کمیت ایکساز قبل شناخته شده: فقط پارامترهای آن ناشناخته هستند. سپس می توانیم سعی کنیم u4 را بر حسب بیان کنیم D.

اجازه دهید رایج ترین مورد را، زمانی که مقدار، در نظر بگیریم ایکسطبق قانون عادی توزیع می شود. سپس چهارمین لحظه مرکزی آن بر حسب واریانس بیان می شود (به فصل 6 زیربخش 6.2 مراجعه کنید).

و فرمول (14.3.12) می دهد یا

جایگزینی در (14.3.14) مجهول Dارزیابی او D، می گیریم: از کجا

لحظه u 4 را می توان بر حسب بیان کرد Dهمچنین در برخی موارد دیگر، هنگام توزیع مقدار ایکسطبیعی نیست، اما ظاهر آن مشخص است. برای مثال، برای قانون چگالی یکنواخت (به فصل 5 مراجعه کنید) داریم:

که در آن (a, P) فاصله ای است که قانون در آن ارائه می شود.

از این رو،

طبق فرمول (14.3.12) به دست می آید: از جایی که تقریباً پیدا می کنیم

در مواردی که شکل قانون توزیع مقدار 26 ناشناخته است، هنگام تخمین مقدار a /، همچنان توصیه می شود از فرمول (14.3.16) استفاده شود، اگر دلیل خاصی برای این باور وجود نداشته باشد که این امر وجود ندارد. قانون بسیار متفاوت از قانون عادی است (دارای کشش مثبت یا منفی قابل توجهی است).

اگر مقدار تقریبی a /) به روشی به دست آید، می توان یک فاصله اطمینان برای واریانس به همان روشی که آن را برای انتظارات ریاضی ساختیم ایجاد کرد:

جایی که مقدار بسته به احتمال داده شده p در جدول یافت می شود. 14.3.1.

مثال 2. یک فاصله اطمینان تقریباً 80% برای واریانس یک متغیر تصادفی پیدا کنید. ایکستحت شرایط مثال 1، اگر معلوم باشد که مقدار ایکسطبق قانون نزدیک به نرمال توزیع می شود.

راه حل.مقدار مانند جدول باقی می ماند. 14.3.1:

طبق فرمول (14.3.16)

با توجه به فرمول (14.3.18) فاصله اطمینان را پیدا می کنیم:

محدوده مربوط به مقادیر انحراف استاندارد: (0.21؛ 0.29).

14.4. روش های دقیق برای ساخت فواصل اطمینان برای پارامترهای یک متغیر تصادفی توزیع شده بر اساس قانون عادی

در بخش فرعی قبل، روش‌های تقریباً تقریبی را برای ایجاد فاصله اطمینان برای میانگین و واریانس در نظر گرفتیم. در اینجا ما ایده ای از روش های دقیق برای حل همان مشکل ارائه می دهیم. تاکید می کنیم که برای یافتن دقیق فواصل اطمینان، لازم است از قبل شکل قانون توزیع کمیت را بدانیم. ایکس،در حالی که این برای استفاده از روش های تقریبی ضروری نیست.

ایده روش های دقیق برای ساخت فواصل اطمینان به شرح زیر است. هر فاصله اطمینان از شرط بیان کننده احتمال تحقق برخی از نابرابری ها که شامل برآورد علاقه ما می شود به دست می آید. آ.قانون توزیع نمره آدر حالت کلی به پارامترهای ناشناخته کمیت بستگی دارد ایکس.با این حال، گاهی اوقات می توان نابرابری ها را از یک متغیر تصادفی عبور داد آبه تابع دیگری از مقادیر مشاهده شده X p X 2, ..., X p.قانون توزیع آن به پارامترهای ناشناخته بستگی ندارد، بلکه فقط به تعداد آزمایش ها و شکل قانون توزیع کمیت بستگی دارد. ایکس.متغیرهای تصادفی از این نوع نقش زیادی در آمار ریاضی دارند. آنها با بیشترین جزئیات برای مورد توزیع نرمال کمیت مورد مطالعه قرار گرفته اند ایکس.

به عنوان مثال، ثابت شده است که تحت یک توزیع نرمال کمیت ایکسمقدار تصادفی

موضوع به اصطلاح قانون توزیع دانش آموزانبا پ- 1 درجه آزادی؛ چگالی این قانون شکل دارد

که در آن G(x) تابع گامای شناخته شده است:

همچنین ثابت شده است که متغیر تصادفی

دارای "توزیع % 2" با پ- 1 درجه آزادی (به فصل 7 مراجعه کنید) که چگالی آن با فرمول بیان می شود

بدون پرداختن به مشتقات توزیع ها (14.4.2) و (14.4.4)، نشان خواهیم داد که چگونه می توان آنها را هنگام ساخت فواصل اطمینان برای پارامترها اعمال کرد. تای دی.

بگذارید تولید شود پآزمایشات مستقل روی یک متغیر تصادفی ایکس،بر اساس قانون عادی با پارامترهای ناشناخته توزیع شده است TIOبرای این پارامترها، برآورد

لازم است فواصل اطمینان برای هر دو پارامتر مربوط به احتمال اطمینان p ساخته شود.

اجازه دهید ابتدا یک فاصله اطمینان برای انتظارات ریاضی بسازیم. طبیعی است که این بازه را با توجه به متقارن بگیریم تی; با s p نصف طول بازه را نشان دهید. مقدار sp باید طوری انتخاب شود که شرط

بیایید سعی کنیم در سمت چپ برابری (14.4.5) از یک متغیر تصادفی عبور کنیم. تیبه یک متغیر تصادفی تی،طبق قانون دانشجویی توزیع می شود. برای انجام این کار، هر دو قسمت نابرابری |m-w?| را ضرب می کنیم

به ارزش مثبت: یا با استفاده از نماد (14.4.1)،

اجازه دهید یک عدد / p پیدا کنیم به طوری که مقدار / p را بتوان از شرط پیدا کرد

از فرمول (14.4.2) می توان دریافت که (1) یک تابع زوج است، بنابراین (14.4.8) نشان می دهد

برابری (14.4.9) مقدار / p را بسته به p تعیین می کند. اگر جدولی از مقادیر انتگرال در اختیار دارید

سپس مقدار / p را می توان با درون یابی معکوس در جدول پیدا کرد. با این حال ، تهیه جدول مقادیر / p از قبل راحت تر است. چنین جدولی در پیوست (جدول 5) آورده شده است. این جدول مقادیر بسته به احتمال اطمینان p و تعداد درجات آزادی را نشان می دهد پ- 1. با تعیین / p مطابق جدول. 5 و با فرض

نصف عرض فاصله اطمینان / p و خود بازه را پیدا می کنیم

مثال 1. 5 آزمایش مستقل بر روی یک متغیر تصادفی انجام شد ایکس،معمولاً با پارامترهای ناشناخته توزیع می شود تیو در مورد. نتایج آزمایشات در جدول آورده شده است. 14.4.1.

جدول 14.4.1

تخمینی پیدا کنید تیبرای انتظارات ریاضی و ایجاد فاصله اطمینان 90٪ / p برای آن (یعنی فاصله مربوط به احتمال اطمینان p \u003d 0.9).

راه حل.ما داریم:

مطابق جدول 5 درخواست برای پ - 1 = 4 و p = 0.9 پیدا می کنیم جایی که

فاصله اطمینان خواهد بود

مثال 2. برای شرایط مثال 1 از بخش 14.3، با فرض مقدار ایکسبه طور معمول توزیع شده است، فاصله اطمینان دقیق را پیدا کنید.

راه حل.با توجه به جدول 5 برنامه، ما در پ - 1 = 19ir =

0.8 / p = 1.328; از اینجا

در مقایسه با راه حل مثال 1 از بخش 14.3 (e p \u003d 0.072)، می بینیم که اختلاف بسیار کوچک است. اگر دقت را تا رقم دوم اعشار حفظ کنیم، فواصل اطمینان یافت شده توسط روش های دقیق و تقریبی یکسان است:

بیایید به ساخت یک فاصله اطمینان برای واریانس برویم. برآورد واریانس بی طرفانه را در نظر بگیرید

و متغیر تصادفی را بیان کنید Dاز طریق ارزش V(14.4.3) دارای توزیع x 2 (14.4.4):

دانستن قانون توزیع کمیت می توان بازه / (1) را که در آن قرار می گیرد با یک احتمال معین p پیدا کرد.

قانون توزیع k n _ x (v)مقدار I 7 به شکلی است که در شکل نشان داده شده است. 14.4.1.

برنج. 14.4.1

این سوال مطرح می شود: چگونه فاصله / p را انتخاب کنیم؟ اگر قانون توزیع کمیت Vمتقارن بود (مثل یک قانون نرمال یا توزیع دانش آموز)، طبیعی است که فاصله /p متقارن را با توجه به انتظارات ریاضی در نظر بگیریم. در این مورد، قانون k n _ x (v)نامتقارن اجازه دهید توافق کنیم که بازه /p را انتخاب کنیم تا احتمال خروجی کمیت وجود داشته باشد Vخارج از فاصله سمت راست و چپ (مناطق سایه دار در شکل 14.4.1) یکسان و مساوی بودند.

برای ساختن فاصله / p با این ویژگی، از Table استفاده می کنیم. 4 برنامه: شامل اعداد است y)به طوری که

برای مقدار دارای x 2 - توزیع با r درجه آزادی. در مورد ما r = n- 1. رفع کنید r = n- 1 و در خط مربوطه جدول پیدا کنید. 4 دو مقدار x 2 -یکی مربوط به احتمال دیگری - احتمالات اجازه دهید اینها را تعیین کنیم

ارزش های در 2و xlفاصله دارد y 2 ,با سمت چپش و y ~انتهای راست

اکنون فاصله اطمینان مورد نیاز /| را برای واریانس با مرزهای D و و پیدا می کنیم D2،که نقطه را پوشش می دهد Dبا احتمال p:

اجازه دهید چنین بازه ای بسازیم / (، = (?> b A)، که نقطه را پوشش می دهد Dاگر و فقط اگر ارزش Vدر بازه / r قرار می گیرد. اجازه دهید آن فاصله را نشان دهیم

این شرط را برآورده می کند. در واقع، نابرابری ها معادل نابرابری ها هستند

و این نابرابری ها با احتمال p وجود دارد. بنابراین، فاصله اطمینان برای پراکندگی پیدا شده و با فرمول (14.4.13) بیان می شود.

مثال 3. فاصله اطمینان برای واریانس را تحت شرایط مثال 2 از بخش فرعی 14.3 بیابید، اگر معلوم باشد که مقدار ایکسبه صورت عادی توزیع می شود.

راه حل.ما داریم . مطابق جدول 4 برنامه

پیدا می کنیم در r = n - 1 = 19

با توجه به فرمول (14.4.13) فاصله اطمینان برای پراکندگی را پیدا می کنیم

فاصله متناظر برای انحراف معیار: (0.21؛ 0.32). این فاصله فقط اندکی از بازه (0.21؛ 0.29) به دست آمده در مثال 2 از بخش 14.3 با روش تقریبی بیشتر است.

  • شکل 14.3.1 یک فاصله اطمینان را در نظر می گیرد که در حدود a متقارن است. به طور کلی، همانطور که بعدا خواهیم دید، این کار ضروری نیست.

فاصله اطمینان برای انتظارات ریاضی - این چنین فاصله ای است که از داده ها محاسبه می شود که با احتمال مشخصی انتظارات ریاضی جمعیت عمومی را در بر می گیرد. برآورد طبیعی برای انتظار ریاضی، میانگین حسابی مقادیر مشاهده شده آن است. بنابراین، بیشتر در طول درس از اصطلاحات "متوسط"، "مقدار متوسط" استفاده خواهیم کرد. در مسائل محاسبه فاصله اطمینان، پاسخ اغلب مورد نیاز این است که "فاصله اطمینان عدد متوسط ​​[مقدار در یک مسئله خاص] از [مقدار پایین] به [مقدار بالاتر] است". با کمک فاصله اطمینان، می توان نه تنها مقادیر متوسط، بلکه سهم یک یا ویژگی دیگر از جمعیت عمومی را نیز ارزیابی کرد. مقادیر میانگین، واریانس، انحراف معیار و خطا که از طریق آنها به تعاریف و فرمول های جدید خواهیم رسید، در درس مورد تجزیه و تحلیل قرار می گیرند. نمونه و مشخصات جمعیت .

تخمین نقطه ای و بازه ای میانگین

اگر مقدار میانگین جمعیت عمومی با یک عدد (نقطه) تخمین زده شود، آنگاه یک میانگین خاص محاسبه شده از نمونه مشاهدات به عنوان تخمین میانگین مجهول جمعیت عمومی در نظر گرفته می شود. در این حالت، مقدار میانگین نمونه - یک متغیر تصادفی - با مقدار میانگین جامعه عمومی منطبق نیست. بنابراین هنگام نشان دادن مقدار میانگین نمونه، باید خطای نمونه را نیز به طور همزمان نشان داد. خطای استاندارد به عنوان معیار خطای نمونه گیری استفاده می شود که در واحدهای مشابه میانگین بیان می شود. بنابراین اغلب از نماد زیر استفاده می شود: .

اگر برآورد میانگین لازم است با احتمال خاصی مرتبط باشد، پارامتر جمعیت عمومی مورد علاقه باید نه با یک عدد، بلکه با یک بازه تخمین زده شود. فاصله اطمینان فاصله ای است که در آن با احتمال معینی پمقدار شاخص تخمینی جمعیت عمومی پیدا می شود. فاصله اطمینان که در آن با احتمال پ = 1 - α یک متغیر تصادفی است که به صورت زیر محاسبه می شود:

,

α = 1 - پ، که در پیوست تقریباً هر کتابی در مورد آمار یافت می شود.

در عمل، میانگین و واریانس جامعه مشخص نیست، بنابراین واریانس جامعه با واریانس نمونه جایگزین می‌شود و میانگین جامعه با میانگین نمونه جایگزین می‌شود. بنابراین، فاصله اطمینان در بیشتر موارد به صورت زیر محاسبه می شود:

.

از فرمول فاصله اطمینان می توان برای تخمین میانگین جمعیت استفاده کرد

  • انحراف معیار جمعیت عمومی شناخته شده است.
  • یا انحراف معیار جامعه مشخص نیست، اما حجم نمونه بیشتر از 30 است.

میانگین نمونه یک برآورد بی طرفانه از میانگین جامعه است. به نوبه خود، واریانس نمونه یک برآورد بی طرفانه از واریانس جمعیت نیست. برای به دست آوردن یک تخمین بی طرفانه از واریانس جامعه در فرمول واریانس نمونه، حجم نمونه است nباید جایگزین شود n-1.

مثال 1اطلاعات از 100 کافه به طور تصادفی انتخاب شده در یک شهر خاص جمع آوری می شود که میانگین تعداد کارمندان در آنها 10.5 با انحراف معیار 4.6 است. فاصله اطمینان 95 درصد از تعداد کارکنان کافه را تعیین کنید.

مقدار بحرانی توزیع نرمال استاندارد برای سطح معناداری کجاست α = 0,05 .

بنابراین، فاصله اطمینان 95 درصد برای میانگین تعداد کارکنان کافه بین 9.6 تا 11.4 بود.

مثال 2برای یک نمونه تصادفی از یک جمعیت عمومی 64 مشاهده ای، مقادیر کل زیر محاسبه شد:

مجموع مقادیر در مشاهدات،

مجموع مجذور انحراف مقادیر از میانگین .

فاصله اطمینان 95% را برای مقدار مورد انتظار محاسبه کنید.

محاسبه انحراف معیار:

,

محاسبه مقدار متوسط:

.

مقادیر موجود در عبارت را با فاصله اطمینان جایگزین کنید:

مقدار بحرانی توزیع نرمال استاندارد برای سطح معناداری کجاست α = 0,05 .

ما گرفتیم:

بنابراین، فاصله اطمینان 95% برای انتظارات ریاضی این نمونه از 7.484 تا 11.266 متغیر بود.

مثال 3برای یک نمونه تصادفی از یک جمعیت عمومی 100 مشاهداتی، مقدار میانگین 2/15 و انحراف معیار 2/3 محاسبه شد. فاصله اطمینان 95% را برای مقدار مورد انتظار و سپس فاصله اطمینان 99% را محاسبه کنید. اگر توان نمونه و تغییرات آن ثابت بماند، اما ضریب اطمینان افزایش یابد، آیا فاصله اطمینان باریک می شود یا افزایش می یابد؟

ما این مقادیر را با عبارت فاصله اطمینان جایگزین می کنیم:

مقدار بحرانی توزیع نرمال استاندارد برای سطح معناداری کجاست α = 0,05 .

ما گرفتیم:

.

بنابراین، فاصله اطمینان 95 درصد برای میانگین این نمونه از 14.57 تا 15.82 بود.

مجدداً، ما این مقادیر را در عبارت فاصله اطمینان جایگزین می کنیم:

مقدار بحرانی توزیع نرمال استاندارد برای سطح معناداری کجاست α = 0,01 .

ما گرفتیم:

.

بنابراین، فاصله اطمینان 99 درصد برای میانگین این نمونه از 14.37 تا 16.02 بود.

همانطور که می بینید، با افزایش ضریب اطمینان، مقدار بحرانی توزیع نرمال استاندارد نیز افزایش می یابد، و بنابراین، نقاط شروع و پایان بازه دورتر از میانگین قرار می گیرند، و بنابراین فاصله اطمینان برای انتظارات ریاضی قرار می گیرند. افزایش.

تخمین نقطه ای و فاصله ای وزن مخصوص

سهم برخی از ویژگی های نمونه را می توان به عنوان یک تخمین نقطه ای تفسیر کرد وزن مخصوص پهمین صفت در جمعیت عمومی اگر این مقدار باید با یک احتمال مرتبط شود، فاصله اطمینان وزن مخصوص باید محاسبه شود. پویژگی در جمعیت عمومی با احتمال پ = 1 - α :

.

مثال 4در فلان شهر دو نامزد وجود دارد آو بنامزد شهرداری از 200 نفر از ساکنان شهر به صورت تصادفی نظرسنجی شد که از این تعداد 46 درصد پاسخ دادند که به نامزد رای می دهند. آ، 26٪ - برای نامزد بو 28 درصد نمی دانند به چه کسی رای خواهند داد. فاصله اطمینان 95٪ را برای نسبت ساکنان شهر که از نامزد حمایت می کنند، تعیین کنید آ.

بگذارید داشته باشیم تعداد زیادی ازاقلام با توزیع نرمال برخی از ویژگی ها (به عنوان مثال، یک انبار کامل از همان نوع سبزیجات، که اندازه و وزن آن متفاوت است). شما می خواهید مشخصات متوسط ​​کل دسته کالاها را بدانید، اما نه زمان و نه تمایلی برای اندازه گیری و وزن کردن هر سبزی دارید. می فهمی که این لازم نیست. اما چند قطعه باید برای بازرسی تصادفی بردارید؟ قبل از ارائه برخی از فرمول های مفید برای این وضعیت، برخی از نمادها را یادآوری می کنیم. ابتدا، اگر کل انبار سبزیجات را اندازه گیری کنیم (به این مجموعه عناصر، جمعیت عمومی می گویند)، آنگاه با تمام دقتی که در دسترس ماست، میانگین وزن کل دسته را دریابیم. بیایید این را میانگین بنامیم ژن متوسط ​​X. - میانگین عمومی ما قبلاً می دانیم که اگر مقدار میانگین و انحراف آن مشخص باشد چه چیزی کاملاً تعیین می شود. درست است، تا کنون ما نه ژن متوسط ​​X یا s از جمعیت عمومی را نمی دانیم. ما فقط می توانیم مقداری نمونه برداریم، مقادیر مورد نیاز خود را اندازه گیری کنیم و برای این نمونه هم میانگین مقدار X و هم انحراف استاندارد S vyb را محاسبه کنیم. مشخص است که اگر بررسی نمونه ما حاوی تعداد زیادی عنصر باشد (معمولاً n بیش از 30) و آنها واقعاً تصادفی گرفته شوند، s جامعه تقریباً با نمونه S تفاوتی نخواهد داشت. علاوه بر این، برای مورد یک توزیع نرمال، می توانیم از فرمول های زیر استفاده کنیم:

با احتمال 95%

با احتمال 99%

.

به طور کلی، با احتمال Р(t)

رابطه بین مقدار t و مقدار احتمال P(t) که با آن می خواهیم فاصله اطمینان را بدانیم را می توان از جدول زیر دریافت کرد:

P(t) 0,683 0,950 0,954 0,990 0,997
تی 1,00 1,96 2,00 2,58 3,00

بنابراین، ما تعیین کرده‌ایم که میانگین مقدار برای جمعیت عمومی در چه محدوده‌ای است (با یک احتمال معین).

اگر نمونه به اندازه کافی بزرگ نداشته باشیم، نمی توانیم ادعا کنیم که جامعه دارای نمونه های s = S است. علاوه بر این، در این مورد، نزدیک بودن نمونه به توزیع نرمال مشکل ساز است. در این مورد از Ss به جای s در فرمول استفاده کنید:

اما مقدار t برای یک احتمال ثابت است P(t) به تعداد عناصر موجود در نمونه n بستگی دارد. هر چه n بزرگتر باشد، فاصله اطمینان حاصل به مقدار داده شده توسط فرمول (1) نزدیکتر خواهد بود. مقادیر t در این مورد از جدول دیگری (تست دانشجویی) گرفته شده است که در زیر ارائه می کنیم:

مقادیر آزمون t دانشجویی برای احتمال 0.95 و 0.99 

n پ n پ
0.95 0.99 0.95 0.99
2 12.71 63.66 18 2.11 2.90
3 4.30 9.93 19 2.10 2.88
4 3.18 5.84 20 2.093 2.861
5 2.78 4.60 25 2.064 2.797
6 2.57 4.03 30 2.045 2.756
7 2.45 3.71 35 2.032 2.720
8 2.37 3.50 40 2.022 2.708
9 2.31 3.36 45 2.016 2.692
10 2.26 3.25 50 2.009 2.679
11 2.23 3.17 60 2.001 2.662
12 2.20 3.11 70 1.996 2.649
13 2.18 3.06 80 1.991 2.640
14 2.16 3.01 90 1.987 2.633
15 2.15 2.98 100 1.984 2.627
16 2.13 2.95 120 1.980 2.617
17 2.12 2.92 >120 1.960 2.576

مثال 3 30 نفر از بین کارکنان شرکت به صورت تصادفی انتخاب شدند. با توجه به نمونه، معلوم شد که میانگین حقوق (در ماه) 10 هزار روبل با میانگین انحراف مربع 3 هزار روبل است. با احتمال 0.99 میانگین حقوق در شرکت را تعیین کنید. راه حل:با شرط، n = 30، X cf داریم. =10000، S=3000، P=0.99. برای یافتن فاصله اطمینان از فرمول مربوط به معیار Student استفاده می کنیم. طبق جدول n \u003d 30 و P \u003d 0.99 t \u003d 2.756 را پیدا می کنیم ، بنابراین ،

آن ها فاصله اطمینان مورد نظر 27484< Х ср.ген < 32516.

بنابراین، با احتمال 0.99، می توان استدلال کرد که بازه (27484؛ 32516) شامل میانگین حقوق در شرکت است.
امیدواریم که از این روش استفاده کنید بدون اینکه لزوماً هر بار صفحه گسترده ای به همراه داشته باشید. محاسبات را می توان به طور خودکار در اکسل انجام داد. در حالی که در یک فایل اکسل هستید، روی دکمه fx در منوی بالا کلیک کنید. سپس، از میان توابع، نوع "آماری" و از لیست پیشنهادی در کادر - STEUDRASP را انتخاب کنید. سپس، در اعلان، با قرار دادن مکان نما در قسمت "احتمال"، مقدار احتمال متقابل را تایپ کنید (یعنی در مورد ما، به جای احتمال 0.95، باید احتمال 0.05 را تایپ کنید). ظاهرا صفحه گستردهگردآوری شده تا نتیجه به این سوال پاسخ دهد که چقدر احتمال دارد اشتباه کنیم. به همین ترتیب، در قسمت "درجه آزادی" مقدار (n-1) را برای نمونه خود وارد کنید.