مقدمه
در حالی که اغلب تعیین توزیع احتمالی برای یک متغیر تصادفی معین مفید است، بسیاری مواقع در استنباط آماری و تصمیمگیری توابع احتمالی متغیرها دارای یک فرم هستند. در چنین مواردی استفاده از نظریه توابع احتمالی شرح داده شده در فصل پنجم برای به دست آوردن نتایج کلی در مورد توزیع احتمالی مثل میانگین و واریانس بهتر است از به دست آوردن این مشخصهها در هر حالت ویژه. زیراکسل کننده خواهد بود که در هر مورد جدید با استفاده از توزیع احتمالی یا چگالی، فرایند تعیین مشخصهها مثل میانگین و واریانس را انجام دهیم. خوشبختانه به اندازه کافی همانندی بین انواع معین از آزمایشهای منحصر به فرد معلوم وجود دارد، به طوری که به دست آوردن یک فرمول که نشان دهنده ویژگی عمومی این آزمایشها باشد را ممکن میسازد.
در این فصل بعضی از توزیع های احتمالی متغیرهای تصادفی گسسته مثل توزیعه ای دو جملهای، فوق هندسی و پواسن را مطالعه خواهیم نمود و خواص آنها را بررسی میکنیم این توزیعها از مهمترین توزیعهای گسسته در آمار هستند که کاربرد زیادی دارند. توزیعهای احتمالی متغیرهای پیوسته با تأکید بر توزیع نرمال که کاملاً شناخته شده است و در آمار استفاده زیادی از آن میشود در فصل هفتم بحث خواهد شد.
آزمایش دو جملهای
بسیاری از آزمایشگاه هستند که دارای یک ویژگی عمومی بوده و آن عبارت است از اینکه نتایج آنها به یکی از دو پیشامد دستهبندی میشوند. برای مثال، «آزمایش دسته بندی یک متقاضی شغل که مرد یا زن است» دارای دو نتیجه میباشد، آزمایش پرتاب یک سکه که نتیجه آن پیشامد شیرآمدن و خط آمدن میباشد. تولد یک نوزاد که نتیجه آن پسر و یا دختر میباشد. آزمایش انتخاب یک کالای تولیدی که نتیجه آن تنها به یکی از دو صورت سالم و یا ناقص اتفاق میافتد.
در حقیقت این امکان همیشه وجود دارد که نتایج رخدادهایی که در زندگی روزمره اتفاق میافتد را به صورت دو نتیجه «موفقیت» و یا «عدم موفقیت» شرح دهیم. امتحانهایی که تنها منتج به دو نتیجه میشوند، نقش بسیار مهمی در یکی از توزیعهای احتمالی گسسته که کاربرد زیادی در عمل دارد یعنی «توزیع دو جملهای» ایفا میکنند.
قبل از این که توزیع دو جملهای را معرفی کنیم، آزمایش دو جملهای را شرح میدهیم با توجه به مثالهای بالا و مثالهایی مثل مصاحبه با یک رأی دهنده که جواب آن موافق کاندیدای مورد نظر است و یا نیست. پرتاب موشک که نتیجه آن به هدف خوردن و یا به هدف نخوردن است، ملاحظه میشود که صرف نظر از بعضی از تفاوتها همه آنها دارای یک مشخصه ویژه آزمایش دو جملهای میباشند.
تعریف:
یک آزمایش دو جملهای دارای فرضیات زیر است.
1-آزمایش دو جملهای مرکب از n امتحان یکسان ساده است.
2-هر امتحان منتج به یکی از دو نتیجه میشود. یک نتیجه را موفقیت و با S نشان داده و نتیجه دیگر را عدم موفقیت و با F نشان میدهیم.
3-احتمال موفقیت در یک امتحان ساده مساوی P است، که از یک امتحان به امتحان دیگر ثابت باقی میماند احتمال عدم موفقیت مساوی q=1-P است.
4-امتحانها از هم مستقل میباشند.
5-علاقمند به X، تعداد موفقیتهای هستیم که در nبار آزمایش ساده مشاهده میشود. امتحانهای سادهای که در این شرایط صدق میکنند به آزمایشهای «برتولی» معروفند. در عمل فرضهای بیان شده در یک آزمایش دو جملهای تنها در حالتهای محدودی وجود دارند، اما مادامی که هر آزمایش روی آزمایش دیگر اثر ناچیزی داشته باشد میتوان نظریه دو جملهای را بکار برد.
برای مثال، احتمال این که یک رایدهنده موافق کاندیدای معینی در یک انتخاب سیاسی رأی به دهد تقریباً از یک امتحان به امتحان دیگر ثابت میماند. مادامی که جامعه رای دهندگان در مقایسه با نمونه نسبتاً بزرگ باشد. اگر پنجاه درصد جامعه 1000 نفری از رای دهندگان کاندیدای A را ترجیح به دهند، آن گاه احتمال موافق بودن اولین مصاحبه شونده به کاندیدای A مساوی خواهد بود. احتمال موافق بودن دومین مصاحبه شونده به کاندیدای A مساوی یا خواهد بود که بستگی دارد به اینکه آیا اولین مصاحبه شونده موافق بوده یا مخالف آن. هر دو عدد نزدیک به هستند، در عمل برای سومین، چهارمین و nامین انتخاب هم همین طور است در صورتی که n خیلی بزرگ باشد. اما اگر تعداد جامعه 10 و تعداد موافق کاندیداA، 5 نفر باشند، آن گاه احتمالی این که اولین رای دهنده موافق A باشد مساوی و دومین مساوی یا بستگی به این که اولی موافق یا مخالف بوده است خواهد بود. بنابراین برای جوامع کوچک، احتمال موافق بودن از یک رأی دهنده به رأی دهنده دیگر (از یک امتحان به امتحان دیگر) به طور محسوس تغییر میکند و نتیجتاً آزمایش دو جملهای نخواهد بود.
توزیع احتمالی دو جملهای
توزیع دو جملهای بوسیله مقادیر n و p که پارامترهای توزیع هستند توصیف میشود. پارامتر هر توزیع عبارت است از یک مشخصه جامعه. در توزیع دو جملهای پارامتر n عبارت است «تعداد امتحانها» و p عبارت از احتمال موفقیت در هر امتحان ساده میباشد. برای هر n وp داده شده با توجه به فرضیات آزمایش دو جملهای میتوان احتمال هر تعداد موفقیت را حساب کرد و نیز میتوان دیگر مشخصههای توزیع مثل میانگین و واریانس را هم به دست آورد.
برای نشان دادن این که چگونه توزیع احتمالی دو جملهای حاصل میشود،فرایند تولید را در نظر بگیرید که یک وسیله همانندی تولید میکند که به دو صورت سالم و یا ناقص دستهبندی میشود. وقتی که فرایند به طور درست کار نکند، احتمال ثابت 10/0=p وجود دارد که کالا ناقص تولید شود. تعداد ناقصها هر مقداری از 0 تا تعداد آزمودنی (n) میتواند باشد. برای مثال، ممکن است سئوال شود، «احتمال این که در یک نمونه تصادفی چهارتایی یک نتیجه ناقص باشد چقدر است؟ یا احتمال این که دو یا بیشتر در یک نمونه تصادفی چهارتایی ناقص وجود داشته باشد چقدر است؟ کلمه تصادفی معادل مستقل بودن در تعریف آزمون دو جملهای است.
برای محاسبه احتمالات در آزمایش دو جملهای میتوانیم از قوانین ضرب احتمال استفاده کنیم. مانند
(یک رویداد) p(تعداد رویدادهای مربوط)=(پیشامد)p
در یک مسئله دو جملهای، علاقمند به محاسبه احتمال دقیقاً x موفقیت در n تکرار امتحان برنولی هستیم، که هر امتحان دارای احتمال موفقی p است. به این معنی که ما x موفقیت و n-x عدم موفقیت داریم. برای محاسبه چنین احتمالهایی، لازم است که احتمال یک رویداد از این وع را پیدا کنیم، آن گاه آن را در تعداد ممکن چنین رویدادهایی ضرب کنیم. چون فرقی ندارد کدام رویداد را ابتدا بررسی کنیم، فرضی کنید به طور اختیاری این رویداد را بررسی کنیم که در آن x موفقیت ابتدا رخ دهد، ادامه پیدا کند یا n-x (عدم موفقیت). فرض کنید موفقیت S= و عدم موفقیت F= باشد، بنابراین این رویداد ویژه به صورت زیر مرتب نمود.
SS…S FF…F
n-x عدم موفقیت x موفقیت
برای تعیین احتمال توأم چنین دنباله ویژهای از موفقیتها و عدم موفقیتها، توجه کنید که امتحانها فرض میشوند که از هم مستقل هستند. چون احتمال یک موفقیت p(S)=p و p(F)=q است، بنابراین داریم.
P(SS…S FF…F)=p(S)p(S)…p(S)p(F)p(F)…p(F)
=(p)(p)…(P)(q)(q)..(q)
میتوان نشان داد که نشان دهنده احتمال هر دنبالهای است که در آن x موفقیت و n-x عدم موفقیت وجود دارد. بنابراین کافی است بدانیم چند رخ داد متفاوتی وجود دارد که در آن x موفقیت و n-x عدم موفقیت داشته باشیم. جواب عبارت است از تعداد ترکیبهای x از n میدانیم این تعداد عبارت از
بنابراین حاصلضرب در احتمال x موفقیت در n امتحان را با احتمال ثابت موفقیت (p) به صورت زیر به دست میدهد.
(6-1) (x موفقیت در n امتحان)p
این توزیع را توزیع دو جملهای گویند. اگر متغیر تصادفی X دارای توزیع دو جملهای با پارامترهای n و p باشد معمولاً آن را به صورت زیر مینویسند.
مثال 6-1 اگر کسر ناقصی تولید یک کالا مساوی 1/0=p باشد، در یک نمونه تصادفی چهارتایی از این کالاها توزیع احتمالی تعداد کالاهای ناقص را حساب کنید.
حل: یک کالای انتخاب دو صورت خواهد داشت یا سالم است و یا ناقص. احتمال این که یک کالای انتخاب ناقص باشد مساوی 1/0=p کالاهای انتخابی از همدیگر مستقل هستند بنابراین تعداد کالاهای خراب در نمونه دارای توزیع دو جملهای است. بنابراین توزیع احتمالی تعداد کالاهای خراب طبق جدول 6-1 خواهد بود.