توزیع پواسن
متغیرهای تصادفی دو جمله ای و فراهندسی ،موفقیت ها را در یک نمونه گیری تعیین می کند. ممکن است در پدیده هایی با روندی از موفقیت ها رو به رو شویم و آگاهی از تعداد موفقیت ها مورد نظر باشد. به مثالهای زیر توجه کنید.
در یک بازی بستکبال گلهایی را که تیم مورد علاقه به ثمر می رساند، روندی از موفقیت ها به دست می دهد.
تعداد دفعه هایی که قلاب ماهیگیری مورد حمله های ماهیان قرار می گیرد،روندی از موفقیت ها است.
تعداد تصادف ها در جاده ای مورد نظر، روندی از موفقیتها است.
ترسم خطوط اضافی در پارچه بوسیله یک ماشین پارچه بافی، روندی از موفقیت ها را به دست می دهد.
تعداد حبابهای موجود در شیشه های تولیدی یک کارخانه ساخت شیشه، روندی از موفقیت ها است.
مطالعه آماری تعداد موفقیت ها در بخشی از روند مورد نظر، اهمیت دارد. تعداد گلهایی که تیم مورد علاقه ما در نیمه اول به ثمر می رساند،تعداد دفعه هایی که به قلاب ماهیگیری در یک ساعت حمله می شود، تعداد تصادف های در طول تابستان،تعداد خطوط اضافی که در یک متر مربع ترسیم شده است و سرانجام، تعداد حبابهای موجود در 5 متر مربع شیشه تعداد موفقیت ها در بخشی از روند مربوطه است. نمونه گیری در اینجا به معنی گزینش آن بخش مورد نظر و شمارش تعداد موفقیت ها است. در مثال تعداد حبابها، هر قطعه شیشه 5 متر مربعی از تولید کارخانه یک نمونه به شمار می آید. در صورتی که X را تعداد موفقیت ها تعریف کنیم، مجموعه مقادیر X
X={و2و1و 0 …}
پیشامد (X=i) بیانگر قطعاتی است که در هر یک از آنها تعداد i حباب است، P(X=i) درصد این قطعات را تعیین می کند. تعیین P(X=i) با روش نمونه گیری در عمل ناممکن است. از این رو چگونه می توان P(X=i) را تعیین کرد؟ (در قسمت 5 به این پرسش پاسخ خواهیم داد) به هر حال تابع چگالی زیر P(X=I) را ارائه می دهد.
متغیر تصادفی پوآسن
یک متغیر تصادفی X با مجموعه مقادیر} …و2و1و0 X={ و تابع چگالی
(1-3)
را متغیر تصادفی پواسن با پارامتر می نامند و در این صورت نمایش بکار برده می شود. در فرمول (1-3) ، e عدد نپر است و میانگین تعداد موفقیت ها است، . اگر توزیع پواسن بر روندی از موفقیت ها دلالت کند، آنگاه تعداد موفقیت ها در هر بخش از روند از توزیع پواسن پیروی می کند که پارامتر آن،، مساوی میانگین تعداد موفقیت ها در آن بخش است.
توزیع نرمال
متغیر تصادفی نرمال
یک متغیر تصادفی X ،متغیر تصادفی نرمال است، اگر مجموعه مقادیر آن و تابع چگالی آن
مقادیر و ثابت است و به ترتیب امید ریاضی و واریانس X است، و در این صورت نمایش را برای X بکار می بریم.
هر متغیر تصادفی نرمال X با میانگین و واریانس خواص زیر را دارد.
1-
2- اگر به سرعت یک تابع نمایی.
خاصیت اول بیان می کند که پراکندگی در فاصله های یکسان است.
خاصیت دوم بیان می کند با دوری از میانگین درصد مشاهده ها نسبتاً سریع کاهش می یابد.
متغیر تصادفی نرمال، نخستین بار به وسیله کارل کاوس بیان شد. این متغیر تصادفی مدل احتمال خوبی برای بسیاری از پدیده های طبیعی است، به این دلیل، آن را نرمال (طبیعی) نامیده اند. به مثالهای زیر توجه کنید.
عموماً نمره های دانش آموزان یک کلاس، نزدیک به میانگین تجمع بیشتر دارد و هر چه از دو سو از میانگین فاصله گرفته شود، تجمع نمره ها کاهش می یابد (نسبتاً سریع).
میزان قد افراد جامعهی مورد نظر نیز پدیده ای طبیعی است. تجمع، نزدیک به میانگین به گونه ای نسبتاً متقارن، زیاد است. با دوری از میانگین از دو سوی، پراکندگی بسرعت (تقریباً به طور متقارن) کاهش می یابد.
درجه حرارت هوا را در نیمه شب بهمن ماه در منطقه ای در نظر بگیرید. دوباره انتظار می رود که تجمع نزدیک به میانگین زیاد باشد و با دور شدن از میانگین مقدار آن سریع کاهش یابد.
دقت کنید که هر متغیر تصادفی نرمال با آگاهی از دو مقدار کاملاً مشخص می شود. مقدار را انحراف معیار (انحراف استاندارد) گویند.
- متغیر نرمال استاندارد
چنانچه دیده شد هر توزیع نرمال به وسیله دو مقدار مشخص می شود. یعنی اگر جمعیتی آماری از توزیع نرمال پیروی کند با محاسبه تمام یافته های آماری را می توان برای آن جمعیت به دست آورد. اکنون اگر در یک توزیع نرمال، باشد، توزیع نرمال استاندارد بوده و متغیر تصادفی نرمال مربوط به آن، متغیر تصادفی نرمال استاندارد است و آن را با Z نشان می دهیم متغیر تصادفی Z در کاربرد اهمیت ویژه ای دارد و بدین دلیل جدول مربوط به مقادیر عددی تابع توزیع آن در بخش جدولها داده شده است بحث زیر اهمیت Z را روشن تر می کند.
توزیع پوآسون
در مواردی که در توزیع دو جمله ای n بزرگ باشد محاسبه احتمالات کاری پیچیده و مشکل می گردد. از طرفی توزیع دو جمله ای در مواردی صدق می کند که d=p-q کوچک باشد، و یا به عبارت دیگر q و p نزدیک به باشند. در مواردی که شرایط فوق صدق نکنند. (n بزرگ و احتمال ها نزدیک بهم نباشند) از توزیع های دیگری بجای توزیع دو جمله ای استفاده می گردد.
به طور کلی اگر احتمال وقوع پیشامدی (q) کوچک باشد و باشد آن پیشامد را نادر گویند. و منحنی توزیع دو جمله ای از حالت تقارن خارج بوده و مورب می گردد. چون در عمل با چنین وقایع نادری روبرو هستیم، داشتن یک توزیع تقریبی برای چنین مواردی ضروری است. چنین توزیعی بنام توزیع پواسون معروف است.
در توزیع دو جمله ای اگر تعداد دفعات آزمایش (n) بتدریج که p کوچک و کوچکتر می گردد، بزرگ و بزرگتر شود، مقدار (لاندا) ثابت می ماند. به عبارت دیگر توزیع دو جمله ای باینومییال وقتی n به سمت بی نهایت و p به سمت صفر میل کند و np ثابت بماند، به توزیع پویسون تبدیل می گردد. بنابراین احتمال وقوع X پیشامد در n آزمایش به صورت زیر محاسبه می گردد.
پایه لگاریتم طبیعی = 718828/2 e=
در این فرمول بجای np از حرف یونانی استفاده شده است. بنابراین توزیع پویسون یک حد از توزیع باینومییال است. در این مورد نیز ثابت می شود که میانگین و واریانس توزیع پویسون برابر با است.
مقدار به مفهوم زیر است:
یا به طور کلی بوسیله ماشین حساب حاصل می شود.
توزیع پویسون تنها به عنوان تقریب توزیع دو جمله ای بکار نمی رود،بلکه به عنوان یک الگو برای بررسی وقایعی که به طور تصادفی و به طور نادر در زمان و مکان توزیع می شوند نیز مورد استفاده واقع می شود. برای مثال می توان تعداد پنچری طایر در یک هفته، تعداد اصابت گلوله در یک هدف گیری، و تعداد موارد گزارش شده از یک بیماری کمیاب و غیره را نام برد. از توزیع پویسون در بازرسی و کنترل کیفیت کالاها، وقتی تعداد کالاهای معیوب نسبت به تولید کل کم باشد، به منظور محاسبه احتمال ها استفاده می شود. از جمله وقایع دیگری که توزیع پویسون برای آنها صادق است، می توان به مشاهده غلط چاپی در یک کتاب، افراد چپ دست یا معلول ذهنی در جامعه، تعداد خودکشی، یافتن بذر علف هرز در یک محموله و یا پیدا کردن باکتری در آب استخر اشاره نمود. برای توزیع پویسون نیز احتمال تجمعی مقادیر مختلف X بر حسب n و محاسبه گردیده و در جداولی در برخی از کتاب های آمار آورده شده است.
توزیع نرمال
توزیع نرمال مهمترین الگوی آماری است و اکثر تئوری ها، محاسبات و استدلالهای آماری بر مبنای آن نهاده شده اند. اهمیت دیگر توزیع نرمال در این است که توزیع فراوانی پدیده های طبیعی، که با رعایت اصول صحیح آماری مورد تحقیق قرار می گیرند، غالباً به صورت نرمال است. از طرفی چون هر متغیری به هر شکلی که مورد مطالعه قرار گیرد دارای توزیع فراوانی مخصوص بخود می باشد،می توان با استفاده از اصول آمار و ریاضی، آن متغیرها یا توزیع آنها را به نرمال تبدیل نمود و از اصول آماری خاص منحنی نرمال برای تجزیه و تحلیل آنها استفاده نمود. به عنوان مثال چنانچه Xi دارای توزیع پویسون باشد، متغیر دارای توزیع نرمال خواهد بود. همچنین چنانچه حالتهای یک متغیر بر حسب درصد باشد، دارای توزیع نرمال نیست،ولی الگاریتم این اعداد یا سینوس معکوس (Arc sin) آنها دارای توزیع نرمال است. این موضوع مبحث نسبتاً مفصلی تحت عنوان تبدیل داده ها است،که خارج از موضوع این کتاب می باشد.
اگر n (تعداد آزمایش) در یک توزیع دو جمله ای زیاد باشد، محاسبه فراوانی ها و احتمال ها با استفاده از توزیع باینومییال مشکل می گردد. در چنین مواردی با استفاده از اصول ریاضیات نشان داده می شود که با بزرگ و بزرگتر شدن n توزیع دو جمله ای باینومییال بیشتر و بیشتر به صورت توزیع پیوسته ای با معادله زیر در می آید که به آن توزیع نرمال می گویند. بنابراین توزیع نرمال “حد” توزیع دو جمله ای است. توجه داشته باشید که با بزرگ شدن n (تعداد حالات ممکن برای وقوع یک رویداد) متغیر حاصل از حالت ناپیوسته به پیوسته تغییر می کند. به عبارت دیگر توزیع دارای منحنی می گردد.