مولفههای اصلی Principle component
در بیشتر مسائل عملی مشاهدات بصورت تعداد زیادی متغیرهای همبسته میباشند برای تحلیل اینگونه مشاهدات به دنبال روش های آماری هستیم که بدون اینکه اطلاعاتی را از دست داده باشیم بعد مسأله را تا حد قابل ملاحظهای کاهش دهیم در حقیقت با کنار گذاشتن متغیر های با واریانس پایین و توجه به متغیرهای با واریانس بالا میتوانیم به راحتی مسأله را در یک زیر فضایی با بعد کمتر مورد مطالعه قرار دهیم.
بردار تصادفی X را با بردار میانگین و ماتریس کواریانس یک بردار p بعدی در نظر می گیریم. مولفههای اصلی x عبارتند از ترکیبات خطی استاندارد شده مولفه های x که بر حسب واریانس ها ویژگیهای خاصی دارند.
وزنهایی که در مولفه های اصلی به بردار تصادفی x مربوط میشوند و دقیقاً بردارهای ویژه استاندارد شده ماتریس کواریانس x هستند ریشههای ماتریس مشخصه کواریانس برابر مولفههای اصلی میباشند و بزرگترین ریشه برابر واریانس اولین مولفه اصلی است. برای X هیچ توزیعی فرض نمیکنیم تنها شرط لازم برای تحلیل مولفههای اصلی این است که متغیرهای اصلی همبستگی معنیداری داشته باشند.
چنانچه مولفههای بردار X هم بعد یا هم واحد نباشند میتوان مقادیر ویژه متناظر با ماتریس همبستگی بردار را بدست آورد بکار بردن ماتریس همبستگی باعث استاندارد شدن متغیرها نسبت به واحد واریانس میگردد/.
بطور کلی اگر بردار X یک بردار تصادفی P متغیر باشد برای بدست آوردن مولفههای اصلی آن چنین عمل میکنیم.
ابتدا مقادیر ویژه مربوط به ماتریس کواریانس یا ماتریس همبستگی P را محاسبه می کنیم
I ماتریس P بعدی همانی و یک ماتریس قطری باشد آنگاه
اگر مولفه اصلی متناظر با متغیر باشد آنگاه
= درصد تغییرات iمین مولفه به کل تغییرات
پس از تعیین مقادیر ویژه بردارهای ویژه متناظر با هر یک از مقادیر محاسبه میگردد.
مقدار اهمیت k مین متغیر اولیه یعنی را در iمین مولفه اصلی یعنی اندازه میگیرد.
ضریب همبستگی بین مولفههای و متغیر برابر است با
واریانس K مین متغیر x است.
مقادیر ویژه مربوط به ماتریس همبستگی نمونه را محاسبه کرده و داریم:
= نسبت تغییرات مولفه اول به کل تغییرات
تحلیل عاملی Factor Analysis
تحلیل عاملی شامل هر دو روش تحلیل مولفهها (Component) و تحلیل عاملهای مشترک (Common Factors) میباشد.
کاربردهای اصلی تحلیل عاملی عبارتست از :
1- کاهش تعداد متغیرها Data Reduction
2- گروه بندی متغیرها Classing Variables
در تحلیل مولفه اصلی همه پراکندگی مربوط به یک متغیر در تحلیل بکار برده میشود در صورتیکه در تحلیل فاکتورهای (عاملهای) اصلی ما فقط آن قسمت از پراکندگی متغیر را که با سایر متغیرها مشترک است، بررسی می کنیم.
تحلیل عاملی در حدود صد سال پیش توسط یک روانشناس بنام چارلز اسپیرمن ابداع شد. او توسط این روش به این نتیجه رسید که در یک زیر جامعهای از انسانها، توانایی ذهنی (mental ability) افراد که بر اساس مهارتهای ریاضی، لغت شناسی مهارتهای شفاهی و کلامی. مهارتهای هنری و مهارتهای منطقی و استدلالی اندازهگیری میشود، میتواند دقیقاً توسط یک فاکتور اساسی مشترک که هوش عمومی یا بعبارتی General intelligence نامیده میشود، اندازهگیری گردد. امروز کالج Board testing service توانایی ذهنی افراد را بر اساس سه عامل مهم (توانایی شفاهی، ریاضی و منطقی) اندازهگیری میکند.
بخشی از واریانس یک متغیر خاص که در اشتراک با عاملهای دیگر باشد، نامیده میشود: connunality = میزان اشتراک. بنابراین هدف با برآورد کردن همین میزان اشتراک است برای هر متغیر. یعنی بخشی از واریانس که هر متغیر با سایر متغیرها در اشتراک دارد.
تحلیل عاملی روشی است که با کشف ساختار یک مجموعه از متغیرها و کاهش این مجموعه به تعداد کمتری از متغیرهای بنیادیتر که عامل نامیده میشود، سرو کار دارد.
این روش در کارهای اسپیرمن روانشناس انگلیسی ریشه دارد که در سال 1904 اولین مقاله خود را درباره این موضوع در مجله روانشناسی آمریکا چاپ کرد. از آن زمان به بعد بسیاری از روانشناسان و دستاندرکاران علوم تربیتی علاوه بر ریاضی دانها که به همکاری با آنها پرداختهاند، در گسترش تحلیل عاملی سهم بسزایی داشتهاند.
یکی از روشهای مهم تحلیل عاملی بنام روش مولفه اصلی بوسیله ریاضیدان آماری هتلینگ گسترش یافت. علاقه او به این موضوع از همکاری وی با پژوهشگران در زمینه علوم تربیتی برانگیخته شد. مقاله اصلی هتلینگ که در آن این روش شرح داده شده است در سال 1933 در مجله روان شناسی تربیتی منتشر شد.
هدف تحلیل عاملی توصیف و تفسیر همبستگی های درونی مجموعهای واحد از متغیرهاست تحلیل عاملی از دو راه این هدف را برآورده می کند. ابتدا مجموعه متغیرهای اصلی را به تعداد کمتری از متغیرها که عامل نامیده میشوند، کاهش میدهد، دوم باید معنای عامل به علت ویژگی های ساختاری که ممکن است در این مجموعه روابط نهفته باشند، روشن شود. عاملها متغیرهای فرضی هستند که از فرایند تحلیل مجموعهای از متغیرها که از طریق اندازهگیری مستقیم بدست می آیند، استنباط میشوند.
تحلیل عاملهای مشترک در مقابل
تحلیل مولفههای اصلی
تحلیل عاملی یا تحلیل عاملهای مشترک بعنوان یک روش کلی شامل تحلیل مولفه اصلی میشود. اگر چه این دو روش هدف یکسانی (کاهش بعد فضای دادهها) را در نظر دارند اما بر حسب فرضیات زیر بنایی از هم کاملاً متفاوتند.
یک متغیر تنها در مجموعه دادهها دارای واریانسی است که این واریانس تجزیه میشود به واریانس مشترک که توسط سایر متغیرهای مدل شرکت داده میشود و واریانس یگانه (unique) که نسبت به یک متغیر خاص یکتاست. و شامل مولفه خطا میشود. تحلیل عاملی مشترک فقط واریانس مشترک متغیرهای مشاهده شده را تحلیل می کند و تحلیل مولفههای اصلی فقط واریانس کلی را در نظر میگیرد و تمایزی بین واریانس یگانه قائل نمیشود. انتخاب یکی از این دو روش بستگی به چندین معیار دارد اولی اینکه چه چیزی در تحلیل مورد توجه است؟
تحلیل عاملهای مشترک و تحلیل مولفه اصلی هر دو مجموعه متغیرهای اصلی را به مجموعهای با بعد کمتر از متغیرهای مرکب که عامل یا مولفه اصلی خوانده میشوند، کاهش میدهند.
این دو روش در تفسیر متغیرهای مرکب بدست آمده از هم متفاوت عمل میکنند.
در تحلیل عاملی مشترک یک تعداد کمی از فاکتورها استخراج میشوند تا همبستگی بین متغیرهای مشاهدهای را تبیین کنند و اینکه تشخیص دهند ابعاد پنهانی را که باعث این همبستگی شده است.
اما در تحلیل مولفههای اصلی مورد توجه این است که ماکزیمم سهم واریانس موجود در مجموعه دادههای اصلی با حداقل تعداد متغیرهای مرکب (مولفههای اصلی) تعیین شود.
ثانیاً چه فرضیاتی در مورد واریانس مجموعه دادههای اصلی در نظر گرفته میشود؟
اگر متغیرهای مشاهدهای نسبتاً بدون خطا اندازهگیری شوند یا اینکه فرض شود واریانس خطا سهم کوچکی از واریانس کل را در مجموعه دادههای اصلی داشته باشد در اینصورت تحلیل مولفههای اصلی مناسب است.
اما اگر متغیرهای مشاهدهای فقط نمایانگر ساختار پنهانی که باید اندازه گیری شود، باشند یا اگر واریانس خطا یک سهم معنی داری از واریانس کل باشد در اینصورت روش تحلیل عاملهای مشترک پیشنهاد میگردد.
در نرم افزار آماری SPSS برای تحلیل مولفه اصلی برنامهای در نظر گرفته نشده است. اما در نرم افزار آماری SAS برنامه خاصی برای تحلیل مولفه اصلی در نظر گرفته شده است.
(PROC PRINCOM)
در تحلیل مولفه اصلی (PCA) ماتریس همبستگی که قطر اصلی آن با 1 جایگزین شده (1 ها همان واریانس ها هستند.) در تحلیل بکار برده میشود.
در تحلیل عاملهای مشترک (CFA) قطر اصلی ماتریس همبستگی که با ها جایگزین شدهاند، در تحلیل بکار گرفته میشود.
ها همان میزان اشتراک یا communality هستند. و برابرند با مجموع مجذورات بارهای عاملی مشترک. بارهای عاملی ضرایب همبستگی معمولی هستند.
= واریانس متغیر i ام
میزان اشتراک بخشی از واریانس است که میتوان آن را به عوامل مشترک نسبت داد. بخشی از واریانس که باقی میماند و نمیتوان آن را به عوامل مشترک نسبت داد، واریانس یگانه (uniqueness) نامیده میشود. این قسمت از واریانس ناشی از خطای اندازهگیری است. مثلاً اگر مقدار 85/0 باشد یعنی 85/0 از واریانس متغیرi، ام در اشتراک با متغیرهای دیگر آن مجموعه است. در حقیقت میزان اشتراک نسبتی از واریانس را نشان میدهد که بین یک متغیر و متغیرهای دیگر در مجموعه مورد نظر مشترک است و برابر است با مجموع مجذورات بارهای عاملی مشترک.