ادامه دارد ...........
مطالب در مورد آزمونهای مقایسهای چندگانه زیاد است. ولی در این نوشته که آخرین نوشته از این سری است قصد دارم به کاربرد این آزمونها در تحلیل دادههای اجتماعی و تفسیر و توضیح آن بپردازم.
فرض کنید که میخواهیم رابطهی متغیر طبقهی اقتصادی (در سطح سنجش ترتیبی) و سالهای تحصیل فرد (در سطح سنجش فاصلهای) را بررسی کنیم.
گذشته از چگونگی معرف سازی و سایر امور روشی ....
همچنین فرض کنید که از تحلیل واریانس (Post3) استفاده کرده و آزمون معنیدار شده است.
معنیداری آزمون فیشر به این معنی است که: اختلاف معنیداری بین میانگین سالهای تحصیل فرد در میان طبقات اقتصادی وجود دارد.
در علوم اجتماعی ما در پی رابطهی بین دو متغیر هستیم. این در حالی است که از آزمون کلی فیشر ما تنها میتوانیم عدم وجود رابطه را بطور مستقیم استنتاج کنیم (عدم معنیداری آزمون و عدم رد فرض صفر). اما درصورتی که آزمون فیشر معنیدار و فرض صفر رد شود نمیتوان وجود رابطه را استنتاج کرد. دلیل کافی برای این استنتاج وجود ندارد.
برای این منظور باید از آزمونهای مقایسهای چندگانه استفاده کرد. گذشته از نوع آزمونها و مقایسهها و ترجیحات آنها که در نوشتههای سابق مقداری از آن آمد در اینجا یک حالت از حالات ممکن را بررسی میکنم.
فرض کردیم که آزمون فیشر معنیدار شدهاست پس باید از آزمونهای مقایسهای چندگانه بهره گرفت. اگر از نرم افزار Spss استفاده بکنیم تنها مقایسههای زوجی را برای تمام آزمونهای مفروض انجام میهد. پس مجبوریم (!) از همین مقایسهها استفاده کنیم.
اگر در مورد مثال فوق نتیجه بصورت زیر بدست آمده باشد:
- اختلاف میانگین سالهای تحصیل طبقهی متوسط با میانگین سالهای تحصیل طبقهی پایین و طبقهی بالا معنی دار است.
- اختلاف میانگین سالهای تحصیل طبقهی پایین با میانگین سالهای تحصیل طبقهی بالا معنی دار نیست.
ما نمیتوانیم طبق گفتهی آقای ساعی که در نوشتهی اول ذکر شد اینگونه استنتاج کنیم که طبقه متوسط تأثیر بیشتری بر متغیر وابستهی ما دارد. بلکه باید استنتاج کنیم که این متغیر مستقل (طبقه اقتصادی) با متغیر وابسته (سالهای تحصیل فرد) رابطهی معنیداری ندارد. ولی متغیر اسمی ِ عضویت در طبقه متوسط به عنوان یک متغیر مستقل جدید با متغیر سالهای تحصیل فرد رابطهی معنیداری دارد.
برای روشنتر شدن مطلب حالتی که استنتاج رابطهی بین دو متغیر را ایجاب میکند، را مدل میکنیم:
- میانگین سالهای تحصیل فرد بین طبقات اقتصادی ِ پایین، متوسط و بالا دوبهدو بطور معنیداری از هم متفاوت باشند.
- میانگین سالهای تحصیل به ترتیب بین طبقات پایین، متوسط و بالا افزایش یا کاهش یابد.
اگر میانگین به ترتیب بین طبقات بصورت معنیدار افزایش یابد رابطهی بین دو متغیر مثبت و معنیدار است و اگر کاهش یابد رابطهی بین دو متغیر منفی و معنیدار میباشد.
در غیر این صورت نمیتوان وجود رابطه را استنتاج کرد.
یک نکته: برای انجام مقایسههای زوجی بین میانگینها میتوان از روش دیگری نیز غیر از آزمونهای مقایسهای چندگانه استفاده کرد. آن روش آزمون اختلاف میانگینهای tاستیودنت میباشد.
نوشتهی بعدی شاید در مورد تخمین حجم نمونه باشد.
تجربهی دو هفتهی گذشته نشان داد که نمیتوان به برنامهی سهشنبه و جمعه پایبند بود. اینهمه نظم برای من ضرر داره ... ولی باز هم نوشتههای آماری را در دو سطح مقدماتی و پیشرفته ارائه خواهم کرد.
منتظر نظرات شما هستم.
تا بعد ......
مرحلهی اول در آزمون فرض آماری تدوین دو فرض آماری است. این دو فرض باید نقیض یکدیگر باشند. یعنی درصورت رد یک فرض بتوان به تأیید دیگری استنتاج کرد. بنابر قرارداد اولین فرض را فرض صفر و فرض دیگر را فرض یک یا فرض مقابل مینامند. فرضهای آماری با یک رابطهی ریاضی مشخص میشوند که معمولاً این روابط؛ = (مساوی)، ≠ (عدم تساوی)، > (کوچکتر از) و < (بزرگتر از) میباشند.
رابطهای که تساوی را نشان میدهد (≤، = یا ≥) طبق قرارداد فرض صفر در نظر گرفته میشود. از آنجا که فرض مقابل باید نقیض فرض صفر باشد با توجه به فرض صفر تعیین میشود. به عنوان مثال اگر فرض صفر a≥ X̅ باشد، فرض مقابل a< X̅ است. همانطور که مشاهده میکنید مقدار X̅ نمیتواند از این دو حالت خارج باشد پس رد فرض صفر به معنی عدم رد فرض مقابل و عدم رد فرض صفر به معنی رد فرض مقابل میباشد.
البته همانطور که گفته شد فرضهای آماری برای آمارههای مختلف تقریباً مشخص است و به همین علت است که در نرمافزارهای آماری فرضهای آماری از پیش مفروض میباشند و نیاز به تعیین آنها نمیباشد.
یکی از مباحث مربوط به فرضهای آماری، مبحث خطای نوع اول و خطای نوع دوم میباشد. اما این مباحث کمی گیج کننده است و ضرورتی ندارد به آن بپردازیم. شما میتوانید بدون اطلاع از این مبحث و فقط با تعیین سطح معنیداری آزمون از تکنیک آزمون فرض آماری به درستی استفاده کنید.
در نوشتهی بعدی مرحلهی دوم از مراحل هفتگانه توضیح داده خواهد شد.
منتظر نظرات شما هستم.
تا بعد ......
با عرض پوزش از بابت تأخیر پیش آمده
آزمونهای مقایسهای چندگانه بسیار متنوع هستند و چندین نوع دستهبندی دارند. دستهبندیها عبارتند از:
- متعامد در مقابل غیر متعامد
- طرح ریزی شده در مقابل طرح ریزی نشده
- مرحلهبهمرحله در مقابل همزمان
- زوجی در مقابل غیر زوجی
- و ...
در مورد این دستهبندیها و مقایسههایی که در این دستهبندیها میگنجند مطلب زیاد است. اما تنها به این اشاره میکنم که مطالبی که در نوشتهی قبلی در مورد تعداد مقایسههای جزئی و رابطهی آن با درجهی آزادی گفته شد مربوط به مقایسههای متعامد میباشد.
در این نوشته میخواهم به Post-hocها به پردازم. در واقع Post-hocها آزمونهایی هستند که نیاز به طرح قبلی برای انجام آزمون ندارند و تقریباً تمام آزمونهای ممکن را انجام میدهند و پس از انجام آزمونها می توان مقایسههای مطلوب برای اهداف نظری خود را برگزید. یعنی این آزمونها جز آزمونهای طرح ریزی نشده (non-planned) هستند.
در میان آزمونها، آزمون Scheffe یک Post-hoc واقعی است. یعنی تمام مقایسههای ممکن را انجام میدهد و پس از آزمون محقق می تواند مقایسههای مناسب خود را انتخاب بکند. ولی با کمی اقماض برخی از آزمونهای دیگر را در این دسته قرار میدهند. مانند آزمون Tukey و Newman-Keuls که آزمون زوجی می باشند.
در نرم افزار Spss آزمونهای زیادی Post-hoc در نظر گرفته شدهاند. از طرف دیگر تا حدی که من متوجه شدهام در Spss تمام این آزمونها، فقط مقایسههای زوجی را آزمون میکنند. اگر این برداشت درست باشد دلیل این دستهبندی مشخص میشود. همچنین اگر این برداشت درست باشد این امر یک ضعف برای Spss محسوب میشود. اگر فردی از بین خوانندگان در مورد این موضوع اطلاعات بیشتری داشته باشد و بتواند مرا راهنمایی کند ممنون میشوم. مطالب شما در صورت تمایل با نام خود شما در وبلاگ ثبت خواهد شد.
یک نکته: آزمونهای مقایسهای چندگانه محدود به مقایسهی میانگینها نمیباشد. به عنوان مثال آزمون Marascuilo برای مقایسه ضریب همبستگی پیرسون بکار می رود.
نوشته بعدی در سطح پیشرفته به ادامهی همین مطلب اختصاص خواهد یافت.
منتظر نظرات شما هستم
آزمون فرض آماری یکی از مباحث آمار استنباطی می باشد. مباحث آمار استنباطی وقتی مطرح می شود که ما قصد داریم با بررسی یک نمونه معرف (نمونه ای که معرف ویژگیهای جامعهی آماری میباشد) به واقعیتهایی درمورد جامعهی اصلی پی ببریم. یعنی ما تنها نمونه را بررسی میکنیم و آمارهها و شاخصها را برای نمونه محاسبه میکنیم ولی هدف اصلی جامعه است و باید اطلاعات بدست آمده را به جامعه تعمیم دهیم. آزمون فرض یکی از راههای تعمیم است.
در تکنیک آزمون فرض آماری به این ترتیب عمل میکنیم:
1. تدوین یک جفت فرض آماری (فرض صفر و فرض یک)
2. تشخیص آزمون مناسب
3. تعیین سطح معنیداری آزمون و تعیین یک دامنه یا دو دامنه بودن آزمون
4. محاسبه آماره آزمون تشخیص داده شده در مرحله2
5. تعیین معنیدار بودن یا نبودن آماره محاسبه شده
6. رد یا عدم رد فرض صفر آماری
7. توضیح و تبیین نتیجه آزمون
خلاصه:
ما یک آماره را براساس اطلاعات نمونه بدست آوردهایم. میخواهیم ببینیم با توجه به این آماره به چه اطلاعاتی در مورد جامعه میتوانیم پی ببریم.
آمارههای مختلف فرضهای مختص خود را ایجاب میکنند. به عنوان مثال میانگین به عنوان یک آماره فرض صفر µ=X̅ را ایجاب می کند ولی ضریب هبستگی پیرسون فرض صفر 0=r را میطلبد. یعنی در مورد میانگین ما میتوانیم مقدار آماره را آزمون کنیم و بگوییم آیا این مقدار آماره در سطح معنیداری تعیین شده میتواند به جامعه تعمیم داده شود یا نه ولی در مورد ضریب هبستگی پیرسون ما تنها میتوانیم صفر بودن یا مخلف صفر بودن (عدم وجود یا وجود رابطه) را آزمون کنیم و بگوییم در سطح معنیداری تعیین شده مقدار ضریب همبستگی بدست آمده، بطور معنیداری مخالف صفر است یا نه (یعنی چنین رابطه ای در جامعه هم وجود دارد یا نه)
در نوشتهی بعدی مراحل هفتگانهی ذکر شده در بالا به ترتیب توضیح داده خواهد شد.
منتظر نظرات شما هستم.
تا بعد ......
در نرمافزار Spss وقتی قصد تحلیل واریانس داریم یک گزینه در پنجرهی مربوطه وجود دارد که ممکن است سوال برانگیز باشد Post Hoc. موضوع اصلی این باگس آزمون های مقایسه ای چندگانه است که به نسبت متنوع می باشند.
علی ساعی در کتاب تحلیل آماری در علوم اجتماعی در صفحه 210 همین مسئله را مطرح کرده است. وی تنها به توضیح آزمون LSD پرداخته و از بقیه تنها به ذکر نام اکتفا کرده است. البته این توجه خاص نمی تواند به معنی بهتر یا بهترین بودن آزمون مذکور باشد چرا که اصلاً اینگونه نیست. همچنین وی چنین بیان میکند که: «محقق از طریق آزمون LSD معین می کند که کدام گروه یا طبقه، اثر واقعی روی متغیر وابسته دارد.». البته من قصد نقد و بررسی این کتاب را ندارم ولی باید بگویم که این جمله چندان دقیق و حتی صحیح نمی باشد. ....
اما در مورد آزمونهای مقایسهای:
در تحلیل واریانس ما در پی این هستیم که بدانیم آیا اختلاف میانگین متغیر مورد نظر ما بین گروه ها، اختلاف معنی داری هست یا نه؟ برای این منظور از آزمون فیشر استفاده میکنیم. فرض صفر در این آزمون برابری میانگینها بین گروهها یا به عبارت دیگر صفر بودن اثر تیمارها (گروهها) و فرض مقابل عدم برابری میانگین ها و به عبارت دیگر غیر صفر بودن اثر تیمارها (گروهها) می باشد. این آزمون کلی بین تمام گروهها در اصل به جای چند آزمون خرد و جزئی، یکجا تمام اطلاعات را بررسی و مورد آزمون قرار می دهد. یعنی اگر ما m گروه متمایز داشته باشیم m-1 فرض آماری داریم که آزمون فیشر تمام آنها را بطور یکجا مورد آزمون قرار می دهد. اگر آزمون فیشر فرض صفر اصلی خود را رد نکرد به معنی رد نشدن تمام فرض های صفر جزئی می باشد و دیگر نیازی به آزمون های مقایسه ای نیست چرا که تنها در صورتی که تمام فرضهای صفر جزئی رد نشوند فرض نهایی (فرض آزمون کلی) رد نخواهد شد. ولی در صورتی که فرض صفر اصلی توسط آزمون فیشر رد شود معلوم نیست که این رد شدن مربوط به رد شدن کدام فرض یا فرض های صفر جزئی می باشد. در اینجا ما از آزمون های مقایسه ای چندگانه استفاده می کنیم تا معلوم شود وضعیت فرضهای آماری جزئی چگونه است.
یک نکته: تعداد آزمون های آماری جزئی برابر درجهی آزادی صورت در آزمون فیشر می باشد. این برابری تصادفی نیست و حتی وجه تسمیهی درجهی آزادی از همین جا است. این مقدار از بررسی تعداد ممکن برای بردارهای ضرایب در آزمون های مقایسهای در فضای mبُعدی به دست می آید.
زیاد جددی نگیرید!
نوشته بعدی در سطح پیشرفته به ادامهی همین مطلب اختصاص خواهد یافت.
منتظر نظرات شما هستم
تا بعد .....
در این مرحله از فعالیت وبلاگ لازم است که مطالب بصورت برنامه ریزی شده و منظم ارائه شوند. به این منظور قصد دارم مطالب مربوط به مباحث آماری را در دوسطح مقدماتی و پیشرفته و به ترتیب در روزهای سه شنبه و جمعه و مطالب مربوط به مباحث روشی را که تعداد آنها کمتر خواهد بود بطور پراکنده در بین آن ها در وبلاگ منتشر کنم.
سطح مقدماتی:
نوشته های این بخش برای کسانی در نظر گرفته شده که تازه در حال آشنایی با مباحث آماری هستند. ویژگی اصلی این نوشته ها توضیحات بیشتر و پیوستگی موضوعی آن ها می باشد. برای شروع قصد دارم از آمار توصیفی صرف نظر کنم و به مباحث آمار استنباطی بپردازم. به بیان دیگر قصد دارم به موضوعات آزمون فرض آماری و تئوری برآورد بپردازم. ....
سطح پیشرفته:
نوشته های این بخش برای کسانی تنظیم می شود که آشنایی بیشتری با مباحث آماری دارند و این نوشته ها بیشتر در حکم یک مباحثه هستند. البته برای موفقت در این بخش نیازمند توجه و همراهی دوستانم که مطالب را مطالعه می کنند هستم. نقد و کنجکاوی ایشان می تواند به مطالب جهت دهد و ضامن دقت، صحت و جذابیت آن ها باشد.
در آخر:
1. احتمال کج فهمی و اشتباه از جانب من به طور معنی داری مخالف صفر است و تذکرات شما در این زمینه بزرگترین نعمت برای تمام خوانندگان وبلاگ
2. نظرات و پیشنهادات شما برای افزایش کیفیت مطالب من ضروری است. به قول وبلاگ نویس های سابقه دار! نظر یادتون نره ...
زمانی که در نرم افزار –spss- ضریب همبستگی پیرسون را محاسبه می کنیم علاوه بر مقدار ضریب عددی به عنوان سطح معنی داری ارائه می شود. فرضیات این آزمون بدین صورت است: فرضیه صفر عدم وجود رابطه –مقدار ضریب هبستگی برابر صفر است- و فرضیه یک وجود رابطه –مقدار ضریب هبستگی مخالف صفر است- می باشد. لذا در صورتی که این عدد کوچکتر از 05/0 باشد آزمون معنی دار است و فرضیه صفر رد می گردد. یعنی وجود رابطه قابل تعمیم به جامعه می باشد و مقدار ضریب هبستگی بطور معنی داری مخالف صفر است.
Correlations
|
|
|
Highest Year of School Completed |
Respondent's Income |
|
Highest Year of School Completed |
Pearson Correlation |
1 |
.342(**) |
| Sig. (2-tailed) |
. |
.000 | |
| N |
1496 |
991 | |
|
Respondent's Income |
Pearson Correlation |
.342(**) |
1 |
| Sig. (2-tailed) |
.000 |
. | |
| N |
991 |
994 |
** Correlation is significant at the 0.01 level (2-tailed).
در اینجا فرض بر این است که خوانندگان با تکنیک تحلیل واریانس آشنایی دارند و مقصود توضیح کاربرد آن در علوم اجتماعی می باشد. اگر ما در پی بررسی رابطه بین یک متغیر اسمی یا ترتیبی با یک متغیر فاصله ای باشیم می توانیم از تحلیل واریانس استفاده کنیم. به عبارت دیگر می خواهیم ببینیم آیا تغییرات متغیر اسمی یا ترتیبی مورد نظر ما می تواند تغییرات متغیر فاصله ای را توضیح بدهد یا خیر. برای این منظور متغییر اسمی یا ترتیبی را مبنای گروه بندی قرار داده و داده های خود را به گروه های مجزا تقسیم می کنیم و سپس از تکنیک تحلیل واریانس استفاده می کنیم. در صورت رد فرضیه صفر در آزمون فیشر مربوطه می توانیم نتیجه بگیریم که اختلاف بین میانگین مقادیر متغیر فاصله ای ما در گروه ها معنادار است و تغییرات متغیر اسمی یا ترتیبی، تغییرات متغیر فاصله ای ما را توضیح می دهد. به عنوان مثال می توانیم رابطه بین متغیر جنسیت –اسمی- و متغیر درآمد -فاصله ای- را در نظر بگیریم. من این کار را بر روی داده های پیمایش عمومی آمریکا انجام دادم و جدول زیر خروجی آن است.
Tests of Between-Subjects Effects
Dependent Variable: Respondent's Income
|
Source |
Type III Sum of Squares |
df |
Mean Square |
F |
Sig. |
|
Corrected Model |
1670.855(a) |
1 |
1670.855 |
55.798 |
.000 |
|
Intercept |
163828.569 |
1 |
163828.569 |
5471.012 |
.000 |
|
SEX |
1670.855 |
1 |
1670.855 |
55.798 |
.000 |
|
Error |
29705.282 |
992 |
29.945 |
|
|
|
Total |
194356.000 |
994 |
|
|
|
|
Corrected Total |
31376.137 |
993 |
|
|
|
مقدمه
ادبیات موجود به زبان فارسی درمورد برآورد حجم نمونه در تحقیقات اجتماعی بسیار آشفته و غیر دقیق است. بسیاری از مولفین کتب آمار و روش تحقیق از کنار این موضوع به راحتی گذشته اند و به آن اشاره ای نکرده اند. برخی دیگر هم که به این موضوع پرداخته اند عموماً دچار ابهام و کج فهمی های بسیاری هستند.کتاب «روش تحقیق در علوم اجتماعی»، تألیف دکتر باقر ساروخانی، جلد دوم، بخش مربوط به تعیین حجم نمونه می تواند شاهدی بر این مدعا باشد.
در بین پژوهشگران وضعیت بهتر از این نیست. با مراجعه به چند تحقیق انجام شده به سرعت در می یابیم که تمام آنها از «فرمول کوکران» برای برآورد حجم نمونه استفاده کرده اند.!!! بدون توجه به این مهم که فرمول کوکران تنها یک تصحیح برای فرمول برآورد حجم نمونه است و تنها در شرایط خاص خود صادق می باشد.
برآورد حجم نمونه
حجم نمونه به سه پارامتر اساسی بستگی دارد:
1. دقت برآورد نمونه ای آماره مورد نظر
2. میزان واریانس متغیر مورد سنجش در بین افراد جامعه آماری
3. توزیع نمونه ای آماره مورد نظر که قصد تخمین زدن آن را داریم
مسئله مهم این است که حجم جامعه آماری در تعیین حجم نمونه هیچ نقشی ندارد. در این مورد تنها یک استثنا وجود دارد و آن هم زمانی است که حجم نمونه نسبت بزرگی -10درصد- از حجم جامعه باشد. یعنی حجم نمونه برآورد شده از فرمول اصلی 10درصد و یا بیشتر از 10درصد -در برخی از منابع 5 درصد ذکر شده است- از حجم جامعه باشد. به عنوان مثال در یک جامعه 5هزار نفره حجم نمونه 500 نفر یا بیشتر محاسبه شود. در این موارد می توان با حجم نمونه کمی کوچکتر به همان دقت مورد نظر دست یافت. در این حالت معمولاً از تصحیح ککران استفاده می شود. البته همانطور که ذکر شد در اکثر پژوهش های اجتماعی که در ایران انجام می گیرد به اشتباه همواره از فرمول ککران استفاده می شود که نادرست است.


فرمول های فوق، فرمول های اصلی برآورد حجم نمونه است. همانطور که مشاهده می کنید دو توزیع نرمال و استیودنت مفروض هستند. تشخیص توزیع مورد نظر براساس اطلاعات ما از جامعه آماری و آماره مورد نظر ما برای برآورد انجام می گیرد. توضیحات بیشتر در مورد چگونگی تشخیص توزیع و واریانس و تعیین دقت برآورد را به زمانی دیگر موکول و در اینجا به همین اندک اکتفا می کنیم.