نحوه انجام تحلیل همبستگی پیرسون در spss
یکی دیگر انواع روش های همبستگی Correlation از تحلیلهای آماری بسیار مهم نرم افزار spss تحلیل همبستگی پیرسون میباشد. تحلیل همبستگی پیرسون جهت بررسی ارتباط دو متغیر با مقیاس فاصلهای استفاده میشود و در علوم انسانی و پزشکی کاربرد بسیار زیادی دارد. تحلیل همبستگی پیرسون را میتوان پیشامد برخی تحلیلهای دیگر مانند تحلیل رگرسیون محسوب نمود زیرا قبل از انجام تحلیل رگرسیون انواع روش های همبستگی Correlation معمولاً ماتریس همبستگی بین متغیرها محاسبه میشود تا مشخص گردد آیا بین متغیرها اصلاً رابطهای وجود دارد یا خیر. بعد از مشخص شدن رابطه بین متغیرهاست که انجام تحلیل رگرسیون برای پیشبینی معنی پیدا میکند. در زیر قصد آن داریم تا به صورت کامل و مرحله به مرحله نحوه انجام تحلیل همبستگی پیرسون در spss را ذکر کنیم.
کار را با ذکر مثالی شروع میکنیم: محققی قصد دارد به بررسی رابطه همبستگی دو متغیر امیدواری و خوش بینی بر روی یک نمونهای بپردازد.
مرحله اول: بعد از جمعآوری دادهها و وارد کردن آنها به نرم افزار spps کار تحلیل داده را اینگونه شروع کنید؛ به نرم افزار spss رفته و دستور زیرا اجرا کنید:
با اجرای دستور فوق پنجرهای به شکل زیر باز میشود. این پنجره دارای دو کادر میباشد که کادر سمت چپ را شمار ۱ و کادر سمت راست (Variable) را کادر شماره ۲ نامگذاری میکنیم.
نحوه انجام تحلیل همبستگی پیرسون در spss
مرحله دوم: متغیرهای مورد نظر خود را از کادر ۱ وارد کادر ۲ نمایید. اگر سوالات دو پرسشنامه را وارد نمودهاید و نمیدانید چگونه نمره کل هریک از پرسشنامهها را در spss چگونه محاسبه نمایید به یکی دیگر از آموزشهای ما که در این لینک آمده مراجعه نمایید. بعد از محاسبه نمره کل دو پرسشنامه صرفا نمرات کل را وارد کادر نمایید و در پایان از قسمت پایین کادر ۱ و ۲ آزمون پیرسون (Pearson) را انتخاب نمایید. سایر گزینهها آزمون کندال و اسپیرمن هستند که آزمونهای جداگانهای میباشند و به تحلیل پیرسون ربطی ندارند. بعد از انجام عملیات فوق نهایتاً میبایست پنجرهای به شکل زیر پدید آید:
نحوه انجام تحلیل همبستگی پیرسون در spss
بعد از پدیدار شدن این پنجره، دکمه OK را فشار دهید تا این تحلیل انجام شود. بعد از انجام این کار خروجیها به شکل زیر ظاهر میشوند:
همانگونه که مشاهده میکنید ماتریس همبستگی برای این دو متغیر ارایه شده است. با توجه به شکل فوق، میزان r همبستگی بین دو متغیر امید و خوشبینی برابر با ۰/۷۵ به دست آمده که این مقدار با توجه سطح آماری معنادار نیز میباشد (۰/۰۰۱=p). از آن جهت بالای عدد ۰/۷۵ دو ستاره آمده است که این مقدار در سطح آماری ۰/۰۱ معنادار شده است. اگر در سطح ۰/۰۵ معنادار میشد فقط یک ستاره بالای آن نمایان میگردید (p-Value در تحلیل آماری چه اطلاعاتی به شما می دهد؟). برای گزارش جدول فوق در پایان نامه یا مقاله جدول زیر را پیشنهاد میکنیم:
اجرای آزمون همبستگی پیرسون در SPSS
احتمالا، گسترده ترین کاربرد شاخص آماری همبستگی دو متغیری، ضریب همبستگی گشتاوری پیرسون است که به طور معمول همبستگی پیرسون نامیده میشود. علامت اختصاری آن r است. ضریب پیرسون نشان می دهد که تا چه اندازه بین متغیرهای کمّی رابطه خطی وجود دارد(میزر، گامست و گارینو،152:1391).
کاربرد اصلیِ ضریب پیرسون زمانی است که متغیرها از نوع پارامتری باشند؛ بدین معنا که توزیع نرمال داشته باشند و در سطح فاصله ای/نسبی باشند. البته زمانی که متغیرها از نوع شبه فاصله ای باشند (یعنی هر متغیر ترکیبی از چند متغیر ترتیبی باشد که اصطلاحا به آن مقیاس های تراکمی میگویند)، برخی از پژوهشگران از ضریب پیرسون استفاده میکنند. برخی از نویسندگان استفاده از ضریب پیرسون برای یک متغیر دو ارزشی و یک متغیر فاصله ای/نسبی را هم مجاز شمرده اند. تفسیر همبستگی پیرسون زمانی که یکی از متغیرها دوارزشی (فقط شامل دو سطح) اما متغیر دیگر کمّی است نیز میتواند منطقی باشد(میزر، گامست و گارینو،164:1391).
تفسیر شدّت رابطه در همبستگی پیرسون
بعد از تعیین معنی داری و جهت رابطه، باید شدّت رابطه ارزیابی شود. برای تفسیر شدّت رابطه دومتغیر، تقسیم بندی های گوناگونی ارائه شده است. تقسیم بندی زیر یکی از آن هاست.
شیوه تفسیر شدت رابطه در همبستگی پیرسون
شدّت رابطه | تفسیر |
8/. تا 1 | رابطه بسیار قوی |
6/. تا 8/. | رابطه قوی |
4/. تا 6/. | رابطه متوسط |
2/. تا 4/. | رابطه کم (یا ضعیف) |
صفر تا 2/. | فقدان رابطه یا رابطه ناچیز |
(منبع: میلر، 299:1380)
مثال
در این بخش به بررسی همبستگی بین دو متغیر بهره هوشی و معدل مقطع کارشناسی می پردازیم. انتظار داریم که دو متغیر با یکدیگر همبسته باشند، به نحوی که با افزایش بهره هوشی، معدل افزایش بیابد. به عبارت دیگر انتظار داریم افرادی که بهره هوشی بالاتری دارند، معدل بالاتری هم داشته باشند. هر دو متغیر کمّی بوده و در سطح سنجش فاصله ای/نسبی قرار دارند. با توجه به این که هردو متغیر در سطح سنجش فاصله ای/نسبی هستند از همبستگی پیرسون استفاده میکنیم. از پیش فرض های آزمون همبستگی پیرسون نرمال بودن توزیع متغیر در جمعیّت آماری است، در این مثال فرض می کنیم که این پیشفرض برقرار است و توزیع داده ها نرمال است
اجـ ـرا
مسیر زیر را دنبال میکنیم:
Analyze—>Correlate—>Bivariate
نتـ ـایج
در جدول بعد، نتایج آزمون همبستگی پیرسون بین دو متغیر بهره هوشی و معدل کارشناسی نشان داده شده است. نخست به سطح معنی داری به دست آمده نگاه میکنیم. سطح معنی داری به دست آمده برابر با 600/. به دست آمده است که بسیار بیشتر از مقدار مفروض 05/.است. در نتیجه بین دو متغیر بهره هوشی و معدل مقطع کارشناسی پاسخگویان رابطه معنی داری وجود ندارد. با توجه به این که بین دو متغیر همبستگی وجود ندارد، شدّت و جهت رابطه مورد بررسی قرار نمی گیرد.
Correlations | ||||
بهره هوشی | معدل کارشناسی | |||
بهره هوشی | Pearson Correlation | 1 | -.053 | |
Sig. (2-tailed) | .600 | |||
N | 100 | 100 | ||
معدل کارشناسی | Pearson Correlation همبستگی پیرسون | -.053 | 1 | |
Sig. (2-tailed) | .600 | |||
N | 100 | 100 |
گـ ـزارش:
در گزارش نتایج می نویسیم:
از آزمون همبستگی پیرسون جهت آزمون رابطه دو متغیر بهره هوشی و معدل مقطع کارشناسی استفاده شد. بین میزان بهره هوشی و معدل مقطع کارشناسی همبستگی معنی دار مشاهده نشد (600/. = P و 100= n و 053/.- = r ). در نتیجه از جنبه آماری دو متغیر بهره هوشی و معدل کارشناسی با یکدیگر رابطه ندارند.
***
(فرض می کنیم رابطه به دست آمده معنی دار باشد و سطح معنی داری به دست آمده برابر با 004/. شده است و ضریب پیرسون برابر با 45/. به دست آمده است. در این صورت به این صورت گزارش می دهیم:
آزمون همبستگی پیرسون نشان داد که بین میزان بهره هوشی و معدل مقطع کارشناسی همبستگی وجود دارد (004/. = P و 100= n و 45/. = r ). جهت رابطه بین بهره هوشی و معدل کارشناسی مثبت است. شدت همبستگی به دست آمده در حد متوسط است. واریانس توضیح داده شده 20.3% است. نتایج نشان می دهد دانشجویانی که بهره هوشی بالاتری دارند، معدل کارشناسی بالاتری هم کسب کرده اند.
چندنکته:
ضریب همبستگی پیرسون را با r نشان می دهند.
واریانس توضیح داده شده همان 2 r است که از به توان دو رساندن ضریب همبستگی پیرسون ( r ) به دست می آید و نشان دهنده واریانس مشترک دو متغیر است.
بهتر است نمودار پراکندگی دو متغیر بهره هوشی و معدل در گزارش ذکر شود (قبل از نتایج آزمون همبستگی پیرسون).
تحقیق روش تحقیق همبستگی
قدرت تصور در انسان يکی از ويژگيهای مهم می باشد اين قدرت به فرد امکان می دهد تا در مورد موضوعات مختلف بيانديشد، حدس بزند، تصوير ذهنی ايجاد کند و راه حل های مختلف پيشنهاد کند. در تحقيق به روش علمی که حول محور يک مسئله يا مشکل صورت می پذيرد، از اين قدرت تصور و حدس ذهنی برای تدوين يک يا چند فرضيه برای نتيجه تحقيق استفاده می شود. از اين رو می توان فرضيه تحقيق را يک حدس علمی يا پيش داوری دانست که بوسيله ی جمع آوری حقايقی که منجر به قبولی يا رد آن فرضيه می شود مورد آزمايش قرار می گيرد. به عبارت دیگر فرضيه را راه حل پيشنهادی محقق برای مسئله تحقيق و يا نتيجه تحقيق دانسته اند.
گاهی اوقات از يک فرمول برای بيان فرضيه استفاده می شود، بدين شکل که:”اگر چنين و چنان رخ دهد چنين و چنان خواهد شد” . اين تعبير ساده و روان به محقق امکان می دهد تا بتواند در جريان تدوين مسئله تحقيق خود، فرضيه ای مناسب که به طور قطعی با کل پژوهش او در ارتباط خواهد بود، بيان نمايد. نکته با اهميت در اینجا آن است که محقق بايد دقت نمايد که در جريان انجام تحقيق ، او صرفا” قصد آزمايش فرضيه را دارد نه اثبات آن ، البته چنانچه در پايان تحقيق ،نتايج ، حاکی از اثبات فرضيه او بود می تواند آن موضوع به شکل يک بحث علمی مورد عنايت قرار دهد.
در هنگام بيان فرضيه محقق به بررسی روابط بين متغيرها می پردازد. به طور متداول اين بيان به سه شکل صورت خواهد گرفت:
- بررسی رابطه علت و معلولی بين دو يا چند متغير
- بررسی همبستگی و شدت آن بين دو يا چند متغير
- بررسی و مقايسه ميزان تفاوت تاثير دو يا چند متغير بر يک يا چند متغير
محقق برای تهيه فرضيه مناسب تحقيق عمدتا از منابع علمی در اختيار خود کمک خواهد گرفت. يافته های علمی قبلی که در زمينه موضوع تحقيق انجام گرفته است يکی از منابع اصلی برای تهيه فرضيه است. همچنين تجربيات شخصی فرد محقق می تواند نقش مهمی را در اين زمينه ايفا نمايد. گاهی اوقات فرضيه هائی مبتنی بر خيال و با مطالب غير علمی، الهامات و پيشنهادات غير عادی هم مطرح می شود که در برخی موارد به نتايج خوبی نيز نائل گرديده است.
در این راستا، تحقیق همبستگی (Correlation) که خود زیر مجموعه تحقیقات توصیفی (غیر آزمایشی) است با این هدف انجام میشود که رابطه میان متغیرها (Variables) را نشان دهد. تحقیق همبستگی بر اساس هدف تحقیق به دسته کلی تقسیم میشود. دسته اول به تحقیقاتی مربوط میشود که هدف بررسی همبستگی دو متغیری است، بدین معنی که محقق میخواهد رابطه دو به دو متغیرهای موجود را بررسی کند.
دسته دوم تحقیقات مربوط به تحلیل رگرسیون (Regression Analysis) را شامل میشود که هدف آن پیش بینی تغییرات یک یا چند متغیر وابسته (ملاک) با توجه به متغیرهای مستقل (پیش بینی) است. و در نهایت دسته سوم مربوط به تحلیل ماتریس همبستگی (Correlafion Matrix Analysis) و آزمودن روابط ساختاری مبتنی بر نظریه ها انجام میگیرد. هر یک از این سه دسته تحقیق روش آماری خود را برای تجزیه و تحلیل لازم دارد که برخی از این روشها به دلیل پیچیدگی توسط کامپیوتر انجام میشود.
فصل دوم: انواع روشهای تحقیق و تحلیل
روش تحقیق همبستگی دو متغیری
در این نوع تحقیق همبستگی هدف تعیین میزان همبستگی تغییرات دو متغیر میباشد. در اکثر تحقیقات همبستگی دو متغیری از مقیاس فاصلهای با پیش فرض توزیع طبیعی دو متغیر در جامعه برای اندازه گیری استفاده میشود و معمولا برای تجزیه و تحلیل دادهها از فرمول ضریب همبستگی گشتاوری پیرسون (Pearson Product Moment Correlation Coefficient) استفاده میشود.
توجه:
برای دانلود فایل کامل ورد لطفا اقدام به خرید نمایید.
لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
سفارش تحقیق
به منظور سفارش تحقیق مرتبط با رشته تخصصی خود بر روی کلید زیر کلیک نمایید.
ضریب همبستگی در بورس چه کاربردی دارد؟
ضریب همبستگی روابط میان دو متغیر را به ما نشان میدهد. یعنی با توجه به این ضریب میتوانیم بفهمیم که آیا دو متغیر با هم ارتباط دارند یا نه. و اگر ارتباطی دارند جهت این ارتباط کدام طرفی است. از این ضریب در بازار بورس به منظور پیدا کردن روابط بین سهام استفاده میکنیم.
بارها توسط افراد مختلف در حوزههای شغلی گوناگون یا در رسانهها به منظور تحلیل آماری و بیان نتایج تحقیقات، واژه ضریب همبستگی یا اصطلاح لاتین آن Correlation را شنیدهایم. یکی از مهم ترین کاربردهای این مفهوم در بازارهای مالی است، که در این مطلب به بررسی آن و مباحث پیرامونی در حوزه بازار بورس میپردازیم. ضریب همبستگی یک ابزار آماری برای تعیین نوع و درجه رابطه متغیرهای کمی با یکدیگر است. این انواع روش های همبستگی Correlation مفهوم یکی از معیارهای تشخیص میزان همبستگی دو متغیر میباشد. در واقع این ضریب نوع رابطه یعنی مستقیم یا معکوس بودن و شدت رابطه یعنی بازه ۱+ تا ۱- را نشان میدهد. همچنین اگر میان دو متغیر مذکور رابطهای وجود نداشته باشد، مقدار ضریب همبستگی برابر صفر است.
انواع روابط بین متغیرها
الف ) رابطه مستقیم
اندازه عددی بدست آمده برای این ضریب بین 1- تا 1+ می باشد که به کمک آن می توان درجه ای را که دو متغیر بایکدیگر در ارتباط هستند را نشان داد. در صورتی که عدد همبستگی بین صفر تا 1 باشد نوع رابطه را مستقیم می نامیم.
رابطه مستقیم به این معنی است که با افزایش یک متغیر انتظار می رود که اندازه متغیر دیگر نیز افزایش یابد و برعکس با کاهش اندازه یک متغیر اندازه متغیر دیگر نیز کاهش یابد. به عنوان مثال وقتی گفته می شود بین مصرف میوه با شادابی پوست رابطه مستقیمی وجود دارد یعنی که اگر فردی مصرف میوه اش بیشتر باشد انتظار می رود که پوست شادابتری داشته باشد و یا اینکه افراد هر چقدر پوست شادابتری داشته باشند انتظار می رود که مصرف میوه آنها نیز بالاتر باشد و برعکس.
ب ) رابطه معکوس
در صورتی که عدد ضریب همبستگی بین صفر تا 1 – باشد رابطه را از نوع معکوس می نامیم. رابطه معکوس به این معنی است که با افزایش یک متغیر انتظار می رد که اندازه متغیر دیگر نیز کاهش یابد و برعکس با کاهش اندازه یک متغیر اندازه متغیر دیگر نیز افزایش یابد. به عنوان مثال وقتی گفته می شود بین مصرف سیگار با طول عمر رابطه معکوس وجود دارد یعنی که اگر فردی مصرف سیگارش بیشتر باشد انتظار می رود که طول عمر کمتری داشته باشد و یا اینکه افراد هر چقدر طول عمر بیشتری داشته باشند انتظار می رود که کمتر سیگار مصرف کرده باشند و برعکس.
علاوه بر این درصورتی که مقدار عددی همبستگی برابر 1+ باشد همبستگی را مستقیم کامل و اگر برابر 1 – باشد آن را معکوس کامل و در صورتی که برابر صفر باشد می گوییم بین دو متغیر هیچگونه رابطه ای وجود ندارد.
انواع روش های همبستگی Correlation
- ضریب همبستگی پیرسون
- ضریب همبستگی اسپیرمن
- ضریب همبستگی تاو کندال
بطور کلی:
۱- اگر هر دو متغیر با مقیاس رتبهای باشند از شاخص تاوکندال استفاده میشود.
۲- اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از ضریب همبستگی پیرسون استفاده میشود.
۳- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از ضریب همبستگی اسپیرمن استفاده میشود.
در پایین فقط ضریب همبستگی پیرسون را با هم بررسی میکنیم.
ضریب همبستگی پیرسون
ضریب همبستگی پیرسون را میتوانیم معروفترین انواع این ضریب بدانیم. وقتی تعداد دادهها زیاد است و توزیعها هم نرمال هستند بهتر است از ضریب پیرسون استفاده کنیم تا شدت و جهت روابط بین دو متغیر را بررسی کنیم. این ضریب مقدار وابستگی بین دو متغیر تصادفی را خیلی خوب به ما نشان میدهد.
در ابتدای مقاله فرمول مربوط به این ضریب را بررسی کردیم. وقتی دادهها را در فرمول جایگذاری کنیم، نتایج مختلفی به دست میآید. در تفسیر ضریب همبستگی پیرسون به طور کلی سه حالت زیر را داریم:
- مثبت: اعداد مثبت نشان از رابطهی مستقیم بین دو متغیر دارند. یعنی اگر مقدار یکی از متغیرها زیاد شود، مقدار متغیر دیگری هم زیاد میشود. در مورد کاهش مقدار هم این قضیه برقرار است. اگر نتیجهی محاسبات اعدادی بین ۰.۸ تا ۱ باشند، در تفسیر ضریب همبستگی باید بگوییم که این دو متغیر رابطهای بسیار قوی دارند. اعداد بین ۰.۸ تا ۰.۶ نشان از رابطهای قوی دارند. همچنین اعداد ۰.۶ تا ۰.۴ رابطهای متوسط را نشان میدهند و مقادیر کمتر نشان از رابطهی ضعیف دارد. اگر نتیجه در بازهی ۰.۲ تا صفر قرار بگیرد رابطه بین دو متغیر یا خیلی ناچیز است یا اصلا رابطهای وجود ندارد.
- منفی: این نتیجه برعکس قبلی است. یعنی اگر ضریب همبستگی پیرسون بین دو متغیر منفی باشد، وقتی مقدار یک متغیر زیاد شود، مقدار متغیر دیگری کم میشود و بالعکس.
- صفر: کاملا مشخص است که ضریب صفر به چه معناست. این عدد نشان میدهد که رابطهای بین دو متغیر تصادفی وجود ندارد.
چه نکاتی در همبستگی دو نماد وجود دارد؟
دو نکته اصلی درباره همبستگی بین نمادها نهفته است که میتواند به تصمیم گیری بهتر به ما کند.
نکته اول: امکان ندارد که عمده پرتفوی بورسی یک شرکتی چندین روز مثبت باشد ولی خود آن سهم منفی باشد. اگر چنین شد، فرصت خوبی برای سرمایه گذاری ایجاد شده است و هر چقدر این اختلاف بیشتر شود سود بیشتری در انتظار خواهد بود. برای مثال اگر دیدید فملی چندین روز صف خرید است و وسپه در حال درجا زدن است، احتمالا وسپه گزینه خوبی برای خرید است چرا که درصدی از فملی برای وسپه است و از رشد آن متنفع خواهد شد. این مسئله تحت عنوان NAV سهم در تحلیل بنیادی مورد بررسی قرار میگیرد.
نکته دوم: برخی نمادها به علت پرتفوی مشابه، رفتار قیمتی مشابهی دارند. این موضوع به یک سرمایه گذار حرفه ای کمک خواهد کرد که موقعیتهای خوبی را شناسایی کند. برای مثال اگر در یک روز وسپه صف خرید بود و تاصیکو منفی، احتمالا میتوانید تاصیکو را حداقل به دید کوتاه مدت خریداری کنید چرا که ضریب همبستگی بین این دو نماد بالاست.
مثالی از کاربرد ضریب همبستگی در ترکیب پرتفوی
این بخش را با یک مثال از کاربرد ضریب همبستگی در چیدمان سبد سهام ادامه میدهیم. دو شرکت الف و ب را در نظرتان مجسم کنید. حالا فرض کنید شرکت الف ۱۱۰ میلیون سهم شرکت ب را که در گروه خودروسازی فعال است خریداری کرده است. پس انتظار داریم وقتی در سهم ب اتفاقات مثبتی رخ بدهد، شاهد تعدیل مثبت در سهم الف باشیم. یعنی با افزایش قیمت سهم ب، سهم الف هم سودسازی خوبی را خواهد داشت. هر چه شرکت الف درصد مالکیت بالاتری داشته باشد، سودسازیاش هم بیشتر خواهد بود. اما این اطلاعات به چه دردی میخورند؟
قضیه خیلی ساده است. اگر سهم شرکت الف را خریدهاید دیگر سهم شرکت ب را نخرید. درست است که این دو شرکت سهام متفاوتی دارند اما به هر حال با یکدیگر همبستگی دارند. اینطور میتوانید سبد سهامی بچینید که پوشش ریسک در آن رعایت شده است. این مسئله یکی از اصول اولیه برای متنوع سازی سبد سهام است. اگر به ترکیب سهامداران شرکتهای فعال در بورس ایران نگاه کنید، میتوانید ببینید عمده سهامداران شرکتها چه کسانی هستند. به این ترتیب نه تنها ریسک را کم کردهاید بلکه ممکن است بازده بیشتری را هم به دست بیاورید.
تحلیل آماری چیست؟ همه چیز درباره انجام تحلیل آماری پایان نامه
علم آمار از گذشته تا کنون نقشی اساسی و مهم را در علوم مختلف داشته است که از اولین کاربردهای آن می توان به مالیات گیری و خراج بستن بر دارایی ها اشاره کرد.
بعدها در دوره رنسانس، از علم آمار استفاده نوینی صورت گرفت و به آمار استنباطی نیز توجه زیادی شد. در دنیای امروز علم آمار و آمارگیری بسیار پررونق است. اکثر دانش آموختگان حداقل یکبار مطلبی را در ارتباط با آمار خوانده اند و نیاز بوده تا با استفاده از روش های آمارگیری، تحلیل هایی انجام دهند.
این مساله اهمیت تحلیل آماری را نشان می دهد بنابراین نیاز است که به طور کامل بدانیم تحلیل آماری چیست و چگونه انجام می شود؟
تحلیل آماری چیست؟
اگر بخواهیم تحلیل آماری را دقیق تر توضیح دهیم باید ابتدا به تعریف واژه ی آمار بپردازیم.
آمار را علم طبقه بندی دیتاها و اطلاعات، علم تصمیم گیری های مبتنی بر منطق، برنامه ریزی های دقیق و علم توصیف و تبیین آنچه از مشاهدات می توان فهمید توصیف می کنند.
آمار را می توان علم و هنر جمع آوری و تجزیه و تحلیل داده ها دانست به طوری که در نهایت بتوان آنچه استخراج شده است را تفسیر و استنباط کرد.
امروزه به ندرت می توان بدون استفاده از تحلیل آماری اقدام به تفسیر و تحلیل نتایج به دست آمده از تحقیقات و پژوهش های علمی کرد.
به گزارشی که شامل جداول و نمودارهای آماری و تحلیل و تفسیر آن ها می شود تحلیل آماری گفته می شود.
تحلیل آماری تصویری روشن و توصیفی دقیق از داده ها ارائه می دهد. این داده ها ممکن است به صورت داده های آماری آماده باشند (مانند نرخ تورم، درآمد، و مانند آن) یا از طریق پرسشنامه ها جمع آوری شده باشند.
فرآیند تحلیل آماری را در دو بخش تقسیم میکنند: آمار استنباطی و آمار توصیفی.
مبنا و پایه این تقسیم بندی به دو دسته استنباطی و توصیفی این است که بشر با توجه به محدودیت زمان و سایر امکانات تصمیم گرفت تا از استقراء استفاده کند. بر اساس استقراء می توان یافته هایی را که از «اجزا» به دست می آید را به «کل» نسبت داد.
این بدین معناست که یافته های مربوط به نمونه ها، در مورد کل جامعه که احتمالا به دلیل محدودیت ها و مشکلات دیگر قابل بررسی به صورت کلی نبوده اند، حکم می شود.
آمار توصیفی چیست؟
وقتی توده ای از اطلاعات برای تحقیق جمع آوری می شود باید ابتدا سازماندهی و خلاصه شود به طوری که به صورت معنی داری قابل درک انواع روش های همبستگی Correlation و ارتباط باشند.
برای این منظور از روش آمار توصیفی (Descriptive Statistics) استفاده می شود.
در تجزیه و تحلیل توصیفی، پژوهشگر داده های جمع آوری شده را با کمک روش های آمار توصیفی از جمله تنظیم جداول توزیع فراوانی، خلاصه کرده و به کمک نمودار آنها را نمایش می دهد و در نهایت با کمک سایر شاخص های آمار توصیفی آن ها را خلاصه می کند.
روش های آمار توصیفی
تشکیل جدول توزیع فراوانی
به سازماندهی داده ها یا مشاهدات به صورت طبقات همراه با فراوانی هر طبقه، توزیع فراوانی گفته می شود.
برای اینکه یک جدول توزیع فراوانی داشته باشید باید دامنه تغییرات، تعداد طبقات و حجم طبقات توسط فرمول های مربوطه محاسبه شود و سپس جدول توزیع در دو ستون x (ستون طبقات) و F (فراوانی طبقات) تشکیل شود.
پس از این مرحله، در صورت تمایل یا لزوم، پژوهشگر می تواند شاخص های دیگری نظیر فراوانی تراکمی، فراوانی تراکمی درصدی را محاسبه کند.
تشکیل جدول توزیع فراوانی یک روش اقتصادی و آسان برای نمایش انبوهی از داده های نامنظم است. اما در طبقه بندی کردن، ممکن است برخی از اطلاعات به علت خطای گروه بندی از دست بروند که در نهایت در محاسبه شاخص های آماری نیز تاثیر بگذارند. ولی مقدار آن اغلب ناچیز است و اشکال عمده ای ایفا نمی کند.
ترسیم نمودار
نمودارها ابزار مناسبی برای نمایش تصویری اطلاعات هستند که انواع مختلفی دارند که از آن ها می توان به نمودار هیستوگرام، نمودار ستونی، نمودار چند ضلعی تراکمی، نمودار دایره ای، نموداری سری های زمانی و موارد دیگر اشاره کرد.
محاسبه شاخص های مرکزی
در محاسبات آماری لازم است که ویژگی ها و موقعیت کلی داده ها تعیین شود.
به همین دلیل شاخص های مرکزی که سه نوع نما(Mode)، میانه(Median) و میانگین (Mean) هستند محاسبه می شوند. هر یک از این شاخص ها کاربرد خاص خود را دارند. مثلا در تحقیقاتی که مقیاس اندازه گیری داده ها حداقل فاصله ای است «میانگین» بهترین شاخص است اما در تحقیقاتی که مقیاس اندازه گیری داده انواع روش های همبستگی Correlation ها رتبه ای یا اسمی باشد «میانه» یا «نما» مناسب تر هستند.
محاسبه شاخص های پراکندگی
شاخص های پراکندگی برخلاف شاخص های مرکزی هستند چرا که میزان پراکندگی با تغییراتی که در بین داده های یک توزیع (نتایج تحقیق) وجود دارد را نشان می دهند.
شاخص هایی که به این منظور در تحقیقات مورد استفاده قرار می گیرند شامل دامنه تغییرات، انحراف چارگی (Quartile Deviation)، واریانس (Variance) و انحراف استاندارد (Standard Deviation) می شود. پس از محاسبه شاخص های مرکزی و پراکندگی می توان نمره های استاندارد را محاسبه و منحنی طبیعی (Z) را ترسیم کرد.
محاسبه همبستگی
در برخی از تحقیقات، پژوهشگر می خواهد رابطه بین دو متغیر را تعیین کند و به همین منظور باید از روش های همبستگی (Correlation) استفاده کند.
در محاسبه همبستگی، نوع مقیاس اندازه گیری دخالت دارد و به طور کلی به دو دسته پارامتری و ناپارامتری تقسیم می شود.
رگراسیون و پیش بینی
رگراسیون (Regression) به روشی برای مطالعه سهم یک یا چند متغییر مستقل در پیش بینی متغیر وابسته گفته می شود.
از تحلیل رگراسیون می توان در تحقیقات توصیفی (غیر آزمایشی) و تحقیقات آزمایشی استفاده کرد. با توجه به نوع تحقیق و متغیرهای آن، روش متنوعی برای تحلیل رگراسیون وجود دارد که برخی از آنها عبارتند از رگراسیون خطی، رگراسیون انحنایی، رگراسیون لوجیستیک و تحلیل کواریانس.
آمار استباطی چیست؟
در آمار توصیفی به جمع آوری و تمرکز به روی خصوصیات و ویژگی های مهم داده ها می پردازیم و به نوعی می توان گفت نقش آمار توصیفی جمع آوری، خلاصه کردن و توصیف اطلاعات کمی به دست آمده از نمونه ها یا جامعه است اما قرار نیست کار یک محقق با توصیف اطلاعات به پایان برسد بلکه باید آنچه از بررسی گروه نمونه به دست آورده است را به گروه های مشابه بزرگ تر تعمیم دهد.
در آمار استنباطی (Inferential)، پژوهشگر با استفاده از مقادیر نمونه، آماره ها را محاسبه کرده و با کمک تخمین یا آزمون فرض آماری، آماره ها را به پارامترهای جامعه تعمیم می دهد. هدف آمار استنباطی، برآورد کردن خصوصیات و ویژگی های جامعه آماری است.
آزمون های آمار استنباطی
آزمون های آماری مورد استفاده جهت تجزیه و تحلیل اطلاعات به دست آمده از یک گروه کوچک یا نمونه و تعمیم آن به جامعه مورد نظر با توجه به مقیاس اندازه گیری متغیرها، به دو گروه پارامتریک و ناپارامتریک تقسیم می شوند.
آزمون های پارامتریک، به تجزیه و تحلیل اطلاعات در سطح مقیاس فاصله ای و نسبتی می پردازند و حداقل شاخص آماری آ نها، میانگین و واریانس است.
در حالیکه آزمون های ناپارامتریک، به تجزیه و تحلیل اطلاعات در سطح مقیاس اسمی و رتبه ای میپردازند که شاخص آماری آنها میانه و نما است.
آمار پارامتریک نیاز به پیش فرض هایی در مورد جامعه ای که از آن نمونه گیری صورت گرفته است دارد.
به عنوان مهم ترین پیش فرض در آمار پارامتریک، فرض می شود که توزیع جامعه نرمال است اما آمار ناپارامتریک مستلزم هیچگونه فرضی در مورد توزیع نیست. به همین دلیل، در بسیاری از تحقیقات علوم انسانی که با مقیاس های کیفی سنجیده شده و فاقد توزیع (Free of distribution) هستند از شاخص های آماری ناپارامتریک استفاده می کنند.
از آزمون های پارامتریک آمار استنباطی می توان به آزمون t، تحلیل واریانس (ANOVA)، تحلیل واریانس چند عاملی(MANOVA)، تحلیل کوواریانس چند عاملی و ضریب همبستگی گشتاوری پیرسون نام برد.
همچنین از آزمون های ناپارامتریک نیز می توان به آزمون علامت تک نمونه، آزمون علامت زوجی، ویلکاکسون، مان_ویتنی، کروسکال_والیس، فریمن، آزمون تقارن توزیع و کولموگروف-اسمیرنف اشاره کرد.
ابزار لازم برای انجام تحلیل آماری
یکی از ابزار اصلی مورد نیاز برای انجام و نگارش تحلیل آماری، نرم افزارهای تحلیل آماری از جمله نرم افزار spss است.
در واقع تصور انجام تحلیل آماری بدون استفاده از نرم افزارهای آماری غیرممکن است چرا که این کار نیاز به عملیات آماری خاصی دارد که محاسبات آن به صورت دستی نه تنها بسیار سخت و زمان بر است بلکه غیرممکن به نظر می رسد.
به همین دلیل بسیاری از محققان و دانشجویان برای تکمیل بخش آماری پایان نامه خود (فصل 4 پایان نامه) تحلیل آماری را برون سپاری می کنند یعنی این کار را به شرکت های آماری می سپارند تا کاملا دقیق و با تخصص خاصی انجام بگیرد.
تحلیل آماری در تمام زمینه ها از جمله پژوهش های دانشگاهی پرکاربرد است اما برای انجام آن نیاز به مهارت و دقت بالایی در استفاده از نرم افزارهای تحلیل آماری است که پیچیدگی های خاص خودشان را دارند، به همین دلیل چه شرکت ها و سازمان ها چه بسیاری از دانشجویان انجام تحلیل آماری خود را به شرکت هایی می سپارند که سال ها در این زمینه فعالیت داشته اند، با این کار اطمینان حاصل می کنند تحلیل آماری پروژهشان با دقت و اطمینان بالایی انجام می گیرد.
تفاوت بین کواریانس و همبستگی(correlation)
در تئوری احتمال و آمار عبارت کواریانس و همبستگی (correlation) خیلی شبیه هم هستند. هر دو پارامتر میزان ارتباط خطی بین دو تا متغیر را توصیف می کنند و با کمک کواریانس و همبستگی میتوان میزان وابستگی یک متغیر را به یک متغیر دیگه بررسی کرد. ولی تفاوت این دو در چی هست؟
در آمار از کواریانس و همبستگی برای بررسی ارتباط خطی دو بین دو متغیر و اندازه گیری میزان وابستگی آنها به همدیگر استفاده میکنند! ولی آیا هر دو عین هم هستند؟ خیر!
همبستگی جهت و شدت ارتباط بین دو متغیر را مشخص میکند، در حالی که کواریانس تنها جهت ارتباط بین دو متغیر را مشخص میکند.
اجازه بدهید با یک مثال ساده این مسئله را بررسی کنیم، فرض کنید که در یک مطالعه ای میخواهید قد افراد در جامعه ایران را بررسی کنید و ببینید قد افراد به چه صورت توزیع شده است. برای اینکار یک تعداد افراد از جامعه را به صورت کاملا تصادفی انتخاب میکنید و قد این افراد را اندازه گیری میکنید. فرض کنید که قد افرادی که بررسی کردید به صورت زیر است.
الان شما یک مجموعهای تک متغیره دارید و اگر بخواهید این مجموعه را از لحاظ آماری بررسی کنید نیاز به محاسبه میانگین و واریانس قد افراد دارید.
میانگین
حد وسط یک داده را مشخص میکند. در این مثال میانگین قد افراد در جامعه را مشخص میکند.
واریانس
میزان تغییرات حول میانگین را مشخص می کند. واریانس کمتر به این معنی است که قد افراد جامعه خیلی شبیه هم هست ولی اگر واریانس زیاد باشد نشان میدهید که قد افراد در جامعه رنج تغییرات زیادی دارد.
خب با همین دو پارامتر میتوانیم به صورت آماری یک مجموعه تک متغیره را بررسی کنیم.
حال بیایید مثال را تغییر بدهیم، فرض کنید که میخواهید ارتباط بین وزن و قد افراد را بررسی کنید. و برای همین منظور تعدادی از افراد جامعه را به صورت کاملا تصادفی انتخاب میکنید، و وزن و قد این افراد را اندازه گیری میکنید .
در این مسئله میخواهیم بدانیم که چه ارتباط خطی بین قد و وزن افراد وجود دارد. برای مثال میخواهیم بدانیم آیا با تغییر قد افراد وزن افراد هم تغییر کرده یا نه. و اگر تغییر کرده این تغییرات به چه شکل بوده است. برای بررسی ارتباط خطی بین دو تا مجموعه تک متغیره از کواریانس و همبستگی استفاده می کنند.
کواریانس
کواریانس دو تا متغیر را میتوان طبق رابطه زیر محاسبه کرد و مقدار بدست آمده یک عددی بین [-∞ :+ ∞] است.
کواریانس تنها جهت(direction) ارتباط بین دو متغیر را مشخص میکند. بعنی مشخص میکند که ارتباط بین دو متغیر مثبت ، منفی و یا صفر است.
- اگر کواریانس بین قد و وزن افراد مثبت باشد، یعنی با افزایش قد افراد جامعه، وزنها انها هم افزایش می یابد و یا برعکس با کاهش قد افراد، وزن افراد نیز کاهش می یابد
- اگر کواریانس بین قد و وزن افراد منفی باشد، یعنی با افزایش قد افراد جامعه، وزنها افراد کاهش می یابد و یا برعکس با کاهش قد افراد، وزن افراد نیز افزایش می یابد
- اگر کواریانس بین قد و وزن افراد صفر باشد، یعنی با افزایش یا کاهش قد افراد جامعه، وزنها انها تغییری نمیکند.
حال فرض کنید کواریانس بین دو تا متغیر شده عدد 15، به نظر شما این عدد چه چیزی را مشخص میکند؟ آیا میتوان گفت ارتباط خطی بین دو متغیر بسیار زیاد هست؟ نه نمیتوان گفت. ما از روی کواریانس بدست آمده تنها جهت ارتباط بین دو متغیر را میتوانیم متوجه شویم، ولی اینکه شدت ارتباط بین دو متغیر چقدر هست را نمیتوان متوجه شد!
همبستگی
همسبتگی همان کواریانس نرمال شده است و طبق رابطه زیر میتوانیم همبتسگی بین دو متغیر را بدست آوریم.
همسبتگی یک عدد بین [-1:+1] هست و جهت(direction) و شدت-میزان (strength) ارتباط خطی بین دو متغیر را مشخص میکند.
هر چقدر همبستگی به عدد +1 نزدیک باشد، به معنی است که بین دو متغیر خطی ارتباط خطی مثبت زیادی وجود دارد. یعنی با افزایش قد افراد، وزن افراد هم افزایش پیدا میکند و برعکس. یک ارتباط مستقیم بین دو متغیر وجود دارد.
هر چقدر همبستگی به عدد -1 نزدیک باشد، به معنی است که بین دو متغیر خطی ارتباط خطی منفی زیادی وجود دارد. یعنی با افزایش قد افراد، وزن افراد کاهش پیدا میکند و برعکس. یک انواع روش های همبستگی Correlation ارتباط عکس بین دو متغیر وجود دارد.
اگر همبستگی دو متغیر نزدیک به عدد 0 باشد معنیش این است که با تغییرات مقدار یک متغیر، تغییر در مقدار متغیر دوم اتفاق نمی افتد!
حالا سوال اینه که اگر هر دو مجموعه به جای تک متغیره، چند متغیره باشند چیکار کنیم؟ از چه ابزاری برای بررسی ارتباط بین دو مجموعه چند متغیره استفاده کنیم؟
یکی از الگوریتمهای معروفی که میتوان با کمک آن ارتباط خطی بین دو مجموعه چند متغیره را بررسی کرد الگوریتم CCA ، تجزیه همسبتگی کانونی است. در دوره واسط مغز کامپیوتر مبتنی بر SSVEP به طور کامل تئوری این روش رو توضیح داده و پیاده سازی کرده ایم.
دیدگاه شما