ضریب تعیین(R ۲(R-squared correlation میزان ارتباط خطی بین دو متغیر را اندازه گیری میکند. R ۲نسبت تغییرات متغیر وابسته را که میتوان به متغیر مستقل نسبت داد اندازه گیری میکند. در تعاریف موجود به R ۲، ضریب تعیینیا ضریب تشخیص نیز گفته میشود. به بیان ساده میتوان گفت ضریب تعییننشان میدهد که چند درصد تغییرات متغیرهای وابسته در یک مدل رگرسیونی با متغیر مستقل تبیین میشود. به عبارت دیگر، ضریب تشخیص یا (R ۲) نشان میدهد که چه میزان یا مقدار از تغییرات متغیر وابسته مساله تحت تاثیر متغیر مستقل مساله بوده است. همچنین تا چه حدی مابقی تغییرات متغیر وابسته مساله مربوط به سایر عوامل موجود در مساله است.
همبستگی قدرت رابطه بین یک متغیر مستقل و وابسته را توضیح میدهد، ضریب تعیینیا ضریب تشخیص بیانگر این است که تا چه اندازه واریانس یک متغیر واریانس متغیر دوم را توضیح میدهد. ضریب تعییننمیتواند تعیین نماید که آیا مدل برازش شده دارای شیب است یا نه و به همین دلیل باید نمودارهای باقیمانده را مورد ارزیابی قرارداد.
محاسبه R ۲
همان طور که بیان شد ضریب تعیینیا ضریب تشخیص نشان دهنده نسبت کل تغییر متغیر وابسته (حول میانگین خود) که بوسیله واریانس متغیرهای مستقل در رگرسیون توضیح داده میشود است. فرمول این شاخص به صورت زیر است:


R ۲مقداری بین ۰ و ۱۰۰٪ به دست میآید که عدد ۰٪ نشان میدهد که مدل هیچ ارتباطی با متغییرهای وابسته و مستقل را در اطراف میانگین آن نشان نمیدهد و عدد ۱۰۰٪ نشان میدهد که مدل همه تغییرپذیری دادههای پاسخ در اطراف میانگین آن را تبیین مینماید.
در مورد ارزیابی دو مدل، با ضرایب تعیین تقریبا یکسان، مدلی انتخاب میشود که خطای استاندارد مقادیر خطا (باقیمانده) کمتری داشته باشد.
ضریب تعیین تعدیل شده
مقدار تعدیل شده ضریب تعیین، میزان R2 را با توجه به متغیرهای مستقل اضافه شده به خط رگرسیون و با توجه به عرض از مبداهای جدید ، تعدیل و اصلاح مینماید .هرچه تفاوت بین R2 و R2 تعدیل شده کمتر باشدنشان میدهد که متغیرهای مستقل که به مدل اضافه شده اند به درستی انتخاب شده اند. فرمول این ضریب به صورت زیر است:

همانطور که در فرمول مشاهده میشود، وقتی تعداد مشاهدات (N) کم و تعداد پیش بینیها (متغیرهای مستقل P) زیاد باشد، تفاوت بین ضریب تعیینو ضریب تعیین تعدیل شدهبسیار زیاد خواهد بود زیرا نسبت (N-P-1)/(N-1) بزرگتر از ۱ خواهد شد. همچنین هنگامیکه تعداد مشاهدات در مقایسه با تعداد پیش بینیها بسیار زیاد باشد، مقدار ضریب تعیینبه ضریب تعیین اصلاح شده نزدیک و نزدیکتر میشود، زیرا نسبت (N-P-1)/(N-1) به ۱ نزدیک میشود.
تفاوت ضریب تعیینو ضریب تعیین تعدیل شده
تفاوت مهم میان ضریب تعیینو ضریب تعیین تعدیل شدهاین است که R ۲بر این فرض است که هرمتغیر مستقل مشاهده شده در مدل، در تغییرات متغیر وابسته نقش دارد. بنابراین درصد نشان داده شده ضریب تشخیص براساس تاثیر همه متغیرهای مستقل بر متغیر وابسته است. در صورتی که درصد نشان داده شده توسط R ۲تعدیل شده فقط حاصل از تاثیر واقعی متغیرهای مستقل مدل بر وابسته است نه همه متغیرهای مستقل. میتوان گقت R ۲تعدیل شده قابل اطمینان تر است.
محاسبه ضریب تعییندر SMARTPLS
در نرم افزار Smart PLS میتوان شاخص R ۲را محاسبه کرد. این شاخص به عنوان یکی از شاخصهای برازش مدل در تحلیل مدل معادلات ساختاری استفاده میشود. پس از اجرای مدل با دستور PLS ALGORITHM یک پنجره باز میشود. در میان شاخصهای QUALITY CRITERIA، گزینه اول R SQUARE است.

با کلیک بر روی گزینه R SQUARE یک پنجره دیگر باز میشود. این پنجره سه ستون دارد. MATRIX، R SQUARE و R SQUARE ADJUSTED. ستون ماتریکس بیانگر ماتریس و یا جدول عددی مقادیر ضریب تشخیص متغیرهای وابسته مدل است. R SQUARE نمودار ضریب تعییناست و R SQUARE ADJUSTED مقدار ضریب تعیین تعدیل شدهاست.
در ادامه نمودارهای این دو شاخص نشان داده شده است:


در این نمودارها اگر مقدار ضریبها مناسب نباشد، نمودار به صورت قرمز نشان داده میشود.
محاسبه ضریب تعییندر EVIEWS
در نرم افزار Eviews میتوان شاخص R ۲را محاسبه کرد. پس از اجرای مدل رگرسیونی در میان خروجیهای تعیین صحت مدل، اولین معیارها، شاخص ضریب تعیینو ضریب تعیین تعدیل شدههستند.

منبع
Chicco, Davide; Warrens, Matthijs J.; Jurman, Giuseppe (2021). “The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation