• محاسبه همبستگی کندال. ضرایب همبستگی رتبه های اسپیرمن، کندال، فچنر. حل این دو معادله می دهد

    یکی از عوامل محدود کننده اعمال معیارها بر اساس فرض نرمال بودن حجم نمونه است. تا زمانی که نمونه به اندازه کافی بزرگ باشد (مثلاً 100 مشاهده یا بیشتر)، می توانید فرض کنید که توزیع نمونه نرمال است، حتی اگر مطمئن نباشید که توزیع متغیر در جامعه نرمال است. با این حال، اگر نمونه کوچک است، این آزمون‌ها تنها در صورتی باید استفاده شوند که اطمینان وجود داشته باشد که متغیر واقعاً به طور معمول توزیع شده است. با این حال، هیچ راهی برای آزمایش این فرض بر روی یک نمونه کوچک وجود ندارد.

    استفاده از معیارهای مبتنی بر فرض نرمال بودن نیز توسط مقیاس اندازه گیری محدود می شود (به فصل مفاهیم اولیه تجزیه و تحلیل داده ها مراجعه کنید). در روش های آماری مانند t-test، رگرسیون و ... فرض بر این است که داده های اصلی پیوسته هستند. با این حال، موقعیت‌هایی وجود دارد که داده‌ها به‌جای اندازه‌گیری دقیق، به سادگی رتبه‌بندی می‌شوند (در مقیاس ترتیبی اندازه‌گیری می‌شوند).

    یک مثال معمولی رتبه‌بندی سایت‌ها در اینترنت است: جایگاه اول توسط سایت با حداکثر تعداد بازدیدکننده، موقعیت دوم توسط سایت با حداکثر تعداد بازدیدکننده در بین سایت‌های باقی‌مانده (در میان سایت‌هایی که از آن‌ها می‌باشد) اشغال می‌شود. اولین سایت حذف شد) و غیره. با دانستن رتبه‌بندی‌ها می‌توان گفت که تعداد بازدیدکنندگان یک سایت از تعداد بازدیدکنندگان سایت دیگر بیشتر است، اما نمی‌توان گفت چقدر بیشتر است. تصور کنید 5 سایت دارید: A، B، C، D، E که در 5 مکان برتر قرار دارند. فرض کنید در ماه جاری ترتیب زیر را داشتیم: A، B، C، D، E و در ماه قبل: D، E، A، B، C. سوال این است که آیا تغییرات قابل توجهی در رتبه‌بندی‌ها رخ داده است. از سایت ها یا نه؟ در این شرایط، بدیهی است که ما نمی توانیم از آزمون t برای مقایسه این دو مجموعه داده استفاده کنیم و در حال حرکت به حوزه محاسبات احتمالی خاص هستیم (و هر آزمون آماری حاوی یک محاسبه احتمالی است!). ما تقریباً به این صورت استدلال می کنیم: چقدر احتمال دارد که تفاوت در ترتیبات دو سایت به دلایل کاملاً تصادفی باشد یا این تفاوت بسیار زیاد است و نمی توان آن را به طور تصادفی توضیح داد. در این بحث ها ما فقط از رتبه یا جایگشت سایت ها استفاده می کنیم و از نوع خاصی از توزیع تعداد بازدیدکنندگان آنها استفاده نمی کنیم.

    برای تجزیه و تحلیل نمونه های کوچک و برای داده های اندازه گیری شده در مقیاس های ضعیف، از روش های ناپارامتریک استفاده می شود.

    مروری کوتاه بر رویه های ناپارامتریک

    اساساً برای هر معیار پارامتری، حداقل یک جایگزین ناپارامتریک وجود دارد.

    به طور کلی، این روش ها در یکی از دسته های زیر قرار می گیرند:

    • معیارهای تفاوت برای نمونه های مستقل؛
    • معیارهای تفاوت برای نمونه های وابسته.
    • ارزیابی میزان وابستگی بین متغیرها

    به طور کلی، رویکرد به معیارهای آماری در تجزیه و تحلیل داده ها باید عمل گرایانه باشد و بار ملاحظات نظری غیرضروری نداشته باشد. با یک کامپیوتر STATISTICA که در اختیار دارید، به راحتی می توانید چندین معیار را برای داده های خود اعمال کنید. با دانستن برخی از مشکلات روش ها، با آزمایش راه حل مناسب را انتخاب خواهید کرد. توسعه نمودار کاملاً طبیعی است: اگر نیاز به مقایسه مقادیر دو متغیر دارید، از آزمون t استفاده می کنید. با این حال، باید به خاطر داشت که بر اساس فرض نرمال بودن و برابری واریانس ها در هر گروه است. رهایی از این مفروضات منجر به آزمایش های ناپارامتریک می شود که به ویژه برای نمونه های کوچک مفید است.

    توسعه آزمون t منجر به تجزیه و تحلیل واریانس می شود که زمانی استفاده می شود که تعداد گروه های مقایسه شده بیشتر از دو باشد. توسعه متناظر رویه‌های ناپارامتریک منجر به تحلیل واریانس ناپارامتریک می‌شود، اگرچه بسیار ضعیف‌تر از تحلیل واریانس کلاسیک است.

    برای ارزیابی وابستگی، یا به بیان تا حدودی بزرگ، درجه نزدیکی اتصال، ضریب همبستگی پیرسون محاسبه می شود. به بیان دقیق، استفاده از آن دارای محدودیت هایی است، به عنوان مثال، با نوع مقیاسی که داده ها در آن اندازه گیری می شوند و غیر خطی بودن وابستگی، بنابراین، به عنوان جایگزین، ضرایب همبستگی ناپارامتریک یا به اصطلاح رتبه ای. همچنین استفاده می شود که برای مثال برای داده های رتبه بندی شده استفاده می شود. اگر داده ها در مقیاس اسمی اندازه گیری شوند، طبیعی است که آنها را در جداول اقتضایی ارائه کنیم که از آزمون کای دو پیرسون با تغییرات و تنظیمات مختلف برای دقت استفاده می کنند.

    بنابراین، در اصل، تنها چند نوع معیار و رویه وجود دارد که بسته به مشخصات داده ها، باید بدانید و بتوانید از آنها استفاده کنید. شما باید تعیین کنید که کدام معیار باید در یک موقعیت خاص اعمال شود.

    روش های ناپارامتریک زمانی مناسب هستند که حجم نمونه کوچک باشد. اگر داده های زیادی وجود داشته باشد (مثلاً n> 100)، اغلب استفاده از آمار ناپارامتریک منطقی نیست.

    اگر حجم نمونه بسیار کوچک باشد (به عنوان مثال، n = 10 یا کمتر)، آنگاه سطوح معنی‌داری برای آن دسته از آزمون‌های ناپارامتریک که از تقریب نرمال استفاده می‌کنند، تنها می‌توانند به عنوان تخمین‌های تقریبی در نظر گرفته شوند.

    تفاوت بین گروه های مستقل. اگر دو نمونه (مثلاً نر و ماده) وجود داشته باشد که باید با توجه به مقدار متوسطی مانند فشار خون متوسط ​​یا تعداد گلبول‌های سفید خون مقایسه شوند، می‌توان از آزمون تی نمونه مستقل استفاده کرد.

    جایگزین های ناپارامتریک برای این آزمون، آزمون سری Wald-Wolfowitz، Mann-Whitney)/n است که x i مقدار i ام، n تعداد مشاهدات است. اگر متغیر دارای مقادیر منفی یا صفر (0) باشد، میانگین هندسی قابل محاسبه نیست.

    میانگین هارمونیک

    از میانگین هارمونیک گاهی اوقات برای میانگین فرکانس ها استفاده می شود. میانگین هارمونیک با فرمول محاسبه می شود: HS = n/S(1/x i) که در آن HS میانگین هارمونیک است، n تعداد مشاهدات، x i مقدار مشاهده با عدد i است. اگر متغیر دارای صفر (0) باشد، میانگین هارمونیک قابل محاسبه نیست.

    واریانس و انحراف معیار

    واریانس نمونه و انحراف معیار رایج ترین معیارهای مورد استفاده برای تغییرپذیری (تغییر) در داده ها هستند. واریانس به عنوان مجموع انحرافات مجذور مقادیر متغیر از میانگین نمونه، تقسیم بر n-1 (اما نه بر n) محاسبه می شود. انحراف استاندارد به عنوان جذر برآورد واریانس محاسبه می شود.

    محدوده

    محدوده یک متغیر معیاری از نوسان است که به عنوان حداکثر منهای حداقل محاسبه می شود.

    محدوده چارک

    محدوده فصلی، طبق تعریف، عبارت است از: چارک بالا منهای چارک پایین (صدک 75 درصد منهای 25 درصد). از آنجایی که صدک 75 درصد (چرک بالایی) مقدار سمت چپ است که 75 درصد مشاهدات آن است و صدک 25 درصد (چرک پایین) مقداری است که در سمت چپ آن 25 درصد مشاهدات مربوط به چارک است. محدوده بازه حول میانه است که شامل 50 درصد مشاهدات (مقادیر متغیر) است.

    عدم تقارن

    چولگی مشخصه شکل توزیع است. اگر چولگی منفی باشد، توزیع به سمت چپ منحرف می شود. اگر چولگی مثبت باشد، توزیع به سمت راست منحرف می شود. چولگی توزیع نرمال استاندارد 0 است. چولگی مربوط به ممان سوم است و به صورت زیر تعریف می شود: چولگی = n × M 3 /[(n-1) × (n-2) × s 3 ]، که در آن M 3 است: (x i -xmean x) 3، s 3 - انحراف استاندارد به توان سوم افزایش یافته است، n - تعداد مشاهدات.

    اضافی

    کورتوز مشخصه شکل توزیع است، یعنی معیاری از وضوح قله آن (نسبت به توزیع نرمال، که کشش آن 0 است). به عنوان یک قاعده کلی، توزیع‌هایی با قله تندتر از توزیع نرمال دارای کشیدگی مثبت هستند. توزیع هایی که پیک آنها تیزتر از قله توزیع نرمال است، کشش منفی دارند. کورتوز با لحظه چهارم همراه است و با فرمول تعیین می شود:

    کشیدگی = /[(n-1) × (n-2) × (n-3) × s 4 ]، که در آن M j است: (x-x میانگین x، s 4 انحراف استاندارد به توان چهارم است، n برابر است تعداد مشاهدات

    نظریه مختصر

    ضریب همبستگی کندال زمانی استفاده می شود که متغیرها با دو مقیاس ترتیبی نشان داده شوند، مشروط بر اینکه هیچ رتبه مرتبطی وجود نداشته باشد. محاسبه ضریب کندال با شمارش تعداد مسابقات و وارونگی همراه است.

    این ضریب در داخل متغیر است و با فرمول محاسبه می شود:

    برای محاسبه، همه واحدها بر اساس ویژگی رتبه بندی می شوند. برای تعدادی از ویژگی های دیگر، برای هر رتبه، تعداد رتبه های بعدی بیش از یک داده شده (آنها را با علامت گذاری می کنیم) و تعداد رتبه های بعدی زیر رتبه داده شده (آن ها را با نشان می دهیم) محاسبه می شود.

    می توان نشان داد که

    و ضریب همبستگی رتبه کندال را می توان به صورت

    برای آزمون فرضیه صفر در مورد برابری ضریب همبستگی رتبه کلی کندال به صفر تحت فرضیه رقیب در سطح معناداری، لازم است نقطه بحرانی محاسبه شود:

    حجم نمونه کجاست - نقطه بحرانی منطقه بحرانی دو طرفه که از جدول تابع لاپلاس با برابری پیدا می شود.

    اگر دلیلی برای رد فرضیه صفر وجود نداشته باشد. همبستگی رتبه ای بین ویژگی ها ناچیز است.

    اگر فرضیه صفر رد شود. بین نشانه ها همبستگی رتبه ای معنی داری وجود دارد.

    مثال حل مسئله

    وظیفه

    هنگام استخدام هفت نامزد برای موقعیت های خالی، دو آزمون ارائه شد. نتایج آزمون (در امتیاز) در جدول نشان داده شده است:

    تست نامزد 1 2 3 4 5 6 7 1 31 82 25 26 53 30 29 2 21 55 8 27 32 42 26

    ضریب همبستگی رتبه کندال بین نتایج آزمون برای دو آزمون را محاسبه کنید و اهمیت آن را در یک سطح ارزیابی کنید.

    راه حل مشکل

    ضریب کندال را محاسبه کنید

    رتبه های صفت عامل به طور دقیق به ترتیب صعودی مرتب شده اند و رتبه های مربوط به ویژگی موثر به صورت موازی نوشته می شوند. برای هر رتبه، از تعداد رتبه‌های بعد از آن، تعداد رتبه‌های بیشتر از آن شمارش شده (در ستون ) و تعداد رتبه‌هایی که از نظر ارزش کمتر هستند (در ستون گنجانده شده است).

    1 1 6 0 2 4 3 2 3 3 3 1 4 6 1 2 5 2 2 0 6 5 1 0 7 7 0 0 مجموع 16 5

    ضریب همبستگی کندال زمانی استفاده می شود که متغیرها با دو مقیاس ترتیبی نشان داده شوند، مشروط بر اینکه هیچ رتبه مرتبطی وجود نداشته باشد. محاسبه ضریب کندال با شمارش تعداد مسابقات و وارونگی همراه است. بیایید این روش را در مثال مشکل قبلی در نظر بگیریم.

    الگوریتم حل مسئله به صورت زیر است:

      داده های جدول را دوباره قالب بندی می کنیم. 8.5 به طوری که یکی از ردیف ها (در این مورد ردیف ایکسط) رتبه بندی شد. به عبارت دیگر، ما جفت ها را با هم عوض می کنیم ایکسو y به ترتیب درست و داده ها را در ستون های 1 و 2 جدول وارد می کنیم. 8.6.

    جدول 8.6

    ایکس من

    y من

    2. "درجه رتبه بندی" ردیف 2 را تعیین کنید ( yمن). این روش به ترتیب زیر انجام می شود:

    الف) مقدار اول سری بدون رتبه "3" را بگیرید. شمارش تعداد رتبه ها زیرعدد داده شده، که بیشترارزش مقایسه شده 9 چنین مقدار وجود دارد (اعداد 6، 7، 4، 9، 5، 11، 8، 12 و 10). در ستون "تصادف" عدد 9 را وارد می کنیم. سپس تعداد مقادیری را که می شماریم کمترسه. 2 چنین مقدار وجود دارد (رتبه های 1 و 2)؛ عدد 2 را در ستون "inversion" وارد کنید.

    ب) عدد 3 را دور بیندازید (ما قبلاً با آن کار کرده ایم) و این روش را برای مقدار بعدی "6" تکرار کنید: تعداد مسابقات 6 است (رتبه های 7، 9، 11، 8، 12 و 10)، تعداد موارد وارونگی 4 است (رتبه های 1، 2، 4 و 5). در ستون "تصادف" عدد 6 و در ستون "وارونگی" عدد 4 را وارد می کنیم.

    ج) به روش مشابه، این روش تا پایان ردیف تکرار می شود. باید به خاطر داشت که هر مقدار "کار شده" از بررسی بیشتر حذف می شود (فقط رتبه هایی که زیر این عدد قرار دارند محاسبه می شوند).

    توجه داشته باشید

    برای اینکه در محاسبات اشتباه نکنید، باید در نظر داشت که با هر "گام" مجموع تصادفات و وارونگی ها یک بار کاهش می یابد. این قابل درک است، با توجه به اینکه هر بار یک مقدار از در نظر گرفتن حذف می شود.

    3. مجموع مسابقات محاسبه می شود (R)و مجموع وارونگی ها (س); داده ها در یک و سه فرمول ضریب کندال قابل تعویض (8.10) وارد می شوند. محاسبات مربوطه انجام می شود.

    تی (8.10)

    در مورد ما:

    روی میز. برنامه های XIV مقادیر بحرانی ضریب برای یک نمونه معین هستند: τ cr. = 0.45; 0.59. مقدار تجربی به دست آمده با مقدار جدول مقایسه می شود.

    نتیجه

    τ = 0.55 > τ cr. = 0.45. همبستگی از نظر آماری برای سطح 1 معنادار است.

    توجه داشته باشید:

    در صورت لزوم (به عنوان مثال، در صورت عدم وجود جدول مقادیر بحرانی)، اهمیت آماری تیکندال را می توان با فرمولی مانند زیر تعریف کرد:

    (8.11)

    جایی که S* = P - Q+ 1 اگر پ< Q ، و S* = P - Q - 1 اگر P > Q.

    ارزش های zبرای سطح معنی‌داری متناظر با معیار پیرسون مطابقت دارد و طبق جداول مربوطه یافت می‌شود (در پیوست موجود نیست. برای سطوح معنی‌داری استاندارد z cr = 1.96 (برای β 1 = 0.95) و 2.58 (برای β2 = 0.99). ضریب همبستگی کندال از نظر آماری معنادار است اگر z > z kr

    در مورد ما S* = P - Q– 1 = 35 و z= 2.40، یعنی نتیجه اولیه تأیید می شود: همبستگی بین علائم برای سطح 1 معناداری از نظر آماری معنی دار است.

    ضریب همبستگی رتبهماهیت کلی وابستگی غیر خطی را مشخص می کند: افزایش یا کاهش در علامت حاصل با افزایش فاکتوریل. این نشانگر تنگ بودن یک رابطه غیرخطی یکنواخت است.

    واگذاری خدمات. این ماشین حساب آنلاین محاسبه می کند ضریب همبستگی رتبه کندالبرای تمام فرمول های اساسی، و همچنین ارزیابی اهمیت آن.

    دستورالعمل. مقدار داده (تعداد ردیف) را مشخص کنید. راه حل به دست آمده در یک فایل Word ذخیره می شود.

    ضریب پیشنهادی کندال بر اساس روابطی از نوع "بیشتر-کمتر" ساخته شده است که اعتبار آن هنگام ساخت مقیاس ها مشخص شده است.
    بیایید چند شی را جدا کنیم و رتبه آنها را با توجه به یک ویژگی و بر اساس ویژگی دیگر مقایسه کنیم. اگر طبق این ویژگی، رتبه‌ها ترتیب مستقیمی را تشکیل دهند (یعنی ترتیب سری طبیعی)، آنگاه 1+ به جفت تخصیص داده می‌شود، اگر برعکس باشد، 1- است. برای جفت انتخاب شده، واحدهای مثبت و منفی مربوطه (با ویژگی X و با ویژگی Y) ضرب می شوند. نتیجه به وضوح +1 است. اگر رتبه های یک جفت از هر دو ویژگی در یک دنباله باشند و -1 اگر به ترتیب معکوس باشند.
    اگر ترتیب رتبه‌بندی برای هر دو ویژگی برای همه جفت‌ها یکسان باشد، مجموع واحدهای تخصیص یافته به همه جفت‌های اشیا حداکثر و برابر با تعداد جفت‌ها است. اگر ترتیب رتبه‌بندی همه جفت‌ها معکوس شود، آنگاه –C 2 N . در حالت کلی، C 2 N = P + Q، که در آن P تعداد واحدهای مثبت و Q منفی اختصاص داده شده به جفت ها هنگام مقایسه رتبه های آنها برای هر دو ویژگی است.
    مقدار ضریب کندال نامیده می شود.
    از فرمول می توان دریافت که ضریب τ تفاوت بین نسبت جفت اشیایی است که در هر دو ویژگی دارای ترتیب یکسانی هستند (در رابطه با تعداد همه جفت ها) و نسبت جفت اشیایی که ندارند. همان دستور
    به عنوان مثال، مقدار ضریب 0.60 به این معنی است که 80٪ از جفت ها دارای ترتیب مشابهی از اشیاء هستند، و 20٪ ندارند (80٪ + 20٪ = 100٪؛ 0.80 - 0.20 = 0.60). آن ها τ را می توان به عنوان تفاوت بین احتمالات تصادفی و عدم تصادفی ترتیبات در هر دو ویژگی برای یک جفت شیء انتخاب شده به طور تصادفی تفسیر کرد.
    در حالت کلی، محاسبه τ (به طور دقیق تر، P یا Q)، حتی برای N از مرتبه 10، دشوار است.
    بیایید نشان دهیم که چگونه محاسبات را ساده کنیم.


    مثال. رابطه بین حجم تولید صنعتی و سرمایه گذاری در سرمایه ثابت در 10 منطقه یکی از مناطق فدرال فدراسیون روسیه در سال 2003 با داده های زیر مشخص می شود:


    ضرایب همبستگی رتبه اسپیرمن و کندال را محاسبه کنید. اهمیت آنها را در α=0.05 بررسی کنید. نتیجه گیری در مورد رابطه بین حجم تولید صنعتی و سرمایه گذاری در دارایی های ثابت در مناطق تحت بررسی فدراسیون روسیه.

    راه حل. رتبه هایی را به ویژگی Y و عامل X اختصاص دهید.


    بیایید داده ها را بر اساس X مرتب کنیم.
    در سری Y، در سمت راست 3، 7 رتبه بزرگتر از 3 وجود دارد، بنابراین، 3 باعث ایجاد عبارت 7 در P می شود.
    در سمت راست 1 8 رتبه بزرگتر از 1 قرار دارد (اینها 2، 4، 6، 9، 5، 10، 7، 8 هستند)، یعنی. P شامل 8 و غیره می شود. در نتیجه P = 37 و با استفاده از فرمول هایی که داریم:

    ایکسYرتبه X، dxرتبه Y, d yپس
    18.4 5.57 1 3 7 2
    20.6 2.88 2 1 8 0
    21.5 4.12 3 2 7 0
    35.7 7.24 4 4 6 0
    37.1 9.67 5 6 4 1
    39.8 10.48 6 9 1 3
    51.1 8.58 7 5 3 0
    54.4 14.79 8 10 0 2
    64.6 10.22 9 7 1 0
    90.6 10.45 10 8 0 0
    37 8


    فرمول های ساده شده:




    که در آن n حجم نمونه است. z kp نقطه بحرانی ناحیه بحرانی دو طرفه است که از جدول تابع لاپلاس با برابری Ф(z kp)=(1-α)/2 پیدا می شود.
    اگر |τ|< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - فرضیه صفر رد می شود. بین ویژگی های کیفی همبستگی رتبه ای معنی دار وجود دارد.
    اجازه دهید نقطه بحرانی z kp را پیدا کنیم
    Ф(z kp) = (1-α)/2 = (1 - 0.05)/2 = 0.475

    بیایید نقطه بحرانی را پیدا کنیم:

    از آنجایی که τ > T kp - فرضیه صفر را رد می کنیم. همبستگی رتبه ای بین نمرات در دو آزمون معنی دار است.

    مثال. با توجه به داده های مربوط به حجم کار ساخت و ساز و نصب که به تنهایی انجام می شود و تعداد کارکنان 10 شرکت ساختمانی در یکی از شهرهای فدراسیون روسیه، رابطه بین این ویژگی ها را با استفاده از ضریب کندل تعیین می کند.

    راه حلبا ماشین حساب پیدا کنید
    رتبه هایی را به ویژگی Y و عامل X اختصاص دهید.
    بیایید اجسام را طوری مرتب کنیم که رتبه آنها در X نشان دهنده اعداد طبیعی باشد. از آنجایی که رتبه بندی های اختصاص داده شده به هر جفت از این سری مثبت است، مقادیر "+1" موجود در P فقط توسط جفت هایی ایجاد می شود که رتبه های آنها در Y یک ترتیب مستقیم را تشکیل می دهد.
    محاسبه آنها با مقایسه متوالی رتبه های هر جسم در ردیف Y با موارد فولادی آسان است.
    ضریب کندال.

    در حالت کلی، محاسبه τ (به طور دقیق تر، P یا Q)، حتی برای N از مرتبه 10، دشوار است. بیایید نشان دهیم که چگونه محاسبات را ساده کنیم.

    یا

    راه حل.
    بیایید داده ها را بر اساس X مرتب کنیم.
    در سری Y، در سمت راست 2، 8 رتبه بزرگتر از 2 وجود دارد، بنابراین 2 باعث ایجاد عبارت 8 در P می شود.
    در سمت راست 4، 6 رتبه بزرگتر از 4 قرار دارد (اینها 7، 5، 6، 8، 9، 10 هستند)، یعنی. P شامل 6 و غیره می شود. در نتیجه P = 29 و با استفاده از فرمول هایی که داریم:

    ایکسYرتبه X، dxرتبه Y, d yپس
    38 292 1 2 8 1
    50 302 2 4 6 2
    52 366 3 7 3 4
    54 312 4 5 4 2
    59 359 5 6 3 2
    61 398 6 8 2 2
    66 401 7 9 1 2
    70 298 8 3 1 1
    71 283 9 1 1 0
    73 413 10 10 0 0
    29 16


    فرمول های ساده شده:


    برای آزمون فرضیه صفر در سطح معناداری α که ضریب همبستگی رتبه کلی کندال در فرضیه رقابتی Н 1: τ≠ 0 برابر با صفر است، لازم است نقطه بحرانی محاسبه شود:

    که در آن n حجم نمونه است. z kp نقطه بحرانی ناحیه بحرانی دو طرفه است که از جدول تابع لاپلاس با برابری Ф(z kp)=(1 - α)/2 پیدا می شود.
    اگر |τ| T kp - فرضیه صفر رد می شود. بین ویژگی های کیفی همبستگی رتبه ای معنی دار وجود دارد.
    اجازه دهید نقطه بحرانی z kp را پیدا کنیم
    Ф(z kp) = (1 - α)/2 = (1 - 0.05)/2 = 0.475
    با توجه به جدول لاپلاس، z kp = 1.96 را پیدا می کنیم
    بیایید نقطه بحرانی را پیدا کنیم:

    از آنجایی که تی

    در هنگام رتبه بندی، کارشناس باید عناصر ارزیابی شده را به ترتیب صعودی (نزولی) ترجیح خود مرتب کند و به هر یک از آنها رتبه هایی را در قالب اعداد طبیعی اختصاص دهد. در رتبه بندی مستقیم، ارجح ترین عنصر دارای رتبه 1 (گاهی 0) و کم ترجیح ترین عنصر دارای رتبه m است.

    در صورتی که کارشناس نتواند رتبه بندی دقیقی انجام دهد به دلیل اینکه به نظر وی برخی از عناصر از نظر اولویت یکسان هستند، در این صورت می توان رتبه های یکسانی را به این عناصر اختصاص داد. برای اطمینان از برابری مجموع رتبه ها با مجموع مکان های عناصر رتبه بندی شده، به اصطلاح از رتبه های استاندارد شده استفاده می شود. رتبه استاندارد شده میانگین حسابی تعداد عناصر سری رتبه بندی شده است که از نظر اولویت برابر هستند.

    مثال 2.6.کارشناس شش مورد را بر اساس اولویت به شرح زیر رتبه بندی کرد:

    سپس رتبه های استاندارد شده این عناصر خواهد بود

    بنابراین، مجموع رتبه های اختصاص داده شده به عناصر برابر با مجموع اعداد طبیعی خواهد بود.

    دقت بیان اولویت توسط عناصر رتبه بندی به طور قابل توجهی به اصلی بودن مجموعه ارائه ها بستگی دارد. روش رتبه بندی مطمئن ترین نتایج را می دهد (با توجه به درجه نزدیکی ترجیح آشکار و "درست")، زمانی که تعداد عناصر ارزیابی شده بیش از 10 نباشد. قدرت محدود کننده مجموعه ارائه نباید از 20 تجاوز کند.

    پردازش و تجزیه و تحلیل رتبه بندی ها به منظور ایجاد یک رابطه ترجیحی گروهی بر اساس ترجیحات فردی انجام می شود. در این مورد، وظایف زیر را می توان تعیین کرد: الف) تعیین محکم بودن ارتباط بین رتبه بندی دو متخصص در عناصر مجموعه ارائه ها. ب) تعیین رابطه بین دو عنصر با توجه به نظرات فردی اعضای گروه در مورد ویژگی های مختلف این عناصر. ج) ارزیابی اجماع نظرات کارشناسان در یک گروه متشکل از بیش از دو کارشناس.

    در دو مورد اول، از ضریب همبستگی رتبه ای به عنوان معیاری برای تنگی رابطه استفاده می شود. بسته به اینکه فقط رتبه بندی سخت یا غیر دقیق مجاز است، از ضریب همبستگی رتبه کندال یا اسپیرمن استفاده می شود.

    ضریب همبستگی رتبه کندال برای مسئله (الف)

    جایی که متر- تعداد عناصر؛ r 1 i -رتبه اختصاص یافته توسط کارشناس اول منعنصر -ام؛ r 2 i -همان، کارشناس دوم.

    برای مسئله (ب)، مؤلفه‌های (2.5) به معنای زیر هستند: m تعداد ویژگی‌های دو عنصر مورد ارزیابی است. r 1 i(r 2 i) - رتبه مشخصه i در رتبه بندی عنصر اول (دوم) که توسط گروهی از متخصصان تعیین شده است.

    رتبه بندی دقیق از ضریب همبستگی رتبه استفاده می کند آراسپیرمن:


    که اجزای آن همان معنایی را دارند که در (2.5) آمده است.

    ضرایب همبستگی (2.5)، (2.6) از -1 تا +1 متغیر است. اگر ضریب همبستگی +1 باشد، به این معنی است که رتبه‌بندی‌ها یکسان است. اگر برابر با 1- باشد، − متضاد هستند (رتبه بندی ها معکوس یکدیگر هستند). برابری ضریب همبستگی به صفر به این معنی است که رتبه بندی ها به صورت خطی مستقل (ناهمبسته) هستند.

    از آنجایی که با این رویکرد (کارشناس یک ابزار اندازه گیری با خطای تصادفی است)، رتبه بندی های فردی تصادفی در نظر گرفته می شود، مشکل آزمون آماری فرضیه در مورد معنی دار بودن ضریب همبستگی به دست آمده مطرح می شود. در این مورد، از آزمون نیمن-پیرسون استفاده می شود: آنها با سطح معنی داری معیار α تنظیم می شوند و با دانستن قوانین توزیع ضریب همبستگی، مقدار آستانه را تعیین می کنند. ca، که مقدار بدست آمده از ضریب همبستگی با آن مقایسه می شود. ناحیه بحرانی راست دست است (در عمل معمولاً ابتدا مقدار معیار محاسبه می شود و سطح معنی داری از آن تعیین می شود که با سطح آستانه مقایسه می شود. α ).

    ضریب همبستگی رتبه τ کندال، برای m > 10، توزیعی نزدیک به نرمال با پارامترهای زیر دارد:

    که در آن M [τ] انتظار ریاضی است. D [τ] پراکندگی است.

    در این مورد، جداول تابع توزیع نرمال استاندارد استفاده می شود:

    و مرز τ α منطقه بحرانی به عنوان ریشه معادله تعریف می شود

    اگر مقدار محاسبه‌شده ضریب τ≥ τ α باشد، در نظر گرفته می‌شود که رتبه‌بندی‌ها مطابقت واقعاً خوبی دارند. به طور معمول، مقدار α در محدوده 0.01-0.05 انتخاب می شود. برای m ≤ 10، توزیع m در جدول آورده شده است. 2.1.

    بررسی اهمیت ثبات دو رتبه بندی با استفاده از ضریب ρ اسپیرمن به همان ترتیب با استفاده از جداول توزیع دانشجویی برای m > 10 انجام می شود.

    در این مورد، ارزش

    دارای توزیعی است که به خوبی با توزیع دانش آموز تقریب شده است متر– 2 درجه آزادی در متر> 30، توزیع ρ با توزیع نرمال مطابقت خوبی دارد که دارای M [ρ] = 0 و D [ρ] = .

    برای m ≤ 10، اهمیت ρ با استفاده از جدول بررسی می شود. 2.2.

    اگر رتبه بندی ها سختگیرانه نیستند، ضریب اسپیرمن

    که ρ طبق (2.6) محاسبه می شود.

    که در آن k 1 , k 2 تعداد گروه های مختلف رتبه های غیر دقیق به ترتیب در رتبه های اول و دوم است. ل i تعداد رتبه های یکسان است من-گروه در استفاده عملی از ضرایب همبستگی رتبه اسپیرمن ρ و کندال τ، باید در نظر داشت که ضریب ρ نتیجه دقیق تری از نظر حداقل واریانس ارائه می دهد.

    جدول 2.1.توزیع ضریب همبستگی رتبه کندال