• Kendall korelasyon hesaplaması. Spearman, kendall, fechner sıralarının korelasyon katsayıları. Bu iki denklemi çözmek,

    Normallik varsayımına dayalı kriterlerin uygulanmasını sınırlayan faktörlerden biri de örneklem büyüklüğüdür. Örnek yeterince büyük olduğu sürece (örneğin, 100 veya daha fazla gözlem), değişkenin ana kütledeki dağılımının normal olduğundan emin olmasanız bile, örnek dağılımının normal olduğunu varsayabilirsiniz. Bununla birlikte, örneklem küçükse, bu testler yalnızca değişkenin gerçekten normal dağıldığına dair bir güven varsa kullanılmalıdır. Ancak, bu varsayımı küçük bir örneklem üzerinde test etmenin bir yolu yoktur.

    Normallik varsayımına dayalı kriterlerin kullanımı da ölçüm ölçeğiyle sınırlıdır (bkz. Veri analizinin temel kavramları bölümü). t-testi, regresyon vb. istatistiksel yöntemler, orijinal verilerin sürekli olduğunu varsayar. Ancak, verilerin doğru bir şekilde ölçülmesi yerine basitçe sıralandığı (sıralı bir ölçekte ölçüldüğü) durumlar vardır.

    Tipik bir örnek, İnternet'teki sitelerin derecelendirmeleridir: ilk konum, maksimum ziyaretçi sayısına sahip site tarafından işgal edilir, ikinci konum, kalan siteler arasında (siteler arasında) maksimum ziyaretçi sayısına sahip site tarafından işgal edilir. ilk site kaldırıldı), vb. Derecelendirmeleri bilerek, bir siteye gelen ziyaretçi sayısının diğerine göre daha fazla olduğunu söyleyebiliriz, ancak ne kadar fazla olduğunu söylemek imkansız. 5 siteniz olduğunu hayal edin: İlk 5 sırada yer alan A, B, C, D, E. İçinde bulunduğumuz ayda A, B, C, D, E ve bir önceki ayda D, E, A, B, C sıralamasına sahip olduğumuzu varsayalım. Soru, derecelendirmelerde önemli değişiklikler olup olmadığıdır. sitelerin mi değil mi? Bu durumda, açıkçası, bu iki veri setini karşılaştırmak için bir t-testi kullanamayız ve belirli olasılık hesaplamaları alanına giriyoruz (ve herhangi bir istatistiksel test bir olasılık hesaplaması içerir!). Yaklaşık olarak şu şekilde akıl yürütürüz: İki site düzenlemesindeki farkın tamamen rastgele nedenlerden kaynaklanma olasılığı ne kadardır veya bu fark çok büyüktür ve tamamen şansla açıklanamaz. Bu tartışmalarda, sitelerin yalnızca sıralarını veya permütasyonlarını kullanıyoruz ve sitelere gelen ziyaretçi sayısına ilişkin belirli bir dağıtım türü kullanmıyoruz.

    Küçük örneklerin analizi ve zayıf ölçeklerde ölçülen veriler için parametrik olmayan yöntemler kullanılır.

    Parametrik olmayan prosedürlere kısa bir genel bakış

    Esasen, her parametrik kriter için en az bir parametrik olmayan alternatif vardır.

    Genel olarak, bu prosedürler aşağıdaki kategorilerden birine girer:

    • bağımsız örnekler için fark kriterleri;
    • bağımlı örnekler için fark kriterleri;
    • değişkenler arasındaki bağımlılık derecesinin değerlendirilmesi.

    Genel olarak, veri analizinde istatistiksel kriterlere yaklaşım pragmatik olmalı ve gereksiz teorik düşüncelerle yüklenmemelidir. Elinizin altındaki bir STATISTICA bilgisayarıyla, verilerinize birçok kriteri kolayca uygulayabilirsiniz. Yöntemlerin bazı tuzaklarını bilerek, deneyerek doğru çözümü seçeceksiniz. Arsa gelişimi oldukça doğaldır: iki değişkenin değerlerini karşılaştırmanız gerekirse, t-testini kullanırsınız. Ancak her gruptaki varyansların normallik ve eşitlik varsayımına dayandığı unutulmamalıdır. Bu varsayımlardan kurtulmak, özellikle küçük örnekler için yararlı olan parametrik olmayan testlere yol açar.

    t testinin geliştirilmesi, karşılaştırılan grupların sayısı ikiden fazla olduğunda kullanılan varyans analizine yol açar. Parametrik olmayan prosedürlerin karşılık gelen gelişimi, klasik varyans analizinden çok daha zayıf olmasına rağmen, parametrik olmayan varyans analizine yol açar.

    Bağımlılığı değerlendirmek veya biraz gösterişli bir şekilde ifade etmek gerekirse, bağlantının yakınlık derecesi Pearson korelasyon katsayısı hesaplanır. Açıkça söylemek gerekirse, kullanımının, örneğin verilerin ölçüldüğü ölçeğin türü ve bağımlılığın doğrusal olmaması ile ilgili sınırlamaları vardır, bu nedenle alternatif olarak, parametrik olmayan veya sıra adı verilen korelasyon katsayıları örneğin sıralanmış veriler için kullanılanlar da kullanılır. Veriler nominal bir ölçekte ölçülürse, bunları doğruluk için çeşitli varyasyonlar ve ayarlamalarla Pearson'un ki-kare testini kullanan olasılık tablolarında sunmak doğaldır.

    Dolayısıyla, özünde, verilerin özelliklerine bağlı olarak bilmeniz ve kullanabilmeniz gereken yalnızca birkaç tür kriter ve prosedür vardır. Belirli bir durumda hangi kriterin uygulanması gerektiğini belirlemeniz gerekir.

    Parametrik olmayan yöntemler, örneklem büyüklüğü küçük olduğunda en uygundur. Çok fazla veri varsa (örneğin, n > 100), parametrik olmayan istatistikleri kullanmak genellikle anlamsızdır.

    Örnek boyutu çok küçükse (örneğin, n = 10 veya daha az), normal yaklaşımı kullanan parametrik olmayan testler için anlamlılık düzeyleri yalnızca kaba tahminler olarak kabul edilebilir.

    Bağımsız gruplar arasındaki farklar. Ortalama kan basıncı veya beyaz kan hücresi sayımı gibi bazı ortalama değerlere göre karşılaştırılması gereken iki numune (örneğin, erkekler ve dişiler) varsa, o zaman bağımsız bir numune t-testi kullanılabilir.

    Bu testin parametrik olmayan alternatifleri Wald-Wolfowitz, Mann-Whitney )/n serisi testidir; burada x i, i'inci değerdir, n gözlem sayısıdır. Değişken negatif değerler veya sıfır (0) içeriyorsa, geometrik ortalama hesaplanamaz.

    Harmonik ortalama

    Harmonik ortalama bazen frekansları ortalamak için kullanılır. Harmonik ortalama şu formülle hesaplanır: HS = n/S(1/x i) burada HS harmonik ortalamadır, n gözlem sayısıdır, x i i numaralı gözlemin değeridir. Değişken sıfır (0) içeriyorsa, harmonik ortalama hesaplanamaz.

    Varyans ve standart sapma

    Örnek varyansı ve standart sapma, verilerde en sık kullanılan değişkenlik (varyasyon) ölçüleridir. Varyans, değişkenin değerlerinin örnek ortalamadan sapmalarının karelerinin toplamının n-1'e bölünmesi (ancak n'ye değil) olarak hesaplanır. Standart sapma, varyans tahmininin karekökü olarak hesaplanır.

    kapsam

    Bir değişkenin aralığı, maksimum eksi minimum olarak hesaplanan oynaklığın bir ölçüsüdür.

    Çeyrek aralığı

    Üç aylık aralık, tanımı gereği şu şekildedir: üst çeyrek eksi alt çeyrek (%75 yüzdelik eksi %25 yüzdelik). %75 yüzdelik dilim (üst çeyrek), gözlemlerin %75'inin solundaki değer ve %25'lik yüzdelik dilim (alt çeyrek), gözlemlerin %25'ini oluşturan solundaki değer olduğundan, çeyrek aralık, gözlemlerin %50'sini (değişkenin değerleri) içeren medyanın etrafındaki aralıktır.

    asimetri

    Çarpıklık, bir dağılımın şeklinin bir özelliğidir. Çarpıklık negatif ise dağılım sola çarpıktır. Çarpıklık pozitif ise dağılım sağa çarpıktır. Standart normal dağılımın çarpıklığı 0'dır. Çarpıklık üçüncü momentle ilişkilidir ve şu şekilde tanımlanır: çarpıklık = n × M 3 /[(n-1) × (n-2) × s 3 ], burada M 3 şu: (x i -xortalama x) 3 , s 3 - üçüncü güce yükseltilmiş standart sapma, n - gözlem sayısı.

    Aşırı

    Basıklık, dağılım şeklinin bir özelliğidir, yani zirvesinin keskinliğinin bir ölçüsüdür (basıklığı 0 olan normal dağılıma göre). Genel bir kural olarak, normal dağılımdan daha keskin bir zirveye sahip dağılımlar pozitif basıklığa sahiptir; zirvesi normal dağılımın zirvesinden daha az keskin olan dağılımlar negatif basıklığa sahiptir. Basıklık dördüncü an ile ilişkilendirilir ve aşağıdaki formülle belirlenir:

    basıklık = /[(n-1) × (n-2) × (n-3) × s 4 ], burada M j: (x-x ortalama x , s 4, dördüncü kuvvete standart sapmadır, n, gözlem sayısı

    Kısa teori

    Kendall korelasyon katsayısı, ilişkili sıra olmaması koşuluyla, değişkenler iki sıralı ölçekle temsil edildiğinde kullanılır. Kendall katsayısının hesaplanması, eşleşme ve tersine çevirme sayılarının sayılmasıyla ilişkilidir.

    Bu katsayı, içinde değişir ve aşağıdaki formülle hesaplanır:

    Hesaplama için, tüm birimler özniteliğe göre sıralanır; bir dizi diğer özellik için, her bir sıra için, verileni aşan sonraki sıraların sayısı (bunları ile gösteririz) ve verilenin altındaki müteakip sıraların sayısı (bunları ile gösteririz) hesaplanır.

    gösterilebilir ki

    ve Kendall'ın sıra korelasyon katsayısı şu şekilde yazılabilir:

    Kendall'ın genel sıra korelasyon katsayısının sıfıra eşitliği hakkındaki sıfır hipotezini, rakip hipotez altında anlamlılık düzeyinde test etmek için kritik noktayı hesaplamak gerekir:

    örneklem büyüklüğü nerede; - Laplace fonksiyonu tablosundan eşitlikle bulunan iki taraflı kritik bölgenin kritik noktası

    Sıfır hipotezini reddetmek için bir neden yoksa. Özellikler arasındaki sıralama korelasyonu önemsizdir.

    ise sıfır hipotezi reddedilir. İşaretler arasında önemli bir sıra korelasyonu vardır.

    Problem çözümü örneği

    Görev

    Boş pozisyonlar için yedi adayı işe alırken iki test teklif edildi. Test sonuçları (puan olarak) tabloda gösterilmiştir:

    Ölçek Aday 1 2 3 4 5 6 7 1 31 82 25 26 53 30 29 2 21 55 8 27 32 42 26

    İki test için test sonuçları arasındaki Kendall sıra korelasyon katsayısını hesaplayın ve bir düzeyde önemini değerlendirin.

    sorunun çözümü

    Kendall katsayısını hesaplayın

    Faktör özelliğinin sıraları kesin olarak artan sırada düzenlenir ve etkili özelliğin karşılık gelen sıraları paralel olarak yazılır. Her sıra için, onu takip eden sıra sayısından, kendisinden büyük olan sıraların sayısı ( sütununda yer alır) ve değer olarak daha küçük olan sıraların sayısı ( sütununda yer alır) sayılır.

    1 1 6 0 2 4 3 2 3 3 3 1 4 6 1 2 5 2 2 0 6 5 1 0 7 7 0 0 toplam 16 5

    Kendall korelasyon katsayısı, ilişkili sıra olmaması koşuluyla, değişkenler iki sıralı ölçekle temsil edildiğinde kullanılır. Kendall katsayısının hesaplanması, eşleşme ve tersine çevirme sayılarının sayılmasıyla ilişkilidir. Bu prosedürü önceki problemin örneğinde ele alalım.

    Sorunu çözmek için algoritma aşağıdaki gibidir:

      Tablodaki verileri yeniden biçimlendiriyoruz. 8.5 böylece sıralardan biri (bu durumda sıra X i) derecelendirildi. Başka bir deyişle, çiftleri değiştiririz X Ve y doğru sırada ve verileri tablonun 1. ve 2. sütunlarına giriyoruz. 8.6.

    Tablo 8.6

    X Ben

    y Ben

    2. 2. sıranın "sıralama derecesini" belirleyin ( y Ben). Bu prosedür aşağıdaki sırayla gerçekleştirilir:

    a) sıralanmamış serinin ilk değerini "3" alın. Sıra sayısını sayma altında verilen numara, hangi Daha karşılaştırılan değer. Bu tür 9 değer vardır (6, 7, 4, 9, 5, 11, 8, 12 ve 10 sayıları). "Tesadüf" sütununa 9 sayısını giriyoruz. Sonra değerlerin sayısını sayarız azüç. Bu tür 2 değer vardır (sıra 1 ve 2); "ters çevirme" sütununa 2 sayısını girin.

    b) 3 sayısını atın (zaten onunla çalıştık) ve sonraki "6" değeri için prosedürü tekrarlayın: eşleşme sayısı 6'dır (sıra 7, 9, 11, 8, 12 ve 10), inversiyonlar 4'tür (sıra 1, 2, 4 ve 5). 6 sayısını "tesadüf" sütununa, 4 sayısını "inversiyon" sütununa giriyoruz.

    c) Benzer şekilde sıra sonuna kadar işlem tekrarlanır; her "işlenmiş" değerin daha fazla dikkate alınmadığı unutulmamalıdır (yalnızca bu sayının altında kalan sıralar hesaplanır).

    Not

    Hesaplamalarda hata yapmamak için, her "adım" ile tesadüflerin ve tersine çevirmelerin toplamının bir azaldığı akılda tutulmalıdır; Her seferinde bir değer değerlendirme dışı bırakıldığı için bu anlaşılabilir bir durumdur.

    3. Eşleşmelerin toplamı hesaplanır (R) ve inversiyonların toplamı (Q); veriler bir ve üç değiştirilebilir Kendall katsayı formülüne (8.10) girilir. İlgili hesaplamalar yapılır.

    T (8.10)

    Bizim durumumuzda:

    Masada. XIV Uygulamaları, belirli bir numune için katsayının kritik değerleridir: τ cr. = 0.45; 0,59. Ampirik olarak elde edilen değer tablo değeri ile karşılaştırılır.

    Çözüm

    τ = 0,55 > τ cr. = 0.45. Korelasyon seviye 1 için istatistiksel olarak anlamlıdır.

    Not:

    Gerekirse (örneğin, kritik değerler tablosunun yokluğunda), istatistiksel anlamlılık T Kendall şöyle bir formülle tanımlanabilir:

    (8.11)

    Nerede S* = P - Q+ 1 eğer P< Q , Ve S* = P - Q - 1 eğer P > Q.

    Değerler z karşılık gelen anlamlılık seviyesi için Pearson ölçümüne karşılık gelir ve karşılık gelen tablolara göre bulunur (ekte yer almaz. Standart anlamlılık seviyeleri için z cr = 1,96 (β 1 = 0,95 için) ve 2,58 (β 2 = 0,99 için). Kendall korelasyon katsayısı şu durumlarda istatistiksel olarak anlamlıdır: z > z kr

    bizim durumumuzda S* = P - Q– 1 = 35 ve z= 2.40, yani, ilk sonuç doğrulandı: işaretler arasındaki korelasyon, 1. anlamlılık düzeyi için istatistiksel olarak anlamlıdır.

    Sıra korelasyon katsayısı doğrusal olmayan bağımlılığın genel doğasını karakterize eder: faktöriyel olandaki artışla bileşke işaretteki artış veya azalma. Bu, monoton doğrusal olmayan bir ilişkinin sıkılığının bir göstergesidir.

    hizmet ataması. Bu çevrimiçi hesap makinesi hesaplar Kendal'ın sıralama korelasyon katsayısı tüm temel formüller için ve ayrıca öneminin bir değerlendirmesi.

    Talimat. Veri miktarını (satır sayısı) belirtin. Ortaya çıkan çözüm bir Word dosyasına kaydedilir.

    Kendall tarafından önerilen katsayı, ölçekler oluşturulurken geçerliliği belirlenen “daha ​​​​az” tipindeki ilişkiler temelinde oluşturulmuştur.
    Birkaç nesneyi seçelim ve bir niteliğe ve diğerine göre derecelerini karşılaştıralım. Sıralar bu özelliğe göre doğrudan bir sıra oluşturuyorsa (yani doğal serinin sırası), çifte +1, tersi ise -1 atanır. Seçilen çift için karşılık gelen artı-eksi birimler (X özelliğine göre ve Y özelliğine göre) çarpılır. Sonuç açıkça +1'dir; her iki özelliğin bir çiftinin sıraları aynı sıradaysa ve -1 ters sıradaysa.
    Her iki özellik için sıra sıraları tüm çiftler için aynıysa, tüm nesne çiftlerine atanan birimlerin toplamı maksimumdur ve çiftlerin sayısına eşittir. Tüm çiftlerin sıra sıraları tersine çevrilirse, o zaman -C 2 N . Genel durumda, C 2 N = P + Q, burada P, her iki özellik için sıralarını karşılaştırırken çiftlere atanan pozitif ve Q negatif birimlerin sayısıdır.
    Değere Kendall katsayısı denir.
    Formülden τ katsayısının, her iki özellikte (tüm çiftlerin sayısına göre) aynı sıraya sahip nesne çiftlerinin oranı ile sahip olmayan nesne çiftlerinin oranı arasındaki fark olduğu görülebilir. aynı düzen
    Örneğin, 0,60'lık bir katsayı değeri, çiftlerin %80'inin aynı nesne sırasına sahip olduğu ve %20'sinin olmadığı anlamına gelir (%80 + %20 = %100; 0,80 - 0,20 = 0,60). Onlar. τ, rastgele seçilen bir nesne çifti için her iki özellikte de sıraların çakışma ve çakışmama olasılıkları arasındaki fark olarak yorumlanabilir.
    Genel durumda, 10 mertebesinde N için bile τ'nin (daha doğrusu P veya Q) hesaplanması külfetlidir.
    Hesaplamaları nasıl basitleştireceğimizi gösterelim.


    Örnek. 2003 yılında Rusya Federasyonu'nun federal bölgelerinden birinin 10 bölgesindeki sınai üretim hacmi ile sabit sermaye yatırımları arasındaki ilişki aşağıdaki verilerle karakterize edilir:


    Spearman ve Kendall sıra korelasyon katsayılarını hesaplayın. α=0.05'te önemini kontrol edin. Rusya Federasyonu'nun söz konusu bölgelerindeki endüstriyel üretim hacmi ile sabit varlıklara yapılan yatırımlar arasındaki ilişki hakkında bir sonuç formüle edin.

    Çözüm. Y özelliğine ve X faktörüne dereceler atayın.


    Verileri X'e göre sıralayalım.
    Y serisinde, 3'ün sağında, 3'ten büyük 7 sıra vardır, bu nedenle, 3, P'de 7 terimini doğuracaktır.
    1'in sağında 1'den büyük 8 sıra vardır (bunlar 2, 4, 6, 9, 5, 10, 7, 8'dir), yani. P, 8'i içerecektir vb. Sonuç olarak, P = 37 ve elimizdeki formülleri kullanarak:

    XYsıralama X, dxY sıralaması, d yPQ
    18.4 5.57 1 3 7 2
    20.6 2.88 2 1 8 0
    21.5 4.12 3 2 7 0
    35.7 7.24 4 4 6 0
    37.1 9.67 5 6 4 1
    39.8 10.48 6 9 1 3
    51.1 8.58 7 5 3 0
    54.4 14.79 8 10 0 2
    64.6 10.22 9 7 1 0
    90.6 10.45 10 8 0 0
    37 8


    Basitleştirilmiş formüller:




    n, örneklem büyüklüğüdür; z kp, Laplace fonksiyonu tablosundan Ф(z kp)=(1-α)/2 eşitliği ile bulunan iki taraflı kritik bölgenin kritik noktasıdır.
    |τ|< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - sıfır hipotezi reddedilir. Niteliksel özellikler arasında anlamlı bir sıra korelasyonu vardır.
    z kp kritik noktasını bulalım
    Ф(z kp) = (1-α)/2 = (1 - 0,05)/2 = 0,475

    Kritik noktayı bulalım:

    τ > T kp olduğundan - boş hipotezi reddediyoruz; iki testteki puanlar arasındaki sıralama korelasyonu anlamlıdır.

    Örnek. Rusya Federasyonu'nun bir şehrinde bulunan 10 inşaat firmasında kendi başlarına gerçekleştirilen inşaat ve montaj işlerinin hacmi ve çalışan sayısına ilişkin verilere göre, bu özellikler arasındaki ilişkiyi Kendel katsayısını kullanarak belirleyin.

    Çözüm hesap makinesi ile bulun.
    Y özelliğine ve X faktörüne dereceler atayın.
    Nesneleri, X'teki sıraları doğal sayıları temsil edecek şekilde düzenleyelim. Bu dizinin her bir çiftine atanan derecelendirmeler pozitif olduğundan, P'ye dahil edilen "+1" değerleri, yalnızca Y'deki sıraları doğrudan bir düzen oluşturan çiftler tarafından üretilecektir.
    Y satırındaki her bir nesnenin sırasını çelik olanlarla sırayla karşılaştırarak hesaplamaları kolaydır.
    Kendall katsayısı.

    Genel durumda, 10 mertebesinde N için bile τ'nin (daha doğrusu P veya Q) hesaplanması külfetlidir. Hesaplamaları nasıl basitleştireceğimizi gösterelim.

    veya

    Çözüm.
    Verileri X'e göre sıralayalım.
    Y serisinde, 2'nin sağında, 2'den büyük 8 sıra vardır, bu nedenle 2, P'de 8 terimini doğuracaktır.
    4'ün sağında 4'ten büyük 6 sıra vardır (bunlar 7, 5, 6, 8, 9, 10'dur), yani. P, 6'yı içerecektir vb. Sonuç olarak, P = 29 ve elimizdeki formülleri kullanarak:

    XYsıralama X, dxY sıralaması, d yPQ
    38 292 1 2 8 1
    50 302 2 4 6 2
    52 366 3 7 3 4
    54 312 4 5 4 2
    59 359 5 6 3 2
    61 398 6 8 2 2
    66 401 7 9 1 2
    70 298 8 3 1 1
    71 283 9 1 1 0
    73 413 10 10 0 0
    29 16


    Basitleştirilmiş formüller:


    Rakip hipotez Н 1: τ ≠ 0 altında Kendall'ın genel sıra korelasyon katsayısının sıfıra eşit olduğu α anlamlılık düzeyinde sıfır hipotezini test etmek için kritik noktayı hesaplamak gerekir:

    n, örneklem büyüklüğüdür; z kp, Laplace fonksiyonu tablosundan Ф(z kp)=(1 - α)/2 eşitliği ile bulunan iki taraflı kritik bölgenin kritik noktasıdır.
    |τ| T kp - sıfır hipotezi reddedilir. Niteliksel özellikler arasında anlamlı bir sıra korelasyonu vardır.
    z kp kritik noktasını bulalım
    Ф(z kp) = (1 - α)/2 = (1 - 0,05)/2 = 0,475
    Laplace tablosuna göre z kp = 1.96 buluyoruz
    Kritik noktayı bulalım:

    T den beri

    Sıralama yapılırken uzman, değerlendirilen unsurları tercihlerine göre artan (azalan) bir düzende düzenlemeli ve her birine doğal sayılar şeklinde dereceler vermelidir. Doğrudan sıralamada en çok tercih edilen elemanın sıralaması 1 (bazen 0), en az tercih edilen elemanın sıralaması ise m'dir.

    Bilirkişi, kendi görüşüne göre bazı unsurların tercihlerinin aynı olması nedeniyle katı bir sıralama yapamıyorsa, bu unsurlara aynı dereceleri vermesine izin verilir. Sıralamaların toplamının sıralanan elemanların yerlerinin toplamına eşit olmasını sağlamak için standartlaştırılmış sıralar kullanılır. Standartlaştırılmış sıralama, sıralanmış serilerdeki tercih bakımından eşit olan öğe sayılarının aritmetik ortalamasıdır.

    Örnek 2.6. Uzman altı maddeyi tercihlerine göre şu şekilde sıraladı:

    Daha sonra bu elemanların standartlaştırılmış sıralamaları şu şekilde olacaktır:

    Böylece, elemanlara atanan derecelerin toplamı, doğal sayıların toplamına eşit olacaktır.

    Öğeleri sıralayarak tercih ifadesinin doğruluğu, önemli ölçüde sunum setinin kardinalitesine bağlıdır. Derecelendirme prosedürü, değerlendirilen öğelerin sayısı 10'dan fazla olmadığında (ortaya çıkan tercihin yakınlık derecesine ve “doğruya” göre) en güvenilir sonuçları verir. Sunum setinin sınırlayıcı gücü 20'yi geçmemelidir.

    Sıralamaların işlenmesi ve analizi, bireysel tercihlere dayalı bir grup tercihi ilişkisi oluşturmak için gerçekleştirilir. Bu durumda, aşağıdaki görevler belirlenebilir: a) iki uzmanın sunum dizisinin unsurları üzerindeki sıralaması arasındaki bağlantının sıkılığının belirlenmesi; b) iki unsur arasındaki ilişkinin, bu unsurların çeşitli özelliklerine ilişkin grup üyelerinin bireysel görüşlerine göre belirlenmesi; c) ikiden fazla uzmanın yer aldığı bir gruptaki uzmanların ortak görüşlerinin değerlendirilmesi.

    İlk iki durumda, sıra korelasyon katsayısı, bağlantının sıkılığının bir ölçüsü olarak kullanılır. Yalnızca katı veya katı olmayan sıralamaya izin verilip verilmediğine bağlı olarak, Kendall'ın veya Spearman'ın sıra korelasyon katsayısı kullanılır.

    (a) sorunu için Kendall'ın sıra korelasyon katsayısı

    Nerede M- eleman sayısı; r 1 ben - ilk uzman tarafından atanan sıralama Ben-inci eleman; r 2 ben – aynı, ikinci uzman.

    Problem (b) için, bileşenler (2.5) şu anlama gelir: m, değerlendirilen iki öğenin karakteristik sayısıdır; r 1 ben(r 2 i) - bir grup uzman tarafından belirlenen birinci (ikinci) öğenin sıralamasındaki i'inci özelliğin sırası.

    Kesin sıralama, sıra korelasyon katsayısını kullanır R Mızrakçı:


    bileşenleri (2.5) ile aynı anlama sahiptir.

    Korelasyon katsayıları (2.5), (2.6) -1 ile +1 arasında değişmektedir. Korelasyon katsayısı +1 ise sıralamalar aynı demektir; -1'e eşitse, o zaman - zıttır (sıralamalar birbirine terstir). Korelasyon katsayısının sıfıra eşit olması, sıralamaların doğrusal olarak bağımsız (ilişkisiz) olduğu anlamına gelir.

    Bu yaklaşımla (uzman, rastgele hata içeren bir "ölçme aracıdır") bireysel sıralamalar rastgele olarak kabul edildiğinden, elde edilen korelasyon katsayısının önemi hakkındaki hipotezin istatistiksel olarak test edilmesi sorunu ortaya çıkar. Bu durumda Neyman-Pearson testi kullanılır: α kriterinin anlamlılık düzeyine göre belirlenirler ve korelasyon katsayısının dağılım yasalarını bilerek eşik değerini belirlerler. ca, korelasyon katsayısının elde edilen değeri ile karşılaştırılır. Kritik alan sağ elini kullanır (uygulamada, genellikle önce ölçüt değeri hesaplanır ve eşik düzeyiyle karşılaştırılan önem düzeyi ondan belirlenir. α ).

    Sıra korelasyon katsayısı τ Kendall, m > 10 için aşağıdaki parametrelerle normale yakın bir dağılıma sahiptir:

    burada M [τ] matematiksel beklentidir; D [τ] dağılımdır.

    Bu durumda, standart normal dağılım fonksiyonunun tabloları kullanılır:

    ve kritik bölgenin sınırı τ α denklemin kökü olarak tanımlanır

    Katsayının hesaplanan değeri τ ≥ τ α ise, sıralamaların gerçekten iyi bir uyum içinde olduğu kabul edilir. Tipik olarak, α değeri 0.01-0.05 aralığında seçilir. m ≤ 10 için m'nin dağılımı Tablo'da verilmiştir. 2.1.

    Spearman katsayısı ρ kullanılarak iki sıralamanın tutarlılığının öneminin kontrol edilmesi, Student'ın m > 10 için dağıtım tabloları kullanılarak aynı sırayla gerçekleştirilir.

    Bu durumda, değer

    Öğrencinin dağılımına iyi yaklaşan bir dağılıma sahiptir. M– 2 serbestlik derecesi. -de M> 30, ρ dağılımı, M [ρ] = 0 ve D [ρ] = olan normal olanla iyi bir uyum içindedir.

    m ≤ 10 için, ρ'nın önemi Tablo kullanılarak kontrol edilir. 2.2.

    Sıralamalar kesin değilse, Spearman katsayısı

    burada ρ (2.6)'ya göre hesaplanır;

    burada k1 , k2 sırasıyla birinci ve ikinci sıralamadaki katı olmayan farklı grupların sayısıdır; ben i, aynı sıraların sayısıdır Ben-inci grup. Spearman'ın sıra korelasyon katsayıları ρ ve Kendall's τ'nin pratik kullanımında, ρ katsayısının minimum varyans açısından daha doğru bir sonuç verdiği unutulmamalıdır.

    Tablo 2.1.Kendall'ın sıra korelasyon katsayısının dağılımı