• Kendallova hodnostní korelace v excelu. Ranková korelace a Kendallův hodnostní korelační koeficient. Co je třeba vzít v úvahu při stanovení tématu, objektu, předmětu, cíle, cílů a hypotézy studia

    KENDALLOVÝ KOEFICIENT KORELACE POŘADÍ

    Jedna z ukázkových mír závislosti dvou náhodných veličin (znaků) X a Y, na základě pořadí prvků vzorku (X 1 , Y x), .. ., (A n, Y n). K. k. r. k. odkazuje tedy k žebříček statistiků a je určen vzorcem

    Kde r i- U patřící k tomuto páru ( X, Y), pro které Xraven i, S = 2N-(n-1)/2, N-počet prvků vzorku, pro které platí j>i i rj >r i. Vždy Jako selektivní měřítko závislosti K. na. to. hojně používal M. Kendall (M. Kendall, viz).

    K. k. r. k. slouží k testování hypotézy nezávislosti náhodných veličin. Pokud je hypotéza nezávislosti pravdivá, pak Et =0 a Dt =2(2n+5)/9n(n-1). S malou velikostí vzorku, kontrola statistiky hypotézy nezávislosti se vytvářejí pomocí speciálních tabulek (viz). Pro n>10 se používá normální aproximace pro rozdělení m: if

    pak je hypotéza nezávislosti zamítnuta, jinak je přijata. Zde a . - hladina významnosti, u a /2 je procentní bod normálního rozdělení. K. k. r. k., jako každý , lze použít k detekci závislosti dvou kvalitativních znaků, pokud lze pouze prvky vzorku seřadit vzhledem k těmto znakům. Li X, Y mají kloubní normálu s korelačním koeficientem p, pak vztah mezi K. to. to. a má tvar:

    viz také Spearmanova hodnostní korelace, hodnostní test.

    Lit.: Kendal M., Rank correlations, přel. z angličtiny, M., 1975; Van der Waerden B. L., Mathematical, přel. z němčiny, M., 1960; Bolshev L. N., Smirnov N. V., Tabulky matematické statistiky, M., 1965.

    A. V. Prochorov.


    Matematická encyklopedie. - M.: Sovětská encyklopedie. I. M. Vinogradov. 1977-1985.

    Podívejte se, co je "KENDALL RANK COEFFICIENT" v jiných slovnících:

      Angličtina s efektivní, hodnostní korelací Kendall; Němec Kendalls Rangkorrelationskoeffizient. Korelační koeficient, který určuje míru korespondence řazení všech dvojic objektů podle dvou proměnných. antinacistické. Encyklopedie sociologie, 2009 ... Encyklopedie sociologie

      KENDALL RANK KOEFICIENT- Angličtina. efektivní, hodnostní korelace Kendall; Němec Kendalls Rangkorrelationskoeffizient. Korelační koeficient, který určuje míru shody řazení všech dvojic objektů podle dvou proměnných ... Výkladový slovník sociologie

      Míra závislosti dvou náhodných proměnných (znaků) X a Y na základě pořadí nezávislých výsledků pozorování (X1, Y1), . . (Xn,Yn). Pokud jsou řady hodnot X v přirozeném pořadí i=1, . . ., n,a Ri hodnost Y odpovídající… … Matematická encyklopedie

      Korelační koeficient- (Korelační koeficient) Korelační koeficient je statistický ukazatel závislosti dvou náhodných veličin Definice korelačního koeficientu, typy korelačních koeficientů, vlastnosti korelačního koeficientu, výpočet a aplikace ... ... Encyklopedie investora

      Závislost mezi náhodnými veličinami, která obecně řečeno nemá striktně funkční charakter. Na rozdíl od funkční závislosti se K. zpravidla uvažuje, když jedna z veličin závisí nejen na dané druhé, ale také ... ... Matematická encyklopedie

      Korelace (korelační závislost) je statistický vztah mezi dvěma nebo více náhodnými proměnnými (nebo proměnnými, které lze za takové považovat s určitou přijatelnou mírou přesnosti). Současně se změní hodnoty jedné nebo ... ... Wikipedie

      Korelace- (Korelace) Korelace je statistický vztah dvou nebo více náhodných proměnných Pojem korelace, typy korelace, korelační koeficient, korelační analýza, cenová korelace, korelace měnových párů na Forexu Obsah ... ... Encyklopedie investora

      Všeobecně se uznává, že počátek S. m. nebo, jak se často říká, statistika „malého n“, byla stanovena v první dekádě 20. století vydáním práce W. Gosseta, do které umístil distribuci t, postulovanou světem, který obdržel o trochu později ... ... Psychologická encyklopedie

      Maurice Kendall Sir Maurice George Kendall Datum narození: 6. září 1907 (1907 09 06) Místo narození: Kettering, Spojené království Datum úmrtí ... Wikipedia

      Předpověď- (Forecast) Definice prognózy, úkoly a principy prognózování Definice prognózy, úkoly a principy prognózování, metody prognóz Obsah Obsah Definice Základní pojmy prognózování Úkoly a principy prognózování ... ... Encyklopedie investora

    Vypočítat Kendallův koeficient hodnoty atributu faktoru jsou předběžně seřazeny, to znamená, že pořadí podle X jsou zaznamenány přísně ve vzestupném pořadí kvantitativních hodnot.

    1) Pro každou hodnost v Y zjistěte celkový počet hodností za ní, jejichž hodnota je větší než daná hodnost. Celkový počet takových případů se bere v úvahu se znaménkem „+“ a označuje se P.

    2) Pro každou hodnost v Y se určí počet hodností za ní následujících, které jsou hodnotově menší než daná hodnost. Celkový počet takových případů se bere v úvahu se znaménkem „-“ a označuje se Q.

    3) Vypočítejte S=P+Q=9+(-1)=8

    4) Kendellův koeficient se vypočítá podle vzorce:

    Kendellův koeficient může nabývat hodnot od -1 do +1 a čím blíže k, tím silnější je vztah mezi prvky.

    V některých případech pro určení směru vztahu mezi dvěma prvky vypočítejte Fechnerův koeficient. Tento koeficient je založen na porovnání chování odchylek jednotlivých hodnot faktoriálu a výsledných charakteristik od jejich průměrné hodnoty. Fechnerův koeficient se vypočítá podle vzorce:

    ; kde součet C je celkový počet shod znamének odchylek, součet H je celkový počet neshod znamének odchylek.

    1) Vypočítejte průměrnou hodnotu faktoru:

    2) Určete znaménka odchylek jednotlivých hodnot faktorové charakteristiky od průměrné hodnoty.

    3) Vypočítejte průměrnou hodnotu efektivního prvku: .

    4) Najděte znaménka odchylek jednotlivých hodnot výsledného atributu od průměrné hodnoty:

    Závěr: spoj je přímý, koeficient nevypovídá o těsnosti spoje.

    Pro určení stupně těsnosti vztahu mezi třemi hodnocenými prvky se vypočítá koeficient konkordance. Vypočítá se podle vzorce:

    , kde m je počet hodnocených prvků; n je počet hodnocených pozorovacích jednotek.

    Průmyslová odvětví X1 X2 X3 R1 R2 R3
    Energetický průmysl 7,49
    Palivo 12,70
    Černý M. 5,92
    barva M. 9,48
    strojírenství 4,18
    Výsledek:

    X1- počet zaměstnanců (tisíc lidí); X2- objem průmyslového prodeje (miliardy rublů); X3- průměrná měsíční mzda.

    1) Hodnotíme hodnoty všech funkcí a nastavujeme pořadí přísně ve vzestupném pořadí kvantitativních hodnot.

    2) Pro každý řádek je určen součet pořadí. Z tohoto sloupce se vypočítá celkový řádek.

    3) Vypočítejte .

    4) Pro každý řádek najděte druhé mocniny odchylek součtů pořadí a hodnot T. Pro stejný sloupec vypočítáme výsledný řádek, který označíme S. Koeficient shody může nabývat hodnot od 0 do 1 a čím blíže je k 1, tím silnější je vztah mezi znaky.

    Při řazení musí expert seřadit hodnocené prvky ve vzestupném (sestupném) pořadí podle jejich preference a každému z nich přiřadit pořadí ve formě přirozených čísel. V přímém hodnocení má nejpreferovanější prvek hodnost 1 (někdy 0) a nejméně preferovaný prvek má hodnost m.

    Pokud odborník nemůže provést přísné hodnocení z důvodu, že podle jeho názoru jsou některé prvky přednostně stejné, je povoleno těmto prvkům přiřadit stejné pořadí. Aby byl součet hodností roven součtu míst hodnocených prvků, používají se tzv. standardizované hodnosti. Standardizovaná hodnost je aritmetický průměr počtu prvků v řazené řadě, které jsou přednostně stejné.

    Příklad 2.6. Expert seřadil šest položek podle preferencí takto:

    Pak budou standardizované řady těchto prvků

    Součet úrovní přiřazených prvkům se tedy bude rovnat součtu přirozených čísel.

    Přesnost vyjádření preference klasifikačními prvky významně závisí na mohutnosti souboru prezentací. Postup hodnocení dává nejspolehlivější výsledky (podle míry blízkosti odhalené preference a „pravda“), kdy počet hodnocených prvků není větší než 10. Limitující síla prezentační sady by neměla překročit 20.

    Zpracování a analýza žebříčků se provádí za účelem vytvoření skupinového preferenčního vztahu na základě individuálních preferencí. V tomto případě lze stanovit následující úkoly: a) stanovení těsnosti spojení mezi hodnocením dvou expertů na prvky souboru prezentací; b) určení vztahu mezi dvěma prvky podle individuálních názorů členů skupiny na různé charakteristiky těchto prvků; c) posouzení shody názorů odborníků ve skupině složené z více než dvou odborníků.

    V prvních dvou případech se jako míra těsnosti vztahu používá koeficient pořadové korelace. V závislosti na tom, zda je povoleno pouze přísné nebo nepřísné hodnocení, se použije buď Kendallův nebo Spearmanův koeficient pořadové korelace.

    Kendallův koeficient pořadové korelace pro problém (a)

    Kde m− počet prvků; r 1 i – hodnost přidělená prvním expertem i-tý prvek; r 2 i – tentýž, druhý odborník.

    Pro úlohu (b) mají složky (2.5) následující význam: m je počet charakteristik dvou hodnocených prvků; r 1 i(r 2 i) - pořadí i-té charakteristiky v pořadí prvního (druhého) prvku, stanovené skupinou odborníků.

    Přísné hodnocení používá koeficient korelace pořadí R Spearman:


    jehož složky mají stejný význam jako v (2.5).

    Korelační koeficienty (2,5), (2,6) se pohybují od -1 do +1. Pokud je korelační koeficient +1, znamená to, že pořadí je stejné; pokud se rovná -1, pak − jsou opačné (hodnocení jsou vzájemně inverzní). Rovnost korelačního koeficientu na nulu znamená, že hodnocení jsou lineárně nezávislá (nekorelovaná).

    Protože u tohoto přístupu (expert je „měřicí nástroj“ s náhodnou chybou) jsou jednotlivá pořadí považována za náhodná, vyvstává problém statistického testování hypotézy o významnosti získaného korelačního koeficientu. V tomto případě se používá Neyman-Pearsonův test: jsou stanoveny hladinou významnosti kritéria α a se znalostí distribučních zákonů korelačního koeficientu určují prahovou hodnotu. ca, se kterou se porovnává získaná hodnota korelačního koeficientu. Kritická oblast je pravotočivá (v praxi se obvykle nejprve vypočítá hodnota kritéria a z ní se určí hladina významnosti, která se porovná s prahovou hladinou α ).

    Koeficient pořadové korelace τ Kendall má pro m > 10 rozdělení blízké normálu s následujícími parametry:

    kde M [τ] je matematické očekávání; D [τ] je disperze.

    V tomto případě se používají tabulky funkce standardního normálního rozdělení:

    a hranice τ α kritické oblasti je definována jako kořen rovnice

    Pokud je vypočtená hodnota koeficientu τ ≥ τ α , pak se má za to, že pořadí jsou ve skutečně dobré shodě. Typicky se hodnota a volí v rozmezí 0,01-0,05. Pro m ≤ 10 je rozdělení m uvedeno v tabulce. 2.1.

    Kontrola významnosti konzistence dvou hodnocení pomocí Spearmanova koeficientu ρ se provádí ve stejném pořadí pomocí Studentových distribučních tabulek pro m > 10.

    V tomto případě hodnota

    má distribuci dobře přibližnou distribuci studenta s m– 2 stupně volnosti. Na m> 30, rozdělení ρ je v dobré shodě s normálním, které má M [ρ] = 0 a D [ρ] = .

    Pro m ≤ 10 je významnost ρ ověřena pomocí tabulky. 2.2.

    Pokud není žebříček přísný, tak Spearmanův koeficient

    kde ρ se vypočítá podle (2.6);

    kde k 1, k 2 je počet různých skupin nepřísných pozic v prvním a druhém pořadí; l i je počet stejných řad v i-tá skupina. Při praktickém použití Spearmanových koeficientů hodnostní korelace ρ a Kendallova τ je třeba mít na paměti, že koeficient ρ poskytuje přesnější výsledek z hlediska minima rozptylu.

    Tabulka 2.1.Rozdělení Kendallova koeficientu pořadové korelace

    Prezentace a předzpracování znaleckých posudků

    V praxi se používá několik typů hodnocení:

    - kvalita (často-zřídka, horší-lepší, ano-ne),

    - skóre stupnice (rozsahy hodnot 50-75, 76-90, 91-120 atd.),

    Skóre z daného intervalu (od 2 do 5, 1 -10), vzájemně nezávislé,

    Hodnoceno (objekty jsou řazeny odborníkem v určitém pořadí a každému je přiděleno pořadové číslo - hodnost),

    Srovnávací získaný jednou ze srovnávacích metod

    metoda postupného srovnávání

    metoda párového porovnávání faktorů.

    V dalším kroku zpracování znaleckých posudků je nutné vyhodnotit míra shody mezi těmito názory.

    Odhady získané od expertů lze považovat za náhodnou veličinu, jejíž rozložení odráží názory expertů na pravděpodobnost konkrétní volby události (faktoru). Proto se k analýze rozptylu a konzistence odborných odhadů používají zobecněné statistické charakteristiky - průměry a rozptylové míry:

    střední kvadratická chyba,

    Rozsah variace min - max,

    - variační koeficient V \u003d rms. devi. / aritm. průměr. (vhodné pro jakýkoli typ hodnocení)

    V i = σ i / x i srov

    Pro sazbu míry podobnosti ale názory každá dvojice odborníků Lze použít různé metody:

    asociační koeficienty, které zohledňují počet shodných a neshodných odpovědí,

    koeficienty nekonzistence znalecké posudky,

    Všechna tato měřítka lze použít buď k porovnání názorů dvou expertů, nebo k analýze vztahu mezi řadou odhadů podle dvou kritérií.

    Spearmanův párový korelační koeficient:

    kde n je počet odborníků,

    c k je rozdíl mezi odhady i-tého a j-tého experta pro všechny T faktory

    Kendallův koeficient pořadové korelace (koeficient shody) dává celkové hodnocení konzistence názorů všech expertů na všechny faktory, ale pouze pro případy, kdy byly použity odhady pořadí.

    Je prokázáno, že hodnota S, když všichni experti posuzují všechny faktory stejně, má maximální hodnotu rovnou

    kde n je počet faktorů,

    m je počet odborníků.

    Koeficient shody se rovná poměru

    navíc, pokud se W blíží 1, pak všichni experti poskytli poměrně konzistentní odhady, jinak jsou jejich názory nekonzistentní.

    Vzorec pro výpočet S je uveden níže:

    kde r ij - hodnocení odhadů i-tého faktoru j-tým expertem,

    r cf - průměrné pořadí v celé matici odhadů a je rovno

    A proto vzorec pro výpočet S může mít tvar:

    Pokud jsou jednotlivá skóre jednoho experta stejná a během zpracování byla standardizována, pak se pro výpočet koeficientu shody použije jiný vzorec:



    kde Tj se vypočítá pro každého odborníka (v případě, že jeho posouzení byla opakována pro různé objekty), s přihlédnutím k opakování podle následujících pravidel:

    kde t j je počet skupin stejné úrovně pro j-tého odborníka a

    h k - počet stejných řad v k-té skupině příbuzných řad j-tého odborníka.

    PŘÍKLAD. Nechte 5 odborníků na šest faktorů reagovat při hodnocení podle tabulky 3:

    Tabulka 3 - Odpovědi odborníků

    Experti O1 O2 O3 O4 O5 O6 Součet hodnocení podle experta
    E1
    E2
    E3
    E4
    E5

    Vzhledem k tomu, že bylo získáno nepřísné pořadí (odhady expertů se opakují a součty pořadí nejsou stejné), provedeme transformaci odhadů a získáme související pořadí (tabulka 4):

    Tabulka 4 - Související pořadí expertních hodnocení

    Experti O1 O2 O3 O4 O5 O6 Součet hodnocení podle experta
    E1 2,5 2,5
    E2
    E3 1,5 1,5 4,5 4,5
    E4 2,5 2,5 4,5 4,5
    E5 5,5 5,5
    Součet pořadí podle objektu 7,5 9,5 23,5 29,5

    Nyní určíme míru shody mezi posudky znalců pomocí koeficientu shody. Vzhledem k tomu, že pořadí spolu souvisí, vypočítáme W pomocí vzorce (**).

    Potom r cf \u003d 7 * 5 / 2 \u003d 17,5

    S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

    Přejděme k výpočtu W. K tomu vypočítáme samostatně hodnoty T j . V příkladu jsou známky speciálně vybrány tak, aby každý znalec měl opakované známky: 1. má dvě, druhý má tři, třetí má dvě skupiny po dvou známkách, čtvrtý a pátý mají dvě stejné známky. Odtud:

    T 1 \u003d 2 3 – 2 \u003d 6 T 5 \u003d 6

    T 2 \u003d 3 3 - 3 \u003d 24

    T 3 \u003d 2 3 -2+ 2 3 -2 \u003d 12 T 4 \u003d 12

    Vidíme, že shoda v názorech odborníků je poměrně vysoká a je možné přistoupit k další fázi studie - zdůvodnění a přijetí alternativního řešení doporučeného odborníky.

    V opačném případě se musíte vrátit ke krokům 4-8.