• Faktorová matice. Problémy ve faktorové analýze Faktorová matice

    FAKTOROVÁ ANALÝZA

    Myšlenka faktorové analýzy

    Při studiu složitých objektů, jevů, systémů nelze faktory, které určují vlastnosti těchto objektů, velmi často přímo měřit a někdy není znám ani jejich počet a význam. Ale pro měření mohou být k dispozici i jiné veličiny, tak či onak v závislosti na faktorech, které nás zajímají. Navíc, když se vliv neznámého faktoru, který nás zajímá, projeví v několika měřených rysech nebo vlastnostech objektu, tyto rysy mohou vykazovat těsný vztah k sobě navzájem a celkový počet faktorů může být mnohem menší než počet naměřených proměnné.

    Metody faktorové analýzy se používají k identifikaci faktorů, které určují měřené vlastnosti objektů.

    Jako příklad aplikace faktorové analýzy lze uvést studium osobnostních rysů na základě psychologických testů. Osobnostní vlastnosti nejsou přímo měřitelné. Lze je posuzovat pouze podle chování člověka nebo podle povahy odpovědí na otázky. Pro vysvětlení výsledků experimentů jsou podrobeny faktorové analýze, která umožňuje identifikovat ty osobní vlastnosti, které ovlivňují chování jedince.
    Různé metody faktorové analýzy jsou založeny na následující hypotéze: pozorované nebo měřené parametry jsou pouze nepřímými charakteristikami studovaného objektu, ve skutečnosti existují vnitřní (skryté, latentní, ne přímo pozorované) parametry a vlastnosti, jejichž počet je malý a které určují hodnoty sledovaných parametrů. Tyto vnitřní parametry se nazývají faktory.

    Účelem faktorové analýzy je soustředit výchozí informaci, vyjadřující velké množství uvažovaných znaků prostřednictvím menšího počtu prostornějších vnitřních charakteristik jevu, které však nelze přímo měřit.

    Bylo zjištěno, že výběr a následné sledování úrovně společných faktorů umožňuje detekovat předporuchové stavy objektu ve velmi raných fázích rozvoje vady. Faktorová analýza umožňuje sledovat stabilitu korelací mezi jednotlivými parametry. Jsou to korelace mezi parametry, stejně jako mezi parametry a společnými faktory, které obsahují hlavní diagnostické informace o procesech. Použití sady nástrojů Statistica při provádění faktorové analýzy eliminuje potřebu dalších výpočetních nástrojů a činí analýzu pro uživatele jasnou a srozumitelnou.

    Výsledky faktorové analýzy budou úspěšné, pokud bude možné identifikované faktory interpretovat na základě významu indikátorů charakterizujících tyto faktory. Tato fáze práce je velmi zodpovědná; vyžaduje jasné pochopení smysluplného významu ukazatelů, které jsou součástí analýzy a na jejichž základě jsou faktory identifikovány. Při předběžném pečlivém výběru ukazatelů pro faktorovou analýzu bychom se proto měli řídit jejich významem, a nikoli touhou zahrnout do analýzy co nejvíce z nich.

    Podstata faktorové analýzy

    Zde je několik základních ustanovení faktorové analýzy. Nechte pro matici X měřených parametrů objektu existuje kovarianční (korelační) matice C, Kde R je počet parametrů, n je počet pozorování. Lineární transformací X=QY+U lze zmenšit rozměr původního faktorového prostoru X vyrovnat Y, kde R"<<R. Tomu odpovídá transformace bodu charakterizujícího stav objektu do j-dimenzionální prostor, do nového prostoru měření s nižší dimenzí R Je zřejmé, že geometrická blízkost dvou nebo množiny bodů v novém faktorovém prostoru znamená stabilitu stavu objektu.

    Matice Y obsahuje nepozorovatelné faktory, což jsou v podstatě hyperparametry, které charakterizují nejobecnější vlastnosti analyzovaného objektu. Společné faktory jsou nejčastěji voleny tak, aby byly statisticky nezávislé, což usnadňuje jejich fyzikální interpretaci. Vektor pozorovaných znaků X dává smysl důsledkům změny těchto hyperparametrů.

    Matice U sestává ze zbytkových faktorů, které zahrnují především chyby měření vlastností X(i). Obdélníková matice Q obsahuje faktorová zatížení, která definují lineární vztah mezi prvky a hyperparametry.
    Faktorová zatížení jsou hodnoty korelačních koeficientů každého z počátečních znaků s každým z identifikovaných faktorů. Čím užší je vztah tohoto prvku s uvažovaným faktorem, tím vyšší je hodnota faktorového zatížení. Kladné znaménko faktorového zatížení indikuje přímý (a záporné znaménko - inverzní) vztah tohoto prvku k faktoru.

    Údaje o faktorovém zatížení nám tedy umožňují vyvodit závěry o souboru počátečních znaků, které odrážejí ten či onen faktor, ao relativní váze jednotlivého znaku ve struktuře každého faktoru.

    Model faktorové analýzy je podobný vícerozměrné regresi a modelům ANOVA. Základní rozdíl mezi modelem faktorové analýzy je v tom, že vektor Y jsou nepozorovatelné faktory a v regresní analýze se jedná o zaznamenané parametry. Na pravé straně rovnice (8.1) jsou neznámé matice faktorových zatížení Q a matice hodnot společných faktorů Y.

    Pro nalezení matice faktorových zatížení se používá rovnice QQ t =S–V, kde Q t je transponovaná matice Q, V je kovarianční matice reziduálních faktorů U, tzn. . Rovnice je řešena iteracemi s určitou nulovou aproximací kovarianční matice V(0). Po nalezení matice faktorových zatížení Q jsou pomocí rovnice vypočteny obecné faktory (hyperparametry).
    Y=(QtV-1)Q-1QtV-1X

    Balíček statistické analýzy Statistica umožňuje interaktivně vypočítat matici zatížení faktorů a také hodnoty několika předdefinovaných hlavních faktorů, nejčastěji dvou - na základě prvních dvou hlavních složek původní matice parametrů.

    Faktorová analýza v systému Statistica

    Uvažujme posloupnost faktorové analýzy na příkladu zpracování výsledků dotazníkového šetření zaměstnanců podniku. Je nutné identifikovat hlavní faktory, které určují kvalitu pracovního života.

    Prvním krokem je výběr proměnných pro faktorovou analýzu. Pomocí korelační analýzy se výzkumník snaží identifikovat vztah studovaných znaků, což mu zase dává příležitost vybrat úplný a neredundantní soubor znaků kombinací silně korelovaných znaků.

    Pokud provedete faktorovou analýzu pro všechny proměnné, pak výsledky nemusí být zcela objektivní, protože některé proměnné jsou určeny jinými daty a nemohou být regulovány zaměstnanci dané organizace.

    Abychom pochopili, které ukazatele by měly být vyloučeny, sestavme matici korelačních koeficientů v programu Statistica pomocí dostupných dat: Statistika/ Základní statistika/ Korelační matice/ Ok. V úvodním okně této procedury Product-Moment and Partial Correlations (obr. 4.3) se pro výpočet čtvercové matice používá tlačítko One variable list. Vybrat všechny proměnné (vybrat vše), Ok, Souhrn. Dostaneme korelační matici.

    Pokud se korelační koeficient pohybuje od 0,7 do 1, znamená to silnou korelaci ukazatelů. V tomto případě lze vyloučit jednu proměnnou se silnou korelací. Naopak, pokud je korelační koeficient malý, můžete proměnnou vyloučit, protože k součtu nic nepřidává. V našem případě neexistuje silná korelace mezi žádnou z proměnných a my provedeme faktorovou analýzu pro celý soubor proměnných.

    Pro spuštění faktorové analýzy je třeba vyvolat modul Statistika / Vícerozměrné průzkumné techniky (vícerozměrné metody výzkumu) / Faktorová analýza (faktorová analýza). Na obrazovce se objeví okno modulu Faktorová analýza.



    Pro analýzu vybereme všechny proměnné tabulky; Proměnné: vybrat vše, Ok. Řádek Vstupní soubor (typ vstupního datového souboru) označuje Nezpracovaná data (počáteční data). V modulu jsou možné dva typy počátečních dat - Raw Data (počáteční data) a Correlation Matrix - korelační matice.

    Sekce mazání MD definuje, jak se zachází s chybějícími hodnotami:
    * Casewise - způsob, jak vyloučit chybějící hodnoty (výchozí);
    * Pairwise – spárovaný způsob eliminace chybějících hodnot;
    * Substituce střední hodnoty - náhrada průměru místo chybějících hodnot.
    Casewise způsob je ignorovat všechny řádky v tabulce obsahující data, která mají alespoň jednu chybějící hodnotu. To platí pro všechny proměnné. V metodě Pairwise nejsou chybějící hodnoty ignorovány pro všechny proměnné, ale pouze pro vybraný pár.

    Zvolme způsob, jak naložit s chybějícími hodnotami Casewise.

    Statistica zpracuje chybějící hodnoty zadaným způsobem, vypočítá korelační matici a nabídne výběr z několika metod faktorové analýzy.

    Po kliknutí na tlačítko OK se zobrazí okno Define Method of Factor Extraction.

    Horní část okna je informační. Říká, že chybějící hodnoty jsou řešeny metodou Casewise. Bylo zpracováno 17 pozorování a 17 pozorování bylo přijato k dalším výpočtům. Korelační matice je vypočítána pro 7 proměnných. Spodní část okna obsahuje 3 záložky: Rychlé, Pokročilé, Popisy.

    Karta Popisy má dvě tlačítka:
    1- zobrazit korelace, střední a standardní odchylky;
    2- vytvořit vícenásobnou regresi.

    Kliknutím na první tlačítko si můžete prohlédnout střední a standardní odchylky, korelace, kovariance, sestavit různé grafy a histogramy.

    V záložce Upřesnit na levé straně vyberte metodu (metoda extrakce) faktorové analýzy: Hlavní komponenty (metoda hlavních komponent). Na pravé straně vybereme maximální počet faktorů (2). Zadává se buď maximální počet faktorů (Max no of factor), nebo minimální vlastní hodnota: 1 (vlastní hodnota).

    Klikněte na OK a Statistica rychle provede výpočty. Na obrazovce se objeví okno Factor Analysis Results. Jak již bylo zmíněno, výsledky faktorové analýzy jsou vyjádřeny jako soubor faktorových zatížení. Proto budeme nadále pracovat se záložkou Loadings.

    Horní část okna je informativní:
    Počet proměnných (počet analyzovaných proměnných): 7;
    Metoda (metoda výběru faktorů): Hlavní složky (hlavní složky);
    Log (10) determinant korelační matice: -1,6248;
    Počet extrahovaných faktorů (počet vybraných faktorů): 2;
    Vlastní čísla (vlastní čísla): 3,39786 a 1,19130.
    Ve spodní části okna jsou funkční tlačítka, která umožňují komplexně zobrazit výsledky analýzy, numericky i graficky.
    Otáčení faktoru - rotace faktorů, v tomto rozbalovacím okně můžete vybrat různé rotace os. Otáčením souřadnicového systému můžete získat sadu řešení, ze kterých si musíte vybrat interpretovatelné řešení.

    Existují různé metody pro otáčení souřadnic prostoru. Balíček Statistica nabízí osm takových metod prezentovaných v modulu faktorové analýzy. Takže například metoda varimax odpovídá transformaci souřadnic: rotaci, která maximalizuje rozptyl. V metodě varimax se získá zjednodušený popis sloupců faktorové matice, přičemž se všechny hodnoty sníží na 1 nebo 0. V tomto případě je uvažován rozptyl druhých mocnin faktorových zatížení. Faktorová matice získaná metodou varimax rotace je do značné míry invariantní s ohledem na výběr různých sad proměnných.

    Rotace metodou quartimax má za cíl podobné zjednodušení pouze ve vztahu k řádkům faktorové matice. Equimax zaujímá mezipolohu? při rotaci faktorů touto metodou je současně učiněn pokus o zjednodušení sloupců i řádků. Uvažované způsoby rotace se týkají ortogonálních rotací, tzn. výsledkem jsou nekorelované faktory. Metody přímé rotace obliminu a promaxu se týkají šikmých rotací, jejichž výsledkem jsou korelující faktory. Termín ?normalizovaný? v názvech metod označuje, že faktorová zatížení jsou normalizována, to znamená, že jsou dělena druhou odmocninou odpovídajícího rozptylu.

    Ze všech navržených metod se nejprve podíváme na výsledek rozboru bez otáčení souřadnicového systému - Neotočený. Pokud se získaný výsledek ukáže jako interpretovatelný a vyhovuje nám, můžeme se tam zastavit. Pokud ne, můžete osy otočit a zobrazit další řešení.

    Klikneme na tlačítko "Načítání faktoru" a podíváme se na zatížení faktoru číselně.



    Připomeňme, že faktorová zatížení jsou hodnoty korelačních koeficientů každé z proměnných s každým z identifikovaných faktorů.

    Hodnota zatížení faktorem větší než 0,7 znamená, že daný atribut nebo proměnná úzce souvisí s uvažovaným faktorem. Čím užší je vztah tohoto prvku s uvažovaným faktorem, tím vyšší je hodnota faktorového zatížení. Kladné znaménko faktorového zatížení indikuje přímý (a záporné znaménko? - inverzní) vztah tohoto prvku k faktoru.
    Takže z tabulky faktorových zatížení byly identifikovány dva faktory. První definuje RSD – pocit sociální pohody. Zbývající proměnné jsou způsobeny druhým faktorem.

    V řádku Expl. Var (obr. 8.5) ukazuje rozptyl, který lze připsat jednomu nebo druhému faktoru. V řadě Prp. Totl ukazuje podíl rozptylu, který lze připsat prvnímu a druhému faktoru. V důsledku toho první faktor tvoří 48,5 % z celkového rozptylu a druhý faktor tvoří 17,0 % celkového rozptylu, zbytek připadají na ostatní nezohledněné faktory. V důsledku toho dva identifikované faktory vysvětlují 65,5 % celkového rozptylu.



    Zde také vidíme dvě skupiny faktorů – RSD a zbytek množiny proměnných, z nichž JSR vyčnívá – touhu po změně zaměstnání. Zjevně má smysl prozkoumat tuto touhu důkladněji na základě sběru dalších dat.

    Výběr a zpřesnění počtu faktorů

    Jakmile máme informace o tom, jak velký rozptyl každý faktor přidělil, můžeme se vrátit k otázce, kolik faktorů by mělo být ponecháno. Toto rozhodnutí je ze své podstaty svévolné. Existuje však několik obecných pokynů a jejich dodržování v praxi poskytuje nejlepší výsledky.

    Počet společných faktorů (hyperparametrů) je určen výpočtem vlastních hodnot (obrázek 8.7) matice X v modulu faktorové analýzy. Chcete-li to provést, v záložce Vysvětlená odchylka (obr. 8.4) klikněte na tlačítko Plot na ploše.


    Maximální počet společných faktorů se může rovnat počtu vlastních hodnot matice parametrů. Ale s nárůstem počtu faktorů se výrazně zvyšují potíže s jejich fyzikální interpretací.

    Nejprve lze vybrat pouze faktory s vlastními čísly většími než 1. V podstatě to znamená, že pokud faktor nevytěží rozptyl ekvivalentní alespoň rozptylu jedné proměnné, pak je vynechán. Toto kritérium je nejpoužívanější. Ve výše uvedeném příkladu by na základě tohoto kritéria měly být zachovány pouze 2 faktory (dvě hlavní složky).

    Na grafu můžete najít místo, kde se pokles vlastních hodnot zleva doprava co nejvíce zpomalí. Předpokládá se, že napravo od tohoto bodu se nachází pouze „faktoriální suť“. V souladu s tímto kritériem můžete v příkladu ponechat 2 nebo 3 faktory.
    Z Obr. je vidět, že třetí faktor mírně zvyšuje podíl na celkovém rozptylu.

    Faktorová analýza parametrů umožňuje v rané fázi odhalit narušení pracovního postupu (výskyt defektu) v různých objektech, což často nelze přímým pozorováním parametrů zaznamenat. To je vysvětleno skutečností, že k porušení korelací mezi parametry dochází mnohem dříve než ke změně jednoho parametru. Takové zkreslení korelací umožňuje včasnou detekci faktorové analýzy parametrů. K tomu stačí mít pole registrovaných parametrů.

    Můžete poskytnout obecná doporučení k použití faktorové analýzy bez ohledu na předmět.
    * Každý faktor musí odpovídat alespoň dvěma měřeným parametrům.
    * Počet měření parametrů musí být větší než počet proměnných.
    * Počet faktorů by měl být odůvodněn na základě fyzikální interpretace procesu.
    * Vždy bychom se měli snažit zajistit, aby počet faktorů byl mnohem menší než počet proměnných.

    Kritérium Kaiser někdy ukládá příliš mnoho faktorů, zatímco kritérium suti někdy ukládá příliš málo faktorů. Obě kritéria jsou však docela dobrá za normálních podmínek, kdy existuje relativně málo faktorů a mnoho proměnných. V praxi je důležitější otázka, kdy lze výsledné řešení interpretovat. Proto se obvykle zkoumá několik řešení s více či méně faktory a pak se vybere to, které dává největší smysl.

    Prostor počátečních znaků by měl být prezentován v homogenních měřítcích, protože to umožňuje použití korelačních matic ve výpočtu. V opačném případě nastává problém „váh“ různých parametrů, což vede k nutnosti použít při výpočtu kovarianční matice. Při změně počtu znaků tedy může nastat další problém opakovatelnosti výsledků faktorové analýzy. Je třeba poznamenat, že tento problém je v balíčku Statistica jednoduše vyřešen přechodem na standardizovanou formu prezentace parametrů. V tomto případě se všechny parametry stávají ekvivalentními z hlediska míry jejich propojení s procesy v objektu studia.

    Špatně upravené matrice

    Pokud jsou v počátečním souboru dat nadbytečné proměnné a nebyla provedena jejich eliminace korelační analýzou, nelze inverzní matici (8.3) vypočítat. Je-li například proměnná součtem dvou dalších proměnných vybraných pro tuto analýzu, pak korelační matici pro tuto sadu proměnných nelze invertovat a faktorovou analýzu zásadně nelze provést. V praxi k tomu dochází, když se pokusíme aplikovat faktorovou analýzu na soubor silně závislých proměnných, k čemuž někdy dochází například při zpracování dotazníků. Pak lze uměle snížit všechny korelace v matici přidáním malé konstanty k diagonálním prvkům matice a poté ji standardizovat. Výsledkem tohoto postupu je obvykle matice, kterou lze invertovat, a proto na ni lze použít faktorovou analýzu. Navíc tento postup neovlivňuje soubor faktorů, ale odhady se ukazují jako méně přesné.

    Faktorové a regresní modelování systémů s proměnnými stavy

    Stavově proměnný systém (SVS) je systém, jehož odezva závisí nejen na vstupní akci, ale také na zobecněném parametru časové konstanty, který určuje stav. Nastavitelný zesilovač nebo atenuátor? toto je příklad nejjednoduššího SPS, ve kterém lze koeficient přenosu diskrétně nebo plynule měnit podle nějakého zákona. Studium SPS se obvykle provádí pro linearizované modely, ve kterých se přechodný proces spojený se změnou stavového parametru považuje za ukončený.

    Nejpoužívanější jsou útlumové články vyrobené na bázi L-, T- a U zapojení sériových a paralelních diod. Odpor diod pod vlivem řídicího proudu se může měnit v širokém rozsahu, což umožňuje měnit frekvenční charakteristiku a útlum v cestě. Nezávislosti fázového posunu v regulaci útlumu u takových útlumových členů je dosaženo pomocí reaktivních obvodů zahrnutých v základní struktuře. Je zřejmé, že s jiným poměrem odporů paralelních a sériových diod lze získat stejnou úroveň zavedeného útlumu. Ale změna fázového posunu bude jiná.

    Podívejme se na možnost zjednodušení automatizovaného návrhu atenuátorů s vyloučením dvojí optimalizace korekčních obvodů a parametrů řízených prvků. Jako zkoumaný SPS použijeme elektricky řízený atenuátor, jehož ekvivalentní zapojení je na Obr. 8.8. Minimální úroveň útlumu je zajištěna v případě nízkého odporu prvku Rs a vysokého odporu prvku Rp. S rostoucím odporem prvku Rs a klesajícím odporem prvku Rp se zvyšuje vkládací útlum.

    Závislosti změny fázového posunu na frekvenci a útlumu pro obvod bez korekce a s korekcí jsou na Obr. 8,9 respektive 8,10. V korigovaném atenuátoru bylo v rozsahu útlumu 1,3–7,7 dB a frekvenčním pásmu 0,01–4,0 GHz dosaženo změny fázového posunu maximálně 0,2°. U nekorigovaného atenuátoru dosahuje změna fázového posunu ve stejném frekvenčním pásmu a rozsahu útlumu 3°. Fázový posun je tedy díky korekci snížen faktorem téměř 15.


    Korekční a regulační parametry budeme považovat za nezávislé proměnné nebo faktory, které ovlivňují útlum a změnu fázového posunu. To umožňuje pomocí systému Statistica provádět faktoriální a regresní analýzu SPS za účelem stanovení fyzikálních vzorů mezi parametry obvodu a individuálními charakteristikami a také zjednodušit hledání optimálních parametrů obvodu.

    Počáteční data byla vytvořena následovně. Pro korekční parametry a regulační odpory, které se liší od optimálních nahoru a dolů na frekvenční mřížce 0,01–4 GHz, byl vypočten vložný útlum a změna fázového posunu.

    Metody statistického modelování, zejména faktoriální a regresní analýza, které se dříve nepoužívaly pro návrh diskrétních zařízení s proměnlivými stavy, umožňují odhalit fyzikální vzorce fungování prvků systému. To přispívá k vytvoření struktury zařízení na základě daného kritéria optimality. Zejména tato část považuje fázově invariantní atenuátor za typický příklad systému s proměnným stavem. Identifikace a interpretace faktorových zatížení, která ovlivňují různé zkoumané charakteristiky, umožňuje změnit tradiční metodiku a výrazně zjednodušit hledání korekčních parametrů a parametrů řízení.

    Bylo zjištěno, že použití statistického přístupu k návrhu takových zařízení je oprávněné jak pro posouzení fyziky jejich činnosti, tak pro doložení schémat zapojení. Statistické modelování může výrazně snížit množství experimentálního výzkumu.

    Výsledek

    • Pozorování společných faktorů a odpovídajících faktorových zatížení je nezbytnou identifikací vnitřních vzorců procesů.
    • Aby bylo možné určit kritické hodnoty řízených vzdáleností mezi faktorovými zatíženími, je nutné shromáždit a zobecnit výsledky faktorové analýzy pro procesy stejného typu.
    • Aplikace faktorové analýzy není omezena na fyzikální vlastnosti procesů. Faktorová analýza je výkonná metoda pro monitorování procesů a je použitelná pro návrh systémů pro různé účely.

    STATISTICKÁ FAKTOROVÁ ANALÝZA

    Korelace (faktor.sta) Řádek po řádku odstranění PD n=100

    Variabilní

    PRÁCE_1

    PRÁCE_2

    PRÁCE_3

    ČÍSLO DOMU 1

    DŮM 2

    DŮM 3

    Jak je vidět z korelační matice, proměnné související se spokojeností v práci spolu více korelují a proměnné související se spokojeností doma také více korelují mezi sebou. Korelace mezi těmito dvěma typy proměnných (proměnné související se spokojeností v práci a proměnné související se spokojeností doma) jsou relativně malé. Zdá se tedy pravděpodobné, že v korelační matici se odrážejí dva relativně nezávislé faktory (dva typy faktorů): jeden se týká pracovní spokojenosti a druhý spokojenosti s domácím životem.

      Faktorová zatížení

    Druhou fází faktorové analýzy je prvotní výběr faktorů buď metodou hlavních složek, nebo metodou hlavních faktorů. Výsledkem pro náš příklad je dvoufaktorové řešení. Zvažte korelace mezi proměnnými a dvěma faktory (nebo „novými“ proměnnými). Tyto korelace se nazývají faktorové korelace.

    Tabulka 3.16

    Tabulka zatížení faktorů (metoda hlavní komponenty)

    STATISTICKÁ FAKTOROVÁ ANALÝZA

    Faktorové zatížení (bez rotace) Hlavní součásti

    Variabilní

    Faktor 1

    Faktor 2

    Celkový rozptyl

    Podíl na celkovém disp.

    Jak je vidět z tabulky 3.16, první faktor více koreluje s proměnnými než druhý (protože hodnoty hmotnostního zatížení pro každou proměnnou prvního faktoru jsou větší než druhého). To je zřejmé, protože, jak je uvedeno výše, faktory jsou extrahovány postupně a obsahují stále menší celkový rozptyl (viz část Vlastní čísla a počet rozlišujících faktorů, strana 61).

      Metody rotace faktorů

    Třetí fází faktorové analýzy je rotace faktorových zatížení vyplývající z předchozí fáze. Typickými rotačními metodami jsou strategie varimax, quartimax, A ekvimax. Cílem těchto metod je získat srozumitelnou (interpretovatelnou) matici zatížení, tj. faktorů, které se jasně vyznačují vysokým zatížením (např. větším než 0,7) pro některé proměnné a nízkým zatížením pro jiné. Tento obecný model se někdy nazývá jednoduchá struktura.

    Myšlenka rotace metodou varimax bylo popsáno výše (viz část Metoda hlavní součásti, strana 60). Tuto metodu lze také aplikovat na uvažovaný příklad. Stejně jako dříve je naším úkolem najít rotaci, která maximalizuje rozptyl podél nových os; nebo jinými slovy získat matici zatížení pro každý faktor tak, aby se co nejvíce lišila a byla zde možnost jejich jednoduché interpretace. Níže je uvedena tabulka zatížení na rotované faktory.

    Tabulka 3.17

    Tabulka faktorového zatížení (rotace - varimax)

    STATISTICKÁ FAKTOROVÁ ANALÝZA

    Faktorová zatížení (Varimax normalizovaná) Extrakce: Hlavní komponenty

    Variabilní

    Faktor 1

    Faktor 2

    Celkový rozptyl

    Podíl na celkovém disp.

    Jak je vidět z tabulky 3.17, první faktor se vyznačuje vysokým zatížením proměnných souvisejících se spokojeností v práci a druhý faktor je poznamenán spokojeností doma. Z toho můžeme usoudit, že spokojenost měřená dotazníkem se skládá ze dvou částí: spokojenost s domovem a prací. Tedy vyrobeno klasifikace studované proměnné. Na základě získané klasifikace lze první faktor nazvat faktorem pracovní spokojenosti (nebo faktorem sociálních hodnot) a podle toho druhým faktorem faktorem domácí spokojenosti (nebo faktorem osobních hodnot).

      Interpretace výsledků faktorové analýzy

    Poslední fází faktorové analýzy je smysluplná interpretace faktorů získaných v důsledku rotace. Zde se od výzkumníka vyžaduje dobré teoretické zázemí a znalost experimentálních výsledků již nashromážděných v této oblasti výzkumu.

    Interpretace faktorů v praxi spočívá v přidělení významných vah faktorů (referenčních proměnných) pro každý z faktorů. Neexistují žádná přesná kritéria pro rozlišení mezi významnými vahami faktorů (zatížení) a nevýznamnými. Například v případě velkých vzorků (několik stovek lidí nebo více) se zatížení 0,3 nebo více někdy považuje za významné. Při redukování vzorku na několik desítek osob se jako významné používají váhy v řádu 0,4–0,5.

    Interpretace faktorů neprobíhá vždy hladce; v některých případech je pouze hypotetický (např. v případě použití dat odpovídajících různým typům škál) a někdy od něj autoři zcela upouštějí, protože faktor zahrnuje testy, ve kterých je obtížné vidět něco společného.

    V ideálním případě (distribuce proměnných se neliší od normálního) může interpretace výsledků faktorové analýzy začít analýzou korelační matice, poté přejít k faktorovému zatížení (výběr referenčních proměnných). Dalším krokem je porovnání výsledků korelační matice a vybraných faktorů obsahujících významné váhy. A konečně poslední fází je analýza získaných obecností obsahu a povahy těch studovaných proměnných (vlastností), které s tímto faktorem nejvíce korelují. Pojmenování faktorů se provádí s přihlédnutím k těm referenčním proměnným, které získaly maximální váhy a mají nejvyšší korelaci s faktorem. Pokud například testy hodnotící schopnost zachytit nesmyslný materiál mají vysokou hmotnostní zátěž tohoto faktoru, pak lze tento faktor nazvat faktorem „rotační paměti“.

    Faktorová analýza je odvětví matematické statistiky. Jeho cílem, stejně jako cílem jiných částí matematické statistiky, je vyvíjet modely, koncepty a metody, které umožňují analyzovat a interpretovat pole experimentálních nebo pozorovaných dat bez ohledu na jejich fyzickou podobu.

    Jednou z nejtypičtějších forem reprezentace experimentálních dat je matice, jejíž sloupce odpovídají různým parametrům, vlastnostem, testům atd. a řádky odpovídají jednotlivým objektům, jevům, režimům popsaným sadou konkrétních hodnot parametrů. V praxi se ukazuje, že rozměry matice jsou poměrně velké: například počet řádků této matice se může lišit od několika desítek do několika set tisíc (například v sociologických průzkumech) a počet sloupců se může lišit. od jedné přes dvě až po několik stovek. Přímá, „vizuální“ analýza matic této velikosti je nemožná, proto v matematické statistice vzniklo mnoho přístupů a metod navržených tak, aby „komprimovaly“ počáteční informace obsažené v matici na zvládnutelnou velikost, extrahovaly to „nejpodstatnější“ , přičemž se vyřadí „sekundární“, „náhodné“.

    Při analýze dat prezentovaných ve formě matice vyvstávají dva typy problémů. Úlohy prvního typu jsou zaměřeny na získání „stručného popisu“ rozložení objektů a úlohy druhého typu jsou zaměřeny na odhalení vztahů mezi parametry.

    Je třeba mít na paměti, že hlavní podnět ke vzniku těchto problémů nespočívá pouze a ani ne tak v touze po krátkém zakódování velkého množství čísel, ale v mnohem zásadnější okolnosti metodologické povahy: jakmile bylo možné stručně popsat velké pole čísel, pak můžeme věřit, že byla objevena určitá objektivní zákonitost, která umožnila podat krátký popis; a právě hledání objektivních vzorců je hlavním cílem, pro který se data zpravidla sbírají.

    Uvedené přístupy a metody zpracování datové matice se liší v tom, jaký typ úlohy zpracování dat mají řešit, a na jakou velikost matic jsou použitelné.

    Pokud jde o problém krátkého popisu vztahů mezi parametry s průměrným počtem těchto parametrů, pak v tomto případě odpovídající korelační matice obsahuje několik desítek či stovek čísel a sama o sobě ještě nemůže sloužit jako „krátký popis“ existující vztahy mezi parametry, ale měly by za účelem dalšího zpracování.

    Faktorová analýza je pouze soubor modelů a metod navržených tak, aby „komprimovaly“ informace obsažené v korelační matici. Různé modely faktorové analýzy jsou založeny na následující hypotéze: pozorované nebo měřené parametry jsou pouze nepřímými charakteristikami studovaného objektu nebo jevu, ale ve skutečnosti existují vnitřní (skryté, ne přímo pozorované) parametry nebo vlastnosti, jejichž počet je malý a které určují hodnoty sledovaných parametrů. Tyto vnitřní parametry se nazývají faktory. Úkolem faktorové analýzy je reprezentovat pozorované parametry ve formě lineárních kombinací faktorů a možná i některých dodatečných „irelevantních“ hodnot – „šumů“. Pozoruhodným faktem je, že ačkoliv samotné faktory nejsou známy, lze takový rozklad získat a navíc lze takové faktory určit, tzn. pro každý objekt lze zadat hodnoty každého faktoru.

    Faktorová analýza bez ohledu na použité metody začíná zpracováním tabulky interkorelací získaných na sadě testů, známé jako korelační matice, a končí získáním faktorové matice, tzn. tabulka uvádějící hmotnost nebo zatížení každého z faktorů pro každý test. Tabulka 1 je hypotetická matice faktorů, která zahrnuje pouze dva faktory.

    Faktory jsou uvedeny v horním řádku tabulky od nejvýznamnějších po nejméně významné a jejich váhy v každém z 10 testů jsou uvedeny v odpovídajících sloupcích.

    stůl 1

    Matice hypotetických faktorů

    Souřadnicové osy. Je obvyklé reprezentovat faktory geometricky ve formě souřadnicových os, vzhledem k nimž lze každý test znázornit jako bod. Rýže. 1 vysvětluje tento postup. V tomto grafu je každý z 10 testů uvedených v tabulce 1 zobrazen jako tečka vzhledem ke dvěma faktorům, které odpovídají osám I a II. Test 1 je tedy reprezentován bodem se souřadnicemi 0,74 podél osy I a 0,54 podél osy II. Body představující zbývajících 9 testů jsou konstruovány podobným způsobem s použitím hodnot hmotnosti z tabulky 1. 1.

    Je třeba poznamenat, že poloha souřadnicových os není daty pevně dána. Původní korelační tabulka určuje pouze polohu testů (tj. bodů na obr. 1) vůči sobě navzájem. Stejné body lze vykreslit v rovině s libovolnou polohou souřadnicových os. Z tohoto důvodu je při provádění faktorové analýzy běžné osy otáčet, dokud nezískáte nejpřijatelnější a snadno interpretovatelné zobrazení.

    Rýže. 1. Mapování hypotetických faktorů ukazující váhy dvou skupinových faktorů pro každý z 10 testů.

    Na Obr. 1 získané po otočení osy I" a II" jsou znázorněny tečkovanými čarami. Tato rotace byla provedena podle kritérií navržených Thurstonem. pozitivní rozmanitost a jednoduchá struktura. První zahrnuje otočení os do polohy, kde jsou eliminovány všechny významné záporné váhy. Většina psychologů považuje zatížení negativními faktory za logicky nevhodné pro testy schopností, protože takové zatížení znamená, že čím vyšší skóre jednotlivce v konkrétním faktoru dosáhne, tím nižší bude jeho skóre v tomto testu. Kritérium jednoduché struktury v podstatě znamená, že každý test by měl mít zatížení na co nejmenší počet faktorů.

    Splnění obou kritérií dává faktory, které lze nejsnáze a jednoznačně interpretovat. Pokud má test vysoké zatížení na jeden faktor a žádné významné zatížení na ostatní faktory, můžeme se dozvědět něco o povaze tohoto faktoru zkoumáním obsahu testu. Naproti tomu, pokud má test střední nebo nízké zatížení šesti faktorů, řekne nám jen málo o povaze kteréhokoli z nich.

    Na Obr. Obrázek 1 jasně ukazuje, že po otočení souřadnicových os jsou všechny verbální testy (1-5) umístěny podél osy I" nebo velmi blízko k ní a numerické testy (6-10) jsou těsně seskupeny kolem osy II". Nová součinitelská zatížení naměřená vzhledem k natočeným osám jsou uvedena v tabulce. 2. Faktorová zatížení v tabulce. 2 nemají záporné hodnoty, s výjimkou zanedbatelných hodnot, které lze jednoznačně přičíst chybám ve vzorkování. Všechny verbální testy mají vysokou zátěž pro faktor I" a téměř nulovou - pro faktor II". Numerické testy mají naopak vysoké zatížení pro faktor II" a zanedbatelně nízké zatížení pro faktor I". Rotace souřadnicových os tedy značně zjednodušila identifikaci a pojmenování obou faktorů a také popis faktorové skladby každého testu. V praxi se často ukazuje, že počet faktorů je více než dva, což samozřejmě komplikuje jejich geometrické znázornění a statistický rozbor, ale nemění to podstatu uvažovaného postupu.

    tabulka 2

    Faktorová matice po rotaci

    Někteří badatelé se řídí teoretickým modelem jako principem rotace os. Zohledňuje také stálost nebo potvrzení stejných faktorů v nezávisle provedených, ale srovnatelných studiích.

    Interpretace faktorů. Po získání faktorového řešení (nebo jednodušeji faktorové matice) po proceduře rotace můžeme přistoupit k interpretaci a pojmenování faktorů. Tato fáze práce vyžaduje spíše psychologickou intuici než statistickou přípravu. Abychom porozuměli povaze konkrétního faktoru, nezbývá nám nic jiného, ​​než studovat testy, které tento faktor silně zatěžují, a pokusit se objevit psychologické procesy, které jsou jim společné. Čím více testů s vysokým zatížením tohoto faktoru, tím snazší je odhalit jeho povahu. Od stolu. 2 je například okamžitě jasné, že faktor I je verbální a faktor II je číselný. Uvedeno v tabulce. 2 zatížení faktorem také zobrazuje korelaci každého testu s faktorem.

    FÁZE FAKTOROVÉ ANALÝZY

    Existuje devět fází faktorové analýzy. Pro přehlednost uvádíme tyto fáze ve schématu a poté je stručně popíšeme.

    Fáze faktorové analýzy jsou znázorněny na Obr.

    Rýže.

    FORMULACE PROBLÉMU A KONSTRUKCE KORELAČNÍ MATICE

    Formulace problému. Je nutné jasně definovat cíle faktorové analýzy. Proměnné podrobené faktorové analýze jsou stanoveny na základě minulých výzkumů, teoretických výpočtů nebo podle uvážení výzkumníka. Proměnné je třeba měřit v interval nebo relativní měřítko. Zkušenosti ukazují, že velikost vzorku by měla být čtyřikrát až pětkrát větší než počet proměnných.

    Konstrukce korelační matice. Analýza je založena na korelační matici mezi proměnnými. Vhodnost provedení faktorové analýzy je dána přítomností korelací mezi proměnnými. Pokud jsou korelace mezi všemi proměnnými malé, pak je faktorová analýza k ničemu. Proměnné, které spolu úzce souvisí, mají tendenci vysoce korelovat se stejným faktorem nebo faktory.

    Pro testování proveditelnosti použití faktoriálního modelu existuje několik statistik. Bartlettův test sféricity testuje nulovou hypotézu, že mezi proměnnými v populaci neexistuje žádná korelace. To znamená, že uvažujeme o tvrzení, že populační korelační matice je matice identity, ve které jsou všechny diagonální prvky rovny jedné a všechny ostatní jsou rovny nule. Test sféricity je založen na převodu determinantu korelační matice na chí-kvadrát statistiku. Pokud je statistika velká, nulová hypotéza se zamítne. Pokud není nulová hypotéza zamítnuta, je faktorová analýza nevhodná. Další užitečnou statistikou je Kaiser-Meyer-Olkin (KMO) test adekvátnosti vzorku. Tento koeficient porovnává hodnoty pozorovaných korelačních koeficientů s hodnotami dílčích korelačních koeficientů. Malé hodnoty KMO - statistiky naznačují, že korelace mezi dvojicemi proměnných nelze vysvětlit jinými proměnnými, což znamená, že použití faktorové analýzy je nevhodné.

    Základní rovnice

    Dříve téměř všechny učebnice a monografie faktorové analýzy poskytovaly vysvětlení, jak provádět základní výpočty „ručně“ nebo pomocí jednoduchého počítacího zařízení (aritmometr nebo kalkulačka). V dnešní době, vzhledem ke složitosti a velkému množství výpočtů nutných k sestavení matice vztahů, identifikaci faktorů a jejich rotaci, asi nezůstal jediný člověk, který by při provádění faktorové analýzy nepoužíval výkonné počítače a související programy.

    Proto se zaměříme na to, jaké jsou nejvýznamnější matice (soubory dat), které lze v průběhu faktorové analýzy získat, jak spolu souvisí a jak je lze použít k interpretaci dat. Všechny potřebné výpočty lze provést pomocí libovolného počítačového programu (např. SPSS nebo STADIA).

    V tab. 1 je uveden seznam nejdůležitějších matic pro analýzu hlavních komponent a faktorovou analýzu. Tento seznam obsahuje především matice vztahů (mezi proměnnými, mezi faktory, mezi proměnnými a faktory), standardizovaná skóre (podle proměnných a podle faktorů), regresní váhy (pro výpočet skóre faktorů pomocí skóre podle proměnných) a matice pro mapování vztahů mezi faktory. a proměnné po šikmé rotaci. V tab. 1 jsou uvedeny také matice vlastních čísel a odpovídající vlastní vektory. Vlastní čísla (vlastní čísla) a vlastní vektory jsou popsány kvůli jejich důležitosti pro výběr faktorů, použití velkého množství speciálních termínů v tomto ohledu a také úzkému vztahu mezi vlastními čísly a rozptylem ve statistických studiích.

    stůl 1

    Matice nejčastěji používané ve faktorové analýze

    Označení název Velikost Popis
    R Vztahová matice pxp Vztahy mezi proměnnými
    D Vlastní datová matice Nxp Primární data - nestandardizované hodnoty pozorování primárních proměnných
    Z Standardizovaná datová matice Nxp Standardizované hodnoty pozorování podle primárních proměnných
    F Faktor Value Matrix N x F Standardizované hodnoty pozorování podle faktorů
    A Matice načítání faktorů Matice mapování faktorů p x F Regresní koeficienty pro společné faktory za předpokladu, že sledované proměnné jsou lineární kombinací faktorů. V případě ortogonální rotace - vztahy mezi proměnnými a faktory
    V Koeficientová matice hodnot faktorů p x F Regresní koeficienty pro výpočet hodnot faktorů pomocí proměnných hodnot
    S Strukturální matice p x F Vztahy mezi proměnnými a faktory
    F Faktorová korelační matice F X F Korelace mezi faktory
    L Matice vlastních čísel (úhlopříčka) F X F Vlastní čísla (charakteristické, latentní kořeny); každý faktor odpovídá jedné vlastní hodnotě
    PROTI Matice vlastních vektorů F X F Vlastní (charakteristické) vektory; každé vlastní číslo odpovídá jednomu vlastnímu vektoru

    Poznámka. Při zadávání velikosti se udává počet řádků x počet sloupců: R- počet proměnných, N- počet pozorování, F- počet faktorů nebo složek. Pokud je matice vztahů R není zdegenerovaný a má stejné postavení R, pak to vlastně vynikne R vlastní čísla a vlastní vektory, nikoli F. Nicméně jen pro zajímavost F z nich. Proto zbývající p-f nejsou zobrazeny.

    Na matrice S A F je aplikována pouze šikmá rotace, zbytek - ortogonální a šikmá rotace.

    Soubor dat připravených pro faktorovou analýzu sestává z výsledků měření (průzkumu) velkého počtu subjektů (respondentů) na určitých škálách (proměnných). V tab. 2 je dáno pole dat, které lze podmíněně považovat za vyhovující požadavkům faktorové analýzy.

    Pěti respondentům, kteří požádali cestovní kancelář o koupi letenky do přímořského letoviska, byly položeny otázky, jaký význam pro ně mají čtyři podmínky (proměnné) pro výběr destinace pro letní dovolenou. Těmito proměnlivými podmínkami byly: náklady na prohlídku, komfort areálu, teplota vzduchu, teplota vody. Čím důležitější, z pohledu respondenta, ta či ona podmínka pro něj měla, tím větší důležitost jí přikládal. Výzkumným úkolem bylo prostudovat model vztahu mezi proměnnými a identifikovat základní příčiny, které určují volbu resortu. (Příklad je samozřejmě extrémně zjednodušený pro ilustrativní a vzdělávací účely a neměl by být brán vážně ve smysluplném aspektu.)

    Matice vztahů ( tab. 2) byla vypočtena jako korelace. Věnujte pozornost struktuře vztahů v něm, zvýrazněné svislými a vodorovnými čarami. Vysoké korelace v levém horním a pravém dolním kvadrantu ukazují, že hodnocení nákladů na prohlídku a pohodlí komplexu spolu souvisí, stejně jako hodnocení teploty vzduchu a teploty vody. Další dva kvadranty ukazují, že spolu souvisí teplota vzduchu a komfort areálu, stejně jako komfort areálu a teplota vody.

    Nyní zkusme pomocí faktorové analýzy detekovat tuto strukturu korelací, snadno viditelnou pouhým okem v malé korelační matici (ve velké matici je to velmi obtížné).

    tabulka 2

    Data pro faktorovou analýzu (případová studie)

    Turisté Proměnné
    Cena lístku Úroveň pohodlí Teplota vzduchu Teplota vody
    T1
    T2
    T3
    T4
    T5

    Korelační matice

    Cena lístku Úroveň pohodlí Teplota vzduchu Teplota vody
    Cena lístku 1,000 -0,953 -0,055 -0,130
    Úroveň pohodlí -0,953 1,000 -,091 -0,036
    Teplota vzduchu -0,055 -0,091 1,000 0,990
    Teplota vody -0,130 -0,036 0,990 1,000

    Faktorizace

    Důležitá věta z maticové algebry říká, že matice splňující určité podmínky lze diagonalizovat, tzn. převedena na matici s čísly na hlavní diagonále a nulami na všech ostatních pozicích. Vztahové matice patří specificky k typu diagonalizovatelných matic. Transformace se provádí podle vzorce:

    těch. matice R je diagonalizována tak, že ji nejprve (zleva) vynásobíme transponovanou maticí V, označenou V', a poté (zprava) samotnou maticí V.

    Sloupce v matici V se nazývají vlastní vektory a hodnoty na hlavní diagonále matice L se nazývají vlastní čísla. První vlastní vektor odpovídá prvnímu vlastnímu číslu a tak dále. (další podrobnosti viz příloha 1).

    Vzhledem k tomu, že ve výše uvedeném příkladu jsou uvažovány čtyři proměnné, získáme čtyři vlastní čísla s jejich odpovídajícími vlastními vektory. Ale protože cílem faktorové analýzy je zobecnit matici vztahů prostřednictvím co nejmenšího počtu faktorů a každá vlastní hodnota odpovídá různým potenciálním faktorům, obvykle se berou v úvahu pouze faktory s velkými vlastními hodnotami. S „dobrým“ faktorovým řešením matice vypočtených vztahů získaná pomocí této omezené sady faktorů prakticky duplikuje matici vztahů.

    V našem příkladu, když neexistují žádná omezení počtu faktorů, jsou pro každý ze čtyř možných faktorů vypočteny vlastní hodnoty 2,02, 1,94, 0,04 a 0,00. Pouze pro první dva faktory jsou vlastní hodnoty dostatečně velké, aby byly předmětem dalšího zvažování. Proto jsou znovu extrahovány pouze první dva faktory. Mají vlastní hodnoty 2,00 a 1,91, jak je uvedeno v tabulce 1. 3. Pomocí rovnice (6) a vložením hodnot z výše uvedeného příkladu dostaneme:

    (Všechny počítačem vypočítané hodnoty jsou stejné; "ruční" výpočty se mohou lišit kvůli nepřesnostem zaokrouhlování.)

    Levé násobení matice vlastních vektorů tou transponovanou do ní dává matici identity E (s jedničkami na hlavní diagonále a ostatními nulami). Můžeme tedy říci, že transformace matice vztahů podle vzorce (6) ji sama o sobě nemění, ale pouze ji transformuje do vhodnější formy pro analýzu:

    Například:

    Tabulka 3

    Vlastní vektory a odpovídající vlastní hodnoty pro uvažovanou případovou studii

    Vlastní vektor 1 Vlastní vektor 2
    -.283 .651
    .177 -.685
    .658 .252
    .675 .207
    Vlastní hodnota 1 Vlastní hodnota 2
    2.00 1.91

    Vzhledem k tomu, že korelační matice je diagonalizovatelná, lze na ni použít maticovou algebru vlastních vektorů a vlastních hodnot pro získání výsledků faktorové analýzy (viz Příloha 1). Pokud je matice diagonalizovatelná, pak jsou všechny podstatné informace o struktuře faktorů obsaženy v její diagonální podobě. Ve faktorové analýze odpovídají vlastní hodnoty rozptylu vysvětlenému faktory. Faktor s největším vlastním číslem vysvětluje největší rozptyl a tak dále, dokud nedojde k faktorům s malými nebo zápornými vlastními hodnotami, které jsou obvykle z analýzy vynechány. Výpočty vlastních hodnot a vlastních vektorů jsou velmi pracné a schopnost je vypočítat není pro psychologa, který ovládá faktorovou analýzu pro své vlastní praktické účely, naprostou nutností. Znalost tohoto postupu však neuškodí, proto v příloze 1 uvádíme jako příklad výpočet vlastních hodnot a vlastních vektorů na malé matici.

    Pro nalezení vlastních hodnot čtvercové matice p x p je nutné najít kořeny polynomu stupně p a pro nalezení vlastních vektorů je nutné řešit p rovnice s p neznámými s dalšími bočními omezeními, které pro p >3 se zřídka provádí ručně. Jakmile jsou nalezeny vlastní vektory a vlastní hodnoty, zbytek faktorové analýzy (nebo analýzy hlavních komponent) bude víceméně jasný (viz rovnice 8-11).

    Rovnice (6) může být reprezentována jako: R=V'LV, (8)

    těch. matici vztahů lze považovat za součin tří matic - matice vlastních čísel, matice odpovídajících vlastních vektorů a matice do ní transponované.

    Po transformaci lze matici vlastních čísel L reprezentovat takto:

    a proto: R=VÖLÖL V’ (10)

    nebo (což je totéž): R=(VÖL)(ÖL V’)

    Označte: A=(VÖL) a A'=(ÖL V'), poté R=AA' (11)

    těch. matici vztahů lze také reprezentovat jako součin dvou matic, z nichž každá je kombinací vlastních vektorů a odmocnin vlastních hodnot.

    Rovnice (11) se často nazývá základní rovnicí faktorové analýzy. Vyjadřuje tvrzení, že matice vztahů je součin faktorové zátěžové matice (A) a její transpozice.

    Rovnice (10) a (11) také ukazují, že významnou částí výpočtů v metodách faktorové analýzy a hlavních komponent je stanovení vlastních čísel a vlastních vektorů. Jakmile jsou tyto známy, matice předrotačního faktoru se získá přímým násobením matice:

    V našem příkladu:

    Matice zatížení faktorů je maticí vztahů (interpretovaných jako korelační koeficienty) mezi faktory a proměnnými. V prvním sloupci jsou korelace mezi prvním faktorem a každou proměnnou v pořadí: náklady na prohlídku (-0,400), pohodlí komplexu (0,251), teplota vzduchu (0,932), teplota vody (. 956). Ve druhém sloupci jsou korelace mezi druhým faktorem a každou proměnnou: náklady na prohlídku (0,900), komfort komplexu (-,947), teplota vzduchu (0,348), teplota vody (0,286). Faktor je interpretován na základě proměnných, které jsou s ním silně spojeny (tj. mají vysoké zatížení). První faktor je tedy především „klimatický“ (teplota vzduchu a vody), zatímco druhý je „ekonomický“ (náklady na prohlídku a pohodlí komplexu).

    Při interpretaci těchto faktorů je třeba věnovat pozornost skutečnosti, že proměnné, které mají vysokou zátěž na první faktor (teplota vzduchu a teplota vody), jsou pozitivně korelované, zatímco proměnné, které mají vysoké zatížení na druhý faktor (náklady na zájezd a komfort komplexu) negativně korelují.(nemůžete čekat velký komfort od levného resortu). První faktor se nazývá unipolární (všechny proměnné jsou seskupeny na jednom pólu) a druhý se nazývá bipolární (proměnné se dělí na dvě protilehlé skupiny - dva póly). Proměnné s faktorem zatížení se znaménkem plus tvoří kladný pól a proměnné se znaménkem mínus tvoří záporný pól. Názvy pólů „pozitivní“ a „negativní“ při interpretaci faktoru přitom nemají hodnotící význam „špatný“ a „dobrý“. Znaménko se při výpočtech volí náhodně. Nahrazení všech znamének jejich protiklady (všechna plus mínus a všechna mínus plusem) nezmění řešení. Analýza znaků je nezbytná pouze pro identifikaci skupin (co je proti čemu). Se stejným úspěchem lze jeden pól nazvat pravý, druhý levý. V našem příkladu se ukázalo, že variabilní cena voucheru je na kladném (pravém) pólu, je v protikladu k variabilnímu komfortu komplexu na záporném (levém) pólu. A tento faktor lze interpretovat (pojmenovat) jako „Economy and Comfort“. Respondenti, pro které je problém úspor významný, se ukázali být vpravo - obdrželi faktoriální hodnoty se znaménkem plus. Při výběru resortu se více zaměřují na jeho levnost a méně na pohodlí. Respondenti, kteří na dovolené nešetří (cena voucheru je příliš netrápí) a chtějí si odpočinout především v komfortních podmínkách, se ukázali jako vlevo - obdrželi hodnoty faktoru s znaménko "mínus".

    Je však třeba mít na paměti, že všechny proměnné vysoce korelují s oběma faktory. V rámci tohoto jednoduchého příkladu je výklad zřejmý, ale v případě reálných dat není vše tak jednoduché. Obvykle je faktor snáze interpretovatelný, pokud s ním vysoce koreluje pouze malá část proměnných a zbytek ne.

    Ortogonální rotace

    Rotace se obvykle aplikuje po extrakci faktoru, aby se maximalizovaly vysoké korelace a minimalizovaly nízké. Existuje mnoho metod rotace, ale nejčastěji používaná je rotace varimax, což je postup maximalizace rozptylu. Tato rotace maximalizuje variace zatížení faktorem tím, že vysoké zatížení je vyšší a nízké zatížení nižší než v den každého faktoru. Tohoto cíle je dosaženo prostřednictvím transformační matice L:

    A před zatáčkou L=A po zatáčce,

    těch. matice faktorových zatížení před zatáčkou se vynásobí transformační maticí a výsledkem je matice faktorových zatížení po zatáčce. V našem příkladu:

    Porovnejte matice před a po otočení. Všimněte si, že matice po rotaci má nízké váhy faktorů nižší a vysoké váhy faktorů vyšší než matice před rotací. Zdůrazněný rozdíl v zatížení usnadňuje interpretaci faktoru a umožňuje jednoznačně vybrat proměnné, které jsou s ním silně propojeny.

    Prvky transformační matice mají speciální geometrickou interpretaci:

    Transformační matice je matice sinů a kosinů úhlu ψ, o který se rotace provádí. (Odtud název transformace je rotace, protože z geometrického hlediska jsou osy natočeny kolem počátku faktorového prostoru.) V našem příkladu je tento úhel přibližně 19 stupňů: cos19°= ,946 a sin19° =.325. Geometricky to odpovídá otočení os faktoriálu o 19 stupňů kolem počátku. (Více o geometrických aspektech rotace viz níže.)