Indhold
Analysen af hovedkomponenterne reducerer et sæt af variabler korreleret med et mindre sæt ukorrelerede variabler, hvilket forenkler et komplekst datasæt til senere analyse. Denne komplekse statistiske procedure kan udføres af mange programmer for dataanalyse eller add-on-programmer, som udvider evnerne til det samme, tilføjer nye funktioner.
Regnearksprogrammer som Excel kan udføre større komponentanalyse ved hjælp af en udvidelse (Billede af Flickr.com, taknemmelighed af Casey Serin)
Forenkling af et datasæt
Analysen af hovedkomponenterne er en teknik til udforskning og reduktion af data. En analytiker kan bruge teknikken til at udtrække relevant information fra et stort og forvirrende sæt data. Teknikken bruges almindeligvis, når antallet af observerede variabler er meget stort, og korrelationerne mellem dem gør dataene vanskelige at analysere direkte. For eksempel kan korrelationen mellem variablerne i nogle tilfælde skabe et fejlagtigt indtryk af dataredundans, hvilket gør teknisk analyse vanskelig eller kompromitterer evalueringen af dataene. Analysen af hovedkomponenterne forenkler variablerne, der udtrykker dem som en funktion af et mindre antal elementer, hovedkomponenterne, som repræsenterer størstedelen af variationerne i dataens målinger.
Brug i programmet
Kompleksiteten ved at analysere hovedkomponenterne kræver brug af et specifikt program. Der er en bred vifte af statistiske programmer, og de fleste af dem er i stand til at udføre denne teknik. De mest populære programmer er SAS, Stata og SPSS. Universiteter, forskningscentre, konsulentorganisationer og andre forskningspersonale bruger disse specifikke programmer. Alle tre kan udføre større komponentanalyse af et datasæt indsat i et regneark, hvor rækkerne repræsenterer de enkelte observationer, og kolonnerne repræsenterer de separate variable.
karakter
De fleste større komponentanalyseprogrammer, herunder SAS, Stata og SPSS, vil præsentere resultaterne i form af tabeller, der indeholder egenværdierne eller variansforklaringer forklaret. Mange programmer giver også den visuelle visning af resultater i form af en scree plot.
overvejelser
Hovedkomponentanalyse er ofte forvekslet med factorialanalyse, en anden metode til datareduktion, der forklarer korrelerede observationer med hensyn til underliggende faktorer. De to er faktisk separate procedurer, selv om større komponentanalyse er et trin med faktoranalyse. Imidlertid kombinerer mange pakker de to procedurer.
En anden vigtig overvejelse er, at specialprogrammer som SAS, SPSS og Stata er dyre. Derfor kan disse programmer måske ikke være nyttige for folk, der ikke planlægger at foretage statistiske analyser ofte.
Excel
Personer, der har brug for at udføre nogle statistiske analyser, men foretrækker ikke at købe et specialprogram, kan spørgsmålet om, hvorvidt almindeligt anvendte regnearksprogrammer, som f.eks. Excel, kan udføre en større komponentanalyse. Svaret er ja og nej. Selvom Excel har nogle dataanalyseværktøjer, der kan være tilgængelige fra installationen af en statistisk analysepakke, er programmet ikke beregnet til at være et statistisk analyseprogram. Hovedkomponentanalyse og faktoranalyse er ikke blandt dataanalyseværktøjets funktioner.
Forebyggelse / løsning
Der er et program, som brugerne kan downloade og installere for at forbedre funktionerne i Excel som et dataanalyseværktøj. Addinsoft, et softwarefirma med speciale i analyseprogrammer, har skabt XLSTAT. Dette program gør det muligt for Excel at udføre større komponentanalyse og andre statistiske procedurer. Det har også brugervenlige procedurer, som giver brugeren mulighed for at vælge dataene til analyse ved blot at klikke og trække en celle gennem de krævede felter. Brugere kan købe og downloade XLSTAT fra Addinsoft hjemmeside. Der er også en gratis version, som brugerne kan prøve, før de beslutter at købe det.