Indhold
En uoverensstemmelse er en værdi i et datasæt, der er langt fra andre værdier. Uoverensstemmelser kan være forårsaget af eksperimentelle eller målefejl. I de første tilfælde kan det være ønskeligt at identificere afvigende og fjerne dem fra andre data, før der udføres en statistisk analyse for at undgå at påvirke resultaterne, da de ikke troværdigt repræsenterer prøvepopulationen. Den enkleste måde at identificere uoverensstemmelser på er med kvartilmetoden.
Trin 1
Angiv dataene i stigende rækkefølge. Overvej datasættet {4, 5, 2, 3, 15, 3, 3, 5}. Bestilt er datasæteksemplet: {2, 3, 3, 3, 4, 5, 5, 15}.
Trin 2
Find medianen. Dette er det centrale tal, der deler den største halvdel fra den mindre halvdel. Hvis der er et lige antal data, skal gennemsnittet af de to beregnes. For eksempel: i det citerede datasæt er midtpunkterne 3 og 4, så medianen er (3 + 4) / 2 = 3,5.
Trin 3
Find det øverste kvartil, Q2, datapunkt, der opdeler gruppen mellem de 75% mindste og de 25% største. Hvis datasættet er jævnt, gennemsnit to point omkring kvartilen. I det foregående eksempel: (5 + 5) / 2 = 5.
Trin 4
Find den laveste kvartil, Q1, det datapunkt, der adskiller de mindste 25% fra de største 75%. Hvis datasættet er jævnt, gennemsnit to point omkring kvartilen. I eksemplet: (3 + 3) / 2 = 3.
Trin 5
Træk det nedre kvartil fra det øvre kvartil for at opnå interkvartilområdet, IQ. I eksemplet: Q2 - Q1 = 5 - 3 = 2.
Trin 6
Multiplicer interkvartilområdet med 1,5. Føj den øverste kvartil til resultatet, og træk den nedre kvartil. Ethvert datapunkt uden for disse værdier er en mild uoverensstemmelse. For det givne eksempel: 1,5 x 2 = 3. 3 - 3 = 0 og 5 +3 = 8. Enhver værdi, der er mindre end 0 eller større end 8, vil således være en lille uoverensstemmelse. Dette betyder, at 15 kvalificerer sig som en lille uoverensstemmelse.
Trin 7
Multiplicer interkvartilområdet med 3. Føj til det øverste kvartil, og træk det nedre kvartil. Ethvert datapunkt uden for disse værdier er en ekstrem uoverensstemmelse. For det givne eksempel er 3 x 2 = 6. 3-6 = -3 og 5 + 6 = 11. Enhver værdi mindre end -3 eller større end 11 er således en ekstrem uoverensstemmelse. Dette betyder, at 15 kvalificerer sig som en ekstrem uoverensstemmelse.