Indhold
Medianen er midtpunktet for et sæt bestilte data. For eksempel har sættet (2,4,7,9,10) en median på 7. De ordnede data aggregeres i kategorier med den nøjagtige detalje for hvert punkt af datatab. Derfor kan den nøjagtige median ikke kendes alene fra grupperede data. Men hvis du kender antallet af data i hvert interval, kan du se, hvad der er "middle range", det vil sige hvad indeholder det punkt, der er medianen. Vi kan yderligere justere median punkt estimatet ved hjælp af en formel baseret på antagelsen om, at midtpunkt datapunkter er jævnt fordelt.
retninger
At lære at beregne mediet i en datagruppe er en simpel opgave (Hemera Technologies / AbleStock.com / Getty Images)-
Grupper værdierne i intervaller, hvis de ikke allerede er. Bestem hvilket interval der skal indeholde midtpunktet.
Til didaktiske formål overveje datasættet (1,2,4,5,6,7,7,7,9). Medianen her er 6. Du kan gruppere sætet i bredder svarende til 4, for eksempel. Deres frekvensfordeling kan f.eks. Være: 1-4: 3 5-8: 5 9-12: 1 I de ikke-samlede data er medianen klart i kategori 5-8. Du kan endda sige det uden at se det oprindelige datasæt.
-
Beregn forskellen i antallet af datapunkter over mellemlinjen og halvdelen af det samlede antal datapunkter.
Ifølge det, der er nævnt, svarer dette til 9/2 - 3 = 1,5. Denne beregning anslår, hvor langt fra mellemområdet bør medianen findes.
-
Opdelt efter antallet af point i mellemområdet.
Fortsat med eksemplet, 1,5 / 5 = 0,3. Dette giver et forhold mellem, hvor langt mellemområdet medianen er.
-
Multiplicér værdien opnået ovenfor ved bredden af mellemområdet.
Fortsat med eksemplet, 0,3 x 4 = 1,2. Dette omdanner forholdet inden for området til et faktisk dataforhøjelse.
-
Tilføj ovenstående resultat til værdien mellem mellemområdet og det nedre område.
Da snit mellem middel og lavere interval er 4,5, får vi ligningen 4,5 + 1,2 = 5,7, som kan få resultatet afrundet til 6, det rigtige svar.
tips
- Faktisk er ovenstående beregning den samme som i formlen "L + (n / 2 - c) / fxw", hvor L er tallet mellem midten og det næste lavere interval, n er det samlede antal datapunkter, c er det samlede antal prikker under mellemkanten, f er antallet af datapunkter i mellemområdet, og w er bredden.