Keskiarvo vs mediaani vs tila
Keskiarvo, mediaani ja tila ovat ensisijaisia keskitaipumuksen mittareita, joita käytetään kuvailevissa tilastoissa. Ne ovat täysin erilaisia toisistaan, ja tapaukset, joissa niitä käytetään tietojen yhteenvetoon, ovat myös erilaisia.
Tarkoittaa
Aritmeettinen keskiarvo on data-arvojen summa jaettuna data-arvojen lukumäärällä, ts
Jos tiedot ovat näytetilasta, sitä kutsutaan näytekeskiarvoksi (
), joka on otoksen kuvaava tilasto. Vaikka se on näytteen yleisimmin käytetty kuvaava mittari, se ei ole vankka tilasto. Se on erittäin herkkä poikkeamille ja värähtelyille.
Tarkastellaan esimerkiksi tietyn kaupungin kansalaisten keskimääräisiä tuloja. Koska kaikki data-arvot lasketaan yhteen ja jaetaan sitten, erittäin varakkaiden ihmisten tulot vaikuttavat merkittävästi keskiarvoon. Siksi keskiarvot eivät aina kuvaa dataa hyvin.
Vaihtelevan signaalin tapauksessa elementin läpi kulkeva virta vaihtelee ajoittain positiivisesta suunnasta negatiiviseen suuntaan ja päinvastoin. Jos otamme elementin läpi kulkevan keskimääräisen virran yhdellä jaksolla, se antaa arvon 0, mikä tarkoittaa, että virtaa ei ole kulkenut elementin läpi, mikä ei tietenkään ole totta. Siksi myös tässä tapauksessa aritmeettinen keskiarvo ei ole hyvä mitta.
Aritmeettinen keskiarvo on hyvä indikaattori, kun tiedot jakautuvat tasaisesti. Normaalijakauman keskiarvo on sama kuin moodi ja mediaani. Sillä on myös pienimmät jäännökset, kun otetaan huomioon keskimääräinen neliövirhe; Siksi paras kuvaava toimenpide, kun sitä vaaditaan edustamaan tietojoukkoa yhdellä numerolla.
Mediaani
Keskidatapisteen arvot sen jälkeen, kun kaikki data-arvot on järjestetty nousevaan järjestykseen, määritellään tietojoukon mediaanina. Mediaani on 2. kvartiili, 5. desili ja 50. persentiili.
• Jos havaintojen (datapisteiden) määrä on pariton, mediaani on havainto tarkalleen järjestetyn luettelon keskellä.
• Jos havaintojen (datapisteiden) määrä on tasainen, mediaani on järjestettyjen luetteloiden kahden keskihavainnon keskiarvo.
Mediaani jakaa havainnon kahteen ryhmään; ts. ryhmä (50%) arvoja korkeampi ja ryhmä (50%) arvoja pienempi kuin mediaani. Mediaaneja käytetään erityisesti vinossa jakaumassa ja ne edustavat tietoja melko paremmin kuin aritmeettinen keskiarvo.
Tila
Tila on havaintokokonaisuuden yleisimmin käytetty luku. Tietojoukon tila lasketaan etsimällä joukon kunkin elementin taajuus.
• Jos arvoa ei esiinny useammin kuin kerran, tietojoukolla ei ole tilaa.
• Muussa tapauksessa kaikki suurimmalla taajuudella esiintyvät arvot ovat tietojoukon tila.
Sarjassa voi olla useampi kuin yksi tila; siksi tila ei ole ainutkertainen tilastotiedosto. Tasaisessa jakaumassa on yksi tila. Diskreetin todennäköisyysjakauman tila on piste, jossa todennäköisyysmassafunktio saavuttaa korkeimman pisteen. Yllä olevista tulkinnoista voidaan sanoa, että globaalit maksimit ovat moodeja.
Harkitse kaikkien kolmen toimenpiteen soveltamista seuraavaan tietojoukkoon.
TIEDOT: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Keskiarvo = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8,12
Mediaani = 9 (13. elementti)
Tila = 9 (taajuus 9 = 5)
Mitä eroa on keskiarvo, mediaani ja tila?
• Aritmeettinen keskiarvo on arvojen (havaintojen) summa jaettuna havaintojen määrällä. Se ei ole vankka tilasto ja riippuu voimakkaasti normaalista jakauman luonteesta tarkasteltavan jakauman sisällä. Yksittäinen poikkeama voi aiheuttaa merkittävän muutoksen keskiarvossa ja antaa suhteellisen harhaanjohtavia arvoja. Käsite voidaan laajentaa koskemaan geometrista keskiarvoa, harmonista keskiarvoa, painotettua keskiarvoa ja niin edelleen.
• Mediaani on havaintoryhmän keskiarvo, ja poikkeamat vaikuttavat siihen suhteellisen vähemmän. Se voi antaa hyvän arvion, koska yhteenvetotilasto on erittäin vinossa.
• Tila on yleisimmät tietojoukon havaintoarvot. Jos jakauma on positiivinen vinossa, tila jää mediaanille ja, jos negatiivisesti vinossa, tila on oikealle mediaanille.
• Jos keskiarvo on positiivisesti vinossa, mediaani on oikea; jos negatiivisesti vinossa keskiarvo on mediaanin vasemmalla puolella.
• Normaalijakaumassa kaikki kolme, keskiarvo, tila ja mediaani ovat samat.