Poikkeama vs. keskihajonta
Poikkeama vs. keskihajonta
Kuvailevassa ja pääteltävässä tilastossa käytetään useita indeksejä kuvaamaan tietojoukkoa, joka vastaa sen keskeistä taipumusta, leviämistä ja vinoutta. Tilastollisessa päättelyssä nämä tunnetaan yleisesti estimaattoreina, koska ne arvioivat populaatioparametrien arvot.
Hajonta on tietojen leviämisen mittari tietojoukon keskustan ympärillä. Keskihajonta on yksi yleisimmin käytetyistä dispersiomittauksista. Kunkin datapisteen poikkeamat keskiarvosta otetaan huomioon laskettaessa keskihajontaa. Siksi voidaan väittää, että keskihajonta yhdessä keskiarvon kanssa antaa melkein riittävän kuvan tietojoukosta.
Harkitse seuraavaa tietojoukkoa. 10 ihmisen painoksi (kilogrammoina) mitataan 70, 62, 65, 72, 80, 70, 63, 72, 77 ja 79. Sitten kymmenen ihmisen keskimääräinen paino (kilogrammoina) on 71 (kilogrammoina)).
Mikä on poikkeama?
Tilastossa poikkeama tarkoittaa määrää, jolla yksittäinen datapiste eroaa kiinteästä arvosta, kuten keskiarvosta. Olkoon k yleensä kiinteä arvo ja x 1, x 2,…, x n tarkoittavat tietojoukkoa. Sitten x j: n poikkeama k: sta määritetään (x j - k): ksi.
Esimerkiksi yllä olevassa datajoukossa vastaavat poikkeamat keskiarvosta ovat (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80-71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 ja (79-71) = 8.
Mikä on keskihajonta?
Kun koko väestön tiedot voidaan ottaa huomioon (esimerkiksi väestönlaskennan tapauksessa), on mahdollista laskea väestön keskihajonta. Populaation keskihajonnan laskemiseksi ensin lasketaan data-arvojen poikkeamat populaation keskiarvosta. Poikkeamien neliökeskiarvoa (neliöllistä keskiarvoa) kutsutaan populaation keskihajonnaksi. Symboleissa σ = √ {∑ (x i -µ) 2 / n}, jossa µ on populaation keskiarvo ja n on populaation koko.
Kun populaation parametrien arvioimiseksi käytetään näytteen (koon n) tietoja, lasketaan otoksen keskihajonta. Ensin lasketaan data-arvojen poikkeamat näytekeskiarvosta. Koska populaatiokeskiarvon sijasta käytetään otoskeskiarvoa (joka ei ole tiedossa), neliön keskiarvon ottaminen ei ole asianmukaista. Näytekeskiarvon käytön kompensoimiseksi poikkeamien neliöiden summa jaetaan (n-1): llä n: n sijasta. Näyte keskihajonta on tämän neliöjuuri. Matemaattisissa symboleissa S = √ {∑ (x i -ẍ) 2 / (n-1)}, missä S on näytteen keskihajonta, ẍ on näytekeskiarvo ja xi ovat datapisteet.
Aikaisemmassa datajoukossa poikkeaman neliöiden summa on (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Populaation keskihajonta on siis √ (366/10) = 6,05 (kilogrammoina). (Olettaen, että tarkasteltava väestö koostuu kymmenestä ihmisestä, joilta tiedot on otettu).
Mikä on ero poikkeaman ja keskihajonnan välillä? • Keskihajonta on tilastollinen indeksi ja estimaattori, mutta poikkeama ei ole. • Vakiopoikkeama on mitta, joka hajottaa tietokokonaisuuden keskeltä, kun taas poikkeama viittaa määrään, jolla yksittäinen datapiste eroaa kiinteästä arvosta. |