Regressio vs. ANOVA
Regressio ja ANOVA (varianssianalyysi) ovat tilastoteoriassa kaksi menetelmää yhden muuttujan käyttäytymisen analysoimiseksi toiseen. Regressiossa se on usein riippuvan muuttujan vaihtelu riippumattoman muuttujan perusteella, kun taas ANOVA: ssa se on kahden populaation kahden näytteen attribuuttien vaihtelu.
Lisätietoja regressiosta
Regressio on tilastollinen menetelmä, jota käytetään kahden muuttujan välisen suhteen piirtämiseen. Usein tietoja kerätessä voi olla muuttujia, jotka ovat riippuvaisia muista. Tarkka suhde näiden muuttujien välillä voidaan vahvistaa vain regressiomenetelmillä. Tämän suhteen määrittäminen auttaa ymmärtämään ja ennustamaan yhden muuttujan käyttäytymistä toiselle.
Regressioanalyysin yleisin sovellus on arvioida riippuvan muuttujan arvo tietylle arvolle tai riippuvuuksien muuttujien arvoalueelle. Esimerkiksi regressiota käyttämällä voimme määrittää hyödykehinnan ja kulutuksen välisen suhteen satunnaisotoksesta kerättyjen tietojen perusteella. Regressioanalyysi tuottaa tietojoukon regressiofunktion, joka on matemaattinen malli, joka parhaiten sopii käytettävissä olevaan dataan. Tämä voidaan helposti esittää sirontakaaviona. Graafinen regressio vastaa parhaiten sopivan käyrän löytämistä annetulle tietojoukolle. Käyrän funktio on regressiofunktio. Matemaattisen mallin avulla hyödykkeen käyttö voidaan ennustaa tietylle hinnalle.
Siksi regressioanalyysiä käytetään laajalti ennustamiseen ja ennustamiseen. Sitä käytetään myös suhteiden luomiseen kokeellisissa tiedoissa fysiikan, kemian ja monien luonnontieteiden ja tekniikan aloilla. Jos suhde tai regressiofunktio on lineaarinen funktio, prosessia kutsutaan lineaariseksi regressioksi. Hajontakaaviossa se voidaan esittää suorana viivana. Jos funktio ei ole parametrien lineaarinen yhdistelmä, regressio on epälineaarinen.
Lisätietoja ANOVAsta (varianssianalyysi)
ANOVA ei sisällä nimenomaisesti kahden tai useamman muuttujan välisen suhteen analysointia. Pikemminkin se tarkistaa, onko kahdella tai useammalla näytteellä eri populaatioista sama keskiarvo. Otetaan esimerkiksi huomioon koululuokalle pidetyn kokeen testitulokset. Vaikka testit ovat erilaiset, suorituskyky voi olla samanlainen luokittain. Yksi tapa tarkistaa tämä on vertaamalla jokaisen luokan keskiarvoja. ANOVA tai Varianssianalyysi mahdollistavat tämän hypoteesin testaamisen. Perusteellisesti ANOVA: ta voidaan pitää t-testin jatkeena, jossa verrataan kahdesta populaatiosta otettujen kahden näytteen keskiarvoja.
ANOVA: n perusajatuksena on ottaa huomioon vaihtelu näytteessä ja vaihtelu näytteiden välillä. Näytteen vaihtelu voidaan liittää satunnaisuuteen, kun taas näytteiden vaihtelu voidaan liittää sekä satunnaisuuteen että muihin ulkoisiin tekijöihin. Varianssianalyysi perustuu kolmeen malliin; kiinteiden vaikutusten malli, satunnaisvaikutusten malli ja sekoitettujen vaikutusten malli.
Mitä eroa on regressiolla ja ANOVA: lla?
• ANOVA on kahden tai useamman näytteen vaihteluanalyysi, kun taas regressio on kahden tai useamman muuttujan välisen suhteen analyysi.
• ANOVA-teoriaa käytetään kolmella perusmallilla (kiinteiden vaikutusten malli, satunnaisvaikutusten malli ja sekoitettujen vaikutusten malli), kun taas regressiota käytetään kahdella mallilla (lineaarinen regressiomalli ja moniregressiomalli).
• ANOVA ja Regression ovat molemmat kaksi versiota yleisestä lineaarisesta mallista (GLM). ANOVA perustuu kategorisiin ennustemuuttujiin, kun taas regressio perustuu kvantitatiivisiin ennustemuuttujiin.
• Regressio on joustavampi tekniikka, ja sitä käytetään ennustamiseen ja ennustamiseen, kun taas ANOVA: ta käytetään kahden tai useamman populaation tasa-arvon vertaamiseen.