Tärkein ero - valvottu ja valvomaton koneoppiminen
Ohjattu oppiminen ja valvomaton oppiminen ovat koneoppimisen kaksi peruskäsitettä. Ohjattu oppiminen on koneoppimistehtävä, jolla opitaan toiminto, joka kartoittaa tulon lähtöön esimerkki panos-lähtö-parien perusteella. Valvomaton oppiminen on koneoppimistehtävä, jonka perusteella päätellään funktio kuvaamaan piilotettua rakennetta merkitsemättömistä tiedoista. Keskeinen ero valvotun ja valvomattoman koneoppimisen välillä on se, että valvottu oppiminen käyttää merkittyjä tietoja, kun taas valvomaton oppiminen käyttää merkitsemättömiä tietoja.
Koneoppiminen on tietojenkäsittelytieteen ala, joka antaa tietojärjestelmälle mahdollisuuden oppia tiedoista ilman nimenomaista ohjelmointia. Sen avulla voidaan analysoida tietoja ja ennustaa niiden malleja. Koneoppimisen sovelluksia on monia. Jotkut niistä ovat kasvojentunnistus, eleiden tunnistaminen ja puheen tunnistaminen. Koneoppimiseen liittyy useita algoritmeja. Jotkut niistä ovat regressiota, luokittelua ja klustereita. Yleisimmät ohjelmointikielet koneoppimiseen perustuvien sovellusten kehittämiseksi ovat R ja Python. Muita kieliä, kuten Java, C ++ ja Matlab, voidaan käyttää.
SISÄLLYS
1. Yleiskatsaus ja keskeinen ero
2. Mikä on
valvottu oppiminen 3. Mikä on valvomaton oppiminen
4. Valvotun ja valvomattoman koneoppimisen yhtäläisyydet
5. Rinnakkain vertailu - valvottu vs. valvomaton koneoppiminen taulukkomuodossa
6. Yhteenveto
Mitä on ohjattu oppiminen?
Koneoppimiseen perustuvissa järjestelmissä malli toimii algoritmin mukaisesti. Ohjatussa oppimisessa mallia valvotaan. Ensin vaaditaan mallin kouluttaminen. Saadun tiedon avulla se voi ennustaa vastauksia tuleville instansseille. Malli koulutetaan käyttämällä merkittyä tietojoukkoa. Kun järjestelmälle annetaan näytetietoja, se voi ennustaa tuloksen. Seuraava on pieni ote suositusta IRIS-tietojoukosta.
Yllä olevan taulukon mukaan seepalin pituutta, seepalin leveyttä, Patelin pituutta, Patelin leveyttä ja Lajia kutsutaan määritteiksi. Sarakkeet tunnetaan ominaisuuksina. Yhdellä rivillä on tietoja kaikista määritteistä. Siksi yhtä riviä kutsutaan havainnoksi. Tiedot voivat olla joko numeerisia tai kategorisia. Mallille annetaan havainnot, joiden syötteenä on vastaava lajin nimi. Kun uusi havainto annetaan, mallin tulisi ennustaa lajien tyyppi, johon se kuuluu.
Ohjatussa oppimisessa on luokittelua ja regressiota koskevia algoritmeja. Luokittelu on merkittyjen tietojen luokitteluprosessi. Malli loi rajat, jotka erottivat dataluokat. Kun mallille toimitetaan uusia tietoja, se voi luokitella pisteen sijainnin perusteella. K-lähimmät naapurit (KNN) on luokittelumalli. Luokasta päätetään k-arvon mukaan. Esimerkiksi kun k on 5, jos tietty tietopiste on lähellä kahdeksaa datapistettä luokassa A ja kuutta datapistettä luokassa B, datapiste luokitellaan A.
Regressio on prosessi, jolla ennustetaan aiempien tietojen suuntaus uusien tietojen tuloksen ennustamiseksi. Regressiossa lähtö voi koostua yhdestä tai useammasta jatkuvasta muuttujasta. Ennustus tehdään viivalla, joka peittää suurimman osan datapisteistä. Yksinkertaisin regressiomalli on lineaarinen regressio. Se on nopea eikä vaadi viritysparametreja, kuten KNN: ssä. Jos tiedot osoittavat parabolista trendiä, lineaarinen regressiomalli ei ole sopiva.
Nämä ovat joitain esimerkkejä valvotuista oppimisalgoritmeista. Yleensä valvottujen oppimismenetelmien tulokset ovat tarkempia ja luotettavampia, koska syötetyt tiedot ovat hyvin tunnettuja ja merkittyjä. Siksi koneen on analysoitava vain piilotetut kuviot.
Mikä on valvomaton oppiminen?
Valvomattomassa oppimisessa mallia ei valvota. Malli toimii itsenäisesti tulosten ennustamiseksi. Se käyttää koneoppimisalgoritmeja tekemään johtopäätöksiä merkitsemättömistä tiedoista. Yleensä valvomaton oppimisalgoritmit ovat vaikeampia kuin valvotut oppimisalgoritmit, koska tietoa on vähän. Klusterointi on eräänlainen valvomaton oppiminen. Sitä voidaan käyttää tuntemattomien tietojen ryhmittelemiseen algoritmeilla. K-keskiarvo ja tiheyspohjainen klusterointi ovat kaksi klusterointialgoritmia.
k-keskimääräinen algoritmi, sijoittaa k sentroidin satunnaisesti kullekin klusterille. Sitten kukin datapiste osoitetaan lähimpään sentroidiin. Euklidista etäisyyttä käytetään etäisyyden laskemiseen datapisteestä sentroidiin. Datapisteet luokitellaan ryhmiin. K-keskipisteiden sijainnit lasketaan uudelleen. Uusi keskiöasento määritetään ryhmän kaikkien pisteiden keskiarvolla. Kukin datapiste on jälleen osoitettu lähimpään sentroidiin. Tämä prosessi toistuu, kunnes keskiosat eivät enää muutu. k-keskiarvo on nopea klusterointialgoritmi, mutta klusterointipisteiden alustusta ei ole määritelty. Lisäksi klusteripisteiden alustamiseen perustuvia klusterimalleja on paljon.
Toinen klusterointialgoritmi on tiheyspohjainen klusterointi. Se tunnetaan myös nimellä Density Based Spatial Clustering Applications with noise. Se toimii määrittelemällä klusteri tiheydeksi kytkettyjen pisteiden maksimijoukoksi. Ne ovat kaksi parametria, joita käytetään tiheyspohjaiseen klusterointiin. Ne ovat Ɛ (epsilon) ja vähimmäispisteet. Ɛ on naapuruston suurin säde. Minimipisteet ovat vähimmäispisteiden määrä Ɛ-naapurustossa klusterin määrittelemiseksi. Nämä ovat joitain esimerkkejä klustereista, jotka kuuluvat valvomattomaan oppimiseen.
Yleensä valvomattomien oppimisalgoritmien tuottamat tulokset eivät ole kovin tarkkoja ja luotettavia, koska koneen on määriteltävä ja merkittävä syötetiedot ennen piilotettujen kuvioiden ja toimintojen määrittämistä.
Mikä on valvotun ja valvomattoman koneoppimisen yhtäläisyys?
Sekä valvottu että valvomaton oppiminen ovat koneoppimisen tyyppejä
Mikä on ero valvotun ja valvomattoman koneoppimisen välillä?
Erilainen artikkeli keskellä taulukkoa
Valvottu vs. valvomaton koneoppiminen |
|
Ohjattu oppiminen on koneoppimistehtävä oppia toiminto, joka kartoittaa tulon lähtöön esimerkki panos-lähtö-parien perusteella. | Valvomaton oppiminen on koneoppimistehtävä, jolla päätellään funktio kuvaamaan piilotettua rakennetta leimaamattomista tiedoista. |
Tärkeimmät toiminnot | |
Valvotussa oppimisessa malli ennustaa tuloksen merkittyjen syötetietojen perusteella. | Valvomattomassa oppimisessa malli ennustaa tuloksen ilman merkittyjä tietoja tunnistamalla mallit itse. |
Tulosten tarkkuus | |
Valvottujen oppimismenetelmien tulokset ovat tarkempia ja luotettavampia. | Valvomaton oppimismenetelmästä saadut tulokset eivät ole kovin tarkkoja ja luotettavia. |
Pääalgoritmit | |
Ohjatussa oppimisessa on regressio- ja luokittelualgoritmeja. | Valvomattomassa oppimisessa on algoritmeja klusterointiin. |
Yhteenveto - valvottu ja valvomaton koneoppiminen
Ohjattu oppiminen ja valvomaton oppiminen ovat kaksi koneoppimisen tyyppiä. Ohjattu oppiminen on koneoppimistehtävä oppia toiminto, joka kartoittaa tulon lähtöön esimerkki panos-lähtö-parien perusteella. Valvomaton oppiminen on koneoppimistehtävä, jolla päätellään funktio kuvaamaan piilotettua rakennetta leimaamattomista tiedoista. Ero valvotun ja valvomattoman koneoppimisen välillä on se, että valvotussa oppimisessa käytetään merkittyjä tietoja, kun taas valvomattomissa oppimisissa käytetään etiketöimätöntä tietoa.