Što je nadzirano strojno učenje?
U učenju pod nadzorom, vi trenirate stroj koristeći podatke koji su dobro "označeni ". To znači da su neki podaci već označeni točnim odgovorom. Može se usporediti s učenjem koje se odvija u prisutnosti supervizora ili učitelja.
Nadzirani algoritam učenja uči iz označenih podataka o treningu, pomaže vam predvidjeti ishode za nepredviđene podatke. Za uspješnu izgradnju, skaliranje i primjenu preciznog nadziranog strojnog učenja Model znanosti znanosti treba vremena i tehničke stručnosti tima visoko kvalificiranih znanstvenika podataka. Štoviše, podatkovni znanstvenik mora obnoviti modele kako bi osigurao da dani uvidi ostanu istiniti sve dok se podaci ne promijene.
U ovom ćete tutorijalu naučiti
- Što je nadzirano strojno učenje?
- Što je nenadgledano učenje?
- Zašto supervizirano učenje?
- Zašto učenje bez nadzora?
- Kako funkcionira nadzirano učenje?
- Kako funkcionira nenadgledano učenje?
- Vrste nadziranih tehnika strojnog učenja
- Vrste tehnika bez strojnog učenja
- Nadzirano protiv nenadziranog učenja
Što je nenadgledano učenje?
Učenje bez nadzora je tehnika strojnog učenja, gdje ne trebate nadgledati model. Umjesto toga, trebate dopustiti modelu da samostalno radi na otkrivanju informacija. Uglavnom se bavi neobilježenim podacima.
Algoritmi učenja bez nadzora omogućuju vam obavljanje složenijih zadataka obrade u usporedbi s nadzorom učenja. Iako nenadgledano učenje može biti nepredvidljivije u usporedbi s drugim metodama dubokog učenja i ojačavanja.
Zašto supervizirano učenje?
- Nadzirano učenje omogućuje vam prikupljanje podataka ili dobivanje podataka iz prethodnog iskustva.
- Pomaže vam u optimizaciji kriterija izvedbe koristeći iskustvo
- Nadzirano strojno učenje pomaže vam u rješavanju različitih vrsta računalnih problema u stvarnom svijetu.
Zašto učenje bez nadzora?
Evo glavnih razloga za upotrebu učenja bez nadzora:
- Strojno učenje bez nadzora pronalazi sve vrste nepoznatih obrazaca u podacima.
- Nenadgledane metode pomažu vam u pronalaženju značajki koje mogu biti korisne za kategorizaciju.
- Održava se u stvarnom vremenu, tako da se svi ulazni podaci analiziraju i označavaju u prisutnosti učenika.
- Lakše je dobiti neoznačene podatke s računala nego etiketirane podatke koji trebaju ručnu intervenciju.
Kako funkcionira nadzirano učenje?
Na primjer, želite osposobiti stroj kako bi vam pomogao predvidjeti koliko će vam trebati vožnja kući sa svog radnog mjesta. Ovdje započinjete sa stvaranjem niza označenih podataka. Ovi podaci uključuju
- Vremenski uvjeti
- Doba dana
- Praznici
Svi ovi detalji su vaši unosi. Rezultat je vrijeme potrebno za povratak kući tog određenog dana.
Instinktivno znate da će vam vani trebati više vremena ako vozite vani. Ali stroj treba podatke i statistiku.
Pogledajmo sada kako možete razviti model učenja pod nadzorom iz ovog primjera koji pomaže korisniku da odredi vrijeme putovanja na posao. Prvo što trebate stvoriti je skup podataka o treningu. Ovaj set treninga sadržavat će ukupno vrijeme putovanja na posao i odgovarajuće čimbenike kao što su vrijeme, vrijeme itd. Na temelju ovog kompleta treninga, vaš bi stroj mogao primijetiti da postoji izravna veza između količine kiše i vremena koje ćete trebati za povratak kući.
Dakle, utvrđuje da što više kiše, to ćete duže voziti do svog doma. Mogla bi vidjeti i vezu između vremena napuštanja posla i vremena na putu.
Što ste bliže 18 sati, potrebno je više vremena da stignete kući. Vaš će uređaj možda pronaći neke veze s vašim označenim podacima.
Ovo je početak vašeg podatkovnog modela. Počinje utjecati na to kako kiša utječe na način vožnje. Također se uočava da više ljudi putuje u određeno doba dana.
Kako funkcionira nenadgledano učenje?
Uzmimo slučaj bebe i njezina obiteljskog psa.
Ona zna i identificira ovog psa. Nekoliko tjedana kasnije obiteljski prijatelj dovodi psa i pokušava se igrati s bebom.
Beba ovog psa nije vidjela ranije. Ali prepoznaje mnoge osobine (2 uha, oči, hodanje na 4 noge) poput njenog psa ljubimca. Ona identificira novu životinju poput psa. Ovo je učenje bez nadzora, gdje vas ne uče, ali učite iz podataka (u ovom slučaju podataka o psu.) Da je to bilo pod nadzorom, obiteljski bi prijatelj rekao bebi da je to pas.
Vrste nadziranih tehnika strojnog učenja
Regresija:
Tehnika regresije predviđa jednu izlaznu vrijednost pomoću podataka treninga.
Primjer: Pomoću regresije možete predvidjeti cijenu kuće iz podataka s treninga. Ulazne varijable bit će mjesto, veličina kuće itd.
Klasifikacija:
Klasifikacija znači grupiranje rezultata unutar klase. Ako algoritam pokušava označiti ulaz u dvije različite klase, to se naziva binarna klasifikacija. Odabir između više od dvije klase naziva se klasifikacija više klasa.
Primjer : Utvrđivanje hoće li netko neplatiti zajam.
Prednosti : Izlazi uvijek imaju vjerojatnosnu interpretaciju, a algoritam se može regulirati kako bi se izbjeglo prekomjerno prilagođavanje.
Slabosti : Logistička regresija može biti loša kad postoje višestruke ili nelinearne granice odlučivanja. Ova metoda nije fleksibilna pa ne obuhvaća složenije odnose.
Vrste tehnika bez strojnog učenja
Problemi učenja bez nadzora nadalje se grupiraju u probleme klasterizacije i udruživanja.
Skupljanje
Grupiranje je važan koncept kada je u pitanju učenje bez nadzora. Uglavnom se bavi pronalaženjem strukture ili uzorka u zbirci nekategoriziranih podataka. Algoritmi klasteriranja obradit će vaše podatke i pronaći prirodne klastere (grupe) ako oni postoje u podacima. Također možete izmijeniti koliko klastera vaši algoritmi trebaju prepoznati. Omogućuje vam podešavanje granularnosti ovih grupa.
Udruživanje
Pravila pridruživanja omogućuju vam uspostavljanje povezivanja među objektima podataka unutar velikih baza podataka. Ova nenadgledana tehnika odnosi se na otkrivanje uzbudljivih odnosa između varijabli u velikim bazama podataka. Na primjer, ljudi koji kupuju novi dom najvjerojatnije će kupiti novi namještaj.
Ostali primjeri:
- Podskupina oboljelih od raka grupirana prema mjerenjima ekspresije gena
- Grupe kupaca na temelju njihove povijesti pregledavanja i kupnje
- Filmska grupa prema ocjeni koju su dali gledatelji filmova
Nadzirano protiv nenadziranog učenja
Parametri | Nadzirana tehnika strojnog učenja | Tehnika strojnog učenja bez nadzora |
Postupak | U nadziranom modelu učenja dat će se ulazne i izlazne varijable. | U modelu učenja bez nadzora, davat će se samo ulazni podaci |
Ulazni podaci | Algoritmi se treniraju pomoću označenih podataka. | Algoritmi se koriste protiv podataka koji nisu označeni |
Upotrijebljeni algoritmi | Stroj s vektorskim potporama, neuronska mreža, linearna i logistička regresija, slučajna šuma i stabla klasifikacije. | Nenadgledani algoritmi mogu se podijeliti u različite kategorije: poput algoritama klastera, K-sredstva, hijerarhijska klasterizacija itd. |
Računalna složenost | Učenje pod nadzorom jednostavnija je metoda. | Učenje bez nadzora je računski složeno |
Korištenje podataka | Nadzirani model učenja koristi podatke o treningu kako bi naučio vezu između ulaza i rezultata. | Učenje bez nadzora ne koristi izlazne podatke. |
Točnost rezultata | Izuzetno točna i pouzdana metoda. | Manje precizna i pouzdana metoda. |
Učenje u stvarnom vremenu | Metoda učenja odvija se izvan mreže. | Metoda učenja odvija se u stvarnom vremenu. |
Broj predavanja | Broj časova je poznat. | Broj časova nije poznat. |
Glavni nedostatak | Klasifikacija velikih podataka može biti pravi izazov u nadgledanom učenju. | Ne možete dobiti precizne informacije o sortiranju podataka, a izlaz kao podaci korišteni u nenadgledanom učenju označen je i nepoznat. |
Sažetak
- U učenju pod nadzorom, vi trenirate stroj koristeći podatke koji su dobro "označeni".
- Učenje bez nadzora je tehnika strojnog učenja, gdje ne trebate nadgledati model.
- Nadzirano učenje omogućuje vam prikupljanje podataka ili dobivanje podataka iz prethodnog iskustva.
- Strojno učenje bez nadzora pomaže vam u pronalaženju svih vrsta nepoznatih obrazaca u podacima.
- Primjerice, moći ćete odrediti vrijeme potrebno za povratak na osnovu vremenskih uvjeta, doba dana i praznika.
- Na primjer, beba može identificirati druge pse na temelju prethodnog učenja pod nadzorom.
- Regresija i klasifikacija dvije su vrste nadziranih tehnika strojnog učenja.
- Grupiranje i udruživanje dvije su vrste učenja bez nadzora.
- U nadgledanom modelu učenja dat će se ulazne i izlazne varijable, dok će se kod modela bez nadzora dati samo ulazni podaci