I det föregående ämnet lärde vi oss övervakad maskininlärning där modeller tränas med hjälp av märkt data under övervakning av träningsdata. Men det kan finnas många fall där vi inte har märkt data och behöver hitta de dolda mönstren från den givna datamängden. Så för att lösa sådana typer av fall inom maskininlärning behöver vi oövervakade inlärningstekniker.
Vad är oövervakat lärande?
Som namnet antyder är oövervakad inlärning en maskininlärningsteknik där modeller inte övervakas med hjälp av träningsdataset. Istället hittar modellerna själva de dolda mönstren och insikterna från den givna datan. Det kan jämföras med lärande som sker i den mänskliga hjärnan samtidigt som man lär sig nya saker. Det kan definieras som:
hur många städer i USA
Oövervakad inlärning är en typ av maskininlärning där modeller tränas med hjälp av omärkt datauppsättning och tillåts agera på dessa data utan någon övervakning.
Oövervakat lärande kan inte direkt appliceras på ett regressions- eller klassificeringsproblem eftersom vi till skillnad från övervakat lärande har indata men inga motsvarande utdata. Målet med oövervakat lärande är att hitta den underliggande strukturen för datamängden, gruppera dessa data efter likheter och representera datamängden i ett komprimerat format .
Exempel: Antag att den oövervakade inlärningsalgoritmen ges en indatadatauppsättning som innehåller bilder av olika typer av katter och hundar. Algoritmen tränas aldrig på den givna datamängden, vilket betyder att den inte har någon aning om funktionerna i datasetet. Uppgiften för den oövervakade inlärningsalgoritmen är att identifiera bildegenskaperna på egen hand. Oövervakad inlärningsalgoritm kommer att utföra denna uppgift genom att gruppera bilddatauppsättningen i grupperna enligt likheter mellan bilder.
Varför använda Unsupervised Learning?
Nedan följer några huvudskäl som beskriver vikten av oövervakat lärande:
- Oövervakat lärande är användbart för att hitta användbara insikter från data.
- Oövervakat lärande påminner mycket om att en människa lär sig att tänka utifrån sina egna erfarenheter, vilket gör den närmare den verkliga AI:n.
- Oövervakat lärande fungerar på omärkta och okategoriserade data som gör oövervakat lärande viktigare.
- I den verkliga världen har vi inte alltid indata med motsvarande utdata så för att lösa sådana fall behöver vi oövervakat lärande.
Arbete av oövervakat lärande
Arbetet med oövervakat lärande kan förstås av nedanstående diagram:
Här har vi tagit en omärkt indata, vilket betyder att den inte är kategoriserad och motsvarande utdata inte heller ges. Nu matas denna omärkta indata till maskininlärningsmodellen för att träna den. För det första kommer den att tolka rådata för att hitta de dolda mönstren från data och sedan tillämpa lämpliga algoritmer som k-means-klustring, beslutsträd, etc.
använder internet
När den väl tillämpar den lämpliga algoritmen delar algoritmen in dataobjekten i grupper enligt likheterna och skillnaderna mellan objekten.
Typer av oövervakad inlärningsalgoritm:
Algoritmen för oövervakad inlärning kan ytterligare kategoriseras i två typer av problem:
Obs: Vi kommer att lära oss dessa algoritmer i senare kapitel.
Algoritmer för oövervakad inlärning:
Nedan är listan över några populära oövervakade inlärningsalgoritmer:
Fördelar med oövervakat lärande
- Oövervakat lärande används för mer komplexa uppgifter jämfört med övervakat lärande eftersom vi i oövervakat lärande inte har märkta indata.
- Oövervakat lärande är att föredra eftersom det är lätt att få omärkta data i jämförelse med märkta data.
Nackdelar med oövervakat lärande
- Oövervakat lärande är i sig svårare än övervakat lärande eftersom det inte har motsvarande effekt.
- Resultatet av den oövervakade inlärningsalgoritmen kan vara mindre exakt eftersom indata inte är märkta och algoritmerna inte känner till den exakta utdatan i förväg.