Övervakad inlärning är den typ av maskininlärning där maskiner tränas med hjälp av väl 'märkta' träningsdata, och på grundval av dessa data förutsäger maskiner resultatet. Märkta data betyder att vissa indata redan är taggade med rätt utdata.
Vid övervakad inlärning fungerar träningsdata som tillhandahålls till maskinerna som handledaren som lär maskinerna att förutsäga resultatet korrekt. Det tillämpar samma koncept som en elev lär sig i handledning av läraren.
Övervakad inlärning är en process för att tillhandahålla indata såväl som korrekta utdata till maskininlärningsmodellen. Syftet med en övervakad inlärningsalgoritm är att hitta en mappningsfunktion för att mappa indatavariabeln(x) med utdatavariabeln(y) .
I den verkliga världen kan övervakat lärande användas för Riskbedömning, bildklassificering, bedrägeriupptäckt, skräppostfiltrering , etc.
Hur fungerar övervakat lärande?
I övervakat lärande tränas modeller med hjälp av märkt dataset, där modellen lär sig om varje typ av data. När träningsprocessen är klar testas modellen på basis av testdata (en delmängd av träningsuppsättningen), och sedan förutsäger den resultatet.
Hur övervakat lärande fungerar kan enkelt förstås av nedanstående exempel och diagram:
Anta att vi har en datauppsättning av olika typer av former som inkluderar kvadrat, rektangel, triangel och polygon. Nu är det första steget att vi behöver träna modellen för varje form.
- Om den givna formen har fyra sidor och alla sidor är lika, kommer den att märkas som en Fyrkant .
- Om den givna formen har tre sidor kommer den att märkas som en triangel .
- Om den givna formen har sex lika sidor kommer den att märkas som sexhörning .
Nu efter träning testar vi vår modell med hjälp av testsetet, och modellens uppgift är att identifiera formen.
Maskinen är redan tränad på alla typer av former, och när den hittar en ny form, klassificerar den formen på basen av ett antal sidor och förutsäger resultatet.
Steg involverade i övervakat lärande:
- Bestäm först vilken typ av träningsdatauppsättning
- Samla/samla in märkt träningsdata.
- Dela upp träningsdatauppsättningen i träning dataset, testdatauppsättning och valideringsdatauppsättning .
- Bestäm inmatningsfunktionerna för träningsdatauppsättningen, som bör ha tillräckligt med kunskap så att modellen exakt kan förutsäga resultatet.
- Bestäm lämplig algoritm för modellen, såsom stödvektormaskin, beslutsträd, etc.
- Kör algoritmen på träningsdatauppsättningen. Ibland behöver vi valideringsuppsättningar som kontrollparametrar, som är underuppsättningen av träningsdatauppsättningar.
- Utvärdera modellens noggrannhet genom att tillhandahålla testsetet. Om modellen förutsäger rätt utdata, betyder det att vår modell är korrekt.
Typer av övervakade maskininlärningsalgoritmer:
Övervakat lärande kan vidare delas in i två typer av problem:
1. Regression
Regressionsalgoritmer används om det finns ett samband mellan indatavariabeln och utdatavariabeln. Den används för att förutsäga kontinuerliga variabler, såsom väderprognoser, marknadstrender, etc. Nedan följer några populära regressionsalgoritmer som ingår i övervakad inlärning:
- Linjär regression
- Regressionsträd
- Icke-linjär regression
- Bayesiansk linjär regression
- Polynomregression
2. Klassificering
Klassificeringsalgoritmer används när utdatavariabeln är kategorisk, vilket betyder att det finns två klasser som Ja-Nej, Man-Kvinna, Sant-falskt, etc.
Skräppostfiltrering,
- Random Forest
- Beslutsträd
- Logistisk tillbakagång
- Stöd vektor maskiner
Obs: Vi kommer att diskutera dessa algoritmer i detalj i senare kapitel.
Fördelar med övervakat lärande:
- Med hjälp av övervakat lärande kan modellen förutsäga resultatet utifrån tidigare erfarenheter.
- Vid övervakat lärande kan vi ha en exakt uppfattning om objektklasserna.
- Övervakad inlärningsmodell hjälper oss att lösa olika verkliga problem som t.ex bedrägeriupptäckt, skräppostfiltrering , etc.
Nackdelar med övervakat lärande:
- Övervakade lärandemodeller är inte lämpliga för att hantera de komplexa uppgifterna.
- Övervakad inlärning kan inte förutsäga korrekt utdata om testdata skiljer sig från träningsdatauppsättningen.
- Träningen krävde många beräkningstider.
- I övervakat lärande behöver vi tillräckligt med kunskap om objektklasserna.