Maskininlärning är en delmängd av AI, som gör det möjligt för maskinen att automatiskt lära sig av data, förbättra prestanda från tidigare erfarenheter och göra förutsägelser . Maskininlärning innehåller en uppsättning algoritmer som fungerar på en enorm mängd data. Data matas till dessa algoritmer för att träna dem, och på basis av träning bygger de modellen och utför en specifik uppgift.
Dessa ML-algoritmer hjälper till att lösa olika affärsproblem som regression, klassificering, prognoser, kluster och associationer, etc.
Utifrån metoderna och sättet att lära sig delas maskininlärning in i huvudsakligen fyra typer, vilka är:
- Övervakad maskininlärning
- Maskininlärning utan tillsyn
- Semi-övervakad maskininlärning
- Förstärkningsinlärning
I det här ämnet kommer vi att ge en detaljerad beskrivning av typerna av maskininlärning tillsammans med deras respektive algoritmer:
1. Övervakad maskininlärning
Som namnet antyder, Övervakad maskininlärning bygger på tillsyn. Det betyder i den övervakade inlärningstekniken att vi tränar maskinerna med hjälp av den 'märkta' datauppsättningen, och baserat på utbildningen förutsäger maskinen resultatet. Här anger den märkta datan att några av ingångarna redan är mappade till utgången. Mer värdefullt kan vi säga; först tränar vi maskinen med indata och motsvarande utdata, och sedan ber vi maskinen att förutsäga utdata med hjälp av testdatauppsättningen.
ficklampa installera
Låt oss förstå övervakat lärande med ett exempel. Anta att vi har en indatauppsättning av katter och hundbilder. Så först kommer vi att ge maskinen utbildning för att förstå bilderna, till exempel form och storlek på svansen på katt och hund, ögonform, färg, höjd (hundar är längre, katter är mindre) etc. Efter avslutad träning matar vi in bilden av en katt och ber maskinen att identifiera föremålet och förutsäga resultatet. Nu är maskinen vältränad, så den kommer att kontrollera alla egenskaper hos föremålet, såsom höjd, form, färg, ögon, öron, svans, etc., och upptäcka att det är en katt. Så den kommer att placeras i kategorin Cat. Detta är processen för hur maskinen identifierar objekten i Supervised Learning.
Huvudmålet med den övervakade inlärningstekniken är att kartlägga indatavariabeln(x) med utdatavariabeln(y). Vissa verkliga tillämpningar av övervakat lärande är Riskbedömning, bedrägeriupptäckt, skräppostfiltrering, etc.
Kategorier av övervakad maskininlärning
Övervakad maskininlärning kan klassificeras i två typer av problem, som anges nedan:
a) Klassificering
Klassificeringsalgoritmer används för att lösa klassificeringsproblemen där utdatavariabeln är kategorisk, såsom ' Ja eller nej, man eller kvinna, röd eller blå osv . Klassificeringsalgoritmerna förutsäger de kategorier som finns i datamängden. Några verkliga exempel på klassificeringsalgoritmer är Spamdetektering, e-postfiltrering, etc.
Några populära klassificeringsalgoritmer ges nedan:
b) Regression
Regressionsalgoritmer används för att lösa regressionsproblem där det finns ett linjärt samband mellan ingångs- och utdatavariabler. Dessa används för att förutsäga kontinuerliga produktionsvariabler, såsom marknadstrender, väderprognoser, etc.
Några populära regressionsalgoritmer ges nedan:
Fördelar och nackdelar med Supervised Learning
Fördelar:
- Sedan övervakat lärande arbeta med den märkta datamängden så att vi kan ha en exakt uppfattning om klasserna av objekt.
- Dessa algoritmer är användbara för att förutsäga resultatet på grundval av tidigare erfarenheter.
Nackdelar:
- Dessa algoritmer kan inte lösa komplexa uppgifter.
- Det kan förutsäga fel utdata om testdata skiljer sig från träningsdata.
- Det kräver mycket beräkningstid att träna algoritmen.
Tillämpningar av övervakat lärande
Några vanliga tillämpningar av Supervised Learning ges nedan:
dubbelt länkad lista
Supervised Learning-algoritmer används i bildsegmentering. I denna process utförs bildklassificering på olika bilddata med fördefinierade etiketter.
Övervakade algoritmer används också inom det medicinska området för diagnossyften. Det görs genom att använda medicinska bilder och tidigare märkta data med etiketter för sjukdomstillstånd. Med en sådan process kan maskinen identifiera en sjukdom för de nya patienterna.
2. Maskininlärning utan tillsyn
Oövervakad inlärning g skiljer sig från Supervised learning-tekniken; som namnet antyder finns det inget behov av tillsyn. Det betyder, i oövervakad maskininlärning, att maskinen tränas med hjälp av den omärkta datamängden, och maskinen förutsäger utdata utan någon övervakning.
Vid oövervakat lärande tränas modellerna med data som varken är klassificerade eller märkta, och modellen agerar på dessa data utan någon övervakning.
Huvudsyftet med den oövervakade inlärningsalgoritmen är att gruppera eller kategorisera den osorterade datamängden efter likheter, mönster och skillnader. Maskiner instrueras att hitta de dolda mönstren från indatauppsättningen.
Låt oss ta ett exempel för att förstå det mer värdefullt; anta att det finns en korg med fruktbilder och vi matar in den i maskininlärningsmodellen. Bilderna är totalt okända för modellen, och maskinens uppgift är att hitta mönster och kategorier för föremålen.
Så nu kommer maskinen att upptäcka sina mönster och skillnader, såsom färgskillnad, formskillnad, och förutsäga resultatet när den testas med testdatauppsättningen.
Kategorier av oövervakad maskininlärning
Oövervakat lärande kan ytterligare klassificeras i två typer, som ges nedan:
1) Klustring
Klustringstekniken används när vi vill hitta de inneboende grupperna från datan. Det är ett sätt att gruppera objekten i ett kluster så att objekten med flest likheter förblir i en grupp och har färre eller inga likheter med objekten i andra grupper. Ett exempel på klustringsalgoritmen är att gruppera kunderna efter deras köpbeteende.
Några av de populära klustringsalgoritmerna ges nedan:
2) Förening
Associationsregelinlärning är en oövervakad inlärningsteknik, som hittar intressanta relationer mellan variabler inom en stor datamängd. Huvudsyftet med denna inlärningsalgoritm är att hitta beroendet av ett dataobjekt till ett annat dataobjekt och kartlägga dessa variabler i enlighet därmed så att det kan generera maximal vinst. Denna algoritm används huvudsakligen i Marknadskorganalys, gruvdrift av webbanvändning, kontinuerlig produktion , etc.
Några populära algoritmer för föreningsregelinlärning är Apriori Algorithm, Eclat, FP-tillväxtalgoritm.
Fördelar och nackdelar med oövervakad inlärningsalgoritm
Fördelar:
- Dessa algoritmer kan användas för komplicerade uppgifter jämfört med de övervakade eftersom dessa algoritmer fungerar på den omärkta datamängden.
- Oövervakade algoritmer är att föredra för olika uppgifter eftersom det är lättare att få den omärkta datamängden jämfört med den märkta datamängden.
Nackdelar:
- Utdata från en oövervakad algoritm kan vara mindre exakt eftersom datauppsättningen inte är märkt och algoritmer inte tränas med den exakta utdatan i föregående.
- Att arbeta med oövervakat lärande är svårare eftersom det fungerar med den omärkta datamängden som inte mappar med utdata.
Tillämpningar av oövervakat lärande
3. Semi-övervakat lärande
Semi-övervakad inlärning är en typ av maskininlärningsalgoritm som ligger mellan övervakad och oövervakad maskininlärning . Den representerar mellanliggande algoritmer mellan övervakad (med märkt träningsdata) och oövervakad inlärning (utan märkt träningsdata) och använder kombinationen av märkta och omärkta datamängder under utbildningsperioden.
A Även om halvövervakat lärande är mellanvägen mellan övervakat och oövervakat lärande och fungerar på data som består av ett fåtal etiketter, består det mestadels av omärkt data. Eftersom etiketter är dyra, men för företagsändamål, kan de ha få etiketter. Det är helt annorlunda än övervakat och oövervakat lärande eftersom de är baserade på närvaron och frånvaron av etiketter.
För att övervinna nackdelarna med övervakat lärande och oövervakat lärande algoritmer introduceras konceptet med semiövervakat lärande . Huvudsyftet med semi-övervakat lärande är att effektivt använda all tillgänglig data, snarare än bara märkt data som i övervakat lärande. Till en början klustras liknande data tillsammans med en oövervakad inlärningsalgoritm, och vidare hjälper det att märka omärkta data till märkta data. Det beror på att märkt data är ett jämförelsevis dyrare förvärv än omärkt data.
Vi kan föreställa oss dessa algoritmer med ett exempel. Övervakat lärande är när en student är under överinseende av en instruktör hemma och på högskolan. Dessutom, om den eleven själv analyserar samma koncept utan någon hjälp från instruktören, kommer det under oövervakad inlärning. Under semi-övervakat lärande måste studenten revidera sig själv efter att ha analyserat samma koncept under ledning av en instruktör på college.
Fördelar och nackdelar med Semi-supervised Learning
Fördelar:
- Det är enkelt och lätt att förstå algoritmen.
- Det är mycket effektivt.
- Det används för att lösa nackdelarna med algoritmer för övervakad och oövervakad inlärning.
Nackdelar:
- Iterationsresultat kanske inte är stabila.
- Vi kan inte tillämpa dessa algoritmer på data på nätverksnivå.
- Noggrannheten är låg.
4. Förstärkningsinlärning
Förstärkningsinlärning fungerar på en återkopplingsbaserad process, där en AI-agent (en mjukvarukomponent) automatiskt utforskar sin omgivning genom att slå och spåra, vidta åtgärder, lära sig av erfarenheter och förbättra dess prestanda. Agenten belönas för varje bra handling och straffas för varje dålig handling; därför är målet med förstärkningsinlärningsagenten att maximera belöningarna.
I förstärkningsinlärning finns det inga märkta data som övervakat lärande, och agenter lär sig endast av sina erfarenheter.
Förstärkningsinlärningsprocessen liknar en människa; till exempel lär sig ett barn olika saker genom erfarenheter i sitt dagliga liv. Ett exempel på förstärkningsinlärning är att spela ett spel, där Spelet är miljön, en agents rörelser vid varje steg definierar tillstånd, och målet för agenten är att få en hög poäng. Agenten får feedback när det gäller straff och belöningar.
På grund av sitt arbetssätt används förstärkningslärande inom olika områden som t.ex Spelteori, Operation Research, Informationsteori, multi-agent system.
Ett förstärkningsinlärningsproblem kan formaliseras med hjälp av Markov Decision Process (MDP). I MDP interagerar agenten ständigt med omgivningen och utför åtgärder; vid varje åtgärd reagerar omgivningen och genererar ett nytt tillstånd.
Kategorier av förstärkningsinlärning
Förstärkningsinlärning kategoriseras huvudsakligen i två typer av metoder/algoritmer:
Verkliga användningsfall av förstärkningsinlärning
RL-algoritmer är mycket populära i spelapplikationer. Det används för att uppnå övermänskliga prestationer. Några populära spel som använder RL-algoritmer är AlphaGO och AlphaGO Zero .
Dokumentet 'Resource Management with Deep Reinforcement Learning' visade att hur man använder RL i en dator för att automatiskt lära sig och schemalägga resurser för att vänta på olika jobb för att minimera den genomsnittliga nedgången i arbetet.
RL används ofta i robotapplikationer. Robotar används inom industri- och tillverkningsområdet, och dessa robotar görs mer kraftfulla med förstärkningsinlärning. Det finns olika branscher som har sin vision om att bygga intelligenta robotar med hjälp av AI och maskininlärningsteknik.
Text-mining, en av de stora applikationerna av NLP, implementeras nu med hjälp av Reinforcement Learning av Salesforce-företaget.
Fördelar och nackdelar med förstärkningsinlärning
Fördelar
- Det hjälper till att lösa komplexa verkliga problem som är svåra att lösa med allmänna tekniker.
- Inlärningsmodellen för RL liknar inlärning av människor; därför kan de mest exakta resultaten hittas.
- Hjälper till att uppnå långsiktiga resultat.
Nackdel
- RL-algoritmer är inte att föredra för enkla problem.
- RL-algoritmer kräver enorma data och beräkningar.
- För mycket förstärkningsinlärning kan leda till en överbelastning av tillstånd som kan försvaga resultaten.
Dimensionalitetens förbannelse begränsar förstärkningsinlärning för verkliga fysiska system.
vad min skärmstorlek