Linjär regression och logistisk regression är de två berömda maskininlärningsalgoritmerna som kommer under övervakad inlärningsteknik. Eftersom båda algoritmerna är av övervakad karaktär använder dessa algoritmer därför märkt dataset för att göra förutsägelserna. Men den största skillnaden mellan dem är hur de används. Linjär regression används för att lösa regressionsproblem medan logistisk regression används för att lösa klassificeringsproblem. Beskrivningen av båda algoritmerna ges nedan tillsammans med skillnadstabellen.
Linjär regression:
- Linjär regression är en av de enklaste maskininlärningsalgoritmerna som ingår under övervakad inlärningsteknik och används för att lösa regressionsproblem.
- Den används för att förutsäga den kontinuerliga beroende variabeln med hjälp av oberoende variabler.
- Målet med den linjära regressionen är att hitta den bästa passformen som exakt kan förutsäga utdata för den kontinuerligt beroende variabeln.
- Om en enda oberoende variabel används för förutsägelse kallas den enkel linjär regression och om det finns fler än två oberoende variabler kallas sådan regression som multipel linjär regression.
- Genom att hitta den bästa passformen, etablerar algoritmen sambandet mellan beroende variabel och oberoende variabel. Och förhållandet bör vara av linjär karaktär.
- Utdata för linjär regression bör endast vara de kontinuerliga värdena som pris, ålder, lön, etc. Relationen mellan den beroende variabeln och den oberoende variabeln kan visas i bilden nedan:
I bilden ovan är den beroende variabeln på Y-axeln (lön) och den oberoende variabeln är på x-axeln (erfarenhet). Regressionslinjen kan skrivas som:
y= a<sub>0</sub>+a<sub>1</sub>x+ ε
Där en0och a1är koefficienterna och ε är feltermen.
Logistisk tillbakagång:
- Logistisk regression är en av de mest populära maskininlärningsalgoritmerna som ingår under övervakad inlärningsteknik.
- Det kan användas för klassificering såväl som för regressionsproblem, men används främst för klassificeringsproblem.
- Logistisk regression används för att förutsäga den kategoriskt beroende variabeln med hjälp av oberoende variabler.
- Utdata från logistisk regression kan bara vara mellan 0 och 1.
- Logistisk regression kan användas där sannolikheterna mellan två klasser krävs. Som om det kommer att regna idag eller inte, antingen 0 eller 1, sant eller falskt etc.
- Logistisk regression är baserad på konceptet Maximum Likelihood-uppskattning. Enligt denna uppskattning bör de observerade uppgifterna vara mest sannolika.
- Vid logistisk regression skickar vi den viktade summan av ingångar genom en aktiveringsfunktion som kan kartlägga värden mellan 0 och 1. Sådan aktiveringsfunktion är känd som sigmoid funktion och den erhållna kurvan kallas sigmoidkurva eller S-kurva. Tänk på bilden nedan:
- Ekvationen för logistisk regression är:
Skillnaden mellan linjär regression och logistisk regression:
Linjär regression | Logistisk tillbakagång |
---|---|
Linjär regression används för att förutsäga den kontinuerliga beroende variabeln med hjälp av en given uppsättning oberoende variabler. | Logistisk regression används för att förutsäga den kategoriskt beroende variabeln med hjälp av en given uppsättning oberoende variabler. |
Linjär regression används för att lösa regressionsproblem. | Logistisk regression används för att lösa klassificeringsproblem. |
I linjär regression förutsäger vi värdet av kontinuerliga variabler. | I logistisk regression förutsäger vi värdena för kategoriska variabler. |
I linjär regression hittar vi den bästa passformen, genom vilken vi enkelt kan förutsäga utdata. | I Logistic Regression hittar vi S-kurvan genom vilken vi kan klassificera proverna. |
Minsta kvadratuppskattningsmetod används för uppskattning av noggrannhet. | Maximal likelihood-uppskattningsmetod används för uppskattning av noggrannhet. |
Utdata för linjär regression måste vara ett kontinuerligt värde, såsom pris, ålder, etc. | Utdata från logistisk regression måste vara ett kategoriskt värde som 0 eller 1, Ja eller Nej, etc. |
I linjär regression krävs att sambandet mellan beroende variabel och oberoende variabel måste vara linjärt. | I logistisk regression krävs det inte att ha det linjära sambandet mellan den beroende och oberoende variabeln. |
Vid linjär regression kan det finnas kollinearitet mellan de oberoende variablerna. | Vid logistisk regression bör det inte finnas kolinearitet mellan den oberoende variabeln. |