logo

Machine Learning Algoritmer

Maskininlärningsalgoritmer är beräkningsmodeller som tillåter datorer att förstå mönster och förutsäga eller göra bedömningar baserade på data utan behov av explicit programmering. Dessa algoritmer utgör grunden för modern artificiell intelligens och används i ett brett spektrum av tillämpningar, inklusive bild- och taligenkänning, naturlig språkbehandling, rekommendationssystem, bedrägeriupptäckt, autonoma bilar etc.

Detta Maskininlärningsalgoritmer artikeln kommer att täcka alla viktiga algoritmer för maskininlärning som Stöd vektormaskin, beslutsfattande, logistisk regression, naiv bayees klassificerare, random forest, k-mean klustring, förstärkningsinlärning, vektor, hierarkisk klustring, xgboost, adaboost, logistik, etc.



diana mary blacker

Typer av maskininlärningsalgoritmer

Det finns tre typer av maskininlärningsalgoritmer.

  1. Övervakat lärande
    • Regression
    • Klassificering
  2. Oövervakat lärande
  3. Förstärkningsinlärning

Typer av maskininlärningsalgoritmer

1. Övervakad inlärningsalgoritm

Övervakat lärande är en typ av maskininlärningsalgoritmer där vi använde märkt dataset för att träna modellen eller algoritmerna. Målet med algoritmen är att lära sig en mappning från indata till utdataetiketter, så att den kan göra förutsägelser eller klassificeringar på ny, osynlig data.

Övervakade maskininlärningsalgoritmer

  1. Linjär modell:
    • Regression
      • Vanlig minsta kvadratisk regression
      • Enkel linjär regression
      • Multipel linjär regression
      • Polynomregression
      • Orthogonal Matching Pursuit (OMP)
      • Bayesiansk regression
      • Kvantilregression
      • Isotonisk regression
      • Stegvis regression
      • Minsta vinkelregression (LARS)
    • Klassificering:
    • Regularisering :
      • Lasso (L1 Regularization)
      • Ridge (L2 Regularization)
        • Ridge regression
        • Ridge Classifier
      • Elastiskt nät
      • LARS Lasso
  2. K-Närmaste grannar (KNN):
    • Brute Force Algoritmer
    • Ball Tree och KD Tree Algoritmer
    • Klassificering av K-Närmaste Grannar (KNN).
    • K-Nearest Neighbours (KNN) Regressor
  3. Stöd för vektormaskiner:
    • Stöd Vector Machines Regressor
    • Olika kärnfunktioner i SVM
  4. Stokastisk gradientnedstigning
    • Stokastisk Gradient Descent Classifier
    • Stokastisk Gradient Descent Regressor
    • Olika förlustfunktioner i SGD
  5. Beslutsträd:
    • Beslutsträdsalgoritmer
      • Iterativ Dichotomiser 3 (ID3) Algoritmer
      • C5. Algoritmer
      • Klassificerings- och regressionsträdalgoritmer
    • Decision Tree Classifier
    • Regressor för beslutsträd
  6. Ensemble Learning:
    • Bagging (Bootstrap Aggregating)
    • Boostning
      • AdaBoost
      • XGBoost
      • CatBoost
      • Gradient Boosting Machines (GBM)
      • LightGBM
    • Stapling
  7. Generativ modell
    • Naiv Bayes
      • Gaussisk naiv Bayes
      • Multinomial Naiva Bayes
      • Bernoulli Naive Bayes
    • Gaussiska processer
      • Gaussisk processregression (GPR)
      • Gaussisk processklassificering (GPC)
    • Gaussisk diskriminerande analys
      • Linjär diskrimineringsanalys (LDA)
      • Quadratic Discriminant Analysis (QDA)
    • Bayesian Belief Networks
    • Dolda Markov-modeller (HMM)
  8. Tidsserieprognos:
    • Tidsserievisualisering och analys:
      • Tidsseriekomponenter: Trend, säsongsvariationer och brus
      • Tidsserienedbrytningstekniker
      • Säsongsjustering och skillnad
      • Autokorrelation och partiella autokorrelationsfunktioner
      • Förstärkt Dickey-Fuller-test
      • Säsongsuppdelning av tidsserier (STL-nedbrytning)
      • Box-Jenkins metodik för ARIMA-modeller
    • Algoritmer för tidsserieprognos:
      • Moving Average (MA) och Weighted Moving Average
      • Exponentiella utjämningsmetoder (enkla, dubbla och trippel)
      • Autoregressiva (AR) modeller
      • Glidande medelvärde (MA) modeller
      • Autoregressive Integrated Moving Average (ARIMA) modeller
      • Säsongsuppdelning av tidsserier av Loess (STL)
      • Säsongsbetonade Autoregressive Integrated Moving Average (SARIMA) modeller
      • ARIMAX och SARIMAX modeller
  9. Övervakad dimensionsreduktionsteknik:
    • Linjär diskrimineringsanalys (LDA)

Några av de övervakade maskininlärningsalgoritmerna kan användas för både klassificering och regression med lite modifiering

  • Multiclass och multioutput algoritmer:
    • Flerklassklassificering
      • OneVsRest Classifier
    • Multilabel-klassificering
    • Multioutput regression

Mätvärden för klassificerings- och regressionsalgoritmer:

  • Regressionsstatistik:
    • Mean squared error (MSE)
    • Root mean squared error (RMSE)
    • Genomsnittligt absolut fel (MAE)
    • R-kvadrat
    • Justerad R-kvadrat
  • Klassificeringsstatistik:
  • Sannolikhetskalibrering
    • Kalibreringskurvor
    • Kalibrerar en klassificerare

Korsvalideringsteknik:

  • K-faldig korsvalidering
  • Stratifierad k-vikningskorsvalidering
  • Lämna-en-ut korsvalidering
  • Blanda delad korsvalidering
  • Tidsseriekorsvalidering

Optimeringsteknik:

  • Gradient Descent
    • Stokastisk gradientnedstigning
    • Mini-batch Gradient Descent
    • Momentum-baserad Gradient Descent
  • Newton-baserade optimeringstekniker
    • Newtons algoritm
    • Quasi-Newton-metoder (BFGS, L-BFGS)
    • Konjugerad gradient
  • Lokala sökoptimeringstekniker
    • Bergsklättring
    • Tabu-sökning

2. Oövervakad inlärningsalgoritm

Oövervakat lärande är en typ av maskininlärningsalgoritmer där algoritmerna används för att hitta mönstren, strukturen eller förhållandet inom en datamängd med hjälp av omärkt dataset. Den utforskar datas inneboende struktur utan fördefinierade kategorier eller etiketter.

Algoritmer för maskininlärning utan tillsyn

  • Klustring
    • Centroid-baserade metoder
      • K-Means klustring
      • K-Means++ klustring
      • K-Mode klustring
      • Fuzzy C-Means (FCM) Clustering
    • Distributionsbaserade metoder
    • Anslutningsbaserade metoder
      • Hierarkisk klustring
        • Agglomerativ klustring
        • Delande klustring
      • Affinitetspridning
    • Densitetsbaserade metoder
      • DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
      • OPTIK (beställningspunkter för att identifiera klustringsstrukturen)
  • Föreningen reglerar gruvdrift
    • Apriori-algoritm
    • FP-Growth (frequent Pattern-Growth)
    • ECLAT (Equivalence Class Clustering och bottom-up Lattice Traversal)
  • Anomalidetektering:
    • Z-poäng
    • Local Outlier Factor (LOF)
    • Isolationsskog
  • Dimensionalitetsreduktionsteknik:
    • Principal Component Analysis (PCA)
    • t-distribuerad Stokastisk Neighbor Embedding (t-SNE)
    • Icke-negativ matrisfaktorisering (NMF)
    • Oberoende komponentanalys (ICA)
    • Faktoranalys
    • Latent Dirichlet Allocation (LDA)
    • Isomap
    • Lokalt linjär inbäddning (LLE)
    • Latent semantisk analys (LSA)

3. Förstärkningsinlärning

Förstärkningsinlärning är en typ av maskininlärningsalgoritmer där en agent lär sig att fatta successiva beslut genom att interagera med sin omgivning. Agenten får feedbacken i form av incitament eller bestraffningar baserat på dess handlingar. Agentens syfte är att upptäcka optimal taktik som maximerar kumulativa belöningar över tid genom försök och misstag. Förstärkningsinlärning används ofta i scenarier där agenten måste lära sig att navigera i en miljö, spela spel, hantera robotar eller göra bedömningar i osäkra situationer.

Förstärkningsinlärning

  • Modellbaserade metoder:
    • Markovs beslutsprocesser (MDP)
    • Bellmans ekvation
    • Värde iterationsalgoritm
    • Monte Carlo trädsökning
  • Modellfria metoder:
    • Värdebaserade metoder:
      • Q-Learning
      • SÅS
      • Monte Carlo metoder
    • Policybaserade metoder:
      • FÖRSTÄRK algoritm
      • Skådespelare-kritisk algoritm
    • Skådespelare-kritiska metoder
      • Asynchronous Advantage Actor-Critic (A3C)

Lista över populära maskininlärningsalgoritmer

Här är en lista över de 10 mest populära maskininlärningsalgoritmerna.

1. Linjär regression

Linjär regression är en enkel algoritm som används för att kartlägga det linjära förhållandet mellan indatafunktioner och en kontinuerlig målvariabel. Det fungerar genom att anpassa en linje till data och sedan använda linjen för att förutsäga nya värden.

2. Logistisk regression

Logistisk regression är en förlängning av linjär regression som används för klassificeringsuppgifter för att uppskatta sannolikheten att en instans tillhör en specifik klass.

3. SVM (Support Vector Machine)

SVM: er är övervakade inlärningsalgoritmer som kan utföra klassificerings- och regressionsuppgifter. Den hittar ett hyperplan som bäst separerar klasser i funktionsutrymme.

4. KNN (K-närmaste granne)

KNN är en icke-parametrisk teknik som kan användas för såväl klassificering som regression. Det fungerar genom att identifiera de k mest lika datapunkterna till en ny datapunkt och sedan förutsäga etiketten för den nya datapunkten med hjälp av etiketterna för dessa datapunkter.

5. Beslutsträd

Beslutsträd är en typ av övervakad inlärningsteknik som kan användas för såväl klassificering som regression. Den fungerar genom att segmentera data i mindre och mindre grupper tills varje grupp kan klassificeras eller förutsägas med hög grad av noggrannhet.

6. Random Forest

Slumpmässiga skogar är en typ av ensembleinlärningsmetod som använder en uppsättning beslutsträd för att göra förutsägelser genom att aggregera förutsägelser från enskilda träd. Det förbättrar precisionen och motståndskraften hos enkla beslutsträd. Den kan användas för både klassificerings- och regressionsuppgifter.

7. Naiva Bayes

Naive Bayes är en probabilistisk klassificerare baserad på Bayes sats som används för klassificeringsuppgifter. Det fungerar genom att anta att funktionerna i en datapunkt är oberoende av varandra.

8. PCA (Principal Component Analysis)

PCA är en dimensionsreducerande teknik som används för att omvandla data till ett lägre dimensionellt utrymme samtidigt som det behåller så mycket varians som möjligt. Det fungerar genom att hitta riktningarna i data som innehåller mest variation och sedan projicera data på dessa riktningar.

9. Apriori-algoritmer

Apriori-algoritmen är en traditionell datautvinningsteknik för utvinning av associationsregler i transaktionsdatabaser eller datauppsättningar. Den är utformad för att avslöja länkar och mönster mellan saker som regelbundet förekommer samtidigt i transaktioner. Apriori upptäcker frekventa artiklar, som är grupper av artiklar som visas tillsammans i transaktioner med en given lägsta stödnivå.

10. K-Means Clustering

K-Means-klustring är en oövervakad inlärningsmetod som kan användas för att gruppera datapunkter. Det fungerar genom att hitta k kluster i data så att datapunkterna i varje kluster är så lika varandra som möjligt samtidigt som de förblir så olika som möjligt från datapunkterna i andra kluster.

Upptäck de grundläggande begreppen som driver maskininlärning genom att lära dig topp 10 algoritmer , såsom linjär regression, beslutsträd och neurala nätverk.

Machine Learning Algorithm – Vanliga frågor

1. Vad är en algoritm i maskininlärning?

Maskininlärningsalgoritmer är tekniker baserade på statistiska koncept som gör det möjligt för datorer att lära av data, upptäcka mönster, göra förutsägelser eller utföra uppgifter utan behov av explicit programmering. Dessa algoritmer är grovt klassificerade i de tre typerna, dvs övervakat lärande, oövervakat lärande och förstärkningsinlärning.

2. Vilka typer av maskininlärning finns?

Det finns huvudsakligen tre typer av maskininlärning:

  • Övervakad algoritm
  • Oövervakad algoritm
  • Förstärkningsalgoritm

3. Vilken ML-algoritm är bäst för förutsägelse?

Den ideala maskininlärningsmetoden för förutsägelse bestäms av a antal kriterier , inklusive problemets natur, typen av data och de unika kraven. Stöd för vektormaskiner, Random Forests och Gradient Boosting-metoder är populära för prediktionsarbetsbelastningar. Valet av en algoritm, å andra sidan, bör baseras på testning och utvärdering av det specifika problemet och det aktuella datasetet.

4. Vilka är de 10 populära algoritmerna för maskininlärning?

Nedan är listan över de 10 mest använda algoritmerna för maskininlärning (ML):

  1. Linjär regression
  2. Logistisk tillbakagång
  3. SVM (Support Vector Machine)
  4. KNN (K-närmaste granne)
  5. Beslutsträd
  6. Random Forest
  7. Naiv Bayes
  8. PCA (Principal Component Analysis)
  9. Apriori-algoritmer
  10. K-Means Clustering