logo

Hur man använder lm()-funktionen i R för att passa linjära modeller?

I den här artikeln kommer vi att lära oss hur man använder lm()-funktionen för att passa in linjära modeller i programmeringsspråket R.

En linjär modell används för att förutsäga värdet av en okänd variabel baserat på oberoende variabler. Det används mest för att ta reda på sambandet mellan variabler och prognoser. Funktionen lm() används för att anpassa linjära modeller till dataramar i R Language. Den kan användas för att utföra regression, variansanalys av enstaka stratum och analys av kovarians för att förutsäga värdet som motsvarar data som inte finns i dataramen. Dessa är till stor hjälp för att förutsäga priset på fastigheter, väderprognoser etc.



För att passa en linjär modell i R-språket genom att använda lm() funktion, Vi använder först funktionen data.frame() för att skapa en exempeldataram som innehåller värden som måste passas in i en linjär modell med hjälp av regressionsfunktion. Sedan använder vi lm()-funktionen för att anpassa en viss funktion till en given dataram.

Syntax:

lm( fitting_formula, dataframe)



Parameter:

    fitting_formula: bestämmer formeln för den linjära modellen. dataram: bestämmer namnet på dataramen som innehåller data.

Sedan kan vi använda summary()-funktionen för att se sammanfattningen av den linjära modellen. Funktionen summary() tolkar de viktigaste statistiska värdena för analysen av den linjära modellen.

java int till dubbel

Syntax:



sammanfattning( linjär_modell )

Sammanfattningen innehåller följande nyckelinformation:

    Återstående standardfel: bestämmer standardavvikelsen för felet där kvadratroten av variansen subtraherar n minus 1 + # av variabler som är involverade istället för att dividera med n-1. Multiple R-Squared: bestämmer hur väl din modell passar data. Justerad R-Squared: normaliserar Multiple R-Squared genom att ta hänsyn till hur många sampel du har och hur många variabler du använder. F-Statistic: är ett globalt test som kontrollerar om minst en av dina koefficienter inte är noll.

Exempel: Exempel för att visa användningen av lm()-funktionen.

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)>

>

>

Produktion:

Ring upp:

lm(formel = y ~ x^2, data = df)

Rester:

1 2 3 4 5

2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00

Koefficienter:

Uppskattning Std. Fel t värde Pr(>|t|)

(Intercept) -7,0000 3,0876 -2,267 0,10821

x 6,0000 0,9309 6,445 0,00757 **

Signif. koder: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 ' ' 1

Kvarstående standardfel: 2,944 vid 3 frihetsgrader

Multipel R-kvadrat: 0,9326, justerad R-kvadrat: 0,9102

F-statistik: 41,54 på 1 och 3 DF, p-värde: 0,007575

Diagnostiska plotter

De diagnostiska plotten hjälper oss att se sambandet mellan olika statistiska värden i modellen. Det hjälper oss att analysera omfattningen av extremvärden och effektiviteten hos den monterade modellen. För att se diagnostiska diagram av en linjär modell använder vi funktionen plot() i R Language.

Syntax:

plot( linjär_modell )

Exempel: Diagnostiska diagram för den ovan monterade linjära modellen.

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)>

>

>

Produktion:

Plotter Linjär modell

Vi kan plotta den ovan anpassade linjära modellen för att visualisera den väl genom att använda abline()-metoden. Vi plottar först ett spridningsdiagram av datapunkter och överlagrar det sedan med ett ablineplot av den linjära modellen genom att använda abline()-funktionen.

Syntax:

plot(df$x, df$y)

strängdelning c++

abline(Linjär_modell)

Exempel: Plotta linjär modell

R




sträng till int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)>

>

>

Produktion:

Förutsäg värden för okända datapunkter med hjälp av den anpassade modellen

För att förutsäga värden för nya indata med den ovan anpassade linjära modellen använder vi predict()-funktionen. Funktionen predict() tar modellen och dataramen med okända datapunkter och förutsäger värdet för varje datapunkt enligt den anpassade modellen.

Syntax:

förutsäga (modell, data)

Parameter:

    modell: bestämmer den linjära modellen. data: bestämmer dataramen med okända datapunkter.

Exempel: Förutsäga nya ingångar

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )>

>

>

Produktion:

1 2 3 83 89 95>