logo

Hur hittar man standardavvikelse i R?

I den här artikeln kommer vi att diskutera hur man hittar standardavvikelsen i R programmeringsspråk . Standardavvikelsen R är måttet på spridningen av värdena. Det kan också definieras som kvadratroten av variansen.

Formel för provets standardavvikelse:



s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-överlinje{x})^2 }

var,

  • s = provets standardavvikelse
  • N = Antal enheter
  • overline{x}= Medelvärde av enheter

I grund och botten finns det två olika sätt att beräkna standardavvikelse i programmeringsspråk R, båda diskuteras nedan.



Metod 1: Naivt förhållningssätt

I den här metoden för att beräkna standardavvikelsen kommer vi att använda ovanstående standardformel för provet standardavvikelse i R-språk.

Exempel 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Produktion:



du är skarv
[1]   25.53886>

Exempel 2:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Produktion:

[1] 2.676004>

Metod 2: Använd sd()

Funktionen sd() används för att returnera standardavvikelsen.

Syntax: sd(x, na.rm = FALSE)

Parametrar:

    x: en numerisk vektor, matris eller dataframe.na.rm: saknade värden tas bort?

Lämna tillbaka: Provets standardavvikelse för x.

Exempel 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)>
>
>

Produktion:

[1] 25.53886>

Exempel 2:

R

v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Produktion:

[1] 23.52175>

Exempel 3:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Produktion:

[1] 2.676004>

Beräkna standardavvikelsen för dataramen:

Vi kan beräkna standardavvikelsen för dataramen med båda metoderna. vi kan ta irisdatauppsättningen och för varje kolumn kommer vi att beräkna standardavvikelsen.

Exempel 1:

R

data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)>
>
>

Produktion:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>

Vi kan även beräkna standardavvikelsen för hela dataramen tillsammans med hjälp av appliceringsfunktionen.

R

# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)>
>
>

Produktion:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>

Kolumnerna 1 till 4 i irisdatauppsättningen, som är de numeriska kolumnerna som bär de variabla måtten, väljs med uttrycket iris[, 1:4] i koden ovan.

sd-funktionen tillämpas på varje kolumn (markerad med 2) i den valda delmängden av irisdatauppsättningen med hjälp av appliceringsfunktionen. De resulterande standardavvikelsevärdena sparas i std_deviation-vektorn för varje kolumn.