logo

Medelvärde, varians och standardavvikelse

Medelvärde, varians och standardavvikelse är viktiga statistiska mått. Varians kvantifierar datapunktsavvikelse från medelvärdet, medan standardavvikelse mäter datadistribution. Den viktigaste skillnaden ligger i att standardavvikelsen är i samma enheter som medelvärdet, medan variansen är i kvadratiska enheter. Dyk djupare in i dessa begrepp med definitioner, formler och ett illustrativt exempel.

Betyda

Betyda är genomsnittet av en given uppsättning data. Låt oss överväga nedanstående exempel



2, 4, 4, 4, 5, 5, 7, 9

Dessa åtta datapunkter har medelvärdet (genomsnittet) av 5:

frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

Formel: mu=frac{sum_{i=1}^{N} x_{i}}{N}

Var ? är medelvärde och x1, x2, x3…., xiär element. Notera också att medelvärdet ibland betecknas med egin{array}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (- 1)^2 = 1 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4  (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16.  end{array}

Variation

Variation är summan av kvadrater av skillnader mellan alla tal och medelvärden.
Avvikelse för ovanstående exempel. Beräkna först avvikelserna för varje datapunkt från medelvärdet och kvadrera resultatet av varje:

Formel: sigma^{2}= frac { sum_{i=1}^{N} (x_{i}-mu)^{2}}{N}

varians = 	extup{Variationskoefficient } =frac{ 	extup{Standardavvikelse}}{Mean}*100= 4.



Var ? är medelvärde, N är det totala antalet element eller distributionsfrekvens.


Standardavvikelse

Standardavvikelse är kvadratroten av variansen. Det är ett mått på i vilken utsträckning data varierar från medelvärdet.

Standardavvikelse (för ovanstående data) = = 2

Varför valde matematiker en kvadrat och sedan kvadratrot för att hitta avvikelse, varför inte helt enkelt ta skillnaden mellan värden?
En anledning är att summan av skillnader blir 0 enligt definitionen av medelvärde. Summa av absoluta skillnader kunde vara ett alternativ, men med absoluta skillnader var det svårt att bevisa många fina satser. [Källa: MIT videoföreläsning vid 1:19]



  1. Värdet på standardavvikelsen är 0 om alla inmatningar i inmatningen är samma.
  2. Om vi ​​adderar (eller subtraherar) ett tal, säg 7, till alla värden i inmatningsmängden, ökas (eller minskas) medelvärdet med 7, men standardavvikelsen ändras inte.
  3. Om vi ​​multiplicerar alla värden i ingångsmängden med ett tal 7, multipliceras både medelvärde och standardavvikelse med 7. Men om vi multiplicerar alla ingångsvärden med ett negativt tal, säg -7, multipliceras medelvärdet med -7, men standardavvikelsen multipliceras med 7.
  4. Standardavvikelse och varians är ett mått som talar om hur utspridda siffrorna är. Även om variansen ger dig en grov uppfattning om spridningen, är standardavvikelsen mer konkret, vilket ger dig exakta avstånd från medelvärdet.
  5. Medelvärde, median och läge är måtten på central tendens hos data (antingen grupperad eller ogrupperad).

Kolla upp:

  • Varians och standardavvikelse
  • Verkliga tillämpningar av standardavvikelse
  • Skillnaden mellan varians och standardavvikelse

Nedanstående frågor har ställts i tidigare års GATE-tentor Referenser:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm

Medelvärde, varians och standardavvikelse – vanliga frågor

Vad är skillnaden mellan standardavvikelse och varians?

Både standardavvikelse och varians mäter spridningen av datapunkter i en datauppsättning i förhållande till medelvärdet. Den viktigaste skillnaden är att variansen mäter medelvärdet av de kvadratiska avvikelserna från medelvärdet, medan standardavvikelsen är kvadratroten av variansen, vilket ger ett mått på spridningen i samma enheter som data.



Hur beräknar du medelvärde, varians och standardavvikelse?

  • Medelvärde: Lägg ihop alla siffror och dividera med antalet siffror.
  • Varians: Beräkna medelvärdet, subtrahera medelvärdet från varje tal, kvadrera resultatet, summera dessa kvadrerade resultat och dividera med antalet siffror minus ett.
  • Standardavvikelse: Ta kvadratroten av variansen.

Varför är medelvärde, varians och standardavvikelse viktiga?

Dessa statistiska mått är avgörande för att förstå fördelningen av data. Medelvärdet ger ett centralt värde, medan varians och standardavvikelse ger insikter i datas variabilitet eller spridning, vilket indikerar datauppsättningens konsistens eller volatilitet.

Kan varians och standardavvikelse vara negativa?

Nej, varians och standardavvikelse kan inte vara negativa. Varians beräknas som medelvärdet av de kvadratiska skillnaderna från medelvärdet, vilket resulterar i ett icke-negativt värde. Eftersom standardavvikelsen är kvadratroten av variansen kan den inte heller vara negativ.

Hur påverkar outliers medelvärde, varians och standardavvikelse?

Outliers kan avsevärt påverka medelvärdet genom att dra det mot extremvärdet, vilket inte exakt återspeglar datasetets centrala tendens. Varians och standardavvikelse påverkas också eftersom de kommer att öka, vilket indikerar en högre spridning av data på grund av extremvärdena.