Variation är ett mätvärde som används för att hitta hur data sprids avseende medelvärdet eller medelvärdet av datamängden. Den används för att ta reda på hur fördelningsdatan är utspridd avseende medel- eller medelvärde. Symbolen som används för att definiera variansen är σ2. Det är kvadraten på standardavvikelsen.
Det finns två typer av varians som används i statistik,
- Provvarians
- Befolkningsvariation
Populationsvariansen används för att bestämma hur varje datapunkt i en viss population fluktuerar eller är utspridda, medan urvalsvariansen används för att hitta medelvärdet av de kvadratiska avvikelserna från medelvärdet.
I den här artikeln kommer vi att lära oss om Varians (prov, population), deras formler, egenskaper och andra i detalj.
Innehållsförteckning
- Vad är varians?
- Typer av varians
- Varianssymbol
- Varians exempel
- Variansformel
- Exempel på variansformel
- Befolkningsvariansformel
- Variansformel för grupperad data
- Variansformel för ogrupperade data
- Formel för att beräkna varians
- Hur beräknar man varians?
- Varians och standardavvikelse
- Varians och kovarians
- Variansegenskaper
- Exempel på variansformel
- Sammanfattning – Varians
- Vanliga frågor om Varians
Vad är varians?
Vi mäter de olika värdena av data och dessa värden används för en mängd olika ändamål. Data kan ges i två typer av grupperad data, eller ogrupperad (diskret) data. Om data ges i form av klassintervall kallas det grupperad data medan om data ges i form av en enda datapunkt kallas det för en diskret eller ogrupperad datapunkt. Varians är måttet på spridningen av data avseende medelvärdet av data. Den berättar för oss hur data är spridda i det givna datavärdet. Vi kan enkelt beräkna urvalsvariansen och populationsvariansen för både grupperade och ogrupperade data.
Varians Definition
Variation är ett statistiskt mått som kvantifierar spridningen eller spridningen av en uppsättning datapunkter. Den indikerar hur mycket de enskilda datapunkterna i en datamängd skiljer sig från medelvärdet (genomsnittet) av datamängden
Typer av varians
Vi kan definiera variansen för de givna uppgifterna i två typer,
- Befolkningsvariation
- Provvarians
Låt oss nu lära oss om dem i detalj.
Befolkningsvariation
Populationsvarians används för att hitta spridningen av den givna populationen. Befolkningen definieras som en grupp människor och alla människor i den gruppen är en del av befolkningen. Den berättar om hur befolkningen i en grupp varierar med avseende på medelbefolkningen.
Alla medlemmar i en grupp kallas befolkningen. När vi vill ta reda på hur varje datapunkt i en given population varierar eller är spridd använder vi populationsvariansen. Den används för att ge det kvadratiska avståndet för varje datapunkt från populationsmedelvärdet.
Provvarians
Om populationsdata är mycket stora blir det svårt att beräkna populationsvariansen för datamängden. I så fall tar vi ett urval av data från den givna datamängden och hittar variansen för den datamängden som kallas provvarians. När vi beräknar urvalets medelvärde ser vi till att beräkna urvalets medelvärde, dvs medelvärdet av urvalsdatauppsättningen inte populationsmedelvärdet. Vi kan definiera urvalsvariansen som medelvärdet av kvadraten på skillnaden mellan provdatapunkten och urvalsmedelvärdet.
Varianssymbol
Symbolen för varians representeras vanligtvis av den grekiska bokstaven sigma i kvadrat (σ²) när det hänvisas till populationsvariansen. För provvarians betecknas det ofta med s².
Varians exempel
Vi kan förstå begreppet varians med hjälp av exemplet som diskuteras nedan.
Hitta populationsvariansen för datan {4,6,8,10}
Lösning:
Medelvärde = (4+6+8+10)/4 = 7
4 (4-7)2 9 6 (6-7)2 1 8 (8-7)2 1 10 (10-7)2 9 Varians = (9+1+1+9)/4 = 20/4 = 5
Variansen på data är alltså 5
Variansformel
Variansen för en datamängd betecknas med symbolen σ2. För populationsdata är dess formel lika med summan av kvadrerade skillnader mellan datainmatningar från medelvärdet dividerat med antalet poster. Medan för exempeldata delar vi täljarvärdet med skillnaden mellan antalet poster och enhet.
Exempel på variansformel
Om datamängden är ett exempel ges variansformeln av,
sid 2 = ∑ (x i – x̄) 2 /(n – 1)
var,
- x är medelvärdet av provdatauppsättningen
- n är det totala antalet observationer
Befolkningsvariansformel
Om vi har en populationsdatamängd skrivs formeln som,
sid 2 = ∑ (x i – x̄) 2 /n
var,
- x är medelvärdet av populationsdatauppsättningen
- n är det totala antalet observationer
Vi kan också beräkna variansen för grupperade och ogrupperade datamängder. Olika formler för variansen är,
två till en multiplexor
Variansformel för grupperad data
För grupperade data diskuteras variansformeln nedan,
Exempelvariansformel för grupperade data (σ 2 ) = ∑ f(m i – x̄) 2 /(n-1)
Populationsvariansformel för grupperade data (sid 2 ) = ∑ f(m i – x̄) 2 /n
var,
- f är frekvensen för varje intervall
- m i är mittpunkten av i:etthintervall
- x är medelvärdet av den grupperade datan
För grupperade data beräknas medelvärdet som,
Medel = ∑ (f i x i ) / ∑ f i
Variansformel för ogrupperade data
För ogrupperade data diskuteras variansformeln nedan,
- Exempelvariansformel för ogrupperade data (sid 2 ) = ∑ (x i – x̄) 2 /(n-1)
- Populationsvariansformel för ogrupperade data (sid 2 ) = ∑ (x i – x̄) 2 /n
var x är medelvärdet av den grupperade datan
Formel för att beräkna varians
Formeln som används för att beräkna variansen diskuteras i bilden nedan,

Hur beräknar man varians?
I allmänhet betyder varians populationsstandardvarians. Stegen för att beräkna variansen för en given uppsättning värden är,
Steg 1: Beräkna medelvärdet av observationen med formeln (medelvärde = summan av observationer/antal observationer)
Steg 2: Beräkna de kvadratiska skillnaderna mellan datavärdena och medelvärdet. (Datavärde – medelvärde)2
Steg 3: Beräkna medelvärdet av de kvadratiska skillnaderna för de givna värdena som kallas variansen för datamängden.
(Varians = summan av kvadratiska skillnader / antal observationer)
Varians och standardavvikelse
Varians och Standardavvikelse båda är mått på den centrala tendens som används för att berätta för oss om i vilken utsträckning värdena på datamängden avviker med avseende på det centrala eller medelvärdet av datamängden.
Det finns ett definitivt samband mellan varians och standardavvikelse för en given datamängd.
Varians = (Standardavvikelse) 2
Varians definieras som kvadraten på standardavvikelsen, det vill säga att ta kvadraten på standardavvikelsen för vilken grupp av data som helst ger oss variansen för den datamängden. variansen definieras med hjälp av symbolen sid 2 medan sid används för att definiera standardavvikelsen för datamängden. Varians av datamängden uttrycks i kvadratiska enheter medan standardavvikelsen för datamängden uttrycks i en enhet som liknar medelvärdet av datamängden.
Läs mer: Varians och standardavvikelse
Varians av binomial distribution
Binomial distribution är den diskreta sannolikhetsfördelningen som talar om för oss antalet positiva utfall i ett binomialexperiment utfört n antal gånger. Resultatet av binomialexperimentet är 0 eller 1, det vill säga antingen positivt eller negativt.
I binomialexperimentet av n försök och där sannolikheten för varje försök anges sid , då ges variansen av binomialfördelningen med hjälp av,
sid 2 = np (1 – p)
var 't.ex' definieras som medelvärdet av värdena för binomialfördelningen.
Varians av Poisson Distribution
Giftdistribution definieras som en diskret sannolikhetsfördelning som används för att definiera sannolikheten för att antalet 'n' händelser inträffar inom tidsperioden 'x'. Medelvärdet i Poisson-fördelningen definieras av symbolen l.
I Poisson-fördelningen är medelvärdet och variansen för den givna datamängden lika. Variansen av Poisson-fördelningen ges med formeln,
sid 2 = λ
Varians av enhetlig distribution
I en enhetlig fördelning är sannolikhetsfördelningsdata kontinuerliga. Resultatet i dessa experiment ligger i intervallet mellan en specifik övre gräns och en specifik nedre gräns och därför kallas dessa fördelningar även för rektangulära distributioner. Om den övre gränsen eller maxgränsen är b och den nedre gränsen eller minimigränsen är a då beräknas variansen för den enhetliga fördelningen med hjälp av formeln,
sid 2 = (1/12)(b – a) 2
Medelvärdet av den enhetliga fördelningen ges med formeln,
Medelvärde = (b + a) / 2
var,
- b är den övre gränsen för den enhetliga fördelningen
- a är den nedre gränsen för den enhetliga fördelningen
Varians och kovarians
Varians av datamängden definierar volatiliteten för alla värden i datamängden med avseende på medelvärdet för datamängden. Kovarians berättar hur de slumpmässiga variablerna är relaterade till varandra och den berättar hur förändringen i en variabel påverkar förändringen i andra variabler.
Kovarians kan vara positiv eller negativ, den positiva kovariansen betyder att båda variablerna rör sig i samma riktning med avseende på medelvärdet medan negativ kovarians betyder att båda variablerna rör sig i motsatta riktningar med avseende på medelvärdet.
För två slumpvariabler x och y där x är den beroende variabeln och y är den oberoende variabeln beräknas kovariansen med hjälp av formeln som nämns i nedanstående bifogade bild.

Variansegenskaper
Varians används i stor utsträckning inom matematik, statistik och andra vetenskapsgrenar för en mängd olika ändamål. Varians har olika egenskaper som ofta används för att lösa olika problem. Några av de grundläggande egenskaperna hos variansen är,
- Varians av datamängden är den icke-negativa kvantiteten och variansvärdet noll betyder att alla värden i datamängden är lika.
- Ett högre värde på variansen talar om för oss att alla datavärden i datamängden är vitt spridda, d.v.s. de är långt borta från medelvärdet för datamängden.
- Ett lägre värde på variansen talar om för oss att alla datavärden i datamängden ligger nära varandra, dvs de är mycket nära medelvärdet för datamängden.
För varje konstant 'c'
- Var(x + c) = Var(x)
var x är en slumpvariabel
- Var(cx) = c2
var x är en slumpvariabel
Även om a och b är det konstanta värdet och x är en slumpvariabel då,
- Var(ax + b) = a2
För oberoende variabler x1, x2, x3…,xnvi vet det,
- Var(x1+ x2+……+ xn) = Var(x1) + Var(x2) +……..+Var(xn)
Folk läser också:
- Betyda
- Läge
- Skillnaden mellan varians och standardavvikelse
Exempel på variansformel
Exempel 1: Beräkna variansen för provdata: 7, 11, 15, 19, 24.
Lösning:
Vi har uppgifterna 7, 11, 15, 19, 24
Hitta medelvärdet av uppgifterna.
x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2Genom att använda formeln för varians får vi,
sid2= ∑ (xi– x̄)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2
Exempel 2: Beräkna antalet observationer om variansen för data är 12 och summan av kvadrerade skillnader mellan data från medelvärdet är 156.
Lösning:
Vi har,
(xi– x̄)2= 156
sid2= 12
Genom att använda formeln för varians får vi,
sid2= ∑ (xi– x̄)2/n
12 = 156/n
n = 156/12
n = 13
Exempel 3: Beräkna variansen för givna data
vilken samling i java
| xi | fi |
|---|---|
| 10 | 1 |
| 4 | 3 |
| 6 | 5 |
| 8 | 1 |
Lösning:
Medelvärde (x̄) = ∑(fixi)/∑(fi)
= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6n = ∑(fi) = 1+3+5+1 = 10
xi
fi
fixi
(xi– x̄)
(xi– x̄)2
fi(xi– x̄)2
10 1 10 4 16 16 4 3 12 -2 4 12 6 5 30 0 0 0 8 1 8 2 4 8 Nu,
sid 2 = (∑ i n f i (x i – x̄) 2 /n)
= [(16 + 12 + 0 +8)/10]
= 3,6Varians(σ2) = 3,6
Exempel 4: Hitta variansen i följande datatabell
| Klass | Frekvens |
|---|---|
| 0-10 | 3 |
| 10-20 | 6 |
| 20-30 | 4 |
| 30-40 | 2 |
| 40-50 | 1 |
Lösning:
Klass
Xi
fi
f×Xi
Xi – μ
(Xi – μ)2
f×(Xi – μ)2
0-10
5
3
femton
-femton
225
675
10-20
femton
6
90
-5
25
150
20-30
25
4
100
5
25
100
30-40
35
2
70
femton
225
450
40-50
Fyra fem
1
Fyra fem
25
625
625
Total
16
320
2000
stjärntopologiMedelvärde (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20sid 2 = (∑ i n f i (x i – m) 2 /n)
= [(2000)/(16)]
= (125)Variansen för given datamängd är 125.
Sammanfattning – Varians
Varians är ett statistiskt mått som visar hur mycket värdena i en datamängd skiljer sig från medelvärdet. Det hjälper oss att förstå spridningen eller spridningen av datapunkter. Det finns två huvudtyper av varians: populationsvarians, som mäter hur datapunkterna i en hel population sprider sig, och urvalsvarians, som mäter hur datapunkterna i ett urval sprider sig. Varians betecknas med σ² och är kvadraten på standardavvikelsen. För att beräkna variansen, hittar du medelvärdet av datan, subtraherar medelvärdet från varje datapunkt, kvadrerar skillnaderna och sedan medelvärdet för dessa kvadratiska skillnader. Varians är viktigt eftersom det hjälper oss att förstå variabiliteten inom en datauppsättning. En hög varians indikerar att datapunkter är utspridda, medan en låg varians indikerar att de ligger nära medelvärdet. Varians är alltid icke-negativ eftersom det handlar om att kvadrera skillnaderna.
Vanliga frågor om Varians
Vad är varians i statistik?
Varians definieras som spridningen av värdena för datamängden med avseende på medelvärdet för datamängden. Variansen av datamängden berättar i vilken utsträckning värdena i en viss datamängd sprider sig från medelvärdet.
Vad är symbolen för varians?
Vi använder symbolerna σ2, s2 och Var(x) för att beteckna variansen för datamängden.
Vad är variansformeln?
Varians av datamängden beräknas med formeln,
sid 2 = E[( X – m ) 2 ]
Vad säger Varians?
Varians används för att hitta omfattningen av spridningen av datan, dvs den berättar hur värdena i en datamängd är utspridda i förhållande till medelvärdet. För det större variansvärdet är värdena vitt spridda med avseende på medelvärdet medan med avseende på det mindre variansvärdet är värdena tätt spridda med avseende på medelvärdet
Vad är förhållandet mellan varians och standardavvikelse?
För den givna datamängden är variansen för datamängden kvadraten på standardavvikelsen för den datamängden. Detta förhållande uttrycks som,
Varians = (Standardavvikelse) 2
Hur beräknar du varians?
För att beräkna variansen hittar du först medelvärdet (genomsnittet) av datamängden. Subtrahera sedan medelvärdet från varje datapunkt och kvadrera resultatet. Slutligen, genomsnitt dessa kvadratskillnader.
Varför är varians viktigt?
Varians är avgörande för att förstå fördelningen av data inom en datamängd. Det hjälper till att avgöra hur utspridda datapunkterna är från medelvärdet, vilket indikerar variabiliteten eller konsistensen inom data.
Vad är skillnaden mellan varians och standardavvikelse?
Medan både varians och standardavvikelse mäter dataspridning, är standardavvikelsen kvadratroten av variansen. Standardavvikelsen uttrycks i samma enheter som data, vilket gör det mer tolkbart för att indikera spridningen.
Kan varians vara negativ?
Nej, varians kan inte vara negativ. Eftersom det beräknas som medelvärdet av de kvadratiska skillnaderna från medelvärdet, är det resulterande värdet alltid icke-negativt.