logo

Variation

Variation är ett mätvärde som används för att hitta hur data sprids avseende medelvärdet eller medelvärdet av datamängden. Den används för att ta reda på hur fördelningsdatan är utspridd avseende medel- eller medelvärde. Symbolen som används för att definiera variansen är σ2. Det är kvadraten på standardavvikelsen.

Det finns två typer av varians som används i statistik,



  • Provvarians
  • Befolkningsvariation

Populationsvariansen används för att bestämma hur varje datapunkt i en viss population fluktuerar eller är utspridda, medan urvalsvariansen används för att hitta medelvärdet av de kvadratiska avvikelserna från medelvärdet.

I den här artikeln kommer vi att lära oss om Varians (prov, population), deras formler, egenskaper och andra i detalj.

Innehållsförteckning



Vad är varians?

Vi mäter de olika värdena av data och dessa värden används för en mängd olika ändamål. Data kan ges i två typer av grupperad data, eller ogrupperad (diskret) data. Om data ges i form av klassintervall kallas det grupperad data medan om data ges i form av en enda datapunkt kallas det för en diskret eller ogrupperad datapunkt. Varians är måttet på spridningen av data avseende medelvärdet av data. Den berättar för oss hur data är spridda i det givna datavärdet. Vi kan enkelt beräkna urvalsvariansen och populationsvariansen för både grupperade och ogrupperade data.

Varians Definition

Variation är ett statistiskt mått som kvantifierar spridningen eller spridningen av en uppsättning datapunkter. Den indikerar hur mycket de enskilda datapunkterna i en datamängd skiljer sig från medelvärdet (genomsnittet) av datamängden

Typer av varians

Vi kan definiera variansen för de givna uppgifterna i två typer,



  • Befolkningsvariation
  • Provvarians

Låt oss nu lära oss om dem i detalj.

Befolkningsvariation

Populationsvarians används för att hitta spridningen av den givna populationen. Befolkningen definieras som en grupp människor och alla människor i den gruppen är en del av befolkningen. Den berättar om hur befolkningen i en grupp varierar med avseende på medelbefolkningen.

Alla medlemmar i en grupp kallas befolkningen. När vi vill ta reda på hur varje datapunkt i en given population varierar eller är spridd använder vi populationsvariansen. Den används för att ge det kvadratiska avståndet för varje datapunkt från populationsmedelvärdet.

Provvarians

Om populationsdata är mycket stora blir det svårt att beräkna populationsvariansen för datamängden. I så fall tar vi ett urval av data från den givna datamängden och hittar variansen för den datamängden som kallas provvarians. När vi beräknar urvalets medelvärde ser vi till att beräkna urvalets medelvärde, dvs medelvärdet av urvalsdatauppsättningen inte populationsmedelvärdet. Vi kan definiera urvalsvariansen som medelvärdet av kvadraten på skillnaden mellan provdatapunkten och urvalsmedelvärdet.

Varianssymbol

Symbolen för varians representeras vanligtvis av den grekiska bokstaven sigma i kvadrat (σ²) när det hänvisas till populationsvariansen. För provvarians betecknas det ofta med s².

Varians exempel

Vi kan förstå begreppet varians med hjälp av exemplet som diskuteras nedan.

Hitta populationsvariansen för datan {4,6,8,10}

Lösning:

Medelvärde = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
10 (10-7)2 9

Varians = (9+1+1+9)/4 = 20/4 = 5

Variansen på data är alltså 5

Variansformel

Variansen för en datamängd betecknas med symbolen σ2. För populationsdata är dess formel lika med summan av kvadrerade skillnader mellan datainmatningar från medelvärdet dividerat med antalet poster. Medan för exempeldata delar vi täljarvärdet med skillnaden mellan antalet poster och enhet.

Exempel på variansformel

Om datamängden är ett exempel ges variansformeln av,

sid 2 = ∑ (x i – x̄) 2 /(n – 1)

var,

  • x är medelvärdet av provdatauppsättningen
  • n är det totala antalet observationer

Befolkningsvariansformel

Om vi ​​har en populationsdatamängd skrivs formeln som,

sid 2 = ∑ (x i – x̄) 2 /n

var,

  • x är medelvärdet av populationsdatauppsättningen
  • n är det totala antalet observationer

Vi kan också beräkna variansen för grupperade och ogrupperade datamängder. Olika formler för variansen är,

två till en multiplexor

Variansformel för grupperad data

För grupperade data diskuteras variansformeln nedan,

Exempelvariansformel för grupperade data (σ 2 ) = ∑ f(m i – x̄) 2 /(n-1)

Populationsvariansformel för grupperade data (sid 2 ) = ∑ f(m i – x̄) 2 /n

var,

  • f är frekvensen för varje intervall
  • m i är mittpunkten av i:etthintervall
  • x är medelvärdet av den grupperade datan

För grupperade data beräknas medelvärdet som,

Medel = ∑ (f i x i ) / ∑ f i

Variansformel för ogrupperade data

För ogrupperade data diskuteras variansformeln nedan,

  • Exempelvariansformel för ogrupperade data (sid 2 ) = ∑ (x i – x̄) 2 /(n-1)
  • Populationsvariansformel för ogrupperade data (sid 2 ) = ∑ (x i – x̄) 2 /n

var x är medelvärdet av den grupperade datan

Formel för att beräkna varians

Formeln som används för att beräkna variansen diskuteras i bilden nedan,

Variansformel

Hur beräknar man varians?

I allmänhet betyder varians populationsstandardvarians. Stegen för att beräkna variansen för en given uppsättning värden är,

Steg 1: Beräkna medelvärdet av observationen med formeln (medelvärde = summan av observationer/antal observationer)

Steg 2: Beräkna de kvadratiska skillnaderna mellan datavärdena och medelvärdet. (Datavärde – medelvärde)2

Steg 3: Beräkna medelvärdet av de kvadratiska skillnaderna för de givna värdena som kallas variansen för datamängden.

(Varians = summan av kvadratiska skillnader / antal observationer)

Varians och standardavvikelse

Varians och Standardavvikelse båda är mått på den centrala tendens som används för att berätta för oss om i vilken utsträckning värdena på datamängden avviker med avseende på det centrala eller medelvärdet av datamängden.

Det finns ett definitivt samband mellan varians och standardavvikelse för en given datamängd.

Varians = (Standardavvikelse) 2

Varians definieras som kvadraten på standardavvikelsen, det vill säga att ta kvadraten på standardavvikelsen för vilken grupp av data som helst ger oss variansen för den datamängden. variansen definieras med hjälp av symbolen sid 2 medan sid används för att definiera standardavvikelsen för datamängden. Varians av datamängden uttrycks i kvadratiska enheter medan standardavvikelsen för datamängden uttrycks i en enhet som liknar medelvärdet av datamängden.

Läs mer: Varians och standardavvikelse

Varians av binomial distribution

Binomial distribution är den diskreta sannolikhetsfördelningen som talar om för oss antalet positiva utfall i ett binomialexperiment utfört n antal gånger. Resultatet av binomialexperimentet är 0 eller 1, det vill säga antingen positivt eller negativt.

I binomialexperimentet av n försök och där sannolikheten för varje försök anges sid , då ges variansen av binomialfördelningen med hjälp av,

sid 2 = np (1 – p)

var 't.ex' definieras som medelvärdet av värdena för binomialfördelningen.

Varians av Poisson Distribution

Giftdistribution definieras som en diskret sannolikhetsfördelning som används för att definiera sannolikheten för att antalet 'n' händelser inträffar inom tidsperioden 'x'. Medelvärdet i Poisson-fördelningen definieras av symbolen l.

I Poisson-fördelningen är medelvärdet och variansen för den givna datamängden lika. Variansen av Poisson-fördelningen ges med formeln,

sid 2 = λ

Varians av enhetlig distribution

I en enhetlig fördelning är sannolikhetsfördelningsdata kontinuerliga. Resultatet i dessa experiment ligger i intervallet mellan en specifik övre gräns och en specifik nedre gräns och därför kallas dessa fördelningar även för rektangulära distributioner. Om den övre gränsen eller maxgränsen är b och den nedre gränsen eller minimigränsen är a då beräknas variansen för den enhetliga fördelningen med hjälp av formeln,

sid 2 = (1/12)(b – a) 2

Medelvärdet av den enhetliga fördelningen ges med formeln,

Medelvärde = (b + a) / 2

var,

  • b är den övre gränsen för den enhetliga fördelningen
  • a är den nedre gränsen för den enhetliga fördelningen

Varians och kovarians

Varians av datamängden definierar volatiliteten för alla värden i datamängden med avseende på medelvärdet för datamängden. Kovarians berättar hur de slumpmässiga variablerna är relaterade till varandra och den berättar hur förändringen i en variabel påverkar förändringen i andra variabler.

Kovarians kan vara positiv eller negativ, den positiva kovariansen betyder att båda variablerna rör sig i samma riktning med avseende på medelvärdet medan negativ kovarians betyder att båda variablerna rör sig i motsatta riktningar med avseende på medelvärdet.

För två slumpvariabler x och y där x är den beroende variabeln och y är den oberoende variabeln beräknas kovariansen med hjälp av formeln som nämns i nedanstående bifogade bild.

Kovariansformel

Variansegenskaper

Varians används i stor utsträckning inom matematik, statistik och andra vetenskapsgrenar för en mängd olika ändamål. Varians har olika egenskaper som ofta används för att lösa olika problem. Några av de grundläggande egenskaperna hos variansen är,

  • Varians av datamängden är den icke-negativa kvantiteten och variansvärdet noll betyder att alla värden i datamängden är lika.
  • Ett högre värde på variansen talar om för oss att alla datavärden i datamängden är vitt spridda, d.v.s. de är långt borta från medelvärdet för datamängden.
  • Ett lägre värde på variansen talar om för oss att alla datavärden i datamängden ligger nära varandra, dvs de är mycket nära medelvärdet för datamängden.

För varje konstant 'c'

  • Var(x + c) = Var(x)

var x är en slumpvariabel

  • Var(cx) = c2

var x är en slumpvariabel

Även om a och b är det konstanta värdet och x är en slumpvariabel då,

  • Var(ax + b) = a2

För oberoende variabler x1, x2, x3…,xnvi vet det,

  • Var(x1+ x2+……+ xn) = Var(x1) + Var(x2) +……..+Var(xn)

Folk läser också:

  • Betyda
  • Läge
  • Skillnaden mellan varians och standardavvikelse

Exempel på variansformel

Exempel 1: Beräkna variansen för provdata: 7, 11, 15, 19, 24.

Lösning:

Vi har uppgifterna 7, 11, 15, 19, 24

Hitta medelvärdet av uppgifterna.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

Genom att använda formeln för varians får vi,

sid2= ∑ (xi– x̄)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2

Exempel 2: Beräkna antalet observationer om variansen för data är 12 och summan av kvadrerade skillnader mellan data från medelvärdet är 156.

Lösning:

Vi har,

(xi– x̄)2= 156

sid2= 12

Genom att använda formeln för varians får vi,

sid2= ∑ (xi– x̄)2/n

12 = 156/n

n = 156/12

n = 13

Exempel 3: Beräkna variansen för givna data

vilken samling i java

xi

fi

10 1
4 3
6 5
8 1

Lösning:

Medelvärde (x̄) = ∑(fixi)/∑(fi)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(fi) = 1+3+5+1 = 10

xi

fi

fixi

(xi– x̄)

(xi– x̄)2

fi(xi– x̄)2

10 1 10 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

Nu,

sid 2 = (∑ i n f i (x i – x̄) 2 /n)

= [(16 + 12 + 0 +8)/10]
= 3,6

Varians(σ2) = 3,6

Exempel 4: Hitta variansen i följande datatabell

Klass

Frekvens

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

Lösning:

Klass

Xi

fi

f×Xi

Xi – μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

3

femton

-femton

225

675

10-20

femton

6

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

femton

225

450

40-50

Fyra fem

1

Fyra fem

25

625

625

Total

16

320

2000

stjärntopologi

Medelvärde (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

sid 2 = (∑ i n f i (x i – m) 2 /n)

= [(2000)/(16)]
= (125)

Variansen för given datamängd är 125.

Sammanfattning – Varians

Varians är ett statistiskt mått som visar hur mycket värdena i en datamängd skiljer sig från medelvärdet. Det hjälper oss att förstå spridningen eller spridningen av datapunkter. Det finns två huvudtyper av varians: populationsvarians, som mäter hur datapunkterna i en hel population sprider sig, och urvalsvarians, som mäter hur datapunkterna i ett urval sprider sig. Varians betecknas med σ² och är kvadraten på standardavvikelsen. För att beräkna variansen, hittar du medelvärdet av datan, subtraherar medelvärdet från varje datapunkt, kvadrerar skillnaderna och sedan medelvärdet för dessa kvadratiska skillnader. Varians är viktigt eftersom det hjälper oss att förstå variabiliteten inom en datauppsättning. En hög varians indikerar att datapunkter är utspridda, medan en låg varians indikerar att de ligger nära medelvärdet. Varians är alltid icke-negativ eftersom det handlar om att kvadrera skillnaderna.

Vanliga frågor om Varians

Vad är varians i statistik?

Varians definieras som spridningen av värdena för datamängden med avseende på medelvärdet för datamängden. Variansen av datamängden berättar i vilken utsträckning värdena i en viss datamängd sprider sig från medelvärdet.

Vad är symbolen för varians?

Vi använder symbolerna σ2, s2 och Var(x) för att beteckna variansen för datamängden.

Vad är variansformeln?

Varians av datamängden beräknas med formeln,

sid 2 = E[( X – m ) 2 ]

Vad säger Varians?

Varians används för att hitta omfattningen av spridningen av datan, dvs den berättar hur värdena i en datamängd är utspridda i förhållande till medelvärdet. För det större variansvärdet är värdena vitt spridda med avseende på medelvärdet medan med avseende på det mindre variansvärdet är värdena tätt spridda med avseende på medelvärdet

Vad är förhållandet mellan varians och standardavvikelse?

För den givna datamängden är variansen för datamängden kvadraten på standardavvikelsen för den datamängden. Detta förhållande uttrycks som,

Varians = (Standardavvikelse) 2

Hur beräknar du varians?

För att beräkna variansen hittar du först medelvärdet (genomsnittet) av datamängden. Subtrahera sedan medelvärdet från varje datapunkt och kvadrera resultatet. Slutligen, genomsnitt dessa kvadratskillnader.

Varför är varians viktigt?

Varians är avgörande för att förstå fördelningen av data inom en datamängd. Det hjälper till att avgöra hur utspridda datapunkterna är från medelvärdet, vilket indikerar variabiliteten eller konsistensen inom data.

Vad är skillnaden mellan varians och standardavvikelse?

Medan både varians och standardavvikelse mäter dataspridning, är standardavvikelsen kvadratroten av variansen. Standardavvikelsen uttrycks i samma enheter som data, vilket gör det mer tolkbart för att indikera spridningen.

Kan varians vara negativ?

Nej, varians kan inte vara negativ. Eftersom det beräknas som medelvärdet av de kvadratiska skillnaderna från medelvärdet, är det resulterande värdet alltid icke-negativt.