logo

Förstå hypotestestning

Hypotestestning innebär att formulera antaganden om populationsparametrar baserade på urvalsstatistik och noggrant utvärdera dessa antaganden mot empiriska bevis. Denna artikel belyser betydelsen av hypotestestning och de kritiska stegen som ingår i processen.

Vad är hypotestestning?

Hypotestestning är en statistisk metod som används för att fatta ett statistiskt beslut med hjälp av experimentella data. Hypotesprövning är i grunden ett antagande som vi gör om en populationsparameter. Den utvärderar två ömsesidigt uteslutande påståenden om en population för att avgöra vilket påstående som bäst stöds av provdata.



Exempel: Du säger att medellängden i klassen är 30 eller att en pojke är längre än en flicka. Alla dessa är ett antagande som vi antar, och vi behöver något statistiskt sätt att bevisa dessa. Vi behöver någon matematisk slutsats vad vi än antar är sant.

Definiera hypoteser

  • Nollhypotes (H 0 ): I statistik är nollhypotesen ett allmänt uttalande eller standardposition att det inte finns något samband mellan två uppmätta fall eller inget samband mellan grupper. Det är med andra ord ett grundantagande eller gjort utifrån problemkunskapen.
    Exempel : Ett företags genomsnittliga produktion är 50 enheter/per da H0: mu= 50.
  • Alternativ hypotes (H 1 ): Den alternativa hypotesen är den hypotes som används vid hypotesprövning som strider mot nollhypotesen.
    Exempel: Ett företags produktion är inte lika med 50 enheter/per dag, dvs H1: mu 
femtio.

Nyckeltermer för hypotestestning

  • Nivå av betydelse : Det hänvisar till graden av signifikans i vilken vi accepterar eller förkastar nollhypotesen. 100 % noggrannhet är inte möjligt för att acceptera en hypotes, så vi väljer därför en signifikansnivå som vanligtvis är 5 %. Detta betecknas normalt med alfaoch i allmänhet är det 0,05 eller 5 %, vilket betyder att din produktion bör vara 95 % säker för att ge ett liknande resultat i varje prov.
  • P-värde: De P-värde , eller beräknad sannolikhet, är sannolikheten att hitta de observerade/extrema resultaten när nollhypotesen (H0) för ett studiegivet problem är sann. Om ditt P-värde är mindre än den valda signifikansnivån så förkastar du nollhypotesen, dvs accepterar att ditt urval påstår sig stödja den alternativa hypotesen.
  • Teststatistik: Teststatistiken är ett numeriskt värde som beräknas från provdata under ett hypotestest, som används för att avgöra om nollhypotesen ska förkastas. Det jämförs med ett kritiskt värde eller p-värde för att fatta beslut om den statistiska signifikansen av de observerade resultaten.
  • Kritiskt värde : Det kritiska värdet i statistik är en tröskel eller gränspunkt som används för att avgöra om nollhypotesen ska förkastas i ett hypotestest.
  • Grader av frihet: Frihetsgrader är förknippade med den variabilitet eller frihet man har när det gäller att uppskatta en parameter. Frihetsgraderna är relaterade till provstorleken och bestämmer formen.

Varför använder vi hypotestestning?

Hypotesprövning är en viktig procedur inom statistik. Hypotestestning utvärderar två ömsesidigt uteslutande populationspåståenden för att avgöra vilket påstående som bäst stöds av provdata. När vi säger att fynden är statistiskt signifikanta, tack vare hypotesprövning.

Ensidigt och tvåsidigt test

Ett svanstest fokuserar på en riktning, antingen större än eller mindre än ett angivet värde. Vi använder ett ensidigt test när det finns en tydlig riktningsförväntning baserad på förkunskaper eller teori. Det kritiska området ligger endast på ena sidan av fördelningskurvan. Om provet hamnar i denna kritiska region förkastas nollhypotesen till förmån för den alternativa hypotesen.



Ensidigt test

Det finns två typer av ensidigt test:

  • Vänstersidigt (vänstersidigt) test: Den alternativa hypotesen hävdar att det sanna parametervärdet är mindre än nollhypotesen. Exempel: H0: mu geq 50och H1:
  • och H1: mu>50

Tvåsidigt test

Ett tvåsidigt test tar hänsyn till båda riktningarna, större än och mindre än ett specificerat värde. Vi använder ett tvåsidigt test när det inte finns någon specifik riktningsförväntning och vill upptäcka någon signifikant skillnad.

Exempel: H0: in =50 och H1: mu 
eq 50



Vad är typ 1 och typ 2 fel i hypotestestning?

Vid hypotesprövning, Typ I och Typ II fel är två möjliga fel som forskare kan göra när de drar slutsatser om en population baserat på ett urval av data. Dessa fel är förknippade med de beslut som fattats angående nollhypotesen och alternativhypotesen.

  • Typ I fel: När vi förkastar nollhypotesen, även om den hypotesen var sann. Typ I-fel betecknas med alfa( alfa).
  • Typ II fel: När vi accepterar nollhypotesen, men den är falsk. Typ II-fel betecknas med beta( eta).


Nollhypotesen är sann

Nollhypotesen är falsk

Nollhypotes är sann (acceptera)

Rätt beslut

Typ II-fel (falskt negativ)

Alternativ hypotes är sann (avvisa)

Typ I-fel (falskt positivt)

Rätt beslut

Hur fungerar hypotestestning?

Steg 1: Definiera noll- och alternativhypotes

Ange nollhypotesen ( H_0), som inte representerar någon effekt, och den alternativa hypotesen ( H_1), vilket tyder på en effekt eller skillnad.

Vi identifierar först problemet som vi vill göra ett antagande om med tanke på att vårt antagande bör vara motsägelsefullt med varandra, förutsatt att Normalfördelad data.

Steg 2 – Välj signifikansnivå

Välj en signifikansnivå ( alfatypiskt 0,05, för att bestämma tröskeln för att förkasta nollhypotesen. Det ger validitet till vårt hypotestest och säkerställer att vi har tillräckligt med data för att backa upp våra påståenden. Vanligtvis bestämmer vi vår signifikansnivå innan testet. De p-värde är det kriterium som används för att beräkna vårt signifikansvärde.

Steg 3 Samla in och analysera data.

Samla in relevant data genom observation eller experiment. Analysera data med hjälp av lämpliga statistiska metoder för att få en teststatistik.

Steg 4-Beräkna teststatistik

Data för testerna utvärderas i detta steg vi letar efter olika poäng baserat på egenskaperna hos data. Valet av teststatistik beror på vilken typ av hypotestest som genomförs.

Det finns olika hypotestest, var och en lämplig för olika mål för att beräkna vårt test. Detta kan vara en Z-test , Chi-kvadrat , T-test , och så vidare.

  1. Z-test : Om populationsmedelvärden och standardavvikelser är kända. Z-statistik används ofta.
  2. t-test : Om populationens standardavvikelser är okända. och urvalsstorleken är liten än t-teststatistik är mer lämplig.
  3. Chi-kvadrattest : Chi-kvadrattest används för kategorisk data eller för att testa oberoende i beredskapstabeller
  4. F-test : F-test används ofta i variansanalys (ANOVA) för att jämföra varianser eller testa jämlikheten mellan medelvärden över flera grupper.

Vi har en mindre datauppsättning, så T-test är mer lämpligt för att testa vår hypotes.

T-statistik är ett mått på skillnaden mellan medelvärdet för två grupper i förhållande till variabiliteten inom varje grupp. Den beräknas som skillnaden mellan urvalsmedelvärdena dividerat med standardfelet för skillnaden. Det är också känt som t-värde eller t-poäng.

Steg 5 – Jämföra teststatistik:

I detta skede bestämmer vi var vi ska acceptera nollhypotesen eller förkasta nollhypotesen. Det finns två sätt att bestämma var vi ska acceptera eller förkasta nollhypotesen.

Metod A: Använda Kritiska värden

Genom att jämföra teststatistiken och tabulerade kritiska värden vi har,

  • Om Teststatistik>Kritiskt värde: Avvisa nollhypotesen.
  • Om Teststatistik≤Kritiskt värde: Misslyckas med att förkasta nollhypotesen.

Notera: Kritiska värden är förutbestämda tröskelvärden som används för att fatta ett beslut vid hypotesprövning. Att bestämma kritiska värden för hypotestestning hänvisar vi vanligtvis till en statistisk distributionstabell, till exempel normalfördelningen eller t-fördelningstabeller baserade på.

Metod B: Använda P-värden

Vi kan också komma till en slutsats med hjälp av p-värdet,

  • Om p-värdet är mindre än eller lika med signifikansnivån, dvs ( pleqalfa), förkastar du nollhypotesen. Detta indikerar att det är osannolikt att de observerade resultaten har inträffat enbart av en slump, vilket ger bevis för den alternativa hypotesen.
  • Om p-värdet är större än signifikansnivån, dvs ( pgeq alpha), misslyckas du med att förkasta nollhypotesen. Detta tyder på att de observerade resultaten överensstämmer med vad som skulle förväntas under nollhypotesen.

Notera : P-värdet är sannolikheten att få en teststatistik som är lika extrem som, eller mer extrem än, den som observerades i urvalet, förutsatt att nollhypotesen är sann. Att bestämma p-värde för hypotestestning hänvisar vi vanligtvis till en statistisk distributionstabell, till exempel normalfördelningen eller t-fördelningstabeller baserade på.

Steg 7- Tolka resultaten

Äntligen kan vi avsluta vårt experiment med metod A eller B.

Beräknar teststatistik

För att validera vår hypotes om en populationsparameter använder vi statistiska funktioner . Vi använder z-poäng, p-värde och signifikansnivå (alfa) för att bevisa vår hypotes för normalfördelade data .

1. Z-statistik:

När populationsmedelvärden och standardavvikelser är kända.

z = frac{ar{x} - mu}{frac{sigma}{sqrt{n}}}

var,

array sorterad i java
  • ar{x}är provets medelvärde,
  • μ representerar populationsmedelvärdet,
  • σ är standardavvikelsen
  • och n är storleken på provet.

2. T-statistik

T-test används när n<30,

t-statistisk beräkning ges av:

t=frac{x̄-Μ}{s/sqrt{n}}

var,

  • t = t-poäng,
  • x̄ = provmedelvärde
  • μ = befolkningsmedelvärde,
  • s = standardavvikelse för provet,
  • n = provstorlek

3. Chi-Square Test

Chi-Square-test för kategoriska data för oberoende (icke-normalfördelade) med hjälp av:

chi^2 = sum frac{(O_{ij} - E_{ij})^2}{E_{ij}}

var,

  • O_{ij}är den observerade frekvensen i cellen {I j}
  • i,j är rad- och kolumnindex.
  • E_{ij}är den förväntade frekvensen i cellen {I j}, beräknat som:
    frac{{	ext{{Rad total}} 	imes 	ext{{Kolumntotal}}}}{{	ext{{Totala observationer}}}}

Exempel på hypotestestning i verkligheten

Låt oss undersöka hypotestestning med hjälp av två verkliga situationer,

Fall A: D Påverkar ett nytt läkemedel blodtrycket?

Föreställ dig att ett läkemedelsföretag har utvecklat ett nytt läkemedel som de tror effektivt kan sänka blodtrycket hos patienter med högt blodtryck. Innan läkemedlet släpps ut på marknaden måste de genomföra en studie för att bedöma dess inverkan på blodtrycket.

Data:

  • Före behandling: 120, 122, 118, 130, 125, 128, 115, 121, 123, 119
  • Efter behandling: 115, 120, 112, 128, 122, 125, 110, 117, 119, 114

Steg 1 : Definiera hypotesen

  • Nollhypotesen : (H0)Det nya läkemedlet har ingen effekt på blodtrycket.
  • Alternativ hypotes : (H1)Det nya läkemedlet har effekt på blodtrycket.

Steg 2: Definiera signifikansnivån

Låt oss betrakta signifikansnivån på 0,05, vilket indikerar förkastande av nollhypotesen.

Om bevisen tyder på mindre än 5 % chans att observera resultaten på grund av slumpmässig variation.

Steg 3 : Beräkna teststatistiken

Använder sig av parat T-test analysera data för att få en teststatistik och ett p-värde.

Teststatistiken (t.ex. T-statistik) beräknas baserat på skillnaderna mellan blodtrycksmätningar före och efter behandling.

t = m/(s/√n)

Var:

  • m = medelvärdet av skillnaden dvs X efter, X innan
  • s = standardavvikelse för skillnaden (d) dvs d i = X efter, i X innan,
  • n = provstorlek,

sedan, m= -3,9, s=1,8 och n=10

vi beräknar , T-statistiken = -9 baserat på formeln för parat t-test

Steg 4: Hitta p-värdet

Den beräknade t-statistiken är -9 och frihetsgrader df = 9, kan du hitta p-värdet med hjälp av statistisk programvara eller en t-fördelningstabell.

alltså, p-värde = 8,538051223166285e-06

Steg 5: Resultat

  • Om p-värdet är mindre än eller lika med 0,05, förkastar forskarna nollhypotesen.
  • Om p-värdet är större än 0,05 misslyckas de med att förkasta nollhypotesen.

Slutsats: Eftersom p-värdet (8,538051223166285e-06) är mindre än signifikansnivån (0,05) förkastar forskarna nollhypotesen. Det finns statistiskt signifikanta bevis för att det genomsnittliga blodtrycket före och efter behandling med det nya läkemedlet är olika.

Python-implementering av hypotestestning

Låt oss skapa hypotestestning med python, där vi testar om ett nytt läkemedel påverkar blodtrycket. För det här exemplet kommer vi att använda ett parat T-test. Vi kommer att använda scipy.stats> bibliotek för T-testet.

Vi kommer att implementera vårt första verkliga problem via python,

Python3

import> numpy as np> from> scipy>import> stats> # Data> before_treatment>=> np.array([>120>,>122>,>118>,>130>,>125>,>128>,>115>,>121>,>123>,>119>])> after_treatment>=> np.array([>115>,>120>,>112>,>128>,>122>,>125>,>110>,>117>,>119>,>114>])> # Step 1: Null and Alternate Hypotheses> # Null Hypothesis: The new drug has no effect on blood pressure.> # Alternate Hypothesis: The new drug has an effect on blood pressure.> null_hypothesis>=> 'The new drug has no effect on blood pressure.'> alternate_hypothesis>=> 'The new drug has an effect on blood pressure.'> # Step 2: Significance Level> alpha>=> 0.05> # Step 3: Paired T-test> t_statistic, p_value>=> stats.ttest_rel(after_treatment, before_treatment)> # Step 4: Calculate T-statistic manually> m>=> np.mean(after_treatment>-> before_treatment)> s>=> np.std(after_treatment>-> before_treatment, ddof>=>1>)># using ddof=1 for sample standard deviation> n>=> len>(before_treatment)> t_statistic_manual>=> m>/> (s>/> np.sqrt(n))> # Step 5: Decision> if> p_value <>=> alpha:> >decision>=> 'Reject'> else>:> >decision>=> 'Fail to reject'> # Conclusion> if> decision>=>=> 'Reject'>:> >conclusion>=> 'There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.'> else>:> >conclusion>=> 'There is insufficient evidence to claim a significant difference in average blood pressure before and after treatment with the new drug.'> # Display results> print>(>'T-statistic (from scipy):'>, t_statistic)> print>(>'P-value (from scipy):'>, p_value)> print>(>'T-statistic (calculated manually):'>, t_statistic_manual)> print>(f>'Decision: {decision} the null hypothesis at alpha={alpha}.'>)> print>(>'Conclusion:'>, conclusion)>
>
>

Produktion:

T-statistic (from scipy): -9.0 P-value (from scipy): 8.538051223166285e-06 T-statistic (calculated manually): -9.0 Decision: Reject the null hypothesis at alpha=0.05. Conclusion: There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.>

I exemplet ovan, givet T-statistiken på ungefär -9 och ett extremt litet p-värde, indikerar resultaten ett starkt fall för att förkasta nollhypotesen vid en signifikansnivå på 0,05.

  • Resultaten tyder på att det nya läkemedlet, behandlingen eller interventionen har en betydande effekt på att sänka blodtrycket.
  • Den negativa T-statistiken indikerar att medelblodtrycket efter behandling är signifikant lägre än det antagna populationsmedelvärdet före behandling.

Fall B : Kolesterolnivå i en befolkning

Data: Ett prov på 25 individer tas, och deras kolesterolnivåer mäts.

Kolesterolnivåer (mg/dL): 205, 198, 210, 190, 215, 205, 200, 192, 198, 205, 198, 202, 208, 200, 205, 198, 205, 2, 205, 198, 205, 205, 205 205, 210, 192, 205.

Populationsmedelvärde = 200

Populationsstandardavvikelse (σ): 5 mg/dL (givet för detta problem)

Steg 1: Definiera hypotesen

  • Nollhypotes (H 0 ): Den genomsnittliga kolesterolnivån i en befolkning är 200 mg/dL.
  • Alternativ hypotes (H 1 ): Den genomsnittliga kolesterolnivån i en befolkning skiljer sig från 200 mg/dL.

Steg 2: Definiera signifikansnivån

Eftersom avvikelsens riktning inte är given antar vi ett tvåsidigt test, och baserat på en normalfördelningstabell kan de kritiska värdena för en signifikansnivå på 0,05 (tvåsidigt) beräknas genom z-tabell och är ungefär -1,96 och 1,96.

Steg 3 : Beräkna teststatistiken

Teststatistiken beräknas med hjälp av z-formeln MED = (203,8 - 200) / (5 div sqrt{25})och vi får därefter, MED =2,0399999999999992.

Steg 4: Resultat

Eftersom teststatistikens absoluta värde (2,04) är större än det kritiska värdet (1,96) förkastar vi nollhypotesen. Och dra slutsatsen att det finns statistiskt signifikanta bevis för att den genomsnittliga kolesterolnivån i befolkningen skiljer sig från 200 mg/dL

Python-implementering av hypotestestning

Python3

import> scipy.stats as stats> import> math> import> numpy as np> # Given data> sample_data>=> np.array(> >[>205>,>198>,>210>,>190>,>215>,>205>,>200>,>192>,>198>,>205>,>198>,>202>,>208>,>200>,>205>,>198>,>205>,>210>,>192>,>205>,>198>,>205>,>210>,>192>,>205>])> population_std_dev>=> 5> population_mean>=> 200> sample_size>=> len>(sample_data)> # Step 1: Define the Hypotheses> # Null Hypothesis (H0): The average cholesterol level in a population is 200 mg/dL.> # Alternate Hypothesis (H1): The average cholesterol level in a population is different from 200 mg/dL.> # Step 2: Define the Significance Level> alpha>=> 0.05> # Two-tailed test> # Critical values for a significance level of 0.05 (two-tailed)> critical_value_left>=> stats.norm.ppf(alpha>/>2>)> critical_value_right>=> ->critical_value_left> # Step 3: Compute the test statistic> sample_mean>=> sample_data.mean()> z_score>=> (sample_mean>-> population_mean)>/> > >(population_std_dev>/> math.sqrt(sample_size))> # Step 4: Result> # Check if the absolute value of the test statistic is greater than the critical values> if> abs>(z_score)>>max>(>abs>(critical_value_left),>abs>(critical_value_right)):> >print>(>'Reject the null hypothesis.'>)> >print>(>'There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.'>)> else>:> >print>(>'Fail to reject the null hypothesis.'>)> >print>(>'There is not enough evidence to conclude that the average cholesterol level in the population is different from 200 mg/dL.'>)>
>
>

Produktion:

Reject the null hypothesis. There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.>

Begränsningar av hypotestestning

  • Även om det är en användbar teknik, erbjuder hypotestestning inte ett heltäckande grepp om ämnet som studeras. Utan att helt återspegla fenomenets intrikata eller hela sammanhang, koncentreras den på vissa hypoteser och statistisk signifikans.
  • Noggrannheten hos hypotestestningsresultaten är beroende av kvaliteten på tillgängliga data och lämpligheten hos de statistiska metoder som används. Felaktiga uppgifter eller dåligt formulerade hypoteser kan leda till felaktiga slutsatser.
  • Att enbart förlita sig på hypotestestning kan få analytiker att förbise betydande mönster eller samband i data som inte fångas upp av de specifika hypoteser som testas. Denna begränsning understryker vikten av att komplettera hypotestestning med andra analytiska tillvägagångssätt.

Slutsats

Hypotestestning står som en hörnsten i statistisk analys, vilket gör det möjligt för datavetare att navigera i osäkerheter och dra trovärdiga slutsatser från provdata. Genom att systematiskt definiera noll- och alternativa hypoteser, välja signifikansnivåer och använda statistiska tester kan forskare bedöma giltigheten av sina antaganden. Artikeln belyser också den kritiska distinktionen mellan typ I- och typ II-fel, vilket ger en omfattande förståelse av den nyanserade beslutsprocess som är inneboende i hypotestestning. Det verkliga exemplet på att testa ett nytt läkemedels effekt på blodtrycket med hjälp av ett parat T-test visar den praktiska tillämpningen av dessa principer, vilket understryker vikten av statistisk rigor i datadrivet beslutsfattande.

Vanliga frågor (FAQs)

1. Vilka är de tre typerna av hypotestest?

Det finns tre typer av hypotestest: högersvansad, vänstersvansad och tvåsvansad. Högersidiga tester bedömer om en parameter är större, vänstersvansad om mindre. Tvåsidiga tester kontrollerar icke-riktade skillnader, större eller mindre.

2. Vilka är de fyra komponenterna i hypotestestning?

Nollhypotesen ( H_o): Ingen effekt eller skillnad finns.

Alternativ hypotes ( H_1): Det finns en effekt eller skillnad.

Signifikansnivå ( alfa): Risk att förkasta nollhypotesen när den är sann (Typ I-fel).

Teststatistik: Numeriskt värde som representerar observerade bevis mot nollhypotes.

3.Vad är hypotesprövning i ML?

Statistisk metod för att utvärdera prestanda och giltighet hos modeller för maskininlärning. Testar specifika hypoteser om modellbeteende, som om funktioner påverkar förutsägelser eller om en modell generaliserar väl till osynliga data.

4.Vad är skillnaden mellan Pytest och hypotes i Python?

Pytest syftar till allmänt testramverk för Python-kod medan Hypothesis är ett egenskapsbaserat testramverk för Python, med fokus på att generera testfall baserat på specificerade egenskaper hos koden.