Kriterijumi i metode za testiranje statističkih hipoteza, primjeri

Sadržaj:

Kriterijumi i metode za testiranje statističkih hipoteza, primjeri
Kriterijumi i metode za testiranje statističkih hipoteza, primjeri
Anonim

Testiranje hipoteze je neophodna procedura u statistici. Test hipoteze procjenjuje dvije međusobno isključive izjave kako bi se utvrdilo koja izjava je najbolje podržana podacima uzorka. Kada se za nalaz kaže da je statistički značajan, to je rezultat testa hipoteze.

Metodi verifikacije

Metode za testiranje statističkih hipoteza su metode statističke analize. Obično se uspoređuju dva skupa statističkih podataka ili se uzorkovani skup podataka upoređuje sa sintetičkim skupom podataka iz idealiziranog modela. Podaci se moraju tumačiti na način da dodaju nova značenja. Možete ih tumačiti pretpostavkom određene strukture konačnog rezultata i korištenjem statističkih metoda da potvrdite ili odbacite pretpostavku. Pretpostavka se naziva hipoteza, a statistički testovi koji se koriste u tu svrhu nazivaju se statističke hipoteze.

H0 i H1 hipoteze

Postoje dva glavnakoncepti statističkog testiranja hipoteza - tzv. "glavna, ili nulta hipoteza" i " alternativna hipoteza". Nazivaju se i Neyman-Pearsonovim hipotezama. Pretpostavka statističkog testa naziva se nultom hipotezom, glavnom hipotezom ili skraćeno H0. Često se naziva zadana pretpostavka ili pretpostavka da se ništa nije promijenilo. Kršenje pretpostavke testa često se naziva prva hipoteza, alternativna hipoteza ili H1. H1 je skraćenica za neku drugu hipotezu, jer sve što znamo o njoj je da se podaci H0 mogu odbaciti.

test nulte hipoteze
test nulte hipoteze

Prije odbijanja ili ne odbacivanja nulte hipoteze, rezultat testa se mora protumačiti. Poređenje se smatra statistički značajnim ako je malo vjerovatno da će odnos između skupova podataka biti implementacija nulte hipoteze prema pragu vjerovatnoće – nivou značajnosti. Postoje i kriterijumi dobrosti za testiranje statističkih hipoteza. Ovo je naziv kriterijuma testa hipoteze, koji je povezan sa navodnim zakonom nepoznate distribucije. Ovo je numerička mjera neslaganja između empirijske i teorijske distribucije.

Procedura i kriterijumi za testiranje statističkih hipoteza

Najčešće metode odabira hipoteze su zasnovane ili na Akaike informacijskom kriterijumu ili na Bayesovom koeficijentu. Testiranje statističkih hipoteza je ključna tehnika i za zaključivanje i za Bayesovo zaključivanje, iako ova dva tipa imaju značajne razlike. Statistički testovi hipotezadefinirati proceduru koja kontrolira vjerovatnoću pogrešne odluke o netačnoj zadanoj ili nultoj hipotezi. Procedura se zasniva na tome koliko je vjerovatno da će djelovati. Ova vjerovatnoća donošenja pogrešne odluke je vjerovatnoća da je nulta hipoteza tačna i da ne postoji posebna alternativna hipoteza. Test ne može pokazati da li je tačno ili netačno.

Metode za testiranje statističkih hipoteza
Metode za testiranje statističkih hipoteza

Alternativne metode teorije odlučivanja

Postoje alternativne metode teorije odlučivanja, u kojima se nulta i prva hipoteza razmatraju na ravnopravnijim osnovama. Drugi pristupi donošenju odluka, kao što je Bayesova teorija, pokušavaju uravnotežiti posljedice loših odluka u svim mogućnostima umjesto da se fokusiraju na jednu nultu hipotezu. Brojni drugi pristupi odlučivanju koja je od hipoteza tačna zasnivaju se na podacima koji od njih imaju željena svojstva. Ali testiranje hipoteza je dominantan pristup analizi podataka u mnogim oblastima nauke.

Testiranje statističke hipoteze

Kad god se jedan skup rezultata razlikuje od drugog skupa, morate se osloniti na testiranje statističkih hipoteza ili testove statističkih hipoteza. Njihovo tumačenje zahtijeva pravilno razumijevanje p-vrijednosti i kritičnih vrijednosti. Također je važno razumjeti da, bez obzira na nivo važnosti, testovi i dalje mogu sadržavati greške. Stoga zaključak možda nije tačan.

Proces testiranja se sastoji odviše koraka:

  1. Pravi se početna hipoteza za istraživanje.
  2. Naznačene su relevantne nulte i alternativne hipoteze.
  3. Objašnjava statističke pretpostavke o uzorku u testu.
  4. Određivanje koji je test prikladan.
  5. Odaberite nivo značajnosti i prag vjerovatnoće ispod kojeg će nulta hipoteza biti odbačena.
  6. Distribucija statistike testa nulte hipoteze pokazuje moguće vrijednosti na kojima se nulta hipoteza odbacuje.
  7. Obračun u toku.
  8. Donosi se odluka da se odbaci ili prihvati nulta hipoteza u korist alternative.

Postoji alternativa koja koristi p-vrijednost.

Primjeri testiranja statističkih hipoteza
Primjeri testiranja statističkih hipoteza

Testovi značaja

Čisti podaci nemaju praktičnu korist bez tumačenja. U statistici, kada je u pitanju postavljanje pitanja o podacima i tumačenje rezultata, koriste se statističke metode kako bi se osigurala tačnost ili vjerovatnoća odgovora. Kada se testiraju statističke hipoteze, ova klasa metoda se naziva statističko testiranje ili testovi značajnosti. Termin “hipoteza” podsjeća na naučne metode, gdje se istražuju hipoteze i teorije. U statistici, test hipoteze rezultira u količini za koju je data pretpostavka. Omogućava vam da protumačite da li je pretpostavka tačna ili je učinjeno kršenje.

Statistička interpretacija testova

Testovi hipotezase koriste za određivanje koji će rezultati istraživanja dovesti do odbacivanja nulte hipoteze za unaprijed određeni nivo značaja. Rezultati testa statističkih hipoteza moraju se interpretirati kako bi se na njemu mogao nastaviti rad. Postoje dva uobičajena oblika kriterijuma za testiranje statističkih hipoteza. To su p-vrijednost i kritične vrijednosti. U zavisnosti od izabranog kriterijuma, dobijeni rezultati se moraju različito tumačiti.

Šta je p-vrijednost

Izlaz je opisan kao statistički značajan kada se tumači p-vrijednost. U stvari, ovaj indikator znači vjerovatnoću greške ako se nulta hipoteza odbije. Drugim riječima, može se koristiti za imenovanje vrijednosti koja se može koristiti za tumačenje ili kvantificiranje rezultata testa, te za određivanje vjerovatnoće greške u odbacivanju nulte hipoteze. Na primjer, možete izvršiti test normalnosti na uzorku podataka i otkriti da su male šanse za odstupanje. Međutim, nulta hipoteza ne mora biti odbačena. Statistički test hipoteze može vratiti p-vrijednost. Ovo se radi poređenjem vrednosti p sa unapred određenom graničnom vrednošću koja se naziva nivo značajnosti.

Statističko testiranje nultih hipoteza
Statističko testiranje nultih hipoteza

Nivo značaja

Nivo značaja se često piše grčkim malim slovom "alfa". Opšta vrijednost koja se koristi za alfa je 5% ili 0,05. Manja alfa vrijednost sugerira pouzdaniju interpretaciju nulte hipoteze. P-vrijednost se poredi saunaprijed odabranu alfa vrijednost. Rezultat je statistički značajan ako je p-vrijednost manja od alfa. Nivo značaja može se obrnuti oduzimanjem od jedan. Ovo se radi da bi se odredio nivo pouzdanosti hipoteze s obzirom na podatke posmatranog uzorka. Kada se koristi ovaj metod testiranja statističkih hipoteza, P-vrijednost je vjerovatnoća. To znači da se u procesu tumačenja rezultata statističkog testa ne zna šta je tačno ili netačno.

Teorija testiranja statističkih hipoteza

Odbijanje nulte hipoteze znači da postoji dovoljno statističkih dokaza da izgleda vjerovatno. U suprotnom, to znači da nema dovoljno statistike da se to odbije. O statističkim testovima možemo razmišljati u smislu dihotomije odbacivanja i prihvatanja nulte hipoteze. Opasnost statističkog testiranja nulte hipoteze je da, ako se prihvati, može izgledati istinito. Umjesto toga, ispravnije bi bilo reći da se nulta hipoteza ne odbacuje jer nema dovoljno statističkih dokaza da se odbaci.

Statistička hipoteza koja provjerava ispravnost kriterija uklapanja
Statistička hipoteza koja provjerava ispravnost kriterija uklapanja

Ovaj trenutak često zbunjuje početnike. U takvom slučaju, važno je podsjetiti se da je rezultat vjerovatnost i da čak i prihvatanje nulte hipoteze i dalje ima male šanse za grešku.

Tačna ili lažna nulta hipoteza

Tumačenje vrijednosti p ne znači da je nulahipoteza je tačna ili netačna. To znači da je napravljen izbor da se odbije ili ne odbaci nulta hipoteza na određenom nivou statističke značajnosti na osnovu empirijskih podataka i izabranog statističkog testa. Stoga se p-vrijednost može smatrati vjerovatnoćom podataka datih pod unaprijed određenom pretpostavkom ugrađenom u statističke testove. P-vrijednost je mjera vjerovatnoće da će uzorak podataka biti posmatran ako je nulta hipoteza tačna.

Tumačenje kritičnih vrijednosti

Neki testovi ne vraćaju p. Umjesto toga, oni mogu vratiti listu kritičnih vrijednosti. Na sličan način se tumače rezultati takvog istraživanja. Umesto poređenja jedne p-vrednosti sa unapred određenim nivoom značajnosti, statistika testa se poredi sa kritičnom vrednošću. Ako se ispostavi da je manji, to znači da nije bilo moguće odbaciti nultu hipotezu. Ako je veća ili jednaka, nultu hipotezu treba odbaciti. Značenje algoritma za testiranje statističkih hipoteza i interpretacija njegovog rezultata je slično p-vrednosti. Odabrani nivo značajnosti je probabilistička odluka da se odbije ili ne odbaci pretpostavka osnovnog testa s obzirom na podatke.

Greške u statističkim testovima

Tumačenje testa statističke hipoteze je probabilističko. Zadatak testiranja statističkih hipoteza nije pronaći istinitu ili lažnu tvrdnju. Dokazi testa mogu biti pogrešni. Na primjer, ako je alfa bila 5%, to znači da je najvećim dijelom 1 od 20nulta hipoteza će biti greškom odbačena. Ili neće zbog statističkog šuma u uzorku podataka. S obzirom na ovu tačku, mala p vrijednost pri kojoj se odbacuje nulta hipoteza može značiti da je netačna ili da je napravljena greška. Ako se napravi ova vrsta greške, rezultat se naziva lažno pozitivan. A takva greška je greška prve vrste pri testiranju statističkih hipoteza. S druge strane, ako je p-vrijednost dovoljno velika da znači odbacivanje nulte hipoteze, to može značiti da je tačna. Ili nije ispravno, a dogodio se neki malo vjerojatan događaj zbog kojeg je greška napravljena. Ova vrsta greške se naziva lažno negativna.

Statističko testiranje nultih hipoteza
Statističko testiranje nultih hipoteza

Vjerovatnoća grešaka

Prilikom testiranja statističkih hipoteza, još uvijek postoji šansa da napravite bilo koju od ovih vrsta grešaka. Lažni podaci ili lažni zaključci su vrlo vjerovatni. U idealnom slučaju, trebalo bi odabrati nivo značajnosti koji minimizira vjerovatnoću jedne od ovih grešaka. Na primjer, statističko testiranje nultih hipoteza može imati vrlo nizak nivo značaja. Iako su nivoi značajnosti kao što su 0,05 i 0,01 uobičajeni u mnogim oblastima nauke, najčešće korišćeni nivo značajnosti je 310^-7, ili 0,0000003. Često se naziva "5-sigma". To znači da je zaključak bio nasumičan sa vjerovatnoćom od 1 prema 3,5 miliona nezavisnih ponavljanja eksperimenata. Primjeri testiranja statističkih hipoteza često nose takve greške. To je i razlog zašto je važno imati nezavisne rezultate.verifikacija.

Primjeri korištenja statističke verifikacije

Postoji nekoliko uobičajenih primjera testiranja hipoteza u praksi. Jedan od najpopularnijih je poznat kao “Degustacija čaja”. Dr. Muriel Bristol, koleginica osnivača biometrije Roberta Fišera, tvrdila je da može sa sigurnošću da utvrdi da li je prvo dodato u šolju čaja ili mleka. Fisher je ponudila da joj nasumično da osam šoljica (po četiri svake vrste). Statistika testa je bila jednostavna: brojanje uspeha u izboru pehara. Kritična oblast je bila jedini uspeh od 4, verovatno na osnovu uobičajenog kriterijuma verovatnoće (< 5%; 1 od 70 ≈ 1,4%). Fisher je tvrdio da alternativna hipoteza nije potrebna. Gospođa je tačno identifikovala svaku šoljicu, što se smatralo statistički značajnim rezultatom. Ovo iskustvo dovelo je do Fišerove knjige Statističke metode za istraživače.

Primjer optuženika

Statistički postupak suđenja je uporediv sa krivičnim sudom gde se optuženi smatra nevinim dok se ne dokaže krivica. Tužilac pokušava da dokaže krivicu okrivljenog. Samo kada postoji dovoljno dokaza za optužbu, optuženi se može proglasiti krivim. Na početku postupka postoje dvije hipoteze: „Okrivljeni nije kriv“i „Okrivljeni je kriv“. Hipoteza nevinosti može se odbaciti samo kada je greška malo verovatna jer se ne želi osuditi nevini optuženi. Takva greška se naziva greška tipa I i njeno pojavljivanjeretko kontrolisan. Kao posljedica ovog asimetričnog ponašanja, češća je greška tipa II, odnosno oslobađanje počinioca.

Primjeri statističke validacije
Primjeri statističke validacije

Statistika je korisna kada se analiziraju velike količine podataka. Ovo se podjednako odnosi i na testiranje hipoteza, koje mogu opravdati zaključke čak i ako ne postoji naučna teorija. U primjeru kušanja čaja, bilo je "očigledno" da nema razlike između sipati mlijeka u čaj ili sipati čaj u mlijeko.

Prava praktična primjena testiranja hipoteza uključuje:

  • testiranje da li muškarci imaju više noćnih mora od žena;
  • atribucija dokumenta;
  • Procjena uticaja punog mjeseca na ponašanje;
  • određivanje raspona u kojem šišmiš može otkriti insekt pomoću eha;
  • odabir najboljeg načina za prestanak pušenja;
  • Provjera da li naljepnice na braniku odražavaju ponašanje vlasnika automobila.

Provjera statističkih hipoteza igra važnu ulogu u statistici općenito i u statističkom zaključivanju. Testiranje vrijednosti se koristi kao zamjena za tradicionalno poređenje predviđene vrijednosti i eksperimentalnog rezultata u srži naučne metode. Kada je teorija sposobna samo da predvidi znak veze, testovi usmjerenih hipoteza mogu se konfigurirati na takav način da samo statistički značajan rezultat podržava teoriju. Ovaj oblik teorije evaluacije je najrigidnijikritika upotrebe testiranja hipoteza.

Preporučuje se: