Osnovni koncepti matematičke statistike. Primjena matematičke statistike

Sadržaj:

Osnovni koncepti matematičke statistike. Primjena matematičke statistike
Osnovni koncepti matematičke statistike. Primjena matematičke statistike
Anonim

Matematička statistika je metodologija koja vam omogućava da donosite informirane odluke suočeni s neizvjesnim uvjetima. Proučavanje metoda za prikupljanje i sistematizaciju podataka, obradu konačnih rezultata eksperimenata i eksperimenata sa masovnom nasumičnošću i otkrivanje bilo kakvih obrazaca je ono čime se bavi ova grana matematike. Razmotrite osnovne koncepte matematičke statistike.

Razlika sa teorijom vjerovatnoće

Metode matematičke statistike blisko se ukrštaju sa teorijom vjerovatnoće. Obje grane matematike bave se proučavanjem brojnih slučajnih pojava. Dvije discipline su povezane graničnim teoremama. Međutim, postoji velika razlika između ovih nauka. Ako teorija vjerovatnoće određuje karakteristike procesa u stvarnom svijetu na osnovu matematičkog modela, onda matematička statistika čini suprotno - postavlja svojstva modela nana osnovu uočenih informacija.

Teorija vjerojatnosti i mat. statistika
Teorija vjerojatnosti i mat. statistika

Koraci

Primjena matematičke statistike može se provoditi samo u odnosu na slučajne događaje ili procese, odnosno na podatke dobijene njihovim posmatranjem. I to se dešava u nekoliko faza. Prvo, podaci eksperimenata i eksperimenata prolaze kroz određenu obradu. Naručeni su radi jasnoće i lakoće analize. Zatim se vrši tačna ili približna procjena potrebnih parametara posmatranog slučajnog procesa. Mogu biti:

  • procjena vjerovatnoće događaja (njegova vjerovatnoća je u početku nepoznata);
  • proučavanje ponašanja funkcije neodređene distribucije;
  • procjena očekivanja;
  • procjena varijance
  • etc.
Osnove mat. statistika
Osnove mat. statistika

Treća faza je provjera bilo koje hipoteze postavljene prije analize, odnosno dobijanje odgovora na pitanje kako rezultati eksperimenata odgovaraju teorijskim proračunima. Zapravo, ovo je glavna faza matematičke statistike. Primjer bi bio da se razmotri da li je ponašanje posmatranog slučajnog procesa unutar normalne distribucije.

Stanovništvo

Osnovni koncepti matematičke statistike uključuju opću i uzorkovanu populaciju. Ova disciplina se bavi proučavanjem skupa određenih objekata u odnosu na neko svojstvo. Primjer je rad taksiste. Uzmite u obzir ove slučajne varijable:

  • utovar ili broj kupaca: po danu, prije ručka, poslije ručka, …;
  • prosječno vrijeme putovanja;
  • broj pristiglih prijava ili njihov prilog za gradske četvrti i još mnogo toga.

Takođe je vrijedno napomenuti da je moguće proučavati skup sličnih slučajnih procesa, koji će također biti slučajna varijabla koja se može promatrati.

Populacija
Populacija

Dakle, u metodama matematičke statistike, čitav skup objekata koji se proučavaju ili rezultati različitih opservacija koja se vrše pod istim uslovima na datom objektu naziva se opšta populacija. Drugim riječima, matematički strožije, to je slučajna varijabla koja je definirana u prostoru elementarnih događaja, sa klasom podskupova označenih u njoj, čiji elementi imaju poznatu vjerovatnoću.

Uzorak populacije

Postoje slučajevi kada je iz nekog razloga (trošak, vrijeme) nemoguće ili nepraktično provoditi kontinuirano proučavanje svakog objekta. Na primjer, otvaranje svake tegle zatvorenog džema kako bi se provjerio njen kvalitet je sumnjiva odluka, a pokušaj procijeniti putanju svake molekule zraka u kubnom metru je nemoguć. U takvim slučajevima koristi se metoda selektivnog posmatranja: određeni broj objekata se bira (obično nasumično) iz opće populacije i oni se podvrgavaju njihovoj analizi.

Uzorak od generalaagregati
Uzorak od generalaagregati

Ovi koncepti u početku mogu izgledati komplikovano. Stoga, da biste u potpunosti razumjeli temu, morate proučiti udžbenik V. E. Gmurmana "Teorija vjerovatnoće i matematička statistika". Dakle, skup za uzorkovanje ili uzorak je niz nasumično odabranih objekata iz općeg skupa. U strogim matematičkim terminima, ovo je niz nezavisnih, ravnomerno raspoređenih slučajnih varijabli, za svaku od kojih se distribucija poklapa sa onom naznačenom za opštu slučajnu varijablu.

Osnovni koncepti

Razmotrimo ukratko niz drugih osnovnih koncepata matematičke statistike. Broj objekata u općoj populaciji ili uzorku naziva se volumen. Vrijednosti uzorka koje se dobiju tokom eksperimenta nazivaju se realizacijom uzorka. Da bi procjena opšte populacije na osnovu uzorka bila pouzdana, važno je imati takozvani reprezentativni ili reprezentativni uzorak. To znači da uzorak mora u potpunosti predstavljati populaciju. Ovo se može postići samo ako svi elementi populacije imaju jednaku vjerovatnoću da budu u uzorku.

Osnovni koncepti
Osnovni koncepti

Uzorci razlikuju povrat i nepovrat. U prvom slučaju, u sadržaju uzorka, ponovljeni element se vraća u opšti skup, u drugom slučaju nije. Obično se u praksi koristi uzorkovanje bez zamjene. Također treba napomenuti da veličina opće populacije uvijek značajno premašuje veličinu uzorka. Postojimnoge opcije za proces uzorkovanja:

  • jednostavno - stavke se nasumično biraju jedna po jedna;
  • typed - opća populacija je podijeljena na tipove, a od svake se bira; primjer je anketa stanovnika: muškaraca i žena odvojeno;
  • mehanički - na primjer, odaberite svaki 10. element;
  • serial - odabir se vrši u nizu elemenata.

Statistička distribucija

Prema Gmurmanu, teorija vjerovatnoće i matematička statistika su izuzetno važne discipline u naučnom svijetu, posebno u njegovom praktičnom dijelu. Uzmite u obzir statističku distribuciju uzorka.

Pretpostavimo da imamo grupu učenika koji su testirani iz matematike. Kao rezultat, imamo skup procjena: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - ovo je naš primarni statistički materijal.

Prvo, moramo ga sortirati, ili izvršiti operaciju rangiranja: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - i tako dobiti varijacioni niz. Broj ponavljanja svake od procjena naziva se učestalost procjene, a njihov odnos prema veličini uzorka naziva se relativna učestalost. Napravimo tabelu statističke distribucije uzorka, ili samo statističku seriju:

ai 1 2 3 4 5
pi 1 1 2 4 3

ili

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Hajde da imamo slučajnu varijablu na kojoj ćemo provesti niz eksperimenata i vidjeti koju vrijednost ova varijabla ima. Pretpostavimo da je uzela vrijednost a1 - m1 puta; a2 - m2 puta, itd. Veličina ovog uzorka će biti m1 + … + mk=m. Skup ai, gdje i varira od 1 do k, je statistička serija.

Intervalna distribucija

U knjizi VE Gmurmana "Teorija vjerojatnosti i matematička statistika" također je predstavljena intervalna statistička serija. Njegova kompilacija je moguća kada je vrijednost karakteristike koja se proučava kontinuirana u određenom intervalu, a broj vrijednosti je velik. Uzmimo u obzir grupu učenika, odnosno njihovu visinu: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 14, 16 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - ukupno 30 učenika. Očigledno, visina osobe je kontinuirana vrijednost. Moramo definirati korak intervala. Za to se koristi Sturgesova formula.

h= max - min = 190 - 156 = 33 = 5, 59
1+log2m 1+log230 5, 9

Dakle, vrijednost 6 se može uzeti kao veličina intervala. Također treba reći da je vrijednost 1+log2m formula zaodređivanje broja intervala (naravno, uz zaokruživanje). Tako se, prema formulama, dobije 6 intervala, od kojih svaki ima veličinu 6. A prva vrijednost početnog intervala bit će broj određen formulom: min - h / 2=156 - 6/2=153. Napravimo tabelu koja će sadržavati intervale i broj učenika čiji rast pada u određenom intervalu.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Naravno, ovo nije sve, jer u matematičkoj statistici postoji mnogo više formula. Razmotrili smo samo neke osnovne koncepte.

Raspored distribucije

Distribucijski grafikoni
Distribucijski grafikoni

Osnovni koncepti matematičke statistike također uključuju grafički prikaz distribucije, koji se odlikuje jasnoćom. Postoje dvije vrste grafikona: poligon i histogram. Prvi se koristi za diskretnu statističku seriju. A za kontinuiranu distribuciju, odnosno drugi.

Preporučuje se: