Statistički značaj: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza

Sadržaj:

Statistički značaj: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza
Statistički značaj: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza

Video: Statistički značaj: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza

Video: Statistički značaj: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza
Video: What "Orwellian" really means - Noah Tavlin 2024, Novembar
Anonim

Statistika je odavno sastavni dio života. Ljudi se s tim suočavaju svuda. Na osnovu statističkih podataka donose se zaključci o tome gdje su i koje bolesti su uobičajene, šta je traženije u određenom regionu ili među određenim segmentom stanovništva. Čak se i izrada političkih programa kandidata za organe vlasti zasniva na statističkim podacima. Koriste ih i maloprodajni lanci prilikom kupovine robe, a tim podacima se i proizvođači rukovode u svojim prijedlozima.

Statistika igra važnu ulogu u životu društva i utiče na svakog pojedinačnog člana, čak i u malim stvarima. Na primjer, ako prema statistikama većina ljudi preferira tamne boje u odjeći u određenom gradu ili regiji, tada će pronaći svijetlo žuti baloner s cvjetnim printom u lokalnim prodajnim mjestima biti izuzetno teško. Ali koje količineda li se ovi podaci zbrajaju da bi imali takav uticaj? Na primjer, šta je „statistički značajno“? Šta se tačno podrazumijeva pod ovom definicijom?

Šta je ovo?

Statistika kao nauka je sastavljena od kombinacije različitih količina i koncepata. Jedan od njih je koncept „statističkog značaja“. Ovo je naziv vrijednosti varijabli, vjerovatnoća pojavljivanja drugih indikatora u kojima je zanemarljiva.

Proračun statističkih pokazatelja
Proračun statističkih pokazatelja

Na primjer, 9 od 10 ljudi obulo je gumene cipele na noge tokom jutarnje šetnje u potrazi za pečurkama u jesenjoj šumi nakon kišne noći. Vjerovatnoća da će u nekom trenutku njih 8 obuti platnene mokasine je zanemarljiva. Dakle, u ovom konkretnom primjeru, broj 9 je ono što se naziva "statistički značaj".

Prema tome, ako dalje razvijamo dati praktičan primjer, prodavnice cipela kupuju gumene čizme do kraja ljetne sezone u većim količinama nego u ostala doba godine. Dakle, veličina statističke vrijednosti ima uticaj na običan život.

Naravno, u složenim proračunima, recimo, prilikom predviđanja širenja virusa, uzima se u obzir veliki broj varijabli. Ali sama suština određivanja značajnog indikatora statističkih podataka je slična, bez obzira na složenost proračuna i broj varijabilnih vrijednosti.

Kako se izračunava?

Koristi se prilikom izračunavanja vrijednosti indikatora "statističke važnosti" jednadžbe. Odnosno, može se tvrditi da u ovom slučaju sve odlučuje matematika. Najjednostavnija opcija proračuna je lanac matematičkih operacija, u koji su uključeni sljedeći parametri:

  • dvije vrste rezultata dobivenih anketama ili proučavanjem objektivnih podataka, kao što je količina kupovina, označena sa a i b;
  • indikator veličine uzorka za obje grupe – n;
  • vrijednost kombinovanog uzorka - p;
  • standardna greška - SE.

Sljedeći korak je određivanje ukupnog rezultata testa - t, njegova vrijednost se upoređuje sa brojem 1,96. 1,96 je prosječna vrijednost, koja prenosi raspon od 95%, prema Studentovoj t-distributivnoj funkciji.

Formula za jednostavno izračunavanje
Formula za jednostavno izračunavanje

Često se postavlja pitanje koja je razlika između vrijednosti n i p. Ovu nijansu je lako razjasniti na primjeru. Recimo da se izračunava statistička značajnost lojalnosti bilo kojem proizvodu ili brendu muškaraca i žena.

U ovom slučaju, iza slova će slijediti sljedeće:

  • n - broj ispitanika;
  • p - broj zadovoljnih sa proizvodom.

Broj intervjuisanih žena u ovom slučaju će biti označen kao n1. Shodno tome, muškarci - n2. Istu vrijednost imat će brojevi "1" i "2" simbola p.

Upoređivanje rezultata testa sa prosjekom studentskih tabela postaje ono što se naziva "statistički značaj".

Šta znači verifikacija?

Rezultati bilo kojeg matematičkog proračuna uvijek se mogu provjeriti, to se uče djeca u osnovnoj školi. Logično je pretpostavitida pošto se statistike određuju korištenjem lanca proračuna, onda se provjeravaju.

Međutim, testiranje statističke značajnosti nije samo matematika. Statistika se bavi velikim brojem varijabli i raznim vjerovatnoćama, koje su daleko od uvijek podložne izračunavanju. Odnosno, ako se vratimo na primjer gumenih cipela na početku članka, onda logičnu konstrukciju statističkih podataka na koje će se oslanjati kupci robe za trgovine može poremetiti suho i vruće vrijeme, što nije tipično za jesen.. Kao rezultat ovog fenomena, smanjit će se broj ljudi koji kupuju gumene čizme, a poslovnice će pretrpjeti gubitke. Naravno, matematička formula nije u stanju da predvidi vremensku anomaliju. Ovaj trenutak se zove "greška".

Alati za vizualizaciju statističkih podataka
Alati za vizualizaciju statističkih podataka

To je samo vjerovatnoća takvih grešaka i uzima u obzir provjeru nivoa izračunate važnosti. Uzima u obzir i izračunate pokazatelje i prihvaćene nivoe značaja, kao i količine koje se konvencionalno nazivaju hipotezama.

Koji je nivo značaja?

Koncept "nivoa" uključen je u glavne kriterijume za statističku značajnost. Koristi se u primijenjenoj i praktičnoj statistici. Ovo je vrsta vrijednosti koja uzima u obzir vjerovatnoću mogućih odstupanja ili grešaka.

Nivo se zasniva na identifikaciji razlika u gotovim uzorcima, omogućava vam da utvrdite njihov značaj ili, obrnuto, slučajnost. Ovaj koncept nema samo digitalna značenja, već i njihova posebna tumačenja. Oni objašnjavajukako trebate razumjeti vrijednost, a sam nivo se određuje upoređivanjem rezultata sa prosječnim indeksom, to otkriva stepen pouzdanosti razlika.

Diskusija o statistici
Diskusija o statistici

Dakle, koncept nivoa možemo zamisliti jednostavno - on je pokazatelj prihvatljive, vjerovatne greške ili greške u zaključcima koji se izvlače iz dobijenih statističkih podataka.

Koji nivoi značaja se koriste?

Statistički značaj koeficijenata vjerovatnoće greške u praksi se zasniva na tri osnovna nivoa.

Prvi nivo je prag na kojem je vrijednost 5%. Odnosno, vjerovatnoća greške ne prelazi nivo značajnosti od 5%. To znači da je povjerenje u besprijekornost i nepogrešivost zaključaka donesenih na osnovu podataka statističkih istraživanja 95%.

Drugi nivo je prag od 1%. Shodno tome, ova brojka znači da se može voditi podacima dobijenim tokom statističkih proračuna sa 99% pouzdanosti.

Treći nivo - 0,1%. Sa ovom vrijednošću, vjerovatnoća greške je jednaka djeliću procenta, odnosno greške su praktično eliminirane.

Šta je hipoteza u statistici?

Greške kao koncept su podijeljene u dvije oblasti, koje se tiču prihvatanja ili odbijanja nulte hipoteze. Hipoteza je koncept iza kojeg se, prema definiciji, krije skup rezultata ankete, drugih podataka ili tvrdnji. To jest, opis distribucije vjerovatnoće nečega što se odnosi na predmet statističkog računovodstva.

statistička značajnost regresije
statistička značajnost regresije

U jednostavnim proračunima postoje dvije hipoteze - nula i alternativna. Razlika između njih je u tome što se nulta hipoteza zasniva na ideji da ne postoje fundamentalne razlike između uzoraka uključenih u određivanje statističke značajnosti, a alternativna je potpuno suprotna od nje. Odnosno, alternativna hipoteza se zasniva na prisutnosti značajne razlike u ovim uzorcima.

Koje su greške?

Greške kao koncept u statistici su u direktnoj proporciji sa prihvatanjem ove ili one hipoteze kao tačne. Mogu se podijeliti u dva smjera ili tipa:

  • prvi tip je zbog prihvatanja nulte hipoteze, za koju se pokazalo da nije tačna;
  • sekunda - uzrokovano praćenjem alternative.
Pregled statističkih grafikona
Pregled statističkih grafikona

Prva vrsta greške naziva se lažno pozitivna i prilično je uobičajena u svim područjima gdje se koristi statistika. Prema tome, greška drugog tipa naziva se lažno negativna.

Zašto nam je potrebna regresija u statistici?

Statistički značaj regresije je u tome što je uz njenu pomoć moguće ustanoviti koliko model različitih zavisnosti izračunat na osnovu podataka odgovara stvarnosti; omogućava vam da identifikujete dovoljnost ili nedostatak faktora za računovodstvo i zaključke.

Vrijednost regresije se utvrđuje poređenjem rezultata sa podacima navedenim u Fisherovim tabelama. Ili koristeći analizu varijanse. Indikatori regresije su važni kadasložene statističke studije i proračuni koji uključuju veliki broj varijabli, slučajnih podataka i vjerovatnih promjena.

Preporučuje se: