Você está na página 1de 37

TESTIRANJE

STATISTIKIH HIPOTEZA

CILJEVI POGLAVLJA

Nakon itanja ovoga poglavlja biete u stanju da:

8. glava
1. shvatite logiku, zna aj i og ranienja statistikog testiranja
hipoteza
2. razumete razliku izmeu testiranja na osnovu kritinih
vrednosti i p-vred nosti
3. primenite najpoznatije parametarske testove u sluaju
jednog i dva uzorka
4. protumaite raunarski izlaz testiranja h ipoteza ako
koristite statistiki softv er ili Ex cel

U ovom poglavlju upoznaemo se sa jednim od najznaajnijih, najkorisnijih,


ali ujedno i najkontroverznijih statistikih metoda, testiranjem hipoteza.
Testiranje hipoteza ima veliku primenu kako u praktinim tako i u teorijskim
istraivanjima. Danas je, na primer, u SAD nezamislivo dobiti odobrenje za
distribuciju novog leka od FDA (Food and Drug Administration) pre
detaljnog ispitivanja efektivnosti i sigurnosti tog leka, u kome kljunu ulogu
ima testiranje hipoteza. Takoe, publikovanje radova u referentnim strunim
asopisima iz razliitih oblasti (medicine, farmacije, psihologije, pedagogije,
biologije, poljoprivrede, istraivanja trita) esto podrazumeva da su
tvrenja i hipoteze potkrepljeni rezultatima nekog statistikog testa.
Podsetimo se da je cilj statistikog zakljuivanja da se na osnovu
informacije iz uzorka doe do to je mogue pouzdanije i preciznije
informacije o populaciji. U prethodnom poglavlju smo detaljnije govorili o
ocenjivanju nepoznatih parametara skupa. Rekli smo da se ono koristi kada
istraiva nema nikakvo prethodno saznanje o relevantnim karakteristikama
posmatranog skupa. Krajnji proizvod ocenjivanja je interval poverenja u
kome se sa odgovarajuom pouzdanou nalazi nepoznati parametar.
Druga oblast statistikog zakljuivanja, testiranje statistikih hipoteza,
koristi se kada o skupu imamo neku prethodnu informaciju. Cilj testiranja je
170 OSNOVI STATISTIKE

da se ispita prihvatljivost nekog tvrenja ili pretpostavke koja se tie


karakteristike jednog ili vie osnovnih skupova. Na primer, testiranjem se
moe proveriti :
da li je osnovano tvrenje proizvoaa da proseno trajanje baterija za
mobilni telefon Nokia N95, pre dopunjavanja, iznosi najmanje 380 asova,
da li 35% mladih u Srbiji smatra da je najvei problem u naoj zemlji
alkoholizam,
da li je prosena duina studiranja na privatnim i dravnim
univerzitetima jednaka,
da li visina studenata Vaeg univerziteta priblino sledi normalan
raspored,
postoji li veza izmeu broja nezaposlenih i broja kriminalnih dela,
da li uzimanje antioksidanata usporava starenje, i sl.
Primetimo da na svako od postavljenih pitanja postoje samo dva mogua
odgovora: da ili ne.
Na osnovu reenog moemo dati generalnu preporuku da se testiranje
hipoteza primenjuje ako su istovremeno ispunjena sledea tri uslova:

a) Raspolaemo nekim prethodnim saznanjem (pretpostavkom) o


karakteristici skupa;
b) Na istraivako pitanje (problem) postoje samo dva mogua
odgovora, da ili ne;
c) Problem se reava korienjem sluajnog uzorka.
Kao to smo vie puta naglasili, tanu vrednost parametra skupa
moemo odrediti samo na osnovu svih elemenata skupa. Zato smo zakljuak
ocenjivanja uvek donosili sa rezervom, tj. tvrdili smo sa pouzdanou
manjom od 100% da interval poverenja sadri nepoznati parametar.
Analogno, da bismo bili potpuno sigurni u tanost odreene pretpostavke ili
tvrenja o karakteristici populacije, morali bismo da izvrimo popis. Kako iz
ve poznatih razloga to najee ne inimo, rezultat testiranja koji donosimo
na osnovu informacije iz uzorka ne moe biti da je polazna pretpostavka tana
ili pogrena. Umesto toga, u zakljuku sa odgovarajuim rizikom tvrdimo da
je pretpostavka prihvatljiva ili da nije prihvatljiva.

Statistika hipoteza je precizno formulisana pretpostavka (iskaz) o


nekoj vanoj osobini jednog ili vie skupova. Statistiki metod koji na
sistematski nain empirijske podatke uzorka koristi radi utvrivanja
prihvatljivosti hipoteze naziva se testiranjem hipoteze, a sama procedura
statistikim testom.
POGLAVLJE 8 Testiranje statistikih hipoteza 171

8.1 KLASIFIKACIJA TESTOVA I


IZBOR OPTIMALNOG TESTA
Sve statistike testove moemo klasifikovati po tri osnova:
Prema prirodi problema koje reavamo razlikujemo: testove o parametrima
skupa (aritmetikoj sredini, proporciji, medijani, varijansi itd.), o obliku
rasporeda skupa, o nezavisnosti dva obeleja, o sluajnosti uzorka, itd.
Prema broju uzoraka na kojima zasnivamo testiranje testove delimo u tri
grupe:

Testovi zasnovani na jednom uzorku

Statistiki testovi Testovi zasnovani na dva uzorka

Testovi zasnovani na tri i vie uzoraka

Prema vrsti i jaini preduslova na kojima se zasnivaju razlikujemo:

Parametarski testovi
Statistiki testovi
Neparametarski testovi

Zadrimo se za trenutak na treoj podeli.


Parametarski testovi se ponekad nazivaju klasinim testovima, jer su
formulisani znatno pre neparametarskih, poetkom XX-og veka. Njihova
teorijska podloga se bazira na tadanjem uverenju istraivaa da u prirodi i
drutvu preovladava samo jedan, normalan raspored. Otuda parametarski
testovi imaju zajedniki preduslov da osnovni skup (ili skupovi) kome
pripada analizirani uzorak (odnosno uzorci) sledi normalan raspored.
Nasuprot njima, neparametarski testovi, koji su nastali uglavnom sredinom XX
veka, predstavljaju loginu reakciju statistiara na injenicu da se pretpostavka
o normalnosti svih pojava pokazala netanom. Ovi testovi se zasnivaju na
mnogo blaim uslovima o obliku osnovnog skupa, a mogu se primenjivati i na
kvalitativna obeleja.
Zbog velikog broja razliitih testova, svakom korisniku statistike
neminovno se namee jednostavno pitanje: Koji test treba da primenim da bih
reio svoj istraivaki problem? Odgovor nije trivijalan, jer je u statistikoj teoriji
formulisan ne samo veliki broj testova sa razliitom namenom, ve se ponekad
ista hipoteza moe proveravati primenom vie razliitih testova. Budui da
svaki test poiva na specifinim preduslovima koji moraju biti ispunjeni da bi
172 OSNOVI STATISTIKE

rezultat bio validan, treba izabrati onaj test koji je optimalan u datoj situaciji, a
to znai test za koji su preduslovi primene zadovoljeni. Recimo, ipak, da je
ovakav pristup testiranju relativno nov. Naime, tokom veeg dela XX veka
korieni su iskljuivo parametarski testovi, pri emu je uslov normalnosti
skupa retko proveravan zbog komplikovane i nepouzdane procedure. Situacija
se potpuno izmenila u poslednjih deset godina. Sa optom dostupnou
raunara i statistikog softvera, preduslovi primene testova se mogu lako
proveriti, a sam test primeniti na podatke iz uzorka. Zbog toga naglasak u
modernom testiranju hipoteza vie nije puka primena nekog testa, ve pre
svega:
1) ispitivanje da li su preduslovi na kojima se test zasniva ispunjeni i
2) korektna interpretacija rezultata.
U ovom poglavlju razmatraemo parametarske testove kojima se testira
aritmetika sredina i proporcija jednog i dva osnovna skupa. U sledeem poglavlju
posmatraemo parametarski test zasnovan na vie uzoraka kojim se testira
hipoteza o jednakosti aritmetikih sredina vie osnovnih skupova.
Parametarske testove emo, takoe, primenjivati i u regresionoj i korelacionoj
analizi, koje su predmet razmatranja u 12. i 13. poglavlju. Neparametarskim
testovima emo se baviti u 11. poglavlju.

8.2 POSTUPAK TESTIRANJA STATISTIKIH HIPOTEZA

Pre nego to preemo na proceduru testiranja daemo dva primera, da bi se


shvatile mogunosti primene i logika samog testiranja.
PRIMER 8.11: U jednom od najpoznatijih sudskih procesa u prolom veku,
poznati ameriki fudbaler i glumac O. J. Simpson je optuen za ubistvo svoje
bive supruge Nikol i njenog dvadesetpetogodinjeg poznanika Ronalda
Goldmena. Proces je trajao 133 dana, kotao je preko 15 miliona dolara i
kontinuirano je prenoen na televiziji. Iako je policija smatrala da je prikupila
dovoljno dokaza za njegovu krivicu, porota je 03. 10. 1995. presudila da
Simpson nije kriv. Istoga dana Galup je sproveo anketu i procenio da je ak
56% amerikih graana smatralo presudu pogrenom, a samo 33% je
podralo.
Pravni sistem u velikom broju zemalja optuenog smatra nevinim sve
dok se ne nae dovoljno dokaza da se on proglasi krivim. Ovo emo statistiki
nazvati nultom hipotezom: optueni nije kriv za poinjeno delo. Nultu
hipotezu smatramo tanom sve dok ne sakupimo dokaze da je ona pogrena,
odnosno da je tana alternativna hipoteza: optueni je kriv. Pri svemu tome,

1 O suenju O. J. Simpsona pogledati, na primer,


http://www.law.umkc.edu/faculty/projects/ftrials/Simpson/simpson.htm
POGLAVLJE 8 Testiranje statistikih hipoteza 173

nastojimo da koliko je mogue smanjimo (poeljno na 0) verovatnou da


osudimo nevinu osobu, tj. da odbacimo istinitu nultu hipotezu. Naalost, kao
posledica, poveava se verovatnoa da nainimo drugaiju greku: da
oslobodimo optuenog iako je on stvarno kriv. Statistiki reeno, postoji
verovatnoa da ne odbacimo pogrenu nultu hipotezu. Za shvatanje
koncepcije testiranja napomenimo da porota nikada ne donosi odluku da je
optueni nevin, ve samo da nije kriv. Iako ovo izgleda kao finesa,
razgranienje je jako bitno u proceduri testiranja. Odmah napomenimo da se
u statistici nikada ne zakljuuje da je nulta hipoteza stvarno istinita, ve
samo da nemamo dovoljno dokaza da je odbacimo. Da li je O. J. Simpson
stvarno bio nevin? Odgovor je verovatno negativan, ali porota nije nala
dovoljno dokaza da ga proglasi krivim za ubistvo bive supruge.
PRIMER 8.2: Dravni tuilac u Indijanapolisu u SAD je dobio anonimnu
prijavu da je graevinska firma koja je gradila puteve u gradu prevarila
gradsku vladu. Na osnovu sklopljenog ugovora, debljina asfalta je u proseku
trebalo da bude 10 ina. Tuiocu je bio potreban dokaz da ubedi porotu da je
prosena debljina puta manja od 10 ina. Naravno, otkopavanje itavog puta
nije dolazilo u obzir, jer osim ogromnih trokova zakljuak je mogao biti da je
kompanija ispotovala ugovor. Zbog toga je uzet uzorak od 100 delova, svaki
prenika jednog ina. Pokazalo se da je prosena debljina u uzorku bila 9,5
ina. Da li je ovo bilo dovoljno da se tretira kao ubedljiv dokaz protiv
kompanije? Porota je smatrala da jeste i nekoliko slubenika te firme je
zavrilo u zatvoru. U ovom primeru nulta hipoteza se moe postaviti u vidu
da je prosena debljina puta 10 ina, a alternativna da je manja od 10 ina.
Da sumiramo: prilikom testiranja neke tvrdnje ili pretpostavke
postavljamo dve suprotstavljene hipoteze, nultu i alternativnu. Zatim polazimo
od pretpostavke da je nulta hipoteza istinita, biramo uzorak i traimo empirijske
dokaze protiv nulte hipoteze. Ako ih pronaemo, onda emo odbaciti nultu
hipotezu i usvojiti alternativnu. Ali, ako ne naemo dovoljno vrste dokaze,
moemo rei samo jedno: nismo nali dovoljno dokaza da odbacimo nultu
hipotezu. Bilo bi pogreno tvrditi da je nulta hipoteza tana.
Postupak testiranja statistikih hipoteza sprovodimo u est etapa, kao na
Dijagramu 8.1.
Za prosenog korisnika statistike verovatno je najtea druga etapa, zbog
ega smo u Dodatku priloili posebno "stablo izbora statistikog metoda" koje
itaocu pomae da, ispitujui ispunjenost uslova na kojima se testovi zasnivaju,
na metodian nain izabere odgovarajui test.
Kao to smo ve naglasili, najvanije etape su trea i esta. Naime, ako
preskoimo treu etapu, mogua posledica je upotreba neodgovarajueg testa,
ijom primenom moemo dobiti nevalidne rezultate. Nekorektno tumaenje
rezultata u estoj etapi je isto tako opasno, jer moe biti uzrok pogrenog
istraivakog zakljuka, pa posledino i neosnovane poslovne odluke.
174 OSNOVI STATISTIKE

1. Formuliu se nulta i alternativna hipoteza i bira nivo znaajnosti, .

2. Uzima se sluajan uzorak, i na osnovu analiziranja postavljenog


problema bira po istraivaevom miljenju optimalni test.

3. Proverava se da li su ispunjeni preduslovi na kojima se izabrani test


zasniva. Ako nisu, prekida se proces testiranja i bira neki drugi test, koji
poiva na blaim, ispunjenim uslovima.

4. Izraunava se tzv. statistika testa. Odreuje se p-vrednost (alternativno,


odreuju se tzv. kritine vrednosti iz tablica odgovarajueg rasporeda).

5. Postavlja se pravilo odluivanja. Na osnovu p-vrednosti (alternativno


kritinih vrednosti) donosi se odluka o odbacivanju ili neodbacivanju
nulte hipoteze.

6. Formulie se zakljuak, odnosno daje odgovor na postavljeni problem.

Dijagram 8.1 Etape u testiranju statistikih hipoteza


U nastavku emo najpre detaljno da objasnimo faze testiranja, a zatim emo
prikazati primenu najpoznatijih parametarskih testova u sluaju jednog i dva
uzorka.

8.2.1 Postavljanje nulte i alternativne hipoteze


Nulta i alternativna hipoteza predstavljaju dva precizna, meu sobom
iskljuujua iskaza ili tvrenja.

Nulta hipoteza
Nulta hipoteza (H0) je iskaz (tvrenje) o karakteristici jednog ili vie
skupova. Kod parametarskih testova koje razmatramo u ovom
poglavlju nulta hipoteza se odnosi na vrednost nepoznatog parametra
jednog ili dva skupa. Konkretna nulta hipoteza varira od problema do
problema, ali se po pravilu postavlja u vidu status quo-a, tj. da "nema
razlike", "nema uticaja", ili da "nema promene".
POGLAVLJE 8 Testiranje statistikih hipoteza 175

Nulta hipoteza moe biti prosta i sloena. Nulta hipoteza je prosta ako se
njom tvrdi da je parametar jednak tano jednoj, unapred poznatoj
numerikoj vrednosti, tzv. hipotetinoj vrednosti. Nultu hipotezu
moemo napisati reima ali je, po pravilu, piemo simbolima, na primer,
H 0: =300 i itamo: "nulta hipoteza glasi da je aritmetika sredina skupa
jednaka 300 evra". Ako nulta hipoteza obuhvata vei broj moguih
vrednosti, na primer, H0: 300 , ona je sloena. Bez obzira kako je
postavljena, nulta hipoteza uvek sadri znak jednakosti.
Svakoj nultoj hipotezi suprotstavljamo (pridruujemo) alternativnu
hipotezu i oznaavamo je sa H 1 ili H a.

Alternativna hipoteza
Alternativna hipoteza (H1 ili Ha) je iskaz (tvrenje) o karakteristici jednog
ili vie skupova koje je suprotno tvrenju sadranom u nultoj hipotezi.
Najee se postavlja u vidu da "ima razlike ", da "postoji uticaj" ili da je
"dolo do promene".

Alternativna hipoteza sadri sve vrednosti koje parametar moe imati, a


koje nisu obuhvaene nultom hipotezom. Zbog toga je data u obliku
sloene hipoteze. H 1 se u naunim istraivanjima esto naziva i
istraivakom hipotezom, jer njom istraiva izraava miljenje koje
postupkom testiranja nastoji da potvrdi. To je i razlog zbog kojeg u praksi
esto prvo postavljamo alternativnu hipotezu, a tek onda nultu.
Napomenimo da nije uvek jednostavno na osnovu istraivakog pitanja
odrediti odgovarajui oblik H 0 i H 1. Pogledajmo nekoliko primera.
PRIMER 8.3: Pretpostavimo da postoji sumnja da prosena potronja
benzina automobila Lexus SC430 u gradskoj vonji (na 100 km) odstupa
od deklarisane, koja iznosi 12l 2. Osnovanost ove sumnje proveriemo
postavljanjem hipoteza u vidu:
H 0 : = 12 l H 1 : 12 l
Ovde je H 0 prosta, a H 1 je sloena hipoteza. Ako H 0 odbacimo,
prihvatiemo da je prosena potronja razliita od 12 l, pri emu smer
odstupanja nije odreen.
Alternativnu hipotezu, kojom mogua odstupanja stvarne od hipotetike
vrednosti parametra pratimo u oba smera nazivamo dvosmernom ili
dvostranom hipotezom. Test koji se primenjuje u ovakvoj situaciji
nazivamo dvosmernim ili dvostranim testom.

2 www.greenhouse.gov.au/fuelguide
176 OSNOVI STATISTIKE

PRIMER 8.4: Prema podacima Amerike trgovinske komore (AMCHAM)


proporcija ilegalnog softvera u Srbiji iznosi najmanje 80%, odnosno
softverske kompanije su oteene za priblino 10,6 miliona dolara3. Ako
vladina agencija sumnja u tanost podatka, tj. smatra da je ovaj procenat
preterano visok, ona e najpre postaviti alternativnu hipotezu u vidu <
0,80. Tek nakon toga suprotstavie joj odgovarajuu nultu hipotezu,
0,80. Dakle:
H0: 0,80 H1 : < 0,80
Ne zaboravimo: moemo potvrditi (uz odgovarajui rizik) samo istinitost
alternativne hipoteze. Tek ako analiza pokae da H0 treba da se odbaci,
agencija e zakljuiti da je uee piratskog softvera manje od 80%.
PRIMER 8.5: Prema podacima Gradskog zavoda za zatitu zdravlja4
prosena godinja vrednost sumpordioksida u Beogradu u 2001. godini
iznosila je 12 mg/m3. Ako smo uvereni da se u meuvremenu situacija
pogorala, odnosno da se prosena zagaenost u Beogradu poveala, kako
da postavimo nultu i alternativnu hipotezu? Postaviemo najpre
alternativnu hipotezu H1: > 12 mg/m3. Sada je lako postaviti nultu
hipotezu: H0: 12 mg/m3. Dakle:
H0 : 12 H1: > 12
Hipoteze postavljene u poslednja dva primera nazivamo jednosmernim ili
jednostranim hipotezama, a testove kojima ispitujemo prihvatljivost H0
nazivamo jednosmernim ili jednostranim testovima. Primetimo da alternativna
hipoteza ukazuje na smer odstupanja koji je kritian. U Primeru 8.4 test se zato
naziva i levostranim, dok se hipoteze u Primeru 8.5 testiraju desnostranim testom.
Postavlja se logino pitanje, kada koristiti dvosmerne, a kada
jednosmerne testove?

Izbor izmeu jednosmernog i dvosmernog testa


Ako testirana vrednost parametra ne sme odstupati u bilo kom
smeru od standarda prihvaenog u praksi (hipotetike vrednosti),
ili ako unapred nita ne znamo o potencijalnom odstupanju
parametra od njegove hipotetine vrednosti, onda koristimo
dvosmerni test.

Napomenimo da neki najpoznatiji statistiki softveri (kao, recimo, SPSS)


nemaju opcije za primenu jednosmernih testova, kao i da jedan broj autora
smatra da treba iskljuivo koristiti dvosmerne testove. Ipak, gornji primeri
pokazuju da u realnim situacijama postoji esta potreba i za jednosmernim

3 http://www.amcham.yu
4 http://www.zdravlje.org.yu/ekoatlas/08t1.htm
POGLAVLJE 8 Testiranje statistikih hipoteza 177

testovima. Pogledajte jo jednom Primer 8.2 i postavite nultu i alternativnu


hipotezu. Da li ste odabrali jednosmernu alternativnu hipotezu H1: < 10 ina?
Ponekad, za istu hipotetiku vrednost parametra i na osnovu istog
uzorka, primenom dvosmernog i jednosmernog testa donosimo razliite
zakljuke; tada u prvom sluaju nultu hipotezu ne moemo da odbacimo, dok je
u drugom sluaju odbacujemo i prihvatamo alternativnu hipotezu. Ono to se u
praksi nikako ne sme raditi je da primenimo, recimo, dvosmerni test, a da
nakon toga, nezadovoljni rezultatom, na istim podacima koristimo jednosmerni
test. Veliki broj autora smatra da je ovakav postupak neetiki i da vodi
falsifikovanju rezultata, i mi se sa njima potpuno slaemo.
Da sumiramo: mada nae uverenje formuliemo u obliku alternativne
hipoteze, u postupku testiranja proveravamo samo nultu hipotezu. Polazimo
od pretpostavke da je H0 istinita i nastojimo da ovu pretpostavku osporimo.
Alternativnu hipotezu ne proveravamo, ve je automatski prihvatamo kao
istinitu ako podaci ubedljivo "svedoe" protiv nulte hipoteze.

8.2.2 Greke pri testiranju i nivo znaajnosti testa

Nulta hipoteza, kao tvrenje o vrednosti nepoznatog parametra osnovnog


skupa, moe u stvarnosti biti ili istinita ili neistinita. Sa druge strane, podaci
sluajnog uzorka mogu biti ili saglasni sa H0 ili joj protivreiti. To znai da kod
testiranja, kao i kod ocenjivanja, postoji mogunost da donesemo pogrean
zakljuak. U Tabeli 8.1 prikazali smo sve ishode testiranja u pogledu njihove
tanosti.
Tabela 8.1 Ishodi testiranja hipoteze i njihove verovatnoe
Stvarna situacija
H0 istinita H0 neistinita

Pravilna odluka Greka II vrste


H0 ne odbacujemo
Odluka
H0 odbacujemo Greka I vrste Pravilna odluka

Na osnovu gornje tabele vidimo da emo ispravno postupiti u sledea dva


sluaja:
1. Ako je H0 istinita, a informacija iz uzorka saglasna sa njom, nultu
hipotezu neemo odbaciti.
2. Ispravno emo postupiti i ako odbacimo H0 koja je neistinita.
Meutim, kako uzorak nikada nije savreno reprezentativan, mogua su i
sledea dva ishoda: da informacija iz uzorka protivrei istinitoj nultoj hipotezi,
178 OSNOVI STATISTIKE

ili da se saglasi sa neistinitom nultom hipotezom. Oigledno je da u oba sluaja


donosimo pogrenu odluku. Iz Tabele 8.1 vidimo da realno postoji mogunost
da napravimo dve razliite greke u odluivanju:
1. Prva je da odbacimo istinitu nultu hipotezu. Takva greka se naziva
grekom prve vrste.
2. Drugu greku u testiranju inimo ako ne odbacimo netanu nultu
hipotezu; to je greka druge vrste.
Jasno je da u zakljuku moemo da nainimo samo jednu greku, a ne
istovremeno obe.

Nivo znaajnosti testa


Nivo znaajnosti testa (naziva se jo rizikom greke prve vrste) je
verovatnoa da emo odbaciti istinitu nultu hipotezu. Obeleava se sa .

Verovatnoa da neemo odbaciti netanu nultu hipotezu naziva se rizikom


greke II vrste i obeleava se sa .
Vodite rauna da rizik greke nije isto to i greka. Rizik greke je
verovatnoa da emo napraviti greku. Takoe, u zbiru, rizik greke I vrste i rizik
greke II vrste nisu jednaki 1.
Prilikom testiranja hipoteza nastojimo da smanjimo oba rizika greke, to
ni malo nije lako. Iako je + 1, ovi rizici su meu sobom povezani, tako da
smanjenje rizika greke I vrste prati porast rizika greke II vrste, i obrnuto.
Postupak testiranja sprovodimo tako to unapred fiksiramo rizik greke I
vrste, tj. nivo znaajnosti . Pri tome biramo relativno mali nivo znaajnosti, ali
ne toliko mali da on onemoguava odbacivanje svake nulte hipoteze. Koliko
mali? Veina istraivaa koristi uglavnom samo dva nivoa znaajnosti: 0,05 i
0,01. Ako odaberemo najee korieni nivo znaajnosti = 0,055, onda svesno
unapred prihvatamo rizik da emo u 5% sluajeva odbaciti H0 iako je ona

5 esto se studenti i istraivai pitaju zato se najee koristi nivo znaajnosti od


5%, a ne neki drugi? Odgovor se nalazi u uticaju Ronalda Fiera koji je, kao vodei
autoritet u statistici, predloio i koristio ovaj nivo znaajnosti kao optimalan.
Naime, Fier je smatrao da ako pri testiranju ve moramo da se suoimo sa
mogunou javljanja greke, onda je potrebno da se negde povue demarkaciona
linija, a on je lino preferirao 5%. Drugaije reeno, po Fieru, statistiari treba da
prihvate rizik da u proseku na osnovu jednog od dvadeset uzoraka naprave greku.
Podsetimo se, slinu logiku smo imali i kod intervala poverenja. I tamo smo traili
optimalni balans izmeu koeficijenta poverenja i irine intervala i najee koristili
95% koeficijent poverenja; kod takvog intervala postoji 5% ansi da smo napravili
greku, odnosno, da smo izabrali jedan od 5% nereprezentativnih uzoraka kada
formirani interval poverenja ne pokriva nepoznati parametar.
POGLAVLJE 8 Testiranje statistikih hipoteza 179

istinita. To e se dogoditi ako izaberemo jedan od 5% nereprezentativnih


uzoraka (u proseku jedan od dvadeset moguih uzoraka) koji po svojim
karakteristikama znaajno odstupaju od karakteristika skupa. ta bi znailo ako
bismo, recimo, sveli rizik greke I vrste na nulu? Tada nikada ne bismo odbacili
nultu hipotezu, bila ona tana ili pogrena. U emu bi onda bio smisao
testiranja?
Kada se nivo greke I vrste unapred odredi (videli smo da je to najee
0,05), ostaje pitanje kako kontrolisati rizik greke II vrste? Naalost,
izraunavanje rizika u konkretnoj situaciji je skoro nemogue jer na ovu
verovatnou, pored faktora koje moemo kontrolisati, utie i razlika izmeu
stvarne i hipotetike vrednosti posmatranog parametra. Kako nam stvarna
vrednost testiranog parametra nije poznata, jasno je da ne moemo precizno
odrediti ni rizik .
Na koji nain moemo istovremeno smanjiti oba rizika pri testiranju, ili
preciznije, kako emo za unapred odabrani rizik , smanjiti rizik ? Da bismo nali
odgovor, vratimo se Primeru 8.1. Pretpostavimo da ste lan porote i da ne biste
eleli da osudite nevinu osobu, ali ni da oslobodite krivu. ta biste uradili da
smanjite rizik donoenja pogrenog suda? Naravno, traili biste dodatnu
istragu, odnosno dodatne informacije. Statistiki reeno, traili biste da se
povea uzorak, to je ujedno i odgovor na postavljeno pitanje.
Umesto da vodi rauna o smanjivanju rizika , istraiva se najee
rukovodi komplementarnom verovatnoom, 1 - . Ova verovatnoa naziva se
jainom testa.

Jaina testa
Jaina testa je verovatnoa da se odbaci pogrena nulta hipoteza.
Obeleava se sa .

8.2.3 Izbor testa

Na osnovu prethodno reenog zakljuujemo da je optimalan test onaj koji za


fiksni nivo znaajnosti ima najveu jainu. Meutim, jaina testa zavisi od
identinih faktora kao i rizik greke pa je jasno da njen nivo ne moemo
precizno izraunati za konkretnu hipotezu. ta nam onda preostaje, koji test da
izaberemo?
Ranije smo ve rekli da se ista hipoteza moe testirati primenom razliitih
testova (parametarskih i neparametarskih). Pri izboru testa treba da izaberemo
onaj koji najvie odgovara empirijskim podacima (tj. test za koji su zadovoljeni
polazni uslovi), ali i test koji e za izabrani nivo greke I vrste imati najveu
jainu, i to za unapred izabranu veliinu uzorka, n. Reenje problema izbora
nam daje teorijska statistika: ako je raspored skupa normalan, najveu jainu
imaju parametarski testovi.
180 OSNOVI STATISTIKE

U ovom poglavlju baviemo se parametarskim testovima koje smo


prikazali u Dijagramu 8.2. Posmatraemo ukupno etiri istraivaka problema i
za njihovo reavanje koristiemo testove zasnovane na jednom i na dva uzorka.
Na osnovu testova zasnovanih na jednom uzorku testiraemo hipoteze o
vrednosti aritmetike sredine i proporcije osnovnog skupa, dok emo
primenom testova zasnovanih na dva uzorka testirati hipoteze o jednakosti
aritmetikih sredina i proporcija dva osnovna skupa.

Istraivaki problem Optimalan test

Z test (ako je poznata


Testiranje aritmetike sredine standardna devijacija skupa)
jednog skupa

t test (ako je nepoznata


standardna devijacija skupa)

Testiranje proporcije jednog Z test (ako su ispunjeni uslovi


skupa n0 > 5 i n(1-0) > 5)

Z test (ako su poznate


Testiranje jednakosti standardne devijacije oba skupa)
aritmetikih sredina dva
k
t test (ako su nepoznate
standardne devijacije oba skupa)

Testiranje jednakosti Z test (ako su ispunjeni uslovi):


proporcija dva skupa n 1 p 1 > 5 i n 1 (1 - p 1 ) > 5
n 2 p 2 > 5 i n 2 (1 - p 2 ) > 5

Dijagram 8.2 Optimalni parametarski testovi u zavisnosti


od istraivakog problema

Na osnovu Dijagrama primeujemo da i u okviru grupe parametarskih testova


za isti problem imamo vie raspoloivih testova. Tako, na primer, hipotezu o
aritmetikoj sredini skupa moemo testirati primenom tzv. Z i t testa.
POGLAVLJE 8 Testiranje statistikih hipoteza 181

Zadovoljen uslov normalnosti skupa u konkretnom sluaju nije dovoljan za


izbor testa, ve moramo uvesti dodatni uslov koji se odnosi na standardnu
devijaciju skupa. Ako je standardna devijacija skupa poznata, onda emo
koristiti Z test, a ako nije (to je najei sluaj u praksi), onda emo primeniti t
test. (Podsetimo sa da smo iste uslove proveravali i kod ocenjivanja nepoznate
aritmetike sredine skupa). Shodno tome, zakljuujemo da za svaki od etiri
navedena problema, i svaku kombinaciju uslova, postoji jedan optimalan
parametarski test.
Navedeni testovi su dobili naziv po odgovarajuem teorijskom rasporedu
koji koristimo u procesu testiranja. To znai da emo u posmatranim
situacijama testiranje sprovoditi primenom standardizovanog normalnog
rasporeda ili Studentovog t rasporeda. Ipak, u zavisnosti od hipoteze koju
testiramo, promenljive Z i t bie definisane na razliite naine, odnosno, bie
prikazane razliitim formulama. Vrednosti ovih promenljivih, koje emo
izraunati na osnovu izabranog uzorka, bie osnova za donoenje konanog
zakljuka o odbacivanju ili neodbacivanju nulte hipoteze. Drugim reima,
promenljiva koju koristimo u konkretnoj situaciji predstavlja zapravo kriterijum
testiranja i nazivamo je statistikom testa.

Statistika testa
Statistika testa je kriterijum na osnovu kojeg vrimo testiranje.

8.2.4 Logika statistikog testiranja hipoteza


Objasnimo logiku kojom se sluimo pri testiranju hipoteza, odnosno, kako
proveravamo odrivost nulte hipoteze da je vrednost parametra skupa jednaka
hipotetikoj vrednosti. Rekli smo da testiranje zasnivamo na kriterijumu
statistici testa, iju vrednost izraunavamo na osnovu empirijske evidencije iz
uzorka. Kako definiemo ovaj kriterijum i od ega zavisi njegova vrednost?
Formulacija kriterijuma zavisi, pre svega, od predmeta testiranja, ali i od
ispunjenosti polaznih uslova. Ako je predmet testiranja vrednost parametra
osnovnog skupa, koje informacije iz uzorka emo koristiti za izraunavanje
vrednosti statistike testa? Na osnovu dosadanjeg znanja iz oblasti ocenjivanja
jasno se namee sledei zakljuak: Prilikom testiranja hipoteze o aritmetikoj
sredini skupa, , empirijsku evidenciju iz uzorka predstavljae njena ocena, tj.
aritmetika sredina uzorka, X , dok e pri testiranju hipoteze o proporciji
skupa, , to biti proporcija uzorka, Pr.
U postupku testiranja polazimo od pretpostavke da je nulta hipoteza
istinita. Drugim reima, pretpostavljamo da uzorak biramo iz skupa u kome je
stvarna vrednost parametra jednaka hipotetinoj vrednosti. Hipotetiku
vrednost aritmetike sredine skupa obeleavamo sa 0, a proporcije skupa sa 0.
Kao to ve znamo, ocene X i Pr su sluajne promenljive, pa njihove vrednosti
182 OSNOVI STATISTIKE

u pojedinim uzorcima odstupaju od stvarne vrednosti odgovarajueg


parametra skupa. Samim tim, ne moemo oekivati da e realizovana vrednost
ocene u izabranom uzorku biti jednaka hipotetinoj vrednosti parametra, ak i
kada je nulta hipoteza istinita. Zato emo meriti razliku izmeu vrednosti ocene
i hipotetine vrednosti parametra sadrane u nultoj hipotezi, tj. ( X 0 ),
odnosno, (Pr -0), i na osnovu nje donositi zakljuak.
Da bismo eliminisali jedinicu mere u kojoj je izraena vrednost pojave
koju posmatramo, razliku izmeu ocene i hipotetike vrednosti parametra
standardizujemo, tj. delimo sa standardnom grekom ocene, i izraavamo je u
broju standardnih greaka. Statistike testa koje emo upoznati u ovoj knjizi
najee imaju upravo takav oblik:

Ocena parametra - Hipotetina vrednost parametra (8.1)


Statistika testa =
Standardna greka ocene
Tako, na primer, statistika testa za testiranje hipoteze o aritmetikoj
sredini skupa, u zavisnosti od ispunjenosti polaznih uslova, moe biti:
X 0 X 0
Z= ili t = .
X SX
Budui da statistika testa predstavlja funkciju barem jedne sluajne
promenljive, jasno je da je i ona sluajna promenljiva. Samim tim, statistika testa
e uzimati razliite vrednosti od uzorka do uzorka i te vrednosti je nemogue
unapred predvideti. Ako nam je raspored statistike testa poznat, tada moemo
izraunavati verovatnoe da e statistika testa biti manja ili vea od neke
vrednosti, pa i od one dobijene u konkretnom uzorku.
Logika formule (8.1), kao i samog postupka testiranja, je u sledeem. Ako
je nulta hipoteza istinita, tada oekujemo da razlika izmeu ocenjene i
hipotetine vrednosti parametra bude mala, pa e i vrednost statistike testa biti
mala. U suprotnom, oekujemo relativno veliku (bilo pozitivnu, bilo negativnu)
vrednost statistike testa. Vidimo da je znaaj statistike testa u tome da ona
predstavlja meru usaglaenosti izmeu podataka iz uzorka i nulte hipoteze.
Da sumiramo: mala vrednost statistike testa nam ne daje osnove da
odbacimo nultu hipotezu. Nasuprot tome, njene velike vrednosti nam sugeriu
da nulta hipoteza nije tana. to je vea vrednost statistike testa, to su uverljiviji
dokazi da je nulta hipoteza pogrena. Ostaje samo da se odredi koje vrednosti
statistike testa emo smatrati malim a koje velikim, odnosno, kolika treba da
bude vrednost statistike testa da bi se nulta hipoteza odbacila.
Postoje dva naina da donesemo konaan zakljuak o odbacivanju ili
neodbacivanju nulte hipoteze. To su Nimen-Pirsonov (Neyman-Pearson)
pristup, i Fierov pristup, zasnovan na primeni tzv. p-vrednosti. Mi emo u
ovoj knjizi primeniti kombinovani pristup.
POGLAVLJE 8 Testiranje statistikih hipoteza 183

8.2.5 p-vrednost

Kao to smo ve rekli, testiranje hipoteza se u praksi najee sprovodi


primenom raunara, kada emo p-vrednost nai u izlazu svakog statistikog
softvera. Drugim reima, neemo imati potrebe da je sami izraunavamo. Ipak,
da bismo razumeli njeno znaenje i logiku testiranja, pokazaemo kako
odreujemo p-vrednost i kako je interpretiramo.
Vratimo se Primeru 8.3, i pretpostavimo da je standardna devijacija
skupa poznata i jednaka =1l, i da biramo uzorak od n=25 elemenata (odnosno,
da je X =0,2). Radi jednostavnosti objanjenja polazimo od jednosmernih
hipoteza datih oblikom B:
H0: 12 l, H1: > 12 l.
Pretpostavimo da je aritmetika sredina u izabranom uzorku x =12,4l, odnosno,
da je vrednost statistike testa z=2. Postavimo sledee pitanje:
Ako je H0 istinita, koliko iznosi verovatnoa da se javi vrednost statistike
testa koja je jednaka upravo realizovanoj, z=2, ili je vea od ove vrednosti
(odnosno, jo vie protivrei tvrenju datom u nultoj hipotezi), tj. kolika je
P(Z 2)?
Traenu verovatnou lako izraunavamo na osnovu Tablice 1 i ona je
jednaka P(Z z) = P(Z 2)=1-0,9772= 0,0228. Moemo je interpretirati na
sledei nain: Ako je H0 istinita (tj. ako uzorak potie iz skupa sa prosenom
potronjom koja je (najvie) jednaka 12 litara), onda se ovako velike vrednosti
statistike testa mogu javiti samo u 2,28% uzoraka. Dobijeni rezultat bismo mogli
da tumaimo na dva naina:
a) Nulta hipoteza je tana, i prisustvujemo veoma retkom dogaaju, odnosno
izvukli smo uzorak koji je ipak mogue izvui, bez obzira to je malo
verovatan, ili
b) Nulta hipoteza je pogrena.
Budui da moramo doneti odluku, mi smo pre skloni da odbacimo nultu
hipotezu, nego da poverujemo da prisustvujemo nekom retkom dogaaju. Da
smo dobili jo veu prosenu vrednost u uzorku, na primer, x =12,6l (tj. ekstremniju
u odnosu na hipotetiku vrednost sadranu u H0), izraunata verovatnoa bi bila jo
manja (iznosila bi 0,0013), a mi bismo imali jo jae argumente protiv nulte
hipoteze. Ova verovatnoa je zapravo p-vrednost.

p-vrednost
p-vrednost je verovatnoa da statistika testa uzme vrednost
jednaku ili jo ekstremniju od vrednosti koja se upravo
realizovala u uzorku, pod uslovom da je nulta hipoteza tana. to
je manja p-vrednost, jai su dokazi protiv nulte hipoteze.
184 OSNOVI STATISTIKE

Pokaimo sada kako izraunavamo p-vrednost u sluaju da su jednosmerne


hipoteze date u obliku C:
H0: 12 l, H1: < 12 l.
Ako pretpostavimo da je aritmetika sredina u izabranom uzorku x =11,48 l,
odgovarajua vrednost statistike testa jednaka je z=-2,6. Koliko sada iznosi p-
vrednost? Ako je H0 istinita, kolika je verovatnoa da se javi vrednost statistike
testa koja je jednaka ili manja od -2,6 (tj. ekstremnija u odnosu na hipotetiku
vrednost sadranu u H0)? Ta verovatnoa je P(Z z) = P(Z -2,6)=0,0047, to
znai da se ovako male vrednosti statistike testa mogu javiti samo u 0,47%
uzoraka, ako oni potiu iz skupa ija je prosena potronja (najmanje) jednaka
12 litara. Zakljuujemo da nam dobijena p-vrednost prua veoma jake
argumente protiv nulte hipoteze.
Pokaimo, na kraju, kako se izraunava p-vrednost u sluaju dvosmernog
testa. U naem primeru hipoteze su date u obliku (A):
H0: =12 l i H1: 12 l.
Ako je aritmetika sredina u izabranom uzorku, na primer, x =12,35 l,
odgovarajua vrednost statistike testa jednaka je z=1,75, pa je P(Z z) = P(Z
1,75)=1-0,9599= 0,0401. Podsetimo se da dvosmerni testovi prate odstupanja u
oba smera. Zato, ako je nulti raspored simetrian, p-vrednost kod dvosmernih
testova odreujemo tako to dobijenu verovatnou mnoimo sa 2. Nulti
raspored u naem primeru je standardizovan normalan raspored, pa budui da
je on simetrian, odgovarajua p-vrednost je jednaka 0,04012=0,0802. To je
verovatnoa da vrednost statistike testa Z bude vea od 1,75, ili da bude manja
od -1,75, tj. P(Z z) = P(Z 1,75) = 0,0802.
Na osnovu gornjih primera zakljuujemo sledee: to je vrednost
statistike testa Z vie udaljena od 0, to je p-vrednost manja, odnosno, podaci su
manje konzistentni sa nultom hipotezom. U tom smislu kaemo da p-vrednost
meri jainu dokaza protiv nulte hipoteze. Ako u kompjuterskom izlazu
dobijemo da je p-vrednost=0, onda moemo biti skoro sasvim sigurni da je H0
neistinita i prihvatiti H1. Ali, ta emo zakljuiti ako je p-vrednost jednaka, na
primer, 0,03, 0,006 ili 0,08? Postavlja se pitanje, koliko mala (bliska nuli) treba da
bude p-vrednost da bismo odbacili nultu hipotezu. Budui da nivo znaajnosti
predstavlja verovatnou da emo odbaciti istinitu nultu hipotezu, logino se
namee zakljuak da odluku moemo doneti uporeivanjem dobijene p-
vrednosti sa unapred izabranim rizikom .
Pravilo odluivanja na osnovu p-vrednosti glasi:

Ako je p-vrednost manja od nivoa znaajnosti , nulta hipoteza


se odbacuje. U suprotnom, kazaemo da nemamo dovoljno
argumenata da odbacimo H0.
POGLAVLJE 8 Testiranje statistikih hipoteza 185

Kao to vidimo, u sluajevima kada koristimo statistiki softver, odnosno, kada


raspolaemo sa p-vrednou, pravilo odluivanja postaje veoma lako. Ako je p-
vrednost manja od nivoa znaajnosti , kaemo da je dobijeni rezultat
statistiki znaajan ili signifikantan, i nultu hipotezu odbacujemo sa rizikom
. U suprotnom, kaemo da rezultat nije statistiki znaajan.

Statistika znaajnost
Ako je p-vrednost manja od nivoa znaajnosti , kaemo da je
rezultat statistiki znaajan na nivou .

Vodimo strogo rauna da pojam "statistiki znaajan" ne mora nuno da znai


i "praktino vaan". U statistici se ovaj termin koristi samo da ukae da su
dokazi protiv nulte hipoteze dostigli standard oznaen postavljenim nivoom
znaajnosti . Praktina znaajnost, meutim, zavisi od veliine razlike
izmeu hipotetine i stvarne vrednosti parametra. Zato se moe dogoditi da
statistiki znaajna razlika bude toliko mala da je sa stanovita posmatranog
praktinog problema smatramo irelevantnom.
Dobijene p-vrednosti se esto (naroito u strunim asopisima) tumae
kao u sledeoj tabeli:
Tabela 8.2 Interpretacija jaine argumenata protiv nulte hipoteze
p-vrednost 0,05 Nemamo dovoljno dokaza protiv H0
p-vrednost < 0,05 Jaki dokazi da je H0 pogrena
p-vrednost < 0,01 Veoma jaki dokazi da je H0 pogrena
p-vrednost < 0,001 Izuzetno jaki dokazi da je H0 pogrena

Na kraju razmatranja p-vrednosti ukaimo da u sluaju rune obrade


podataka ona ima jedan krupan nedostatak. Naime, bez pomoi kompjutera
njenu tanu vrednost moemo izraunati samo kod Z testa, na osnovu Tablice
1. Kod svih ostalih testova to nije mogue, jer se oni zasnivaju na teorijskim
rasporedima za koje ne raspolaemo kompletnim tablicama. U takvim
situacijama moemo samo izraunati interval u kome se nalazi p-vrednost.

8.3 TESTIRANJE HIPOTEZE ZASNOVANO NA JEDNOM UZORKU


Sve statistike testove u ovom poglavlju, radi preglednosti i lakeg
razumevanja, tretiraemo na identian nain. Najpre emo tabelarno prikazati
uslove koji moraju biti ispunjeni za njihovu primenu, oblike nulte i alternativne
hipoteze, i statistiku testa koja se koristi. Zatim emo ukratko objasniti logiku
testiranja i na primeru pokazati kako se ono sprovodi. Konano, kod svih
analiziranih testova prikazaemo i izlaz iz nekog statistikog softvera.
186 OSNOVI STATISTIKE

8.3.1 Testiranje hipoteze o aritmetikoj sredini osnovnog skupa

U Dijagramu 8.2, a i tokom prethodnog izlaganja, videli smo da se za testiranje


hipoteze o aritmetikoj sredini osnovnog skupa mogu koristiti dva
parametarska testa, Z i t.

Z test
Osnovne informacije vezane za primenu Z testa u sluaju testiranja aritmetike
sredine jednog skupa prikazane su u Tabeli 8.3.

Tabela 8.3 Testiranje hipoteze o aritmetikoj sredini skupa primenom Z testa


Uslovi za primenu Z testa:
1) Osnovni skup ima normalan raspored ili
moe se primeniti Centralna granina teorema ( n 30 ).
2) Standardna devijacija skupa, , je poznata.
Izbor oblika nulte i alternativne hipoteze:
A) H0 : = 0 H1: 0
B) H0 : 0 H1 : > 0
C) H0 : 0 H1 : < 0
gde je 0 hipotetina vrednost aritmetike sredine skupa.
X - 0
Statistika testa: Z = (8.2)
X
ako je H0 istinita ima standardizovan normalan raspored, Z : N (0, 1).

Budui da smo ve pokazali kako se kod Z testa izraunava p-vrednost, ovde


emo posebnu panju posvetiti etapama testiranja, koje smo prikazali u
Dijagramu 8.1.
PROBLEM 8.1: U deklaraciji uz poiljku od 5000 litijumskih Energizer L92
baterija navedeno je da neprekidna duina njihovog trajanja (kada se koriste
na digitalnim audio aparatima) iznosi 13 asova,6 sa dozvoljenim prosenom
odstupanjem od 2 asa. Prilikom preuzimanja poiljke, sluajnim putem je
izabrano 50 baterija i ustanovljeno da njihov prosean vek trajanja iznosi 12,6
asova. Da li poiljka zadovoljava navedeni standard po pitanju trajanja
baterija?
REENJE
Reavanje problema zahteva, pre svega, da paljivom analizom precizno

6 http://data.energizer.com/PDFs/l92.pdf
POGLAVLJE 8 Testiranje statistikih hipoteza 187

definiemo pitanje, a zatim da izaberemo odgovarajui statistiki metod


kojim emo doi do traenog odgovora. Ova faza pokazuje da je statistiki
nain istraivanja i kvalitativan, a ne samo kvantitativan, tj. da se ne svodi na
puko primenjivanje formula i izraunavanje.
Prvo to treba utvrditi je koji se statistiki parametar ispituje. Paljivim
itanjem (analizom Problema 8.1) uoavamo da je predmet analize
aritmetika sredina skupa.
Da bismo utvrdili da li kvalitet baterija odgovara navodima u
deklaraciji moramo odabrati odgovarajui statistiki metod. Vidimo da
raspolaemo uzorkom od 50 baterija i da na postavljeno pitanje "Da li
poiljka zadovoljava navedeni standard" postoje samo dva mogua
odgovora, da ili ne. Primenjujui preporuku datu na poetku ovog poglavlja,
zakljuujemo da treba izabrati testiranje hipoteza.
Tek sada moemo da pokrenemo proceduru testiranja po etapama
sugerisanim u Dijagramu 8.1.
Etapa 1. Postavljanje nulte i alternativne hipoteze, i odreivanje nivoa znaajnosti.
Odredimo najpre da li postavljeni problem treba prikazati u obliku
dvosmernog ili jednosmernog testa. Vidimo da su dozvoljena odstupanja u
oba smera, zbog ega se opredeljujemo za dvosmerni test. Nivo znaajnosti
biramo sami, pa emo po Fierovoj preporuci izabrati = 0,05.
H0 : = 13h H1: 13h = 0,05
Etapa 2. Uzima se sluajan uzorak, bira odgovarajui test i proveravaju uslovi za primenu
izabranog testa.
Budui da ve raspolaemo uzorkom, ostaje da odredimo optimalan test,
rukovodei se Dijagramom 8.2. Izbor izmeu Z i t testa zavisi od toga da li je
poznata standardna devijacija skupa. U deklaraciji poiljke je navedeno da
dozvoljeno "proseno odstupanje" iznosi 2 asa, iz ega zakljuujemo da je
= 2h. Samim tim, biramo Z test, sa statistikom testa datom izrazom 8.2.
Etapa 3. Proveravanje ispunjenosti uslova izabranog testa.
Z test, kao to vidimo u Tabeli 8.3, zasniva se na dva uslova. Proverimo da li
su oni ispunjeni.
1) Osnovni skup ima normalan raspored, ili
Ispunjeno, jer je n = 50
moe se primeniti CGT (n > 30).
2) Standardna devijacija skupa, , je poznata. Ispunjeno, jer je = 2h
Zakljuujemo da su oba uslova ispunjena i nastavljamo sa testiranjem.
Etapa 4. Izraunavanje statistike testa i p-vrednosti.
Realizovana vrednost statistike testa je:
x - 0 12,6 13
z = = = 1, 414
X 2 / 50
188 OSNOVI STATISTIKE

Vidimo da je aritmetika sredina izabranog uzorka, x =12,6, manja od


hipotetike aritmetike sredine skupa od 13 asova za 1,414 standardne
greke. Da li je ova razlika dovoljno velika da sugerie odbacivanje H0?
Odgovor na ovo pitanje dae nam p-vrednost, koju za dvosmerne testove
izraunavamo na sledei nain:
2 P(Z z ) = 2 P(Z 1, 414 ) = 2 P(Z 1, 414) = 2 1 P(Z < 1, 414)
= 2 [ 1 0,9207 ] = 0,1586

Generalno, p-vrednost kod svakog Z testa izraunavamo na osnovu


objanjenja u odeljku 8.2.6 koji je grafiki ilustrovan na Slici 8.2.

Alternativna
hipoteza p-vrednost

H 1 : > 0 P( Z z )

H 1 : < 0 P( Z z )

H1: 0 2 P(Z z )

z
Slika 8.2 Izraunavanje p-vrednosti kod Z testa
Etapa 5. Postavljanje pravila odluivanja i donoenje odluke o nultoj hipotezi.
Kao to smo videli pravilo odluivanja pri korienju p-vrednosti glasi:
Ako je p-vrednost manja od nivoa znaajnosti, H0 se odbacuje; u suprotnom se ne
odbacuje.
Naa p-vrednost je jednaka 0,1586 i kao takva vea od odabranog nivoa
znaajnosti = 0,05. Usled toga nemamo dovoljno razloga da odbacimo
nultu hipotezu.
Za dobijeni rezultat kaemo da nije statistiki znaajan, odnosno da je
nesignifikantan.

Etapa 6. Donoenje zakljuka.


POGLAVLJE 8 Testiranje statistikih hipoteza 189

Nemamo dovoljno dokaza da tvrdimo da kvalitet poiljke (meren prosenim


trajanjem baterija) odstupa od vrednosti u deklaraciji. Konsekventno,
prihvatiemo poiljku od 5000 baterija.
Na kraju razmatranja Z testa prikaimo rezultate analize primenom EduStata.
Primeujemo da postoje neznatne razlike u rezultatima, koje su posledica
zaokrugljivanja.

Z-test za aritmetiku sredinu jednog skupa


H0: = 13
H1: <> 13
Varijabla Veliina Aritmetika sredina Stand. devijacija skupa
uzorka (n) uzorka
50 12,6 2

Standardna Z statistika P
greka
0,283 -1,4142 0,15735
Zakljuak
Nemamo dovoljno razloga da tvrdimo da se prosena vrednost u populaciji
razlikuje od 13

Studentov t test
Osnovne informacije vezane za primenu verovatno najpoznatijeg statistikog
testa, t testa, u sluaju testiranja aritmetike sredine jednog skupa prikazane su
u Tabeli 8.4.
Tabela 8.4 Testiranje hipoteze o aritmetikoj sredini skupa
primenom t testa

Uslovi za primenu t testa:


1) Osnovni skup je normalno rasporeen, ili
2) Vai Centralna granina teorema (uzorak ima najmanje 30
elemenata)
Izbor oblika nulte i alternativne hipoteze:
A) H0 : = 0 H1: 0 B) H0: 0 H1: > 0 C) H0 : 0 H1: < 0
gde je 0 hipotetina vrednost aritmetike sredine skupa
X - 0 X - 0
Statistika testa: t = = (8.3)
SX S/ n
ako je H0 istinita ima Studentov raspored sa n-1 stepeni slobode.

U praksi nam standardna devijacija populacije skoro nikada nije


poznata. Zato, kao i kod ocenjivanja, ocenjujemo na osnovu standardne
190 OSNOVI STATISTIKE

devijacije uzorka S, i na osnovu nje dobijamo ocenu standardne greke, S X .


Tako dobijamo novu statistiku testa, tzv. statistiku t testa datu izrazom 8.3.

PROBLEM 8.2: Prema jednom istraivanju7 samo 11% studenata u Srbiji


zavri studije u predvienom roku, a prosena duina studiranja je 8 godina.
Mi, meutim, verujemo da studenti smera Bankarstvo na Ekonomskom
fakultetu u Beogradu po ovom pitanju ostvaruju bolje rezultate. Da bismo to
proverili uzeli smo od rukovodioca studentske slube sluajan uzorak od 16
studenata koji su na tom smeru diplomirali kolske 2005/2006. godine. Dobili
smo sledee podatke (duina studiranja u godinama):
8,5 6,5 4,5 9,5 11,5 4,5 5,5 4,5
7,5 7,5 6,5 5,5 7,5 4,5 6,5 5,5
Da li je prosena duina studiranja na smeru Bankarstvo kraa od proseka
studiranja u Srbiji? Iz iskustva znamo da je duina studiranja normalno
rasporeena.
REENJE
Budui da istraivako pitanje glasi "da li je prosena duina studiranja kraa"
testiranje emo sprovesti primenom jednosmernog (levostranog) testa:
H0: 8 H1 : < 8,
i izabraemo nivo znaajnosti = 0,05.
Pri izboru testa, uzimamo u obzir da je osnovni skup normalno
rasporeen i da nepoznatu moramo da ocenimo na osnovu S. Zato
koristimo statistiku t (8.3) i Studentov raspored sa n - 1 = 16 - 1 = 15 stepeni
slobode.
Aritmetika sredina uzorka jednaka je

x=
xi =
106
= 6,625
n 16
a ocenjena vrednost standardne greke iznosi:

sX =
x i
2
n x2
=
11236 16 6,6252
= 0, 499
n (n - 1) 16 15

pa zamenom u (8.3) izraunavamo vrednost statistike t:


6,625 - 8
t= = -2,76 .
0,499
Primetimo da Tablica 2 sadri kritine vrednosti Studentovog

7 Slobodanka Turajli, "Higher education in Serbia Reform strategy", dostupno na

sajtu www.see-educoop.net/education_in/pdf/heser_reform-ser_enl_t02.pdf
POGLAVLJE 8 Testiranje statistikih hipoteza 191

rasporeda za nekoliko izabranih verovatnoa. Ovde smo prikazali samo red


koji se odnosi na 15 stepeni slobode, zajedno sa zaglavljem:
Verovatnoa 0,10 0,05 0,025 0,01 0,005
Kritina t rednost 1,341 1,7531 2,1315 2,602 2,9467

Budui da ne raspolaemo svim verovatnoama Studentovog rasporeda za


15 stepeni slobode, bez primene nekog statistikog softvera ne moemo
odrediti tanu p-vrednost. Mogue je odrediti samo interval u kojem se
nalazi p-vrednost. Bez obzira to u praksi nikada neemo koristiti tablice i
formirati interval za p-vrednost da bismo do kraja shvatili koncept testiranja
pokazaemo kako se taj interval odreuje.
Po definiciji p-vrednost je verovatnoa da statistika testa bude jednaka
ili ekstremnija (u ovom sluaju manja) od realizovane vrednosti, -2,76.
Budui da zbog simetrinosti t rasporeda vai relacija:
P ( t15 < -2,76) = P (t15 > 2,76),
p-vrednost moemo odrediti zanemarujui predznak vrednosti statistike
testa. Dakle naa statistika testa iznosi 2,76, i nalazi se izmeu 2,602 i 2,9467.
Ovim tablinim vrednostima odgovaraju verovatnoe u zaglavlju od 0,01 i
0,005. Samim tim zakljuujemo da je 0,005 < p-vrednost < 0,01. Ovaj rezultat
potvruju i rezultati testiranja u statistikom paketu Minitab, verzija 14, koji
sadre tanu p-vrednost= 0,007.

One-Sample T: Duina studiranja


Test of mu = 8 vs < 8
95%
Upper
Variable N Mean StDev SE Mean Bound T P
Duina 16 6,62500 1,99583 0,49896 7,49970 -2,76 0,007

To znai da bismo postavljenu nultu hipotezu mogli da odbacimo uz rizik


greke I vrste od samo 0,007. Ipak, ako zakljuak donosimo poreenjem p-
vrednosti sa rizikom , na osnovu odnosa p<, nultu hipotezu emo odbaciti
uz rizik greke od 0,05.

Vana napomena: Prilikom izraunavanja p-vrednosti, u sluaju kada se koristi


dvosmerni test, dobijene vrednosti verovatnoa u zaglavlju tablice potrebno je
pomnoiti sa 2, kao kod Z testa.

8.3.2 Testiranje hipoteze o proporciji osnovnog skupa


Osnovne informacije vezane za primenu Z testa u sluaju testiranja proporcije
jednog skupa prikazane su u Tabeli 8.5.
192 OSNOVI STATISTIKE

Tabela 8.5 Testiranje hipoteze o proporciji skupa primenom Z testa

Uslovi za primenu Z testa:


n 0 5 , n (1 0 ) 5 i n 30
Izbor oblika nulte i alternativne hipoteze:
A) H 0 : = 0 H 1 : 0 B) H 0 : 0 H 0 : > 0 C) H 0 : 0 H 1 : < 0
gde je 0 hipotetina proporcija skupa.

p - 0 0 (1 - 0 )
Statistika testa: Z = Sp =
Sp n

pod uslovom da je H0 istinita ima standardizovan normalan raspored.

Logika statistike testa o proporciji skupa je analogna onoj kod aritmetike


sredine. Razlika je u tome to proporcije malih uzoraka nemaju normalan
raspored. Meutim, u ovoj knjizi mi emo testiranje hipoteze o proporciji skupa
sprovoditi samo primenom velikih uzoraka. Tada se raspored verovatnoe
proporcije Pr, ako su ispunjeni uslovi dati u Tabeli 8.5, moe aproksimirati
normalnim rasporedom, Pr: priblino N( 0 , p ). Generalna formula za
statistiku testa (8.1) sugerie i oblik koji e statistika testa imati:

Proporcija uzorka - Hipotetina vrednost proporcije p - 0


Z = = (8.4)
Standardna greka proporcije p

Statistika 8.4, pod uslovom da je H0 istinita, ima standardizovan


normalan raspored, Z: N(0, 1).
Primetimo da u praksi u formuli (8.4) umesto nepoznate standardne
greke proporcije ( p ) koristimo njenu ocenu ( S p ). Vano je da napomenemo
da ocenu standardne greke proporcije kod testiranja izraunavamo primenom
hipotetine vrednosti parametra ( 0 ), a ne kao kod ocenjivanja, na osnovu
realizovane vrednosti proporcije (p) u uzorku:

Standardna greka 0 (1 - 0 )
Sp = (8.5)
proporcije n

PROBLEM 8.3: Na osnovu istraivanja sprovedenih 2003. godine poznato je


da je procenat stanovnika koji podravaju ulazak Srbije u EU iznosio 76%. U
POGLAVLJE 8 Testiranje statistikih hipoteza 193

decembru 2006. godine sprovedena je nova anketa8 i u sluajnom uzorku od


1700 ispitanika njih 1139 je izjavilo da su za pridruivanje Srbije EU. Da li je
dolo do promene stavova stanovnitva Srbije o ulasku u EU?
REENJE
Proitajte paljivo problem i pronaite koji je parametar u pitanju i koliko se
uzoraka koristi. Da li ste utvrdili da je parametar proporcija, i da se koristi
jedan uzorak? Uoimo da postavka problema zahteva primenu dvosmernog
testa. U prvoj etapi postavimo nultu i alternativnu hipotezu:
H0 : = 0,76 H1 : 0,76
i nivo znaajnosti specifikujmo na nivou od 0,05.
Ispitajmo sada da li su ispunjeni uslovi za njegovu validnu primenu; drugim
reima da li se moe primeniti normalna aproksimacija.
n 0 = 1700 0,76 = 1292 > 5 i n (1 0 ) = 1700 0,24 = 408 > 5
Oba uslova su ispunjena, a kako je uzorak veliki, prelazimo na izraunavanje
statistike testa i p-vrednosti.
Proporcija ispitanika koji podravaju pridruivanje je:
1139
p= = 0,67 ,
1700
a ocenjena vrednost standardne greke, na osnovu (8.5) iznosi:
0,76( 1 - 0,76)
Sp = = 0,01 .
1700
Realizovana vrednost statistike Z testa, na osnovu formule (8.4), jednaka je:
p - 0 0,67 - 0,76
z= = = -9 .
sp 0,01

Budui da primenjujemo Z test, p-vrednost se identino rauna kao i prilikom


testiranja aritmetike sredine skupa (Slika 8.2). Budui da je test dvosmeran
2 P( Z z ) = 2 P(Z 9 ) = 2 P(Z 9) = 2 1 P(Z < 9)
= 2 [ 1 1] = 0

Kako je p-vrednost manja od nivoa znaajnosti rezultat je signifikantan, tj.


statistiki znaajan. To znai da nultu hipotezu odbacujemo. Uz rizik od 0,05
tvrdimo da se proporcija stanovnitva koje podrava ulazak Srbije u EU
razlikuje od 76%.
Na kraju prikaimo izlaz iz statistikog softvera Statgraphics Plus.

8 Anketu je sprovela novosadska agencija "SCAN" a rezultati su objavljeni u Politici

7 decembra 2006.
194 OSNOVI STATISTIKE

Hypothesis Tests
Sample proportion = 0,67
Sample size = 1700
Approximate 95,0% confidence interval for p: [0,646001;0,691529]
Null Hypothesis: proportion = 0,76
Alternative: not equal
P-Value = 0,0
Reject the null hypothesis for alpha = 0,05.

8.4 TESTIRANJE HIPOTEZE ZASNOVANO NA DVA UZORKA

Na kraju ovog poglavlja objasniemo parametarske testove kojima poredimo


parametre dva skupa. Pri tome zadraemo se samo na poreenju aritmetikih
sredina dva skupa. Neki autori smatraju da ovi metodi spadaju meu
najkorisnije statistike metode u eksperimentalnoj praksi. Na primer, prilikom
ispitivanja efikasnosti nekog novog leka uobiajeno je da se oforme dve grupe.
Jedna (eksperimentalna), prima novi lek, a druga (kontrolna) prima standardni
lek ili pilulu bez ikakvog aktivnog sastojka (tzv. placebo). Pri tome je od
posebne vanosti da se a) svaki subjekt sluajnim putem dodeli jednoj od dve
grupe, i b) da niti uesnici u eksperimentu (pacijenti) ni medicinski personal
koji im daje lekove ne znaju ko prima lek a ko placebo. Nakon odreenog
vremena uporeuje se zdravstveno stanje pacijenata u obe grupe i testira da li je
dobijena razlika statistiki znaajna. Usled ovako postavljenog
eksperimentalnog plana, ako eksperimentalna grupa u proseku pokae bolje
rezultate od kontrolne, moe se zakljuiti da je novi lek efikasniji od
standardnog, odnosno da ima pozitivan efekat.
Statistike testove u sluaju dva uzorka moemo koristiti i u drugim
situacijama. Na primer, radi provere pretpostavke da su LCD televizori dva
proizvoaa istog kvaliteta u pogledu prosenog trajanja, da su prosena
primanja zaposlenih u jednom gradu vea za 100 evra u odnosu na primanja u
drugom, da nema razlike u prosenoj duini studiranja na dravnim i
privatnim fakultetima, da je u proizvodnji MP3 plejera uee neispravnih kod
jednog proizvoaa manje nego kod drugog i slino. Vidimo da predmet
testiranja ne mora biti sama vrednost jednog parametra u dva skupa, ve
razlika izmeu ovih vrednosti. Ipak zadraemo se samo na hipotezama o
jednakosti parametara dva skupa (preciznije njihovih aritmetikih sredina). Ako
dva skupa obeleimo sa 1 i 2, a vrednosti aritmetikih sredina u njima sa 1 i 2,
nulte a alternativne hipoteze moemo postaviti na sledee naine::

A. H0 : 1 = 2 H1 : 1 2 dvosmerna alternativna hipoteza


B. H0 : 1 2 H1 : 1 > 2 jednosmerna alternativna hipoteza
C. H0 : 1 2 H1 : 1 < 2 jednosmerna alternativna hipoteza
POGLAVLJE 8 Testiranje statistikih hipoteza 195

Nultu hipotezu testiramo po identinom postupku kao do sada. Statistika testa i


ovde u sutini ima generalni oblik (8.1), s tim to se umesto vrednosti jednog
parametra ovde testira razlika izmeu parametara dva skupa.
Ocena razlike - Hipotetina vrednost razlike
Statistika testa =
Standardna greka ocene razlike

Ograniiemo se samo na sluaj kada su oba sluajna uzorka meusobno


nezavisna, odnosno kada izbor bilo kog elementa u jedan uzorak ne zavisi od
izbora elemenata u drugi uzorak.

8.4.1 Testiranje hipoteze o jednakosti


aritmetiki sredina dva skupa

Z test
Osnovne informacije vezane za primenu Z testa u sluaju testiranja jednakosti
aritmetikih sredina dva skupa prikazane su u Tabeli 8.6.
Tabela 8.6 Testiranje hipoteze o razlici aritmetikih sredina dva skupa
primenom Z testa

Uslovi za primenu Z testa:


1) Osnovni skupovi imaju normalan raspored ili moe da se primeni
Centralna granina teorema, odnosno oba uzorka imaju najmanje 30
elemenata.
2) Standardne devijacije (ili varijanse) oba osnovna skupa su poznate.
(X 1 X 2 ) ( 1 - 2 ) 0
Statistika testa: Z = (8.7)
12 22
+
n1 n2
pod uslovom da je H0 istinita ima standardizovan normalan raspored .

Identina ogranienja vezana za primenu Z i t-testa pri testiranju aritmetike


sredine jednog skupa vae i ovde. Dakle, Z test se zasniva na nerealnoj
pretpostavci da su standardne devijacije oba skupa poznate, pa u praksi
preporuujemo primenu t testa.
Testiranje hipoteze o jednakosti aritmetikih sredina dva skupa
sprovodimo analogno testiranju u sluaju jednog uzorka. Iz oba skupa uzeemo
po jedan prost sluajan uzorak, kao na Slici 8.3.
196 OSNOVI STATISTIKE

Skup 1 Skup 2

Da li postoji razlika?

1 2

x1 x2
Uzorak 1 Uzorak 2
Slika 8.3 Grafiki prikaz testiranja jednakosti aritmetike sredine dva skupa
Ideja testiranja je u sledeem: ako je nulta hipoteza istinita, tj. ako su aritmetike
sredine dva skupa meu sobom jednake, onda oekujemo da razlike izmeu
aritmetikih sredina uzoraka, izabranih iz dva skupa, bude relativno male.
Takve razlike emo pripisati sluajnom kolebanju uzoraka. U suprotnom, ako
su razlike izmeu aritmetikih sredina uzoraka relativno velike, onda emo ih
tretirati kao argumente protiv nulte hipoteze, koju emo odbaciti uz izabrani
nivo znaajnosti.
Kao to znamo, ako osnovni skup ima normalan raspored, onda i
aritmetike sredine uzoraka iz tog skupa slede normalan raspored. U statistici je
pokazano da razlika aritmetikih sredina uzoraka izabranih iz dva normalno
rasporeena osnovna skupa ima normalan raspored.
X 1 X 2 : N ( 1 2 , X2 1 + X2 2 ) .

Poto razlika aritmetikih sredina uzoraka sledi normalan raspored,


testiranje hipoteze o jednakosti aritmetikih sredina dva skupa emo sprovesti
primenom Z testa. Statistika Z testa glasi:
X1 X2
Z = ,
X 1 X 2

Na osnovu statistike testa vidimo da hipotezu o jednakosti aritmetikih sredina


dva skupa testiramo na osnovu razlike izmeu aritmetikih sredina izabranih
uzoraka.
X 1 X 2
je standardna greka razlike aritmetikih sredina dva uzorka i
izraunavamo je po formuli:
POGLAVLJE 8 Testiranje statistikih hipoteza 197

12 22
X 1 X 2 = + (8.8)
n1 n2

Dakle, statistiku Z moemo napisati u sledeem obliku:

X1 X2
Statistika Z testa Z = (8.9)
/ n 1 + 22 / n 2
2
1

Pod uslovom da je H0 istinita, statistika Z ima standardizovan normalan


raspored.

PROBLEM 8.4: Radi ispitivanja da li novi lek, Topiramejt, ima efekta pri
leenju migrene, formirane su dve grupe (eksperimentalna i kontrolna) od po
osam pacijenata. Rezultati o mesenom broju migrena su objavljeni u
februaru 2004. godine u asopisu Science News9:

Topiramejt 3 3 2 4 3 4 3 5

Placebo 3 3 5 5 7 5 5 4

Da li Topiramejt uzrokuje smanjenje prosenog broja javljanja migrena?


(pretpostavimo da oba skupa imaju normalan raspored i da su varijanse
skupova poznate i da iznose u eksperimentalnoj grupi 1 a u drugoj 1,7).

REENJE
Postavimo najpre nultu i alternativnu hipotezu. Budui da istraivako
pitanje glasi da li lek uzrokuje smanjenje, jasno je da se zahteva primena
jednosmernog testa. Oznaavajui Topiramejt grupu sa 1, a kontrolnu
(placebo) sa 2, nulta i alternativna hipoteza glase :
H0 : 1 2 H1 : 1 < 2
Budui da nivo znaajnosti nije dat uzeemo = 0, 05 .

Kako su varijanse poznate, a trai se poreenje aritmetikih sredina,


odabraemo Z test.
Proverimo da li su ispunjeni preduslovi:
1) Osnovni skupovi su normalno rasporeeni ispunjeno
2) Varijanse oba skupa su poznate ispunjeno
Da bismo izraunali statistiku testa moramo najpre odrediti aritmetike

9 The Science News, 165, No. 9, 28 februar 2004.


198 OSNOVI STATISTIKE

sredine uzoraka:
x 1 = 27/8 = 3,375 x 2 = 37/8 = 4,625
Na osnovu formule (8.9) realizovana vrednost statistike Z testa jednaka je:
x1 x2 3, 375 4,625
Z = = = -2,15
/n 1 + /n 2
2
1
2
2
1/8 + 1,7 /8

p-vrednost izraunavamo kao kod svakog Z testa (Slika 8.2):


P(Z z) = P(Z 2,15) = 0,0158 .

Poto je p-vrednost manja od 0,05 nultu hipotezu odbacujemo. Zakljuujemo,


uz rizik od 0,05, da Topiramejt statistiki znaajno smanjuje prosean broj
dana u mesecu u kojima se javlja migrena.
Na kraju prikaimo rezultate navedenog problema pomou kompjuterskog
izlaza iz Excela.
z-Test: Two Sample for Means

Topiramejt Placebo
Mean 3,375 4,625
Known Variance 1 1,7
Observations 8 8
Hypothesized Mean Difference 0
z -2,151657415
P(Z<=z) one-tail 0,015712173
z Critical one-tail 1,644853627
P(Z<=z) two-tail 0,031424347
z Critical two-tail 1,959963985

Primetimo da izborom nivoa znaajnosti od 0,01 ne bismo mogli da odbacimo


nultu hipotezu, pa bismo zakljuili da novi lek nije efikasan! To je jo jedan
primer koji govori u prilog miljenju velikog broja autora da p-vrednost ne
treba porediti sa rizikom , ve da treba prepustiti donosiocu odluke da na
osnovu realizovanog nivoa znaajnosti odredi smer svoje akcije.

Studentov t test
Studentov test kojim se porede aritmetike sredine dva skupa je jedan od
najvanijih i u praksi najee korienih testova. Kao i kod Z testa
zadraemo se samo na sluaju kada je hipotetina vrednost razlike
aritmetikih sredina dva skupa jednaka nuli
Osnovne informacije vezane za primenu t testa u sluaju testiranja jednakosti
aritmetikih sredina dva skupa prikazane su u Tabeli 8.7.
POGLAVLJE 8 Testiranje statistikih hipoteza 199

Tabela 8.7 Testiranje hipoteze o jednakosti aritmetikih sredina dva skupa


primenom t testa (nepoznate varijanse skupova su meu sobom jednake)

Uslovi za primenu t testa:


1) Oba osnovna skupa imaju normalan raspored ili moe da se primeni
Centralna granina teorema (oba uzorka imaju najmanje 30 elemenata).
2) Nepoznate varijanse dva skupa su meu sobom jednake ( 12 = 22 )

(X 1 X 2 ) ( 1 2 ) 0 (8.10)
Statistika testa: t =
S X 1 X 2

1 1 (n 1 1) S 12 + (n 2 1) S 22
S X 1 X 2 = S P + SP = (8.11)
n1 n2 n1 + n2 2

pod uslovom da je H0 istinita ima Studentov raspored sa n 1 + n 2 - 2


stepeni slobode.

. Primetimo, takoe, da je pored uslova normalnosti uveden i dopunski


uslov da su varijanse dva skupa meu sobom jednake. Ovaj uslov se u statistici
naziva pretpostavkom homogenosti varijansi, a t test koji se na njemu zasniva
naziva se ponderisani t test (eng. pooled t test). Problem sa praktinom
primenom ovog testa je to ne postoji pouzdan nain provere ispunjenosti
pretpostavke homogenosti varijansi10. Ipak, radovi objavljeni u drugoj polovini
XX-og veka pokazuju da se ponderisani t test moe koristiti i kada je
pretpostavka homogenosti varijansi naruena, ali pod uslovom da oba uzorka
imaju jednak broj elemenata. Zbog toga postoji preporuka istraivaima da
istraivanje sprovode na uzorcima jednake veliine.
Razlog za primenu ponderisanog t testa se nalazi u problemu11 koji
sobom nosi primena t statistike, koju dobijamo kada u formuli statistike Z testa
(8.10), nepoznate varijanse skupova, 12 i 22 , samo zamenimo njihovim
ocenama, tj. sa S12 i S 22 . Pored toga to ova statistika ima samo priblino t
raspored, broj stepeni slobode se u ovom sluaju izraunava primenom veoma
sloenog obrasca, i esto se dobija decimalan broj12. Upravo iz tog razloga, ovde
smo se opredelili za ponderisani t test, mada se on poslednjih godina, sa sve

10 Testovi koji ispituju jednakost varijansi dva skupa (recimo F test) su neprecizni,
jer strogo zahtevaju da oba skupa imaju normalan raspored.
11 Ovaj problem poznat je u literaturi pod nazivom Fier-Berensov problem.

12U literaturi je predloeno vie predloga kako da se odredi broj stepeni slobode.
Najpoznatiji predlog je tzv. Velova (Bernard Lewis Welch 1911.-1989.) korekcija
broja stepeni slobode koja se koristi, izmeu ostaloga u Excelu, Minitabu i EduStatu.
200 OSNOVI STATISTIKE

irom upotrebom statistikih softvera polako naputa.


Ponderisani t test je dobio naziv po tome to se standardna greka rauna
na osnovu ponderisane aritmetike sredine varijansi dva uzorka, koja
predstavlja ponderisanu ocenu jednakih varijansi dva skupa. Takva,
ponderisana, ocena varijanse S P2 izraunava se po formuli:

(n 1 1) S 12 + (n 2 1) S 22
S P2 =
n1 + n2 2
(indeks p ukazuje da je re o ponderisanoj oceni iste varijanse u oba skupa, pa
je ne treba dovoditi u vezu sa ocenom varijanse proporcije uzorka, S p2 ).

Usled toga, statistika ponderisanog t testa glasi:

Statistika X1 X2
t= (8.12)
t testa SP (1/ n 1 + 1/ n 2 )

Pod pretpostavkom da je H0 istinita, statistika testa (8.12) ima Studentov


raspored sa n1 + n2 - 2 stepeni slobode.
PROBLEM 8.5: Pretpostavimo da varijanse dva skupa u prethodnom
problemu (8.4) nisu poznate, ali da su jednake. Odaberite optimalni test i
ispitajte da li je Topiramejt efikasniji od placeba.
REENJE
Nulta i alternativna hipoteza imaju identini oblik kao i kod Z testa. Dakle:
H0 : 1 2 H1 : 1 < 2 = 0,05
Budui da testiramo razliku izmeu aritmetikih sredina dva skupa, da su
skupovi normalno rasporeeni i da su njihove varijanse nepoznate ali
jednake, kao optimalni test biramo ponderisani t test.
Lako je proveriti da smo u postavci problema naveli da su ispunjena
oba preduslova za primenu ponderisanog t-testa.
Da bismo izraunali vrednost statistike testa datu formulom (8.12),
potrebno je da izraunamo varijanse oba uzorka (aritmetike sredine uzoraka
smo ve izraunali prilikom reavanja problema 8.4.):

s12 =
xi
2
n1 x 2
=
97 8 3,3752
= 0,84
n1 1 8 1

s22 =
xi
2
n2 x2
=
183 8 4,6252
= 1,69
n2 1 8 1

Na osnovu dobijenih vrednosti izraunavamo ponderisanu ocenjenu


vrednost varijansi u oba skupa na osnovu formule (8.11):
POGLAVLJE 8 Testiranje statistikih hipoteza 201

(8 1) 0,84 + (8 1) 1,69
s P2 = = 1, 265 ,
8+82
odakle je s P = 1,09. Vrednost statistike ponderisanog t testa izraunavamo
po formuli (8.12):
x1 x2 3, 375 4,625
t = = = 2, 22 .
s P (1/ n 1 + 1/ n 2 ) 1,125 1/8 + 1/8

Testiranje emo sprovesti primenom p-vrednosti, odnosno, odrediemo


interval u kome se ona nalazi, vodei rauna da statistika testa sledi t
raspored sa 8 + 8 - 2 = 14 stepeni slobode. U Tablici 2 prvo nalazimo red koji
odgovara broju stepeni slobode, =14. Kao to smo objasnili, koristiemo
apsolutnu vrednost statistike t testa, tj. 2,22, i nai kritine vrednosti izmeu
kojih se ona nalazi. Vidimo da je 2,1448 < 2,2, < 2,624. Verovatnoe u
zaglavlju koje odgovaraju ovim kritinim vrednostima su 0,025 i 0,01, iz ega
sledi: 0,01 < p-vrednost < 0,025.
Da bismo odredili preciznu p-vrednost, ovde emo primeniti statistiki
paket SPSS, sa sledeim izlazom.
Independent Samples Test

t-test for Equality of Means

Mean Std. Error


t df Sig. (2-tailed) Difference Difference
TOPIRAME Equal variances
-2,220 14 ,043 -1,2500 ,56300
assumed
Equal variances
-2,220 12,564 ,045 -1,2500 ,56300
not assumed

Ali, kao to smo ve rekli, primenom ovog paketa nije mogue testirati
jednosmerne hipoteze, ve samo dvosmerne, pa u izlazu ne moemo ni
dobiti p-vrednost jednosmernog testa. Da bismo ipak utvrdili tanu vrednost
ove verovatnoe, potrebno je da p-vrednost dvosmernog testa, koja iznosi
0,043, podelimo sa 2, na osnovu ega dobijamo P=0,0215. Budui da je P<
nultu hipotezu odbacujemo uz rizik = 0,05. Samim tim, zakljuujemo da
Topiramejt statistiki znaajno smanjuje prosean broj dana u mesecu u
kojima se javlja migrena.

REZIME
Testiranje hipoteza je statistika procedura u kojoj se podaci uzorka koriste da
bi se donela odluka da li neku tvrdnju (ili postavku) o nekoj karakteristici skupa
treba odbaciti ili ne odbaciti. U ovom poglavlju izuavali smo dva parametarska
testa (Z i t) i njihovu primenu u sluaju jednog i dva uzorka. Pri tome smo kao
karakteristike skupa posmatrali njegove parametre, konkretno aritmetiku
sredinu i proporciju. Parametarski testovi se zasnivaju na pretpostavci da
202 OSNOVI STATISTIKE

izuavana pojava, odnosno osnovni skup, ima normalan raspored.


Z test smo koristili 1) pri testiranju aritmetike sredine jednog skupa u
(nerealnom) sluaju da je poznata standardna devijacija toga skupa, , 2) pri
testiranju jednakosti aritmetikih sredina dva skupa uz pretpostavku da su
standardne devijacije oba skupa poznate, 3) prilikom testiranja proporcije
jednog skupa ako statistika testa ima priblino normalan raspored.
Studentov t-test se nikada ne koristi pri testiranju proporcije skupa.
Koristili smo ga u dva sluaja: 1) pri testiranju aritmetike sredine skupa kada je
standardna devijacija skupa nepoznata, i 2) kod testiranja jednakosti
aritmetikih sredina dva skupa (uz uslov da oba skupa imaju nepoznate (ali
jednake) standardne devijacije).
Logika testiranja hipoteza se zasniva na pronalaenju dovoljno dokaza
u uzorku kako bi se nulta hipoteza odbacila. Budui da ne raspolaemo sa
svim podacima o skupu, odluku o odbacivanju ili neodbacivanju nulte hipoteze
uvek donosimo uz izvestan rizik da smo doneli pogrenu odluku. Ukoliko
odbacimo istinitu nultu hipotezu inimo greku prve vrste, a verovatnoa da se
takva greka javi naziva se nivo znaajnosti testa i obeleava sa .
Da bismo doneli odluku o "sudbini" nulte hipoteze moramo da
postavimo pravilo odluivanja. U statistici postoje dva koncepta po ovom
pitanju. Po jednom odluka se donosi na osnovu kritinih vrednosti i formiranja
oblasti odbacivanja. Po drugom potrebno je da se izrauna p-vrednost. P-
vrednost je verovatnoa da statistika test uzme vrednost koja je jednaka ili
jo vie ekstremna od realizovane, pod uslovom da je nulta hipoteza istinita.
Pravilo odluivanja na osnovu p-vrednosti glasi: nulta hipoteza se odbacuje
ako je p-vrednost manja od odabranog nivoa znaajnosti, . Kada odbacimo
nultu hipotezu automatski usvajamo alternativnu kao tanu, ali obavezno uz
odgovarajui rizik greke. Ako je p-vrednost vea od nivoa znaajnosti nemamo
dovoljno dokaza da odbacimo nultu hipotezu. Nultu hipotezu nikada ne
usvajamo kao tanu.
Prilikom testiranja hipoteza vodimo rauna o sledeem:
1. Nulta hipoteza kod parametarskih testova se uvek odnosi na odreenu
vrednost parametra skupa (recimo ), a ne na statistiku uzorka (recimo X ).
2. Iskaz o nultoj hipotezi uvek sadri znak jednakosti, bilo da se radi o prostoj ili
sloenoj hipotezi. Alternativna hipoteza nikada ne sadri znak jednakosti).
3. Uvek prilikom tumaenja koristimo izraz statitika znaajnost, a ne samo
znaajnost.
4. Nikada rezultate testiranja ne tumaimo kao kod ocenjivanja reima uz
pouzdanost.
5. U statistici je pogreno pri neodbacivanju nulte hipoteze interpretirati
rezultat reima da se nulta hipoteza usvaja. U statistici nikada ne usvajamo
nultu hipotezu, moemo je samo odbaciti ili ne odbaciti.
POGLAVLJE 8 Testiranje statistikih hipoteza 203

KLJUNI NOVI POJMOVI

Nulta hipoteza Alternativna hipoteza


Greka prve vrste Greka druge vrste
Nivo znaajnosti Jaina testa
Statistika testa p-vrednost
Dvosmerni test Statistika znaajnost
Parametarski test Jednosmerni test
Studentov t-test Z test

KONTROLNA PITANJA I ZADACI

1. Kada u statistikoj analizi primenjujemo ocenjivanje, a kada testiranje?


2. Objasnite razliku izmeu nulte i alternativne hipoteze.
3. Kada primenjujemo jednosmerni, a kada dvosmerni test?
4. U emu je razlika izmeu parametarskih i neparametarskih testova?
5. Koji test primenjujemo ako testiramo hipotezu o aritmetikoj sredini skupa, a
standardna devijacija tog skupa je nepoznata?
6. Koji su neophodni uslovi da bi se primenio Z test u ispitivanju hipoteze o
proporciji jednog skupa?
7. Kada odbacujemo nultu hipotezu primenom p-vrednosti?
8. Kada u statistici usvajamo nultu hipotezu kao tanu?
9. U emu je razlika izmeu greke prve i druge vrste? A rizika greke prve i
druge vrste?
10. Proizvoa automobilskih guma tvrdi da je prosean vek trajanja vei od 40000
kilometara, a da je standardna devijacija 5000 km. Ako je u uzorku od 150 guma
prosena duina trajanja 40700 km, ispitajte, uz rizik = 0,05, da li se moe
prihvatiti tvrdnja proizvoaa?
11. U sluajnom uzorku od 25 pakovanja jednog proizvoda prosena teina iznosi
489 grama. Propisana teina pakovanja je 500 grama, a standardna devijacija
iznosi 15 gr. Ako teina pakovanja ima normalan raspored, utvrdite da li se na
osnovu informacije iz uzorka moe zakljuiti da teina pakovanja odstupa od
standarda? (rizik = 0, 01).
12. U reklami jednog servisa se tvrdi da proseno vreme opsluivanja jednog
klijenta iznosi manje od 30 minuta, a da je standardna devijacija 7 minuta. Ako
smo u sluajnom uzorku od 36 klijenata zabeleili proseno vreme opsluivanja
od 28 minuta, ispitajte, uz rizik od 0,01, da li moemo prihvatiti tvrenje servisa
kao tano?
204 OSNOVI STATISTIKE

13. U sluajnom uzorku od 100 vozaa, 77 vozaa je koristilo sigurnosni pojas. Da li


na osnovu uzorka moemo prihvatiti hipotezu da vie od 75% vozaa koristi
sigurnosni pojas?
14. Nabavlja katodnih cevi e prihvatiti poiljku ako je proseno vreme trajanja
vee od 5000h. U uzorku od devet cevi dobijeni su sledei rezultati: x = 5060
i s2 = 2500. Pod pretpostavkom da trajanje cevi ima normalan raspored,
zakljuite, primenom p-vrednosti, da li poiljku treba prihvatiti.
15. Propisani prenik kuglinih leaja je 5cm, sa standardnom devijacijom 0,lcm. U
sluajnom uzorku od 100 kuglinih leaja prosena duina prenika je 5,07 cm.
Zakljuite da li proizvod odgovara propisanom standardu; rizik = 0,05.
16. Iz prispele poiljke od 1000 pakovanja kafe, ija je ugovorena teina 200 gr, a
varijansa 49 gr2 formiran je uzorak od 80 pakovanja. Prosena teina u uzorku
je 198,5 gr. Uz rizik = 0,05 proverite da li poiljka zadovoljava ugovorom
predvienu teinu.
17. Od 500 kupaca u jednoj prodavnici u toku jednog dana, sluajnim putem smo
odabrali 100 i zabeleili da je prosena vrednost njihovih kupovina 758 dinara.
Prodavac tvrdi da je proseni dnevni pazar manji od 780 dinara, a da varijansa
iznosi 2 = 10000. Ispitajte, na osnovu p-vrednosti, da li moemo prihvatiti
tvrenje prodavca. ta ete zakljuiti ako je = 0,05, a ta ako je = 0,01?
18. Ako je u sluajnom uzorku od 60 elemenata aritmetika sredina jednaka 25,
testirajte, uz rizik =0,05 sledee hipoteze:
H0 : = 28, H1 : 28
H0 : 23, H1 : > 23
H0 : 27, H1 : < 27
Varijansa osnovnog skupa je 150.
19. Proizvod odgovara standardima ako je njegov radni vek dui od godinu dana.
U uzorku od 200 proizvoda proseno vreme trajanja bilo je 11,5 meseci, tj. 0,958
godina. Odredite, uz rizik =0,05, da li se proizvoa pridrava standarda, ako
je varijansa u uzorku 2,l godina.
20. Standardna devijacija osnovnog skupa je 500. Ako je u uzorku od 35 elemenata
aritmetika sredina jednaka 8800, ispitajte, uz rizik greke I vrste od 0,01 da li se
moe prihvatiti pretpostavka da je aritmetika sredina skupa manja od 9000?
Izraunajte p-vrednost.
21. Ako je u uzorku od 12 studenata prosean broj poloenih ispita u jednom
ispitnom roku 2,7, a standardna devijacija 0,4, ispitajte da li se moe prihvatiti
pretpostavka da je prosean broj poloenih ispita u skupu od 100 studenata
manji od 3? Rizik je 0,01.
22. Na osnovu informacije uzorka od 100 anketiranih odraslih osoba, od kojih je 85
izjavilo da prati politike informativne emisije na TV, ispitajte da li se mogu
prihvatiti sledee pretpostavke:
a) da je gledanost vea od 80%;
b) da je gledanost manja od 90%.
POGLAVLJE 8 Testiranje statistikih hipoteza 205

23. Ako je broj "uspeha" u uzorku od 100 elemenata jednak 73, testirajte sledee
hipoteze:
a) H0 : 0,71, H1 : > 0,71
b) H0 : = 0,70, H1 : 0,70
c) H0 : 0,745, H1 : < 0,745
Uporedite rezultate i objasnite ih.
24. U uzorku od 30 studenata drutvenih fakulteta proseno vreme uenja u toku
dana je 150 minuta, a standardna devijacija 14 minuta. U sluajnom uzorku od
40 studenata tehnikih fakulteta, proseno vreme uenja je 160 minuta, sa
standardnom devijacijom 10 minuta. Testirajte nultu hipotezu da studenti dve
grupe fakulteta u proseku provode isto vreme u uenju; pretpostavka je da su
varijanse oba skupa jednake medu sobom.
25. Ako je u uzorku od 10 prodavnica tampe u gradu A, prosena mesena
prodaja jednaka 4000 dnevnih listova i asopisa, a u uzorku od 8 novinarnica u
gradu B ona iznosi 4300, ispitajte da li se gradovi razlikuju u kupovini tampe.
Standardna devijacija u prvom uzorku je 200 komada, a u drugom 250;
pretpostavlja se da su varijanse skupova meu sobom jednake.
26. U jednoj auto kui, koja se bavi prodajom stranih automobila, anketirano je 400
potencijalnih kupaca i konstatovano da je kod 250 potencijalnih kupaca
prethodni automobil bio domae proizvodnje.
a) Ispitati tvrdnju agenta ove auto kue da je kod 70% potencijalnih kupaca
prethodni automobil bio automobil domae proizvodnje.
b) Uz rizik greke 0,05, ispitati tvrdnju agenta ove auto kue da je proporcija
potencijalnih kupaca iji je prethodni automobil bio automobil domae
proizvodnje manja od 75%.
c) Uz rizik greke 0,05, ispitati tvrdnju agenta ove auto kue da je proporcija
potencijalnih kupaca iji prethodni automobil nije bio automobil domae
proizvodnje vea od 20%.
27. Na osnovu anketiranja 30 nezaposlenih lica koja se nalaze na birou za
zapoljavanje izraunata je njihova prosena starost 30,77 godina i standardna
devijacija 8,62 godine.
a) Uz nivo znaajnosti testa 0,05, ispitati da li se moe prihvatiti pretpostavka
da prosena starost nezaposlenih lica znaajno odstupa od 26 godina.
b) Uz nivo znaajnosti testa 0,05, ispitati da li se moe prihvatiti pretpostavka
da je prosena starost nezaposlenih lica vea od 28 godina.
c) Uz nivo znaajnosti testa 0,05, ispitati da li se moe prihvatiti pretpostavka
da je prosena starost nezaposlenih lica manja od 34 godine.