Escolar Documentos
Profissional Documentos
Cultura Documentos
Vom prezenta acest test cu ajutorul unui exemplu, pe care îl vom folosi şi pentru
a introduce noţiunile fundamentale ale testelor parametrice: ipoteză de nul, ipoteză
alternativă, statistică a testului şi regulă de decizie.
Un cercetător presupune că într-un anumit an, media aritmetică a punctajelor
obţinute la examenul de rezidenţiat al medicilor este de 800. Pentru a testa această
ipoteză, cercetătorul alcătuieşte un eşantion aleatoriu de 130 de medici care şi-au
susţinut rezidenţiatul în acel an şi constată că la nivelul acestui eşantion media
aritmetică a punctajului obţinut este de 755. Prin investigaţii extensive, cercetătorul ştie
că abaterea standard la nivelul populaţiei de referinţă este de aproximativ 152. Problema
care se pune este dacă diferenţa dintre media aritmetică a eşantionului şi valoarea
presupusă pentru populaţie este sau nu statistic semnificativă. Dacă răspunsul este
afirmativ, atunci ipoteza făcută poate fi respinsă. Dacă, însă, răspunsul este negativ,
atunci diferenţa poate fi pusă pe seama întâmplării, astfel că ipoteza cercetătorului nu
poate fi respinsă. După cum vom vedea, testul scorurilor Z permite determinarea
7 TESTAREA IPOTEZELOR DESPRE O SINGURĂ POPULAŢIE Pagina 2 din 12
Populaţie Eşantion
μH = 800 X 755
σ = 152 n = 130
H0: μ = μH
H0: μ μH = 0
Ha: μ μH
Dacă, însă, sensul diferenţei dintre eşantion şi populaţie poate fi prezis sau dacă
cercetătorul este interesat doar de un singur sens al diferenţei, atunci ipoteza alternativă
poate lua una dintre următoarele două forme:
Ha: μ μH
Ha: μ μH
În cazul în care Ha are forma μ μH, se spune că testul este bilateral sau non-
direcţional, iar în cazurile în care Ha are una dintre celelalte două forme, se spune că
testul este unilateral sau direcţional. Vom reveni la aceste noţiuni ceva mai departe. Să
reţinem deocamdată că în orice test se decide dacă se respinge sau nu se respinge
ipoteza de nul, pe baza dovezilor aduse în sprijinul ipotezei alternative. Astfel, dacă
putem respinge H0 ca neadevărată, atunci vom accepta Ha.
7 TESTAREA IPOTEZELOR DESPRE O SINGURĂ POPULAŢIE Pagina 3 din 12
Revenind la exemplul nostru, ipoteza de nul este H0: μ = 800. Din enunţul
problemei rezultă că nu este vorba despre un sens al diferenţei menţionate, astfel că
ipoteza alternativă este Ha: μ 800.
Termenul statistică a testului se referă la formula a cărei aplicare în testul
respectiv permite obţinerea unei valori ce formează baza deciziei asupra ipotezei de nul.
Pentru mediile aritmetice, atunci când se cunoaşte sau se poate aproxima valoarea lui σ,
statistica testului este dată de următoarea formulă:
X H
Formula 7.1 Z
n
X H 755 800 45 45
Z 3,36
n 152 130 152 11,40 13,4
Din motive care vor deveni imediat evidente, vom desemna rezultatul aplicării formulei
7.1 prin Z (obţinut). Aici, Z (obţinut) = 3,36.
Regula de decizie se referă la o anumită amplitudine de valori pentru rezultatul
statisticii testului, numită zonă critică sau zonă de respingere, care conduce la
respingerea ipotezei de nul. În cazul testului scorurilor Z pentru medii aritmetice, zona
critică se stabileşte cu ajutorul distribuţiei de eşantionare a X . Astfel, în exemplul de
mai sus, eşantionul alcătuit este unul dintre toate eşantioanele posibile cu n = 130 din
populaţia de referinţă. Să presupunem că H0 este adevărată, Dacă s-ar calcula toate
mediile aritmetice posibile, atunci teorema limitei centrale asigură următorul rezultat:
755 μ = 800
dacă rezultatul statisticii testului este un număr negativ „prea mare” sau un număr
pozitiv „prea mare”. Înţelesul expresiei „prea mare” se fixează prin alegerea unui nivel
de încredere sau nivel α (revedeţi capitolul anterior). În cazul ipotezei alternative de
forma Ha: μ μH, nivelul α ales se împarte în mod egal în cele două extremităţi ale
distribuţiei de eşantionare:
α/2 α/2
Zα/2 Zα/2
Aria de sub Zα/2 plus aria de peste +Zα/2 reprezintă zona critică: dacă scorul Z
corespunzător mediei aritmetice a unui eşantion cade în această arie (i.e. sub Zα/2 sau
peste +Zα/2), atunci media aritmetică respectivă are prin definiţie o probabilitate de
apariţie mai mică decât α. Scorurile Zα/2 şi +Zα/2 se numesc scoruri Z critice şi se
desemnează, respectiv, prin Zα/2 (critic) şi +Zα/2 (critic).
Să revenim iarăşi la exemplul nostru şi să stabilim α = 0,05. Ştim că pentru
această valoare a lui α, Zα/2 = 1,96. Z (obţinut) se află în zona critică (3,36 1,96),
după cum se ilustrează în figura următoare:
1,96 0 1,96
-3,36
Se respinge H0, dacă Z (obţinut) +Zα/2 (critic) sau dacă Z (obţinut) Zα/2 (critic)
Într-un test unilateral sau direcţional, dacă cercetătorul crede că valoarea efectivă a
parametrului este mai mare decât valoarea presupusă, Ha ia forma μ μH, iar pentru un
test în sensul opus, Ha ia forma μ μH.. În cazul unui test unilateral, întreaga zonă critică
specificată de nivelul α este plasată în extremitatea de interes a distribuţiei de
eşantionare. De pildă, într-un test bilateral în care α = 0,05, zona critică începe de la Zα/2
(critic) = 1,96. Într-un test unilateral, la acelaşi nivel α, Zα (critic) este +1,65 dacă este
vorba despre extremitatea superioară (dacă Ha este de forma μ μH) şi este 1,65 dacă
este vorba despre extremitatea inferioară (dacă Ha este de forma μ μH)1. De notat că
aici folosim Zα în loc de Zα/2, întrucât întreaga zonă critică este plasată într-o singură
extremitate a distribuţiei de eşantionare.
Într-un test unilateral, indiferent de nivelul α ales, dacă Ha este de forma μ μH
(„test unilateral dreapta”), atunci regula de decizie este
Dacă Ha este de forma μ μH („test unilateral stânga”) atunci regula de decizie este
După cum rezultă şi din cele de mai sus, un test unilateral este mai „bun” decât
unul bilateral, deoarece zona critică este „trasă” mai aproape de media aritmetică,
îmbunătăţind astfel probabilitatea de a respinge H0. Astfel, dacă cercetătorul are mai
multă experienţă şi mai multe cunoştinţe în legătură cu variabila investigată, atunci se
recomandă folosirea unui test unilateral, ceea ce cere o ipoteză alternativă direcţională.
Se obişnuieşte ca testarea ipotezelor statistice să fie organizată sub forma unui
„model în n paşi”, numărul de paşi diferind de la un autor la altul în funcţie de anumite
1
Scădem 0,05 din 0,5 (proporţia de cazuri aflate de o parte şi de alta a mediei aritmetice a distribuţiei de
eşantionare). Rezultatul scăderii este 0,4500. Conform tabelului distribuţiei normale standard, scorul Z
corespunzător acestei proporţii este 1,65.
7 TESTAREA IPOTEZELOR DESPRE O SINGURĂ POPULAŢIE Pagina 6 din 12
H0: μ = 800
Ha: μ 800
X H 755 800 45 45
Z 3,36
n 152 130 152 11,40 13,4
Întrucât Z (obţinut) se află în zona critică (3,36 1,96), ipoteza de nul poate fi
respinsă. Diferenţa dintre eşantionul de medici rezidenţi şi populaţia de referinţă nu
poate fi atribuită întâmplării sau, altfel spus, această diferenţă este statistic semnificativă
(la un nivel de încredere de 95%).
H0: μ = 800
Ha: μ 800
7 TESTAREA IPOTEZELOR DESPRE O SINGURĂ POPULAŢIE Pagina 7 din 12
X H 755 800 45 45
Z 3,36
n 152 130 152 11,40 13,4
Întrucât Z (obţinut) se află în zona critică (3,36 1,65), ipoteza de nul poate fi
respinsă şi se poate accepta că media aritmetică a populaţiei de rezidenţi este mai mică
decât 800 (la un nivel de încredere de 95%).
H0 adevărată H0 falsă
Se respinge Eroare de
H0 tipul I Decizie corectă
Nu se Decizie corectă Eroare de
respinge H0 tipul II
După cum se indică în figura 7.1, H0 este în realitate adevărată sau falsă şi sunt
posibile două decizii: se respinge H0 sau nu se respinge H0. Ca atare, sunt posibile două
decizii corecte: respingerea unei ipoteze de nul false şi nerespingerea unei ipoteze de
nul adevărate. Corespunzător, sunt posibile două decizii greşite: respingerea unei
ipoteze ne nul care este adevărată, numită eroare de tipul I, şi nerespingerea unei
ipoteze de nul care este falsă, numită eroare de tipul II. Probabilitatea de a comite o
eroare de tipul I este desemnată prin α, iar probabilitatea de a comite o eroare de tipul II
este desemnată prin β.
Probabilitatea de a comite o eroare de tipul I este determinată de nivelul α ales.
Astfel, atunci când se alege un nivel α, distribuţia de eşantionare este împărţită în două
mulţimi de rezultate ale eşantioanelor posibile: zona critică, ce include toate rezultatele
definite ca improbabile sau rare şi care îndreptăţesc respingerea H0, şi zona necritică, ce
constă din toate rezultatele definite drept „non-rare”. Cu cât nivelul α este mai mic, cu
atât este mai mică zona critică şi, corespunzător, este mai mare distanţa dintre media
aritmetică a distribuţiei de eşantionare şi începuturile (în cazul unui test bilateral) sau
7 TESTAREA IPOTEZELOR DESPRE O SINGURĂ POPULAŢIE Pagina 8 din 12
începutul (în cazul unui test unilateral) zonei critice. De pildă, dacă se alege α = 0,05,
probabilitatea de a comite o eroare de tipul I este de 0,05: dacă H0 este respinsă, există 5
şanse din 100 ca această decizie să fie greşită; dacă α = 0,01, probabilitatea de a comite
o eroare de tipul I este de 0,01: dacă H0 este respinsă, există doar 1 şansă din 100 ca
această decizie să fie greşită. Prin urmare, pentru a minimiza probabilitatea de a comite
o eroare de tipul I, trebuie să folosim nivele α foarte mici.
Pe de altă parte, cu cât nivelul α este mai mic, cu atât este mai mare zona
necritică şi, păstrând celelalte date constante, este mai puţin probabil ca rezultatul
obţinut pe eşantion să cadă în zona critică, deci este mai mare probabilitatea de a comite
o eroare de tipul II.
Prin urmare, cele două probabilităţi sunt invers proporţionale, nefiind posibil să
le minimizăm pe amândouă: dacă alegem un nivel α foarte mic pentru a pentru a
minimiza probabilitatea de a comite o eroare de tipul I, creşte probabilitatea de a comite
o eroare de tipul II. Cu alte cuvinte, dacă creştem dificultatea de a respinge ipoteza de
nul, probabilitatea de a nu respinge ipoteza de nul atunci când aceasta este falsă creşte.
În mod normal, în ştiinţele omului se doreşte minimizarea probabilităţii erorii de tipul I,
socotită a fi mai gravă decât eroarea de tipul II, astfel că se aleg valori mici pentru α.
În tabelul următor sunt prezentate câteva scoruri Z critice pentru nivele α mai
des folosite, atât pentru teste bilaterale, cât şi pentru teste unilaterale:
De regulă, nivelul α = 0,05 este considerat drept un indicator bun al unui rezultat
semnificativ.
X H
Formula 7.2 Z
s n 1
7 TESTAREA IPOTEZELOR DESPRE O SINGURĂ POPULAŢIE Pagina 9 din 12
Această formulă diferă de formula 7.1 prin aceea că σ este înlocuit cu s, iar n este
înlocuit cu n – 1 pentru a se corecta distorsiunea lui s.
7 TESTAREA IPOTEZELOR DESPRE O SINGURĂ POPULAŢIE Pagina 10 din 12
X H
Formula 7.3 t
s n 1
Vom spune că este vorba despre testul scorurilor t pentru medii aritmetice şi vom
desemna rezultatul aplicării formulei 7.3 prin t (obţinut).
Să presupunem că un cercetător primeşte informaţia neverificată conform căreia
media aritmetică a coeficientului de inteligenţă al participanţilor la fazele naţionale ale
olimpiadelor de matematică din ultimii 10 ani este de aproximativ 125. Pentru a testa
această ipoteză, cercetătorul selectează un eşantion aleatoriu de 20 de olimpici la
matematică din ultimii 10 ani şi constată că media aritmetică a coeficientului de
inteligenţă la nivelul eşantionului este de 123, abaterea standard la nivelul eşantionului
fiind de 8. Cercetătorul este interesat să determine la un nivel de încredere de 99% dacă
media aritmetică a coeficientului de inteligenţă al participanţilor la fazele naţionale ale
olimpiadelor de matematică din ultimii 10 ani este mai mare de 125. Datele problemei
sunt, deci, următoarele:
Populaţie Eşantion
μH = 125 X 123
s=8
n = 20
H0: μ = 125
Ha: μ 125
X H 125 123 2
t 1,09
s n 1 8 19 8 4,36
ultimii 10 ani este mai mare de 125. Rezultatul acestui test este prezentat grafic în figura
următoare:
0
+2,539
+1,09
Se respinge H0, dacă t (obţinut) +tα/2 (critic) sau dacă t (obţinut) tα/2 (critic)
Atunci când variabila de interes nu este de interval sau de raport, astfel încât să
se justifice calcularea mediei aritmetice, se poate utiliza proporţia eşantionului (p) în loc
de media aritmetică. În cele ce urmează, prezentăm un test al ipotezelor pentru proporţii,
aplicabil în cazul eşantioanelor pentru care np 5 şi n(1 p) 5.
În acest test, formula de calcul pentru Z (obţinut) are aceeaşi structură cu
formula 7.1: Z (obţinut) este egal cu mărimea pentru eşantion minus valoarea presupusă
pentru parametrul corespunzător, totul de împărţit la abaterea standard a distribuţiei de
eşantionare. Din capitolul anterior, ştim că proporţiile pentru eşantioane (p) au
distribuţii de eşantionare aproximativ normale, cu media aritmetică (μp) egală cu
proporţia pentru populaţie (P) şi abaterea standard (σp) egală cu P (1 P ) n . Teoretic,
formula de calcul al testului scorurilor Z pentru proporţii este următoarea:
p PH
Formula 7.4 Z
P (1 P ) n
unde PH este proporţia presupusă pentru populaţie. Acum, valoarea proporţiei pentru
populaţie, P, nu este cunoscută. Ca şi în cazul estimării intervalelor pentru proporţii,
putem estima valoarea lui P prin p, lucrând cu formula următoare:
7 TESTAREA IPOTEZELOR DESPRE O SINGURĂ POPULAŢIE Pagina 12 din 12
p PH
Formula 7.5 Z
p (1 p ) n
Populaţie Eşantion
PH = 0,10 p = 0,12
n = 200
H0: P = 0,10
Ha: P 0,10
GLOSAR