Você está na página 1de 61

Testes Paramétricos

(Estimação Intervalar
e
Testes de Hipóteses)

Carlos Agra Coelho

2017
Índice

1 Estimação Intervalar e Testes de Hipóteses 1


1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 IC’s e testes para a média de uma v.a. com distribuição
Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 O caso de variância conhecida . . . . . . . . . . . . . . 7
1.2.2 O caso de variância desconhecida . . . . . . . . . . . . 10
1.3 IC’s e testes para a média da diferença de duas v.a.’s, com
base em duas a.a.’s emparelhadas . . . . . . . . . . . . . . . . 13
1.4 IC’s e testes para a diferença de duas médias, baseados em
duas amostras independentes . . . . . . . . . . . . . . . . . . 15
1.5 IC’s e testes para a variância de uma v.a. com distribuição
Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6 IC’s e testes para a razão de duas variâncias, baseados em
duas amostras independentes . . . . . . . . . . . . . . . . . . 21
1.7 O valor-de-p . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.8 Sobre o dimensionamento das amostras . . . . . . . . . . . . 26
Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

i
Capı́tulo 1

Estimação Intervalar e
Testes de Hipóteses

1.1 Introdução
Neste Capı́tulo vamos focar a nossa atenção nos testes de hipóteses e na
estimação intervalar, i.e. na estimação através da construção de intervalos
de confiança (IC), cujos limites, inferior e superior, são em si duas v.a.’s
(i.e. trata-se de facto de intervalos aleatórios), nos testes de hipóteses e na
relação entre estimação intervalar e testes de hipóteses.
É cada vez mais comum hoje em dia ouvirmos valores de estimativas
de custos ou de previsões de produções ou de determinadas percentagens
que vêm afectados de uma ’margem de erro’. Este valor da ’margem de
erro’, habitualmente designado por α, está intimamente relacionado com a
amplitude de um IC bilateral correspondente a uma probabilidade interna de
(1 − α), onde α deverá ser um pequeno valor de probabilidade (por exemplo,
0.01 ou 0.05) que funciona em termos simples como a ’probabilidade de
erro’ (todos estes conceitos serão apresentados de uma forma mais precisa
ao longo deste Capı́tulo).
Na estimação intervalar pretende-se determinar os limites de um IC,
de modo que o verdadeiro valor do parâmetro que pretendemos estimar se
encontre dentro desses limites. Isto com uma margem de erro associada, a
qual se pretende pequena, ou mesmo, segundo determinada óptica, mı́nima,
isto é, qual possamos de alguma forma controlar, de forma que seja possı́vel
fazermos variar os limites do IC em função dessa margem de erro, a qual se
pretende manter pequena.
Um exemplo muito simples é o seguinte: suponhamos que se sabe (ou se

1
2 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

postula, ou se pensa ser um bom modelo) que o volume de enchimento de


garrafas de determinado refrigerante em determinada linha de enchimento é
uma v.a. com distribuição Normal com determinado valor médio µ e desvio
padrão 0.1 litros, e que decidimos retirar uma a.a de 10 volumes enchidos
nessa linha de enchimento, com o intuito de estimar µ, o verdadeiro valor
médio de enchimento nessa linha de enchimento. Suponhamos que para além
de uma estimativa pontual de µ pretendemos também obter um Intervalo
de Confiança para µ.
Então teremos X como estimador UMVU de µ e como sabemos que
!
σ2 0.01 X −µ
 
X ∼ N µ, ≡ N µ, ⇐⇒ √ ∼ N (0, 1) ,
n 10 0.001

e como podemos facilmente determinar que para Z ∼ N (0, 1),

0.95 = P (−1.96 ≤ Z ≤ 1.96)


 √ √ 
= P −1.96 0.001 ≤ X − µ ≤ 1.96 0.001
 √ √ 
= P −X − 1.96 0.001 ≤ −µ ≤ −X + 1.96 0.001
 
= P X − 0.062 ≤ µ ≤ X + 0.062 ,

de modo que para uma a.a. de dimensão n = 10


h i
X − 0.062, X + 0.062

será um intervalo de confiança para µ correspondente a uma probabilidade


interna ou confiança de 0.95, i.e. afirmamos que o verdadeiro valor de µ se
encontra entre X −0.062 e X +0.062 com uma confiança de 0.95, ou com uma
margem de erro de 1 − 0.95 = 0.05. Utilizando uma linguagem mais comum,
poderı́amos dizer que, face a uma dada a.a. de dimensão 10, x1 , . . . , x10 ,
afirmamos que o verdadeiro valor de µ ficará entre x − 0.062 e x + 0.062
litors litros, e que a esta afirmação está associada uma probabilidade de
erro de 0.05, ou uma confiança de 0.95.
Temos assim a seguinte definição.

Definição: (Intervalo de Confiança bilateral)


Seja X1 , . . . , Xn uma a.a. de dimensão n da distribuição com f.d.p. ou f.m.p.
f ( · ; θ). Sejam S1 = S1 (X1 , . . . , Xn ) e S2 = S2 (X1 , . . . , Xn ) duas estatı́sticas
tais que S1 ≤ S2 e Pθ [S1 ≤ τ (θ) ≤ S2 ] = 1 − α, onde α não depende de θ.
Então o intervalo aleatório (note-se que S1 e S2 são duas v.a.’s) [S1 , S2 ] é
1.1. Introdução • 3

chamado um intervalo de confiança (IC) bilateral para τ (θ), correspondente


a uma probabilidade 1 − α, sendo S1 e S2 respectivamente os limites de
confiança inferior e superior para τ (θ). Um valor realizado do intervalo de
confiança [S1 , S2 ], [s1 , s2 ] é também usualmente ainda chamado um IC, mas
mais precisamente deveria ser designado por estimativa do IC.

Note-se que usualmente S1 e S2 serão estatı́sticas derivadas de esti-


madores, usualmente centrados (e se possı́vel UMVU) do parâmetro ou
função do parâmetro para o qual se pretende determinar o IC.
Note-se que o IC derivado atrás é o que se chama um IC bilateral, sendo
possı́vel também definir e determinar IC’s unilaterais.

Definição: (Intervalos de Confiança unilaterais)


Seja X1 , . . . , Xn uma a.a. de dimensão n da distribuição com f.d.p. ou
f.m.p. f ( · ; θ). Seja S1 = S1 (X1 , . . . , Xn ) uma estatı́stica para a qual
Pθ [S1 ≤ τ (θ)] = 1 − α não depende de θ. Chama-se então a S1 um limite de
confiança unilateral à esquerda de τ (θ), correspondente a uma probabilidade
1 − α, e a
[S1 , +∞[
um intervalo de confiança unilateral à esquerda para τ (θ), correspondente a
uma probabilidade de 1 − α. De forma análoga, seja S2 = S2 (X1 , . . . , Xn )
uma estatı́stica para a qual Pθ [τ (θ) ≤ S2 ] = 1−α não depende de θ. Chama-
se então a S2 um limite de confiança unilateral à direita de τ (θ), correspon-
dente a uma probabilidade 1 − α, e a
]−∞, S2 ]
um intervalo de confiança unilateral à direita para τ (θ), correspondente a
uma probabilidade de 1 − α.

Um IC unilateral à esquerda para µ, correspondente a uma probabilidade


de 1 − α = 0.95, no problema atrás, poderia ser determinado com base nos
seguintes cálculos:
 √ 
0.95 = P (Z ≤ 1.645) = P X − µ ≤ 1.645× 0.001
 √ 
= P −µ ≤ −X + 1.645× 0.001
 
= P µ ≥ X − 0.052

sendo o IC unilateral à esquerda, para µ, correspondente a uma probabilidade


de 0.95, dado por
[X − .052, +∞[
4 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

enquanto que um IC unilateral à direita, para µ, correspondentea uma pro-


babilidade de 1 − α = 0.95 poderia ser obtido com base no facto de que
 √ 
0.95 = P (Z ≥ −1.645) = P X − µ ≥ −1.645× 0.001
 √ 
= P −µ ≥ −X − 1.645× 0.001
 
= P µ ≤ X + 0.052

sendo o IC unilateral à direita, para µ, correspondente a uma probabilidade


de 0.95, dado por
] − ∞, 0.052] .
Embora a utilidade dos IC’s unilaterais poderá neste momento parecer
não muito clara, tudo se tornará mais claro quando se estabelecer a corres-
pondência entre a construção de IC’s e a realização de determinados testes
de hipóteses.
Note-se ainda também que o IC bilateral para µ construı́do atrás, era
centrado em X, embora tal não tenha forçosamente de acontecer. Repare-se
que
[X − 0.0585, X + 0.0665] (1.1)
é também um IC bilateral para µ, correspondente a uma probabilidade in-
terna ou confiança de 0.95, pois
 
P X − 0.0585 ≤ µ ≤ X + 0.0665
 √ √ 
= P X − 1.85× 0.001 ≤ µ ≤ X + 2.10× 0.001
 √ √ 
= P X − 1.85× 0.001 ≤ µ ≤ X + 2.10× 0.001
 √ √ 
= P −1.85× 0.001 ≤ µ − X ≤ 2.10× 0.001
 √ √ 
= P −2.10× 0.001 ≤ X − µ ≤ 1.85× 0.001
!
X −µ
=P −2.10 ≤ √ ≤ 1.85
0.001
= P (−2.10 ≤ Z ≤ 1.85) = P (Z ≤ 1.85) − (1 − P (Z ≤ 2.10))
= 0.9678 − (1 − 0.9821) = 0.9499 ,

no sentido que a probabilidade de o verdadeiro valor de µ estar contido


no intervalo em (1.1) é de 0.95. Face a um dado valor realizado de X, x,
1.1. Introdução • 5

então dir-se-á que temos uma confiança de 0.95 que o verdadeiro valor de µ
esteja entre x − 0.0585 e x + 0.0665, chamando-se então também ao valor
0.95(= 1 − α) o coeficiente de confiança ou grau de confiança.
Embora se possam evidentemente construir IC’s com um qualquer valor
de coeficiente ou grau de confiança entre 0 (zero) e 1, é comum tomar para
coeficiente de confiança um valor elevado, próximo de 1 e os valores 0.95
e 0.99 (e também 0.995 e 0.999) tornaram-se clássicos, primordialmente
porque para muitas das v.a.’s que encontraremos envolvidas na construção
de IC’s terão distribuição Normal, Qui-quadrado, T , ou F e essencialmente,
antes do advento e generalização da utilização dos computadores recorria-
-se à utilização de tabelas de onde se retiravam os valores dos respectivos
quantis dessas v.a.’s para calcular os IC’s.
Uma questão que aqui se poderá colocar desde já ao leitor menos atento
é a seguinte: mas então porque não construı́mos sempre IC’s com 100% de
grau de confiança?
Observe bem como foi realizada a construção dos IC’s apresentados atrás
como exemplo e tente responder a esta questão! (Veja que existe de facto
uma boa razão para que não utilizemos IC’s com 100% de confiança!)
O método de construção de IC’s apresentado é de facto um método
geral. Se pretendermos construir um IC para determinado parâmetro ou
determinada função de dado parâmetro, temos de obter em primeiro lugar
um estimador (usualmente centrado ou mesmo UMVU) desse parâmetro ou
dessa função do parâmetro (o estimador X nos nossos exemplos) e construir
com ele uma v.a. cuja distribuição não dependa nem do parâmetro em causa
nem de outros parâmetros com valor desconhecido (a v.a. Z nos nossos
exemplos).
Os testes de hipóteses serão introduzidos de uma forma um tanto in-
formal, quase que intuitiva, a par com a construção dos correspondentes
intervalos de confiança. Mais tarde a questão dos testes de hipóteses será
abordada mais formalmente.
Quanto aos testes de hipóteses, mesmo para uma abordagem simples,
teremos de definir pelo menos o que se entende por hipótese nula e hipótese
alternativa. Em termos muito simples diremos que a hipótese nula, habi-
tualmente denotada por H0 , representa usualmente o valor do parâmetro que
reflecte de alguma forma o que os conhecimentos assentes até à data pos-
tulam, ou o que a nossa falta de conhecimento sobre o assunto nos levaria
cautelosamente a postular, sendo assim sempre redigida de forma que o
parâmetro em causa (i.e. o parâmetro a ser testado) exibe com o valor pos-
tulado uma relação de igualdade. Por exemplo, num teste ao valor esperado
6 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

ou valor médio de uma v.a., a hipótese nula assume frequentemente a forma

H0 : µ = a ,

onde a representa um determinado valor real. A esta hipótese será contra-


posta uma chamada hipótese alternativa, habitualmente denotada por H1 ,
redigida como o complemento de H0 , ou seja, neste nosso exemplo muito
simples terı́amos,
H1 : µ 6= a .

A hipótese alternativa reflecte habitualmente o que a pessoa que foi


levada a realizar o teste afirma ou ’desconfia’ ser a realidade, a qual contrapõe
ao que H0 afirma.
Considere-se por exemplo o enunciado no exercı́cio 1.1. Neste caso
terı́amos
H0 : µ = 200(cm)
(1.2)
H1 : µ 6= 200(cm)

onde, se X for a v.a. que representa a altura em centı́metros de um pé de


milho, se supõe
X ∼ N (µ, σ 2 ) .

Considere-se agora que o enunciado dizia que o experimentador dizia que


achava que a asserção relativa ao valor médio estava errada mas por excesso.
Terı́amos então
H0 : µ = 200(cm)
(1.3)
H1 : µ < 200(cm) .

Demonstra-se que testar as hipóteses acima, em (1.3) é de facto equivalente


a testar as hipóteses
H0 : µ ≥ 200(cm)
(1.4)
H1 : µ < 200(cm) .

Note-se que em qualquer dos casos H0 mantem o sinal de igualdade entre


o parâmetro em questão e o valor postulado. Designaremos o teste corre-
spondente às hipóteses em (1.2) como teste bilateral (o qual corresponde
de facto à determinação de um IC bilateral para µ – veja-se a secção 11.2
adiante) e o teste correspondente às hipóteses em (1.3) ou (1.4) como teste
unilateral à esquerda, uma vez que corresponde à determinação de um IC
unilateral à esquerda, para µ. Para mais detalhes vejam-se as secções a
seguir.
1.2. IC’s e testes para a média de uma v.a. com distribuição Normal • 7

1.2 IC’s e testes para a média de uma v.a. com


distribuição Normal
1.2.1 O caso de variância conhecida
Suponhamos que X1 , . . . , Xn é uma a.a. de dimensão n de uma po-
pulação com distribuição N (µ, σ 2 ), onde σ 2 é assumida conhecida e supon-
hamos que pretendemos determinar IC’s para µ. Este é exactamente o caso
que foi tratado como exemplo na secção anterior, mas iremos apesar disso
dar-lhe um tratamento mais formal e mais geral.
Ora um estimador centrado ( e também UMVU) para µ é X = n1 ni=1 Xi ,
P

com !
σ2
X ∼ N µ,
n
e portanto com
X −µ
Z=p 2 ∼ N (0, 1) , (1.5)
σ /n
sendo que a distribuição de Z não é função de µ e na construção de Z o
único parâmetro não conhecido é exactamente µ. Então será exactamente
com base na v.a. Z que iremos construir os IC’s para µ.
Assim, um IC bilateral para µ (e centrado em X), correspondente a uma
probabilidade de 1 − α, será derivado do facto de termos
 
1 − α = P −z1−α/2 ≤ Z ≤ z1−α/2
!
X −µ
= P −z1−α/2 ≤p 2 ≤ z1−α/2
σ /n
 q q 
= P −X − z1−α/2 σ 2 /n ≤ −µ ≤ −X + z1−α/2 σ 2 /n
 q q 
= P X − z1−α/2 σ 2 /n ≤ µ ≤ X + z1−α/2 σ 2 /n ,

de modo que um IC bilateral para µ, correspondente a uma probabilidade


de 1 − α (e centrado em X), será dado por
 q q 
X − z1−α/2 σ 2 /n, X + z1−α/2 σ 2 /n , (1.6)

onde z1−α/2 representa o quantil 1 − α/2 de uma v.a. com distribuição


N (0, 1).
8 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

Note-se que de facto podemos basear a dedução de um IC bilateral para


µ (não necessariamente centrado em X) no facto de termos, para quaisquer
α e q tais que 0 < α, q < 1, com 0 < α − q < 1,

1 − α = P (zq ≤ Z ≤ z1−α+q )

onde Z ∼ N (0, 1) e zq e z1−α+q representam respectivamente os quantis q e


1−α+q de uma v.a. com distribuição N (0, 1), sendo então o correspondente
IC bilateral para µ, correspondente a uma probabilidade de 1 − α, dado por
 q q 
X − z1−α+q σ 2 /n, X − zq σ 2 /n ,

sendo a confirmação deste facto deixado como exercı́cio.


Quanto ao IC unilateral à direita, para µ, correspondente a uma proba-
bilidade de 1 − α, ele será derivado do facto de termos
1 − α = P (Z ≥ −z1−α )
!
X −µ
= P p ≥ z1−α
σ 2 /n
 q 
= P −µ ≥ −X − z1−α σ 2 /n
 q 
= P µ ≤ X + z1−α σ 2 /n ,

sendo assim o IC unilateral à direita para µ, correspondente a uma proba-


bilidade de 1 − α, dado por
 q 
−∞, X + z1−α σ 2 /n , (1.7)

e sendo o IC unilateral à esquerda, correspondente a uma probabilidade de


1 − α, dado por  
q
X − z1−α σ 2 /n, +∞ , (1.8)

sendo a sua dedução deixada como exercı́cio.


A construção do IC bilateral em (1.6), é de alguma forma equivalente à
realização do teste bilateral correspondente às hipóteses
H0 : µ = a
vs. (a ∈ IR) (1.9)
H1 : µ 6= a

a um (chamado) nı́vel α. Tal teste realizar-se-á do seguinte modo:


1.2. IC’s e testes para a média de uma v.a. com distribuição Normal • 9

i) necessitamos de arranjar uma chamada estatı́stica do teste, a qual


deverá ser uma v.a. com distribuição conhecida (pois necessitamos
de determinar alguns dos seus quantis) e deverá envolver como único
parm̂aetro desconhecido exactamente o parâmetro a ser testado; esta
estatı́stica do teste será exactamente a mesma estatı́stica que é uti-
lizada na construção dos IC’s para µ, i.e. neste caso que estamos a
considerar, a estatı́stica Z em (1.5);

ii) em seguida teremos de determinar o valor calculado dessa estatı́stica


para o problema em estudo, substituindo na estatı́stica escolhida em
i), o valor do parâmetro a ser testado pelo valor postulado para ele em
H0 (i.e. o valor a nas hipóteses em (1.9) acima),

X − µ|H X −a
Zcalc = p 2 0 = p 2 (1.10)
σ /n σ /n

iii) rejeitar a hipótese nula H0 (a favor de H1 ) se o valor calculado da


estatı́stica em ii) cair na zona de rejeição de H0 em (1.9), a qual é
exactamente a zona exterior ao IC em (1.9), i.e. rejeitar H0 em (1.9)
se |Zcalc | > z1−α/2 (e não rejeitar H0 no caso contrário). Note-se que
está associada a esta decisão de rejeição de H0 uma margem de erro
exactamente igual a α, chamada de probabilidade de erro do tipo I,
sendo o erro do tipo I, o erro de rejeitar H0 , dado que H0 é verdadeira
(mais adiante serão abordadas com mais pormenor as probabilidades
de erros de tipo I e tipo II). A α chama-se habitualmente o nı́vel do
teste.
Ao IC unilateral à direita em (1.7), corresponde o teste às hipóteses

H0 : µ ≥ a
vs. (a ∈ IR) (1.11)
H1 : µ < a

devendo-se proceder para a realização do teste de um modo exactamente


análogo ao descrito atrás, excepto que a decisão de rejeição de H0 deverá
agora ser a de rejeitar H0 em (1.11) se Zcalc < −z1−α (= zα ) (e vice-versa,
não rejeitar H0 se Zcalc 6< −z1−α ). Ao teste cujas hipóteses se encontram
em (1.11), chamaremos um teste unilateral com zona de rejeição à esquerda.
Ao IC unilateral à esquerda em (1.8) corresponde o teste às hipóteses

H0 : µ ≤ a
vs. (a ∈ IR) (1.12)
H1 : µ > a
10 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

sendo o procedimento a adoptar para o seu teste mais uma vez exactamnente
análogo ao descrito atrás, mas sendo agora a regra de rejeição de H0 a
de rejeitar H0 se Zcalc > z1−α , e vice-versa. Ao teste cujas hipóteses se
encontram em (1.12) chamaremos teste unilateral com zona de rejeição à
direita.
Note-se que em qualquer um dos casos a regra de rejeição de H0 , cor-
responde a rejeitarmos H0 se o valor calculado da estatı́stica do teste em
(1.10) assumir valores ’demasiado extremos’. Precise o sentido do termo
’demasiado extremos’ na frase acima e interprete o sentido de tais decisões,
face às expressões em (1.10).
Note-se também que correspondendo a zona de rejeição de qualquer
hipótese nula à zona exterior ao correspondente IC, a decisão de rejeição
de determinada hipótese nula H0 corresponderá sempre à postulação de um
valor a que cai fora do correspondente IC, de modo que de facto a simples
determinação do devido IC será sempre suficiente para a realização do res-
pectivo teste de hipóteses, sendo a decisão a tomar a de rejeitar H0 se o
valor de a em H0 cair fora do IC correspondente ao teste que se pretende
realizar (e vice-versa, não rejeitar H0 se o valor de a em H0 não cair fora do
IC). Note-se que associada a esta decisão está de facto uma margem de erro
igual a α.
Note-se também que a construção do Intervalo de Confiança correspon-
dente a um qualquer teste de hipóteses, será sempre feita sobre a zona de
não-rejeição de H0 , uma vez que a probabilidade de 1 − α, que se pretende
que seja a probabilidade de o verdadeiro valor do parâmetro que estamos a
testar ficar entre os limites do Intervalo de Confiança, é a probabilidade de
não se cometer o erro de rejeitar a hipótese H0 , dado que H0 é verdadeira.
A questão que se poderia então colocar ao leitor menos atento seria:
porque não reduzimos então α a zero?
Note-se que esta questão já foi colocada atrás, sob uma faceta ligeira-
mente diferente, sendo que o leitor mais atento saberá já certamente qual a
resposta a dar à questão colocada.

1.2.2 O caso de variância desconhecida


Embora neste caso o estimador de µ a ser utilizado seja exactamente o
mesmo que no caso anterior, i.e. X = n1 ni=1 Xi e ainda também neste caso
P

tenhamos !
σ2
X ∼ N µ,
n
1.2. IC’s e testes para a média de uma v.a. com distribuição Normal • 11

e
X −µ
Z=p 2 ∼ N (0, 1) (1.13)
σ /n
a v.a. Z em (1.13) não poderá ser utilizada para construir IC’s para µ, uma
vez que agora σ 2 também é desconhecido e Z é função de µ mas também de
σ2.
Como σ 2 é desconhecido, teremos de utilizar no seu lugar um seu es-
timador, de preferência centrado e consistente (e, se possı́vel, UMVU), i.e.
utilizaremos
n
2 1 X
S = (Xi − X)2
n − 1 i=1

para estimar σ 2 , sendo que em vez de utilizarmos a v.a. Z em (1.13) iremos


então utilizar a v.a.
X −µ
p . (1.14)
S 2 /n
A questão será agora a de determinar a distribuição da v.a. em (1.14),
uma vez que ela será a v.a. utilizada na construção dos IC’s para µ e teremos
assim de utlizar quantis seus na construção dos referidos IC’s.
Note-se que para a.a.’s da distribuição Normal, temos relativamente a
X e S 2 o resultado no Teorema 9.4. Assim, sabemos que a v.a.

√X−µ
X −µ σ 2 /n
T =p 2 =p (∼ Tn−1 ) (1.15)
S /n ((n − 1)S /σ 2 ) /(n − 1)
2

sendo o quociente de uma v.a. N (0, 1), a v.a.

X −µ
p
σ 2 /n

pela raı́z quadrada de uma v.a. com distribuição Qui-quadrado com n − 1


graus de liberdade, a v.a.
(n − 1)S 2 /σ 2

a dividir pelos seus graus de liberdade, e sendo estas duas v.a.’s indepen-
dentes por serem construı́das respectivamente à base das v.a.’s X e S 2 e estas
serem independentes (veja-se o Teorema 9.4), a v.a. T em (1.15) será uma
v.a. com distribuição T com n − 1 graus de liberdade (os graus de liberdade
da v.a. com distribuição Qui-quadrado que surge no denominador).
12 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

Mas então será fácil determinar um IC bilateral para µ, correspondente


a uma probabilidade de 1 − α, pois como, sendo tn−1 (1 − α/2) o quantil
1 − α/2 de uma v.a. T com n − 1 graus de liberdade,

1 − α = P (−tn−1 (1 − α/2) ≤ Tn−1 ≤ tn−1 (1 − α/2))


!
X −µ
= P −tn−1 (1 − α/2) ≤ p 2 ≤ tn−1 (1 − α/2)
S /n
 q q 
= P −tn−1 (1 − α/2) S 2 /n ≤ X − µ ≤ tn−1 (1 − α/2) S 2 /n
 q q 
= P X − tn−1 (1 − α/2) S 2 /n ≤ µ ≤ X + tn−1 (1 − α/2) S 2 /n ,

de modo que
 q q 
X − tn−1 (1 − α/2) S 2 /n, X + tn−1 (1 − α/2) S 2 /n

é um IC bilateral para µ, correspondente a uma probabilidade de 1 − α. Os


IC’s unilaterais à direita e à esquerda sendo respectivamente
 q 
−∞, X + tn−1 (1 − α) S 2 /n

e  q 
X − tn−1 (1 − α) S 2 /n, +∞ ,

onde tn−1 (1 − α) representa o quantil 1 − α de uma v.a. com distribuição T


de Student com n − 1 graus de liberdade. A dedução detalhada destes IC’s
é deixada como exercı́cio.
Os testes de hipóteses referentes a µ utilizarão assim a estatı́stica de
teste em (1.15), rejeitando-se H0 , a favor de H1 , no teste às hipóteses

H0 : µ = a
vs. (a ∈ IR)
H1 : µ 6= a

se |Tcalc | > tn−1 (1 − α/2), ou então rejeitando H0 , a favor de H1 , no teste


às hipóteses
H0 : µ ≥ a
vs. (a ∈ IR) (1.16)
H1 : µ < a
1.3. IC’s e testes para a média da diferença de duas v.a.’s • 13

se Tcalc < −tn−1 (1−α), ou rejeitando H0 , a favor de H1 , no teste às hipóteses

H0 : µ ≤ a
vs. (a ∈ IR) (1.17)
H1 : µ > a

se Tcalc > tn−1 (1 − α), o que é de facto equivalente a rejeitar H0 se em qual-


quer dos casos o valor µ|H0 , i.e. o valor de a, não pertencer ao correspon-
dente IC, deixando-se como exercı́cio a determinação dos IC’s unilaterias
correspondentes aos testes às hipóteses em (1.17) e (1.16).

1.3 IC’s e testes para a média da diferença de duas


v.a.’s, com base em duas a.a.’s emparelhadas
Suponhamos que temos uma a.a. X11 , . . . , X1n de dimensão n de uma de-
terminada distribuição e que temos outra a.a. de dimensão n, X21 , . . . , X2n
de uma outra distribuição, e que as duas amostra são emparelhadas, i.e. que
existe uma ligação ou correspondência entre X1i e X2i , de tal forma que fará
sentido considerar as diferenças

Di = X1i − X2i (i = 1, . . . , n)

como formando uma a.a. de uma v.a.


 
2
D = X1 − X2 ∼ N (µD , σD )

2.
com distribuição Normal com valor esperado µD e variância σD
Talvez seja então apropriado definirmos aqui formalmente o que enten-
demos por amostras emparelhadas.

Definição: (amostras emparelhadas)


Se uma única selecção aleatória der origem a duas (ou mais) amostras, então
essas amostras dizem-se emparelhadas (sendo então possı́vel estabelecer uma
associação entre a i-ésima observação de cada uma das a.a.’s).

Exemplos de amostras emparelhadas serão por exemplo:

i) amostras dos nı́veis de audição no ouvido direito e esquerdo de uma


a.a. de n pessoas (note-se que a única selecção aleatória realizada foi
a das n pessoas)
14 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

ii) amostras das temperaturas médias diárias em Lisboa e no Porto para


(os mesmos) n dias aleatoriamente seleccionados de registos referentes
ao mês de Janeiro dos últimos 10 anos (note-se que a única selecção
aleatória foi a dos n dias)

iii) amostras dos pesos de uva produzidos pelos chamados ramos A e B de


n videiras seleccionadas aleatoriamente numa vinha, para videiras con-
duzidas nesse sistema de poda (note-se que a única selecção aleatória
foi a das n videiras)

iv) amostras de temperaturas do solo às 12 horas a 10 e 20 centı́metros


de profundidade em n locais sleccionados aleatoriamente (note-se que
a única selecção aleatória foi a dos n locais).

Note-se que enquanto em alguns casos, face às duas (ou mais) amostras
poderá nem sempre ser fácil a determinação da correspondência entre as
i-ésimas observações das duas (ou várias) amostras, a aplicação da definição
de amostras emparelhadas funciona sempre muito bem para determinar se
duas (ou mais) amostras são ou não emparelhadas.
Nesta nossa abordagem muito simples da questão da amostragem, duas
(ou mais) amostras que não sejam emparelhadas serão independentes (veja-
se a secção a seguir para uma definição mais rigorosa de amostras indepen-
dentes).
Voltando então ao nosso problema de construção de IC’s, pretendemos
construir IC’s para µD , o valor esperado ou média da v.a. D, suposta ter
uma distribuição Normal. Se suposermos que σD 2 é desconhecida, estaremos

então na situação da subsecção anterior e os IC’s obtidos e sua construção


serão em tudo análogos aos obtidos na secção anterior. Utilizando
n n
!
2 1 X 1X
SD = (Di − D)2 com D = Di
n − 1 i=1 n i=1

como estimador de σD2 , teremos o IC bilateral para µ , correspondente a


D
uma probabilidade de 1 − α, dado por
 q q 
D − tn−1 (1 − α/2) 2 /n,
SD D + tn−1 (1 − α/2) 2 /n
SD

e os IC’s unilaterais à direita e à esquerda sendo respectivamente dados por


 q 
−∞, D + tn−1 (1 − α) 2 /n
SD
1.4. IC’s e testes para a diferença de duas médias • 15

e  q 
2 /n, +∞ .
D − tn−1 (1 − α) SD

Os correspondentes testes de hipóteses referentes a µD utilizarão, para


2 desconhecida, a estatı́stica de teste
este caso em que se supõe σD

D − µD
T = q ∼ Tn−1
SD2 /n

com uma distribuição Tn−1 , rejeitando-se H0 , a favor de H1 , no teste às


hipóteses
H0 : µD = a
vs. (a ∈ IR)
H1 : µD 6= a
se |Tcalc | > tn−1 (1 − α/2), ou então rejeitando H0 , a favor de H1 , no teste
às hipóteses
H0 : µD ≥ a
vs. (a ∈ IR) (1.18)
H1 : µD < a
se Tcalc < −tn−1 (1−α), ou rejeitando H0 , a favor de H1 , no teste às hipóteses

H0 : µD ≤ a
vs. (a ∈ IR) (1.19)
H1 : µD > a

se Tcalc > tn−1 (1 − α), o que é de facto equivalente a rejeitar H0 se em


qualquer dos casos o valor µD|H0 , i.e. o valor de a, não pertencer ao cor-
respondente IC. A associação dos testes às hipóteses em (1.19) e (1.18) aos
respectivos IC’s unilaterias é deixada como exercı́cio.

1.4 IC’s e testes para a diferença de duas médias,


baseados em duas amostras independentes
Suponhamos que temos duas a.a.’s, uma de dimensão n1 da distribuição
da v.a.
X1 ∼ N (µ1 , σ12 )
que será denotada por X11 , . . . , X1n1 , e outra a.a. independente, de di-
mensão n2 , da distribuição da v.a.

X2 ∼ N (µ2 , σ22 ),
16 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

denotada por X21 , . . . , X2n2 , e onde tanto poderemos ter n1 = n2 como


n1 6= n2 .
As duas a.a.’s serão consideradas independentes se forem baseadas em
duas selecções aleatórias independentes, tendo-se a seguinte definição.

Definição: (amostras independentes)


Duas (ou k ≥ 2) a.a.’s são consideradas independentes se e só se forem
baseadas em duas (ou k ≥ 2) selecções aleatórias independentes.

Exemplos de amostras independentes poderão ser por exemplo:

i) uma a.a. de nı́veis de audição do ouvido esquerdo de n1 indivı́duos


seleccionados aleatoriamente e outra a.a. de nı́veis de audição do ou-
vido direito de n2 indivı́duos seleccionados aleatoriamente e de forma
independente dos primeiros n1 indivı́duos,

ii) uma a.a. de temperaturas médias diárias em Lisboa referentes a n1


dias do mês de Janeiro de entre os registos disponı́veis para os últimos
30 anos e outra a.a. de temperaturas médias diárias no Porto, ref-
erentes a n2 dias seleccionados aleatoriamente do mesmo registo de
temperaturas para os últimos 30 anos e de forma independente dos
outros n1 dias,

iii) uma a.a. de n1 valores de produção da variedade A de determinado ce-


real, plantada no talhão T1 e uma outra a.a. de n2 valores de produções
da variedade B do mesmo cereal, obtidas (de forma independente) num
outro talhão T2 (sendo as duas selecções realizadas de forma indepen-
dente).

Note-se que nos exemplos i) e ii) acima os dados recolhidos eram exacta-
mente da mesma natureza dos recolhidos nos exemplos i) e ii) apresentados
na secção anterior como exemplos de amostras emparelhadas., o que tenta
ilustrar o facto de a natureza das amostras (emparelhadas ou independentes)
ter unicamente a ver com o modo como a amostragem foi conduzida e não
com o tipo de variáveis amostradas, podendo-se contudo colocar a questão de
qual será ou teia sido o tipo de amostragem mais adequado para a realização
de determinado estudo com determinados objectivos.
Consideremos então as estatı́sticas
n1 n2
1 X 1 X
X1 = X1i , X2 = X2i ,
n1 i=1 n2 i=1
1.4. IC’s e testes para a diferença de duas médias • 17

n 1  n2 
1 X 2 1 X 2
S12 = X1i − X 1 , S22 = X2i − X 2 .
n1 − 1 i=1 n2 − 1 i=1

Note-se que, dado o resultado no Teorema 9.4 e dada a independência das


duas amostras, as 4 estatı́sticas acima serão independentes.
Desta forma, se suposermos que σ12 e σ22 são desconhecidas mas iguais,
i.e. se considerarmos σ12 = σ22 (= σ 2 ), tanto S12 como S22 serão estimadores
centrados e consistentes (e UMVU) de σ 2 , com

S12 S22
(n1 − 1) ∼ χ2n1 −1 independente de (n2 − 1) ∼ χ2n2 −1
σ2 σ2
e portanto com

(n1 − 1)S12 + (n2 − 1)S22


∼ χ2n1 +n2 −2
σ2
onde
(n1 − 1)S12 + (n2 − 1)S22
Sp2 = ,
n1 + n2 − 2
que é uma média ponderada de S12 e S22 , é um estimador centrado (e UMVU),
combinado (’pooled’) de σ 2 , independente de X 1 e X 2 , de tal forma que a
v.a.  
X 1 − X 2 − (µ1 − µ2 )
T = r   (1.20)
Sp2 n11 + n12

tem uma distribuição T (de Student) com n1 + n2 − 2 graus de liberdade,


uma vez que (admitindo σ12 = σ22 (= σ 2 ))

1 1
  
2
X 1 − X 2 ∼ N µ1 − µ2 , σ +
n1 n2
ou  
X 1 − X 2 − (µ1 − µ2 )
r   ∼ N (0, 1) ,
1 1
σ2 n1 + n2

é independente de Sp2 , com

Sp2 (n1 − 1)S12 + (n2 − 1)S22


(n1 + n2 − 2) = ∼ χ2n1 +n2 −2 ,
σ2 σ2
18 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

podendo-se escrever a v.a. T em (1.20) como

(Xr
1 −X 2 )−(µ1 −µ2 )
 
1
σ2 n1
+ n1
2
T =r (∼ Tn1 +n2 −2 )
S2
.
(n1 + n2 − 2) σp2 (n1 + n2 − 2)

o que mostra ser esta v.a. um quociente entre uma v.a. com distribuição
N (0, 1) e a raı́z quadrada de uma v.a. com distribuição Qui-quadrado a
dividir pelos seus graus de liberdade, independente da v.a. no numerador,
sendo assim uma v.a. com distribuição T (de Student) com os mesmos graus
de liberdade que a v.a. com distribuição Qui-quadrado.
Teremos assim um IC bilateral para µ1 − µ2 , correspondente a uma
probabilidade de 1 − α, construı́do sobre of facto de termos

1−α = P (−tn1 +n2 −2 (1 − α/2) ≤ Tn1 +n2 −2 ≤ tn1 +n2 −2 (1 − α/2))


  
 X 1 − X 2 − (µ1 − µ2 )
−tn1 +n2 −2 (1 − α/2) ≤
= P r  
1 1
Sp2 n1 + n2


≤ tn1 +n2 −2 (1 − α/2)

 s
1 1
   
= P  − tn1 +n2 −2 (1−α/2) Sp2 + ≤ X 1 −X 2 − (µ1 −µ2 )
n1 n2
s 
1 1
 
≤ tn1 +n2 −2 (1 − α/2) Sp2 + 
n1 n2
 s
1 1
   
= P  − X 1 −X 2 − tn1 +n2 −2 (1−α/2) Sp2 + ≤ − (µ1 −µ2 )
n1 n2
s 
1 1
   
≤ − X 1 − X 2 + tn1 +n2 −2 (1 − α/2) Sp2 + 
n1 n2
1.4. IC’s e testes para a diferença de duas médias • 19

 s
1 1
   
= P  X 1 − X 2 − tn1 +n2 −2 (1 − α/2) Sp2 + ≤ µ1 − µ2
n1 n2
s 
1 1
   
≤ X 1 − X 2 + tn1 +n2 −2 (1 − α/2) Sp2 + 
n1 n2
e sendo assim dado por
" s
1 1
   
X 1 − X 2 − tn1 +n2 −2 (1 − α/2) Sp2 + ,
n1 n2
s #
1 1
  
X 1 − X 2 + tn1 +n2 −2 (1 − α/2) Sp2 + .
n1 n2
O IC unilateral à direita para µ1 − µ2 , correspondente a uma probabilidade
de 1 − α, é dado por
# s #
1 1
  
−∞, X 1 − X 2 + tn1 +n2 −2 (1 − α) Sp2 + ,
n1 n2
e o IC unilateral à esquerda por,
" s "
1 1
   
X 1 − X 2 − tn1 +n2 −2 (1 − α) Sp2 + , +∞ ,
n1 n2
sendo a dedução destes IC’s unilaterais deixada como exercı́cio.
Os correspondentes testes de hipóteses serão o teste bilateral com
H0 : µ1 − µ2 = a
vs. (a ∈ IR) (1.21)
H1 : µ1 − µ2 6= a
com rejeição da hipótese nula H0 a favor de H1 se |Tcalc | > tn1 +n2 −2 (1−α/2),
onde Tcalc representa o valor calculado da estatı́stica em (1.20), onde se
substitui µ1 − µ2 pelo valor a em H0 em (1.21) acima, o teste unilateral com
zona de rejeição à esquerda,
H0 : µ1 − µ2 ≥ a
vs. (a ∈ IR)
H1 : µ1 − µ2 < a
com rejeição de H0 se Tcalc < −tn1 +n2 −2 (1 − α), e o teste unilateral com
zona de rejeição à direita, com
H0 : µ1 − µ2 ≤ a
vs. (a ∈ IR)
H1 : µ1 − µ2 > a
20 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

rejeitando-se H0 , a favor de H1 , se Tcalc > tn1 +n2 −2 (1 − α), sendo deixada


como exercı́cio a construção dos respectivos IC’s unilaterais.
Qualquer um dos testes acima podendo ser realizado através da deter-
minação do IC associado, rejeitando-se então H0 se o valor de a em H0 cair
fora do IC (e vice-versa).

1.5 IC’s e testes para a variância de uma v.a. com


distribuição Normal
Seja X1 , . . . , Xn uma a.a. de uma distribuição N (µ, σ 2 ). Sabemos então
1 Pn
que S 2 = n−1 2
i=1 (Xi − X) é um estimador centrado (e UMVU) de σ ,
2

com (veja-se o Teorema 9.4)

S2
X 2 = (n − 1) ∼ χ2n−1 , (1.22)
σ2

de modo que, sendo χ2n−1 (α/2) e χ2n−1 (1 − α/2) respectivamente os quantis


α/2 e 1 − α/2 de uma v.a. com distribuição Qui-quadrado com n − 1 graus
de liberdade, temos
 
1 − α = P χ2n−1 (α/2) ≤ χ2n−1 ≤ χ2n−1 (1 − α/2)
!
S2
= P χ2n−1 (α/2) ≤ (n − 1) 2 ≤ χ2n−1 (1 − α/2)
σ
!
χ2n−1 (α/2) 1 χ2n−1 (1 − α/2)
= P ≤ ≤
(n − 1)S 2 σ2 (n − 1)S 2
!
(n − 1)S 2 2 (n − 1)S 2
= P ≤ σ ≤ ,
χ2n−1 (1 − α/2) χ2n−1 (α/2)

sendo assim " #


(n − 1)S 2 (n − 1)S 2
, (1.23)
χ2n−1 (1 − α/2) χ2n−1 (α/2)

um IC bilateral para σ 2 , correspondente a uma probabilidade de 1 − α.


Note-se que enquanto os IC’s bilaterais para µ, µD e µ1 − µ2 nas secções
anteriores eram centrados nos respectivos estimadores centrados, sendo esse
facto devido ao facto de as respectivas estatı́sticas a partir das quais tais IC’s
eram determinados terem distribuições com f.d.p.’s simétricas em relação ao
seu valor médio, o IC bilateral para σ 2 não é centrado em S 2 , uma vez que
1.6. IC’s e testes para a razão de duas variâncias • 21

a distribuição Qui-quadrado com n − 1 graus de liberdade tem uma f.d.p.


assimétrica (em relação ao seu valor médio).
Os IC’s unilaterais para σ 2 , correspondentes a uma probabilidade de
1 − α, respectivamente à direita e à esquerda, serão dados por
# # " "
(n − 1)S 2 (n − 1)S 2
0, 2 e , +∞ ,
χn−1 (α) χ2n−1 (1 − α)
sendo a sua dedução deixada como exercı́cio.
Ao IC bilateral em (1.23) corresponde o teste às hipóteses
H0 : σ 2 = a
vs. (a ∈ IR+ )
H1 : σ 2 6= a
sendo H0 rejeitada, a favor de H1 , se Xcalc2 > χ2n−1 (1 − α/2) ou Xcalc
2 <
χn−1 (α/2), onde Xcalc representa o valor calculado da estatı́stica X 2 em
2 2

(1.22), onde se substitui σ 2 pelo valor de a em H0 acima.


Quanto ao IC unilateral à direita, corresponde o teste às hipóteses
H0 : σ 2 ≥ a
vs. (a ∈ IR+ )
H1 : σ2 <a
e ao IC unilateral à esquerda o teste às hipóteses
H0 : σ 2 ≤ a
vs. (a ∈ IR+ )
H1 : σ 2 > a
devendo H0 ser rejeitada a favor de H1 , se Xcalc2 < χ2n−1 (α) ou Xcalc
2 >
2
χn−1 (1 − α), respectivamente; o que de facto é equivalente a determinar os
respectivos IC’s e rejeitar, em cada caso, H0 a favor de H1 , se o valor de a
em H0 não cair dentro do respectivo IC.

1.6 IC’s e testes para a razão de duas variâncias,


baseados em duas amostras independentes
Tal como na secção 11.4, seja X11 , . . . , X1n1 uma a.a. de dimensão n1
da distribuição N (µ1 , σ12 ), e seja X21 , . . . , X2n2 uma a.a. de dimensão n2 da
distribuição N (µ2 , σ22 ). Sejam ainda as duas amostras independentes. Então
os estimadores centrados (e UMVU) de σ12 e σ22 serão respectivamente
n
1  n1 
1 X 2 1 X 2
S12 = X1i − X 1 e S22 = X2i − X 2
n1 − 1 i=1 n2 − 1 i=1
22 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

com
S12 S22
(n1 − 1) ∼ χ2n1 −1 e (n2 − 1) ∼ χ2n2 −1
σ12 σ22
a serem duas v.a.’s independentes, dada a independência de S12 e S22 , devida
à independência das duas amostras.
Mas então a v.a.
S22 σ12
F = ( ∼ Fn2 −1,n1 −1 ) (1.24)
S12 σ22

terá uma distribuição Fn2 −1,n1 −1 por ser o quociente de duas v.a.’s inde-
pendentes com distribuição Qui-quadrado, cada uma delas a dividir pelos
seus respectivos graus de liberdade, de modo que, sendo fn2 −1,n1 −1 (α/2)
e fn2 −1,n1 −1 (1 − α/2) respectivamente os quantis α/2 e 1 − α/2 de uma
distribuição Fn2 −1,n1 −1 , temos

1 − α = P (fn2 −1,n1 −1 (α/2) ≤ Fn2 −1,n1 −1 ≤ fn2 −1,n1 −1 (1 − α/2))


!
S 2 σ2
= P fn2 −1,n1 −1 (α/2) ≤ 22 12 ≤ fn2 −1,n1 −1 (1 − α/2)
S1 σ2
!
S2 σ2 S2
= P fn2 −1,n1 −1 (α/2) 12 ≤ 12 ≤ fn2 −1,n1 −1 (1 − α/2) 12 .
S2 σ2 S2

Assim, e tomando em conta que


1
fn2 −1,n1 −1 (α/2) = ,
fn1 −1,n2 −1 (1 − α/2)

σ12
um IC bilateral para σ22
, correspondente a uma probabilidade de 1 − α será
" #
1 S12 S12
, f n2 −1,n1 −1 (1 − α/2) . (1.25)
fn1 −1,n2 −1 (1 − α/2) S22 S22

σ2
Os IC’s unilaterais para σ12 , respectivamente à direita e à esquerda, cor-
2
respondentes a uma probabilidade de 1 − α, serão então
# # " "
S2 1 S12
0, fn2 −1,n1 −1 (1 − α) 12 e , +∞ ,
S2 fn1 −1,n2 −1 (1 − α) S22

sendo a sua dedução deixada como exercı́cio.


1.7. O valor-de-p • 23

Ao IC bilateral em (1.25) corresponde o teste às hipóteses


σ12
H0 : σ22
=a H0 : σ12 = a σ22
vs. ⇐⇒ vs. (a ∈ IR+ ) , (1.26)
σ12
H1 : σ22
6= a H1 : σ12 6= a σ22

sendo H0 rejeitada se Fcalc > fn2 −1,n1 −1 (1−α/2) ou Fcalc < fn2 −1,n1 −1 (α/2)
= 1/fn1 −1,n2 −1 (1 − α/2), onde Fcalc representa o valor calculado da es-
σ2
tatı́stica em (1.24), onde se substitui σ12 pelo valor a em H0 em (1.26).
2
Os testes unilaterais, respectivamente com zonas de rejeição à esquerda e à
direita, correspondem respectivamente às hipóteses
σ12
H0 : σ22
≤a H0 : σ12 ≤ a σ22
vs. ⇐⇒ vs. (a ∈ IR+ )
σ12
H1 : σ22
>a H1 : σ12 >a σ22

e
σ12
H0 : σ22
≥a H0 : σ12 ≥ a σ22
vs. ⇐⇒ vs. (a ∈ IR+ )
σ12
H1 : σ22
<a H1 : σ12 < a σ22

sendo H0 rejeitada, a favor de H1 , respectivamente se Fcalc < fn2 −1,n1 −1 (α)


= 1/fn1 −1,n2 −1 (1 − α) ou se Fcalc > fn2 −1,n1 −1 (1 − α).
Note-se que de facto em cada um dos casos a realização do teste da forma
indicada é equivalente à determinação do correspondente IC, procedendo-
se então à rejeição de H0 se o valor a, na respectiva hipótese nula, não
pertencer ao IC (e vice-versa), sendo deixada como exercı́cio a dedução dos
IC’s unilaterias para a razão de variâncias, bem como a sua associação aos
respectivos conjuntos de hipóteses nula e alternativa.

1.7 O valor-de-p
Embora muitos autores advoguem que na abordagem clássica de um teste
devemos fixar a priori o valor de α para o qual vamos realizar o teste e tomar
então a decisão, face ao valor calculado da estatı́stica do teste, de rejeitar ou
não a hipótese nula, uma das questões que se pode legitimamente colocar é
a questão de o que se passaria para um valor ou nı́vel diferente de α. Esta
questão tem de facto uma resposta parcial relativamente simples, bastando
reparar que para valores de α menores, as amplitudes dos IC’s associados ao
24 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

teste serão forçosamente maiores, de modo que se para um dado valor de α


não rejeitámos a hipótese nula, sabemos que, com base na mesma amostra,
para um qualquer outro valor de α que seja menor também não rejeitarı́amos
essa mesma hipótese nula, não sabendo todavia o que poderá acontecer para
valores de α superiores ao utilizado inicialmente, enquanto que se para um
dado valor de α rejeitámos a hipótese nula, também certamente o farı́amos
para qualquer outro valor de α superior ao utilizado, não sabendo o que
acontecerá para valores de α inferiores. As quatro possı́veis situações base
encontram-se ilustradas na Figura 11.2.

α2 < α1

rejeitar H0 =⇒ rejeitar H0
decisão não rejeitar H0 =⇒ 6 ?
tomada não rejeitar H0 ⇐= não rejeitar H0
? ⇐=
6 rejeitar H0
Figura 11.2 – Ilustração da relação entre as decisões de rejeição
ou não de H0 , para quatro situações possı́veis, relativas a
dois diferentes valores de α, com α1 > α2 .

Repare-se no entanto que a resposta dada à questão foi de facto apenas


parcial pois há situações nas quais não se sabe qual será a conclusão a tirar
para um valor de α diferente do utilizado.
Uma outra questão pertinente e cuja resposta, a ser possı́vel de deter-
minar, permitirá uma resposta mais precisa à questão do resultado do teste
para diferentes valores de α é a seguinte: para um dado teste, baseado numa
determinada a.a., qual o valor de α abaixo do qual não rejeito a hipótese
nula e acima do qual deverei rejeitar a hipótese nula?
Ora, este valor de α é exactamente o que se chama de valor-de-p (p-
value) de um teste. A definição mais rigorosa de valor-de-p associado a um
teste, e aliás a qual permite o seu cálculo, é a apresentada a seguir.

Definição: Seja S a estatı́stica associada ao teste φ. Para um teste


realizado com base numa a.a. que originou para S um valor calculado Scalc ,
chama-se valor-de-p, associado ao teste φ, à probabilidade de a estatı́stica
1.7. O valor-de-p • 25

S assumir o valor Scalc ou qualquer outro valor ainda mais na direcção da


rejeição da hipótese nula.

Por exemplo, para o teste na alı́nea c) do Exercı́cio 1.1, relativo às


hipóteses
H0 : µ = 200
vs.
H1 : µ 6= 200
com base numa a.a. de uma v.a. Normal com média µ e variância σ 2
(desconhecida), o valor calculado da estatı́stica do teste, para a amostra em
questão, é
Tcalc = −3.0125
onde, face à asserção de que a v.a. X que representa a altura (em cm) de
um pé de milho é uma v.a. com distribuição N (µ, σ 2 ), temos

X −µ
T =p 2 ∼ Tn−1 .
S /n

Assim, tendo em conta que se trata de um teste bilateral e que a f.d.p. da


distribuição Tn−1 é simétrica em relação ao ponto de abcissa zero, o valor-
de-p associado a este teste será

P (Tn−1 ≤ −3.0125) + P (Tn−1 ≥ 3.0125)


= 2 P (Tn−1 ≥ 3.0125)
= 2 (1 − P (Tn−1 < 3.0125)) = 0.0196 .

Note-se então a forma como é realizado o teste quer na sua abordagem


clássica quer a partir do cálculo da estimativa do correspondente IC bilateral
e repare-se que se o valor de α que estamos a utilizar for superior ao valor-
-de-p determinado deveremos rejeitar a hipótese nula e vice-versa, i.e. para
um dado valor de α, e face à a.a. em questão,
valor-de-p < α =⇒ rejeitar H0
valor-de-p > α =⇒ não rejeitar H0 .
Repare-se que se tomarmos S como a estatı́stica do teste e CS como a
região crı́tica (i.e. o conjunto de valores de S para os quais rejeitamos H0 ),
então
valor-de-p < α ⇐⇒ Scalc ∈ CS
valor-de-p > α ⇐⇒ Scalc 6∈ CS .
26 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

Note-se que se o teste fosse unilateral, por exemplo, se as hipóteses nula


e alternativa fossem
H0 : µ ≥ 200
vs.
H1 : µ < 200
terı́amos então o valor-de-p dado por

P (Tn−1 ≤ −3.0125) = 0.0098

devendo então rejeitar H0 para valores de α superiores a 0.0098 (e vice-


versa).
Nomeadamente em situações em que a pessoa que executa o teste e
aquela que toma a decisão são duas pessoas diferentes, o valor-de-p associado
ao teste será porventura o resultado a reportar, de modo que a pessoa que
toma a decisão possa então utilizar o valor de α que achar mais adequado.
Note-se porém que a determinação de um qualquer valor-de-p pressupõe
que tenhamos acesso a um programa que nos permita calcular valores para
a f.d.c. da estatı́stica do teste em questão.
Deixamos como exercı́cio a determinação de valores-de-p para todos os
testes nos exercı́cios apresentados no fim deste Capı́tulo.

1.8 Sobre o dimensionamento das amostras


Note-se que a amplitude de qualquer IC considerado nas secções ante-
riores é função decrescente da dimensão da amostra, i.e. será tanto menor
quanto maior for o valor de n, a dimensão da amostra em que se baseia. Por
exemplo, para o IC bilateral para µ na subsecção 1.2.1, em que se admitia
σ 2 conhecido, a amplitude deste IC vem dada por
q
2 z1−α/2 σ 2 /n ,

de modo que quanto mais elevado for o valor de n, menor será esta amplitude.
Também a amplitude do IC bilateral para µ na subsecção 1.2.2, onde se
considera σ 2 desconhecido é uma função decrescente de n, ao ser dada por
q
2 tn−1 (1 − α/2) S 2 /n

pois não só n surge como denominador na fracção S 2 /n como também,


para dado α, quanto mais elevado for o valor de n, menor será o valor de
tn−1 (1 − α/2), acontecendo fenómeno semelhante com os IC’s unilaterais.
1.8. Sobre o dimensionamento das amostras • 27

Poderı́amos então pensar que, sendo assim, então deverı́amos sempre


ter amostras de dimensão tão grande quanto possı́vel. Contudo, amostras
de maior dimensão são mais caras de obter, quer em termos de recursos
necessários para as recolher quer em termos do tempo necessário para as
realizar, já para não falar da dificuldade que em alguns estudos se poderá
ter para encontrar um número elevado de unidades amostrais (como é o
caso de alguns estudos em epidemiologia, medicina, biologia, agronomia,
etc.), embora em princı́pio estejamos a amostrar uma população infinita.
Coloca-se assim a questão do dimensionamento ’óptimo’ da amostra,
face a determinados objectivos. A questão do dimensinamento ’óptimo’ ou
’mı́nimo’ de uma dada amostra é frequentemente ou mesmo quase sempre
colocada ao estatista de ums forma incorrecta ou de uma forma que não
lhe disponibiliza toda a informação de que necessita para poder dar uma
resposta à questão.
De uma forma geral a resposta à questão do dimensionamento de uma
dada amostra a realizar, de determinada população e com determinado ob-
jectivo em vista, só pode mesmo ser respondida depois da realização de uma
amostra prévia, a partir da qual se obtenha alguma informação relevante da
população em estudo.
Tomemos como exemplo o dimensionamento de uma amostra com a fi-
nalidade de realizar um teste ou calcular uma estimativa de um IC para a
média (desconhecida) de uma v.a. com distribuição Normal. A questão, a
ser devidamente colocada, deverá ser enunciada em termos semelhantes aos
seguintes (veja-se a lı́nea e) do Exercı́cio 1.1):

– pretendemos saber qual deverá ser a dimensão mı́nima da amsotra para


que com determinado α (suponhamos α = 0.05), tenhamos uma am-
plitude do IC bilateral para µ não superior a L,

i.e., se considerarmos a situação (pouco realista) de supormos conhecida a


variância σ 2 , pretendemos determinar n tal que
q
2 z1−α/2 σ 2 /n ≤ L . (1.27)

Podemos facilmente resolver a desigualdade (1.27) em ordem a n, obtendo


a expressão
 2
4 σ 2 z1−α/2
n ≥ ,
L2
a partir da qual poderemos, uma vez que temos um valor conhecido para σ 2 ,
facilmente determinar um valor mı́nimo para n que satisfaça a desigualdade.
28 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

Porém, na situação mais realista de supormos σ 2 desconhecida, seremos


confrontados com dois problemas, pois neste caso terı́amos a desigualdade,
q
2 tn−1 (1 − α/2) S 2 /n ≤ L ,

a qual resolvida em ordem a n dará qualquer coisa como

4 S 2 (tn−1 (1 − α/2))2
n ≥ . (1.28)
L2
O problema agora é que não só surge S 2 no lado direito da desigualdade,
o que nos força não só a ter uma amostra prévia disponı́vel que seja sufi-
cientemente fiável, de modo a que possamos utilizar o valor calculado de S 2
dessa amostra para o cálculo de n, assumindo assim que esse valor será uma
tão boa estimativa de σ 2 que o seu valor não se alterará significativamente
de amostra para amostra, como o problema ainda é também o de n surgir
também no segundo membro da desigualdade (1.28), como parte do número
de graus de liberdade no quantil da v.a. com distribuição T de Student.
Temos então de facto três diferentes possı́veis abordagens para ultrapas-
sar esta dificuldade. Uma será a de determinar n por tentativas, ou talvez
mais propriamente, através de um processo iterativo em que. a partir de um
valor inicial, vamos dando valores sucessivos a n até encontrarmos o menor
valor de n que satisfaça (1.28). Outra possibilidade será a de determinar n
’po defeito’, i.e. utilizando um processo que sabemos que irá dar um valor
de n que será igual ou inferior (de uma forma geral inferior) ao valor de n
que de facto se pretende determinar. Este processo baseia-se na substituição
da desigualdade (1.28) pela desigualdade

4 S 2 (z(1 − α/2))2
n ≥ , (1.29)
L2
proveniente de (1.28) pela substituição de tn−1 (1 − α/2) por z(1 − α/2).
Note-se que z(1 − α/2) < tn−1 (1 − α/2), para qualquer n ∈ IN , com

lim tn−1 (1 − α/2) = z(1 − α/2) .


n→∞

Assim, o menor valor de n ∈ IN que verifique a desigualdade (1.29) será um


valor de n determinado por defeito, o qual será de facto bastante próximo
do menor valor de n que será solução de (1.28) em situações em que este
valor seja suficientemente elevado (geralmente para valores de n superiores
a 25-30). A terceira possibilidade é a de calcularmos n ’por excesso’, i.e.
utilizando um processo que sabemos a priori ir conduzir a um valor de
Bibliografia • 29

n demasiado elevado, consistindo na utilização em (1.28) de um quantil


demasiado elevado em lugar de tn−1 (1 − α/2), sendo este em geral o quantil
1 − α/2 de uma v.a. com distribuição T de Student com menos graus de
liberdade que os devidos (sendo que os ’devidos’ graus de liberdade seriam
iguais a n−1, onde n deveria ser, no mı́nimo, o menor valor de n que verifique
(1.28)). Habitualmente utilizaremos para n a dimensão da amostra utilizada
para calcular a estimativa de σ 2 , i.e., o valor observado de S 2 , partindo do
princı́pio que a dimensão mı́nima de amostra que será solução de (1.28) será
superior a este valor. Note-se que, para um dado valor de α, os quantis
1 − α/2 de uma v.a. com distribuição T , vão diminuino à medida que o
número de graus de liberdade aumenta.
Na prática utiliza-se muitas vezes quer o processo iterativo quer o cálculo
’por defeito’ seguido do cálculo ’por excesso’, procedendo-se então ao cálculo
do valor médio de n obtido por estes dois últimos processos.
Questão semelhante poder-se-á colocar também para outros IC’s e testes,
sendo o caso tratado de forma algo análoga, com as devidas adaptações
(veja-se a alı́nea e) do Exercı́cio 1.18).

Bibliografia
(Leitura recomendada)

Dagnelie, P. (1980). Théorie et Méthodes Statistiques. Applications Agrono-


miques. Vol II. (Les méthodes de l’inférence statistique). Les Presses
Agronomiques de Gembloux. Reimpr. 2.a ed. (cap. 12 (12.1,12.2),
cap 13 (13.1,13.2))

Knight, K. (2000). Mathematical Statistics, Chapman & Hall/CRC, New


York. (Cap. 7)

Lehmann, E. L., Romano, J. P. (2005) Testing Statistical Hypotheses, 3 a


ed.. Springer, New York.

Mood, A. M., Graybill, F. A., Boes, D. C. (1974). Introduction to the


Theory of Statistics, 3 a ed.. McGraw-Hill, New York.

Pearson, E. S. e Hartley, H. O. (1972). Biometrika Tables for Statisticians.


Vol. 2. Cambridge, England. Cambridge Univ. Press.
30 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

Rohatgi, V. K. (1976). An Introduction to Probability Theory and Mathe-


matical Statistics. J. Wiley & Sons, New York.

Rothman, E. D. and Ericson, W. A. (1986). Statistics: Methods and Ap-


plications. Kendall/Hunt Pub. Company, Dubuque, Iowa. 2.a ed.
(cap. 13)

Smith, G. (1988). Statistical Reasoning. Allyn and Bacon, Inc., Needham


Heights, Massachusetts, 2.a ed. (cap. 12 (12.2,12.3))
Exercı́cios • 31

Exercı́cios

Exercı́cios :
1.1 Suponhamos que é habitualmente aceite que a altura (medida em
cm) de determinada cultivar de milho é uma v.a. normal com média
200 e variância desconhecida. Um certo experimentador pensa que
a asserção quanto ao valor médio está errada e decide implemen-
tar uma experiência que lhe permita testar tal hipótese. Planta
então um talhão com a referida cultivar de milho, de onde amostra
aleatòriamente 8 plantas. As suas alturas (em cm) eram

198.5 205.5 195.0 190.0 186.5 192.5 191.0 189.5

a) Face ao cenário acima, estabeleça as hipóteses nula e alternativa.


b) Determine a estimativa de um IC bilateral correspondente a 0.95
de probabilidade para µ (a verdadeira média).
c) Para um α = 0.05 e face aos dados recolhidos pelo experimentador
teste as hipóteses em a). Comente o resultado obtido face aos
resultados obtidos em b).
d) Determine uma estimativa de um IC bilateral para µ correspon-
dente a 0.99 de probabilidade.
e) Teste mais uma vez as hipóteses de a), agora utilizando α = 0.01.
Os resultados fazem sentido face aos de c)? Comente face aos
resultados de b) e d).
f) Suponha agora que o experimentador tinha sido mais preciso e
tinha dito que achava que a asserção quanto ao valor médio da
altura da referida cultivar estava errado mas por excesso (i.e.
ele pensa que tal altura média é inferior a 200cm). Estabeleça
agora as hipóteses H0 e H1 .
g) Determine um IC unilateral correspondente a 0.95 de probabili-
dade para µ. Escolha o IC unilateral que lhe permita testar as
hipóteses em f).
h) Face ao novo cenário estabelecido em f), teste, para α = 0.05 as
hipóteses aı́ estabelecidas. Confronte com os resultados de c) e
g).
i) Teste as hipóteses em f), agora para α = .01. Os resultados fazem
sentido face aos resultados de h)?
32 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

j) Determine um IC unilateral para µ que lhe permita (para α =


0.01) executar o mesmo teste pedido em i). Execute então tal
teste.
k) Se em f) o sinal que figura em H1 fosse invertido, qual seria a
nova regra de decisão para um teste de nı́vel α?
l) Qual deveria ser a dimensão da amostra (n) para conseguir, para
um α de 0.05 localizar µ com um erro (amplitude do Intervalo
de confiança bilateral para µ) não superior a 6cm?
m) Relativamente à variância, σ 2 , da variável aleatória em questão
(altura de um pé de determinada cultivar de milho, medida em
cm), pretende-se efectuar o teste das seguintes hipóteses
H0 : σ 2 = 150
vs
H1 : σ 2 6= 150
para α = 0.05 e α = 0.01. Execute tais testes.
n) Construa IC’s bilaterais correspondentes às probabilidades de
0.95 e 0.99 para σ 2 . Confronte os resultados obtidos com os
da alı́nea m).
o) Suponha agora que se pretendia testar
H0 : σ 2 = (≥)150
vs
H1 : σ 2 < 150
para α = 0.05 e α = 0.01. Execute tais testes.
p) Construa IC’s unilaterais para σ 2 correspondentes às probabili-
dades 0.95 e 0.99 adequados à realização do teste pedido em o)
e confronte os resultados obtidos com os obtidos em o).
q) Os resultados de o) fazem sentido face aos de m)?
r) Diga o que teve de assumir para que fosse legı́tima a realização de
todos os testes da forma levada a efeito e para que tivesse sig-
nificado o cálculo das estimativas dos IC’s da forma efectuada.
Explique porque é necessário que tal se assuma.

1.2 Suponhamos que se pretende determinar se, em termos médios, em


determinado estágio de desenvolvimento, o comprimento da folha do
1.o nó e da folha do 2.o nó de determinada cultivar de milho diferem
ou não. Para tal efeito plantou-se um talhão com essa cultivar de
milho e amostraram-se então na devida altura os comprimentos das
Exercı́cios • 33

folhas do 1.o e do 2.o nó (medidos em cm) em 11 plantas. Os resul-


tados foram os seguintes:
Planta
1 2 3 4 5 6 7 8 9 10 11
Folha 1o nó 52.5 49.7 48.6 49.6 46.4 52.3 51.2 50.9 46.7 48.7 49.2
Folha 2o nó 53.0 52.1 47.5 52.1 47.1 55.6 54.2 50.4 45.0 48.9 51.8

a) Diga se se trata de um problema de amostras independentes ou


emparelhadas. Justifique.
b) Face ao enunciado acima, estabeleça as hipóteses nula e alterna-
tiva.
c) Teste as hipóteses em b), para α = 0.05. Valeria a pena testar as
mesmas hipóteses para α = 0.01?
d) Calcule a estimativa de um IC bilateral para a média das diferenças
correspondente a uma probabilidade de .95 . Confronte com o
resultado obtido em c).
e) Como escreveria as hipóteses nula e alternativa e como execu-
taria o teste se o investigador que realizou a experiência tivesse
como hipótese que a folha do 2.o nó tinha um comprimento em
termos médios superior ao da folha do 1.o nó? Determine um
Intervalo de Confiança que lhe permitisse dar uma resposta a
essa questão.
f) Diga que pressupostos teve de assumir na resolução das alı́neas
anteriores. Porque são necessários tais pressupostos?

1.3 Pretende-se avaliar o efeito do adubo A sobre a produção de deter-


minada cultivar do cereal T . Para tal efeito certo experimentador
plantou 2 talhões com a referida cultivar, tendo aplicado o adubo A só
num deles. De cada talhão foram então amostradas 12 áreas de 1m2 .
Em cada uma destas áreas foram colhidas todas as plantas e pesado
o grão. Os dados obtidos, expressos em gramas foram os seguintes:
Talhão c/
422 460 455 466 475 472 465 456 452 430 458 470
adubo
Talhão s/
470 437 429 447 432 457 422 425 432 474 452 442
adubo

a) Diga se se trata de um problema de amostras independentes ou


emparelhadas. Justifique.
b) Estipule as hipóteses a testar, face ao enunciado.
c) Teste as hipóteses em b), para α = .05 e α = .01.
34 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

d) Determine estimativas de IC’s unilaterais correspondentes a .95


e .99 de probabilidade para a diferença das médias que lhe per-
mitam confrontar os resultados de c). Confronte os resultados
com os de c).
e) O que decidiria quanto à utilização do adubo?
f) Considere uma hipótese alternativa bilateral. Teste esta hipótese
contra a hipótese nula em b), para α = .05 e α = .01.
g) Determine estimativas de IC’s bilaterais correspondentes a .95 e
.99 de probabilidade para a diferença das médias. Confronte
com os resultados de f).
h) Supondo que pretende fazer duas amostras de igual dimensão,
qual deveria ser essa dimensão de modo a conseguir, para α =
.05, obter um IC para a diferença de médias com semi-amplitude
não superior a 8g?
i) Diga o que teve de assumir para serem legı́timos os testes e terem
significado as estimativas de IC’s acima calculadas.
j) Teste se o que assumiu em relação às variâncias é ou não legı́timo.
Estabeleça as hipóteses nulas e alternativa e realize o teste.
k) Resolva a alı́nea j) através do cálculo da estimativa de um IC
apropriado.

1.4 Certo investigador pensa ter razões suficientes para afirmar que a
utilização de determinado herbicida, habitualmente utilizado na cul-
tura do cereal T, conduz a produções mais elevadas, por combater
as infestantes. O experimentador pensa mesmo poder afirmar que
’a aplicação do herbicida conduz a aumentos de produção superi-
ores a 80g/m2 ’. Com a finalidade de testar a sua hipótese decidiu
estabelecer um ensaio onde em 6 pequenos talhões de terreno, cor-
respondentes a 6 diferentes tipos de solo, divididos em 2 lotes cada
um, foi semeado o cereal T. Posteriormente foi aplicado o herbicida
em apenas um dos 2 lotes, seleccionado aleatoriamente. Realizada a
colheita, os resultados referentes à produção do cereal T, em g/m2 ,
foram os seguintes:
Talhão
1 2 3 4 5 6
Lote c/ herbicida 380 420 450 360 410 390
Lote s/ herbicida 280 290 370 260 270 280
Exercı́cios • 35

a) Diga se se trata de um problema de amostras independentes ou


emparelhadas. Justifique sumariamente.
b) Estipule as hipóteses nula e alternativa face ao enunciado acima.
Utilizando a abordagem paramétrica usual, teste essas hipóteses
para α = .05 e α = .01. Comente os resultados indicando a que
conclusões chegou. O que aconselharia quanto à utilização do
herbicida?
c) Que pressupostos teve de assumir para realizar a abordagem para-
métrica em b)? Porque é(são) necessário(s) tal(tais) pressupos-
to(s)?

1.5 Pretendendo-se avaliar o efeito das condições edafo-climáticas sobre


o crescimento de determinada espécie florestal decidiu-se medir os
diâmetros (à altura do peito - DAP) de um total de 12 árvores,
escolhendo-se aleatoriamente 6 em cada um de 2 povoamentos su-
jeitos a condições edafo-climáticas distintas. Os povoamentos tinham
sido plantados com árvores da mesma idade e do mesmo genótipo.
O experimentador pensa que devido às diferentes condições edafo-
-climáticas pode afirmar que o povoamento B tem árvores cujo diâme-
tro médio excede em mais de 2.5cm o diâmetro médio das árvores do
povoamento A. Os resultados das medições dos diâmetros, em cm,
foram os seguintes:
Árvore
1 2 3 4 5 6
Povoamento A 9.2 12.8 10.4 12.0 10.0 13.8
Povoamento B 12.5 16.4 15.3 14.4 13.5 12.1
Responda às seguintes alı́neas, justificando sumária mas adequada-
mente as suas respostas.

a) Pensa que se trata de um problema de amostras independentes


ou emparelhadas?
b) Estipule, face ao enunciado, as hipóteses nula e alternativa
adequadas à utilização de uma abordagem paramétrica do pro-
blema em questão. Teste essas hipóteses, utilizando α=.05 e
α =.01 . A que conclusões chegou? Existe alguma contradição
nessas conclusões?
c) Que pressuposto(s) teve de admitir na abordagem paramétrica
em b)? Porque é(são) necessário(s) tal(tais) pressuposto(s)?
36 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

d) Deduza a partir da distribuição da estatı́stica do teste utilizada


na alı́nea b) a expressão de um Intervalo de Confiança (IC),
correspondente a uma probabilidade 1 − α, que permita uma
abordagem equivalente ao teste realizado em b). Calcule então
o(s) limite(s) de um tal IC, correspondente a uma probabilidade
de .95, para o problema em estudo e relacione o resultado obtido
com o(s) resultado(s) de b).

1.6 Certo experimentador julga ter razões para pensar que a produção
de uma videira da Casta A excede, em termos médios, em mais
de um quilograma a de uma videira da Casta B. Pretendendo tes-
tar esta hipótese decide então seleccionar aleatóriamente 5 videiras
numa vinha da Casta A e cinco outras numa vinha da Casta B. As
duas vinhas encontram-se plantadas sobre dois talhões contı́guos que
apresentam caracterı́sticas uniformes quanto ao solo, topografia e ex-
posição. Na devida altura avaliou a produção das referidas videiras,
tendo-a registado em quilogramas. Os resultados foram os seguintes:
Videira
1 2 3 4 5
Casta A 8.6 8.8 8.2 8.9 7.5
Casta B 6.8 5.6 5.8 6.4 7.8

a) Trata-se de um problema de amostras independentes ou empare-


lhadas? Justifique.

Utilizando uma abordagem paramétrica:


b) Face ao problema posto no enunciado, estabeleça as hipóteses
nula e alternativa e execute o teste para α = .05 e α = .01.
Comente os resultados.
c) Suponha agora que o investigador tinha somente como hipótese
que as produções médias das Castas A e B são diferentes. Es-
tabeleça as hipóteses nula e alternativa e execute o teste para
α = .05 e α = .01.
d) O que teve de assumir para poder utilizar a abordagem paramé-
trica? Porque é (são) necessária(s) tal(tais) asserção(ões)?
e) Determine um IC bilateral para a diferença das médias das
produções das Castas A e B, correspondente a uma probabili-
dade de .95. Como relaciona o resultado obtido com algum ou
alguns anteriormente obtidos?
Exercı́cios • 37

f) Qual deverá ser a dimensão comum das amostras se preten-


dermos, para um α de .05, determinar a diferença entre as
produções médias das Castas A e B com um erro (amplitude do
IC bilateral) inferior a 0.5Kg?

1.7 Um tipo de poda vulgar em videiras é um sistema que deixa 2


ramos base, usualmente designados ramo A e ramo B, sendo o ramo
chamado A digamos o ramo principal. Determinado viticultor pensa
poder afirmar que, na casta que cultiva, em termos médios, a produção
do ramo A excede em mais de 0.5Kg a do ramo B. Com a finalidade
de testar a sua hipótese decidiu seleccionar aleatòriamente 6 videiras
da sua vinha, nas quais, na altura da colheita, avaliou o peso de uvas
produzidas pelo ramo A e pelo ramo B. Os dados obtidos, em Kg,
foram os seguintes:
Videira
1 2 3 4 5 6
Ramo A 4.5 4.4 4.1 4.6 3.7 3.6
Ramo B 3.4 2.8 2.9 3.2 3.9 3.7

a) Trata-se de um problema de amostras independentes ou empare-


lhadas? Justifique.

Utilizando uma abordagem paramétrica:


b) Face ao problema posto no enunciado, estabeleça as hipóteses
nula e alternativa e execute o teste para α = .05 e α = .01.
Comente os resultados.
c) Suponha agora que o investigador tinha apenas como hipótese
que o ramo A produzia em média mais do que o ramo B. Es-
tabeleça as hipóteses nula e alternativa e execute o teste para
α = .05 e α = .01.
d) O que teve de assumir para poder utilizar a abordagem paramé-
trica? Porque é (são) necessária(s) tal(tais) asserção(ões)?
e) Determine um IC unilateral para o parâmetro de localização em
estudo, correspondente a uma probabilidade de .95, escolhendo
um Intervalo de Confiança unilateral que lhe permita comprovar
os resultados obtidos em b) e c). Como relaciona o resultado
obtido com os resultados de b) e c)?
f) Qual deverá ser a dimensão da amostra se pretendermos, para
um α de .05, determinar a média da diferença entre as produções
38 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

do ramo A e do ramo B com um erro (amplitude do IC bilateral)


inferior a 0.75Kg?

1.8 Certo investigador pensa ter razões para crer que, em média, o com-
primento da nervura principal das folhas de videiras da casta Fernão
Pires, plenamente desenvolvidas, excede em mais de 0,4cm o compri-
mento da nervura esquerda. Com a finalidade de testar tal hipótese
decide seleccionar aleatóriamente 12 folhas de uma videira em plena
frutificação da casta Fernão Pires, nas quais mediu os comprimen-
tos da nervura esquerda (l2e) e da nervura principal (l1), ambos em
centı́metros. Os resultados foram os seguintes:
Folha
1 2 3 4 5 6 7 8 9 10 11 12
l2e 11.4 8.8 13.2 11.7 9.7 12.0 11.5 9.0 11.0 11.2 8.0 10.0
l1 13.8 9.1 14.5 13.8 12.0 11.5 12.5 9.4 12.5 10.3 9.6 10.5

a) Trata-se de um problema de amostras independentes ou empare-


lhadas?

Utilizando uma abordagem paramétrica:


b) Face ao enunciado acima, estabeleça as hipóteses nula e alterna-
tiva.
c) Teste as hipóteses em b) para α = .05 e α = .01. Interprete os
resultados.
d) Suponha agora que o investigador apenas tinha como hipótese
que, em média, o comprimento da nervura principal é maior
que o da nervura esquerda. Estabeleça as hipóteses nula e al-
ternativa e execute o teste para α = .05 e α = .01.
e) Suponha agora que o investigador apenas pretendia ver se o com-
primento médio da nervura principal diferia do da nervura es-
querda. Estabeleça as hipóteses nula e alternativa e execute o
teste para α = .01.
f) O que teve de assumir para poder utilizar a abordagem paramétrica?
Porque é (são) necessária(s) tal(tais) asserção(ões)?
g) Determine IC’s unilaterais para a média da diferença entre os
comprimentos da nervura esquerda e da nervura principal, con-
struı́dos sobre a zona de não-rejeição da hipótese nula em b),
correspondentes a probabilidades de .95 e .99 . Como relaciona
o resultado obtido com o da alı́nea c)?
Exercı́cios • 39

h) Determine um IC bilateral para a média da diferença entre os


comprimentos da nervura esquerda e da nervura principal, cor-
respondente a uma probabilidades de .99 . Como relaciona o
resultado obtido com alguns anteriormente obtidos?
i) Qual deverá ser a dimensão da amostra se pretendermos, para
um α de .01, determinar o valor médio da diferença entre os
comprimentos da nervura esquerda e da nervura principal com
um erro (amplitude do IC bilateral) inferior a 1cm?

1.9 Pretendendo-se testar se existe ou não diferença entre os comprimen-


tos médios das nervuras principais de folhas de videiras das castas
Fernão Pires e Vital, procedeu-se à medição dos comprimentos das
referidas nervuras em 6 folhas seleccionadas aleatóriamente numa
vinha da casta Fernão Pires e em 6 folhas seleccionadas aleatóriamente
numa vinha da casta Vital. Os resultados, em centı́metros foram os
seguintes:
Folha
1 2 3 4 5 6
F. Pires 13.8 11.1 14.5 12.7 12.0 11.5
Vital 11.7 10.6 11.0 9.8 10.1 11.3

a) Trata-se de um problema de amostras independentes ou empare-


lhadas? Justifique.

Utilizando uma abordagem paramétrica:


b) Face ao enunciado acima, estabeleça as hipóteses nula e alter-
nativa.
c) Teste as hipóteses em b) para α = .05 e α = .01. Discuta os
resultados.
d) Suponha agora que o investigador tinha como hipótese que o
comprimento médio da nervura principal das folhas da casta F.
Pires excede em mais de 5mm o comprimento médio da nervura
principal das folhas da casta Vital. Estabeleça as hipóteses nula
e alternativa e execute o teste para α = .05.
e) Determine um IC bilateral para a diferença das médias dos com-
primentos da nervura principal das folhas da casta F. Pires
e da casta Vital, correspondente a uma probabilidade de .95.
Como relaciona o resultado obtido com outro(s) anteriormente
obtido(s)?
40 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

f) Qual deverá ser a dimensão comum das amostras se pretender-


mos, para um α de .05, determinar a diferença das médias dos
comprimentos das nervuras com um erro (semi-amplitude do
IC bilateral) inferior a 1.1cm?
g) O que teve de assumir para poder utilizar a abordagem paramé-
trica? Porque é (são) necessária(s) tal(tais) asserção(ões)?

1.10 Para determinados estudos em Engenharia Agronómica é importante


avaliar o comportamento da temperatura a diferentes profundidades
no solo. Certo investigador pensa poder afirmar que, em determi-
nada estação meteorológica onde é avaliada a temperatura do solo
à superfı́cie e às profundidades de 10 e 20 cm, no mês de Abril, às
9 horas da manhã, a temperatura do solo à profundidade de 20 cm
excede em mais de 1o C a temperatura à profundidade de 10cm. Para
testar tal hipótese decide seleccionar aleatóriamente um dia do mês
de Abril em cada um dos últimos 5 anos de registos e tomar os valores
da temperatura, em graus centı́grados, a 10 e a 20 cm de profundi-
dade, às 9 horas da manhã. Os resultados foram os seguintes:
Dia
1o 2o 3o 4o 5o
10 cm 15 12 12 18 10
Prof.
20 cm 19 16 11 21 13
a) Trata-se de um problema de amostras independentes ou empa-
relhadas? Justifique.

Utilizando uma abordagem paramétrica:


b) Face ao enunciado acima, estabeleça as hipóteses nula e alter-
nativa e teste as hipóteses em b) para α = .05 e α = .01.
c) Suponha agora que o investigador tinha apenas como hipótese
que a temperatura a 10 e a 20 cm de profundidade são difer-
entes. Estabeleça as hipóteses nula e alternativa e execute o
teste para α = .05 e α = .01. Discuta os resultados.
d) O que teve de assumir para poder utilizar a abordagem paramé-
trica? Porque é (são) necessária(s) tal(tais) asserção(ões)?
e) Determine um IC bilateral para a média da diferença das tem-
peraturas a 10 e a 20 cm de profundidade, correspondente a
uma probabilidade de .95 . Como relaciona o resultado obtido
com outro(s) anteriormente obtido(s)?
Exercı́cios • 41

f) Qual deverá ser a dimensão da amostra se pretendermos, para


um α de .05, determinar a média da diferença das temperaturas
com um erro (semi-amplitude do IC bilateral) inferior a 1o C?

1.11 Determinado investigador pensa poder afirmar que a pereira Rocha


do clone A produz frutos com maior diâmetro que a pereira Rocha do
clone B. Apresentando ambas as pereiras grande porte e tendo pro-
duzido um elevado número de frutos, o investigador decidiu recolher
uma amostra aleatória de 5 frutos da pereira A e outra de 5 frutos da
pereira B, com a finalidade de testar a hipótese avançada acima. Os
resultados, relativamente aos diâmetros das peras foram os seguintes
(em mm):

Pereira – Clone A 72 84 74 70 78
Pereira – Clone B 70 71 67 69 68

a) Diga se está perante um problema de amostras emparelhadas ou


independentes. Justifique.
b) Se tiver em vista executar o teste paramétrico usual, como esta-
beleceria as hipóteses nula e alternativa, face à questão lev-
antada pelo investigador e face à forma como foi colocada no
enunciado? Execute o teste utilizando α = .05 e α = .01. Que
conclusões tira?
c) Determine um Intervalo de Confiança (IC) que lhe permita
responder à questão colocada no enunciado e testar as hipóteses
em b) para α =.05 . Trata-se de um IC bilateral ou unilateral?
Trata-se de um IC para que parâmetro(s) ou que função de
parâmetro(s)?
d) Pode ou não utilizar o IC acima para testar a hipótese de outro
investigador que diz pensar ser correcta a firmação de que a
pereira do clone A produz peras com um calibre que excede em
termos médios em mais de 2mm o calibre médio das peras da
pereira do clone B? Se achar que sim escreva as hipóteses nula
e alternativa envolvidas e execute o teste.

1.12 Um pomar que apresenta caracterı́sticas edafo-topográficas homogé-


neas e árvores equiéneas, de caracterı́sticas também homogéneas,
sujeitas até há duas épocas ao mesmo sistema de condução, foi nessa
altura dividido em dois talhões. Em cada um dos talhões foi então
utilizado um sistema de poda diferente. Em cada um dos dois talhões
42 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

foram seleccionadas aleatoriamente 5 árvores, tendo sido as seguintes


as produções obtidas (em Kg)
Árvore
1 2 3 4 5
Sist. A 43 43 50 51 52
Sist. B 35 46 40 36 44

a) Trata-se de um problema de amostras independentes ou empa-


relhadas? Justifique.
Utilizando uma abordagem paramétrica
b) Suponha que o experimentador pretende apenas testar se os
dois sistemas de poda conduzem ou não a produções idênticas.
Estabeleça as hipóteses nula e alternativa e execute o teste para
α = .05 e α = .01.
c) Suponha agora que o experimentador acha que o sistema de
poda A deverá conduzir a uma produção média que excede em
mais de 2Kg a produção média do sistema de poda B. Esta-
beleça as hipóteses nula e alternativa e execute o teste para
α = .05 e α = .01. Comente os resultados obtidos.
d) O que teve de assumir para poder realizar a abordagem paramé-
trica que realizou? Porque é(são) necessária(s) tal(tais) asser-
ção(ões)?
e) Determine um IC bilateral para a diferença das médias das
produções dos dois sistemas de poda, correspondente a uma
probabilidade de .95 . Interprete o resultado obtido. Como o
relaciona com alguma das alı́neas anteriores?
f) Qual deverá ser a dimensão comum das amostras se preten-
dermos, para um α de .05, determinar a diferença entre as
produções médias dos dois sistemas de poda com um erro (semi-
amplitude do IC bilateral) inferior a 5Kg?

1.13 Certo produtor de leite pretendendo avaliar o possı́vel efeito de


duas diferentes dietas sobre a produção leiteira das suas vacas decidiu
seleccionar aleatoriamente 5 vacas da mesma idade, da mesma raça
e plenamente sãs. Depois de alimentadas durante 6 meses com a
dieta designada por dieta A foi avaliada a sua produção de leite num
dado dia. As mesmas 5 vacas, depois de submetidas durante 6 meses
ao regime alimentar B foram também avaliadas num dado dia quanto
Exercı́cios • 43

à sua produção de leite. Os resultados foram os seguintes (em litros


de leite):
Vaca
1 2 3 4 5
Após dieta A 4.2 4.5 5.0 4.6 4.0
Após dieta B 4.8 4.9 5.4 5.2 3.9
Admitindo que a experiência foi conduzida de forma que não existe
efeito de condicionamento, isto é, que a ordem em que foram admi-
nistradas as dietas não afecta os resultados dos rendimentos de leite,
responda às seguintes alı́neas.
a) Trata-se de um problema de amostras independentes ou empa-
relhadas? Justifique.
b) Utilizando a abordagem paramétrica usual, diga se será lı́cito
admitir que os rendimentos médios das duas dietas são equiv-
alentes. Estabeleça as hipóteses nula e alternativa e execute o
teste para α = .05 e α = .01.
c) Utilizando ainda uma abordagem paramétrica, suponha agora
que o produtor tinha como hipótese que a dieta B conduzia a
uma produção de leite que excedia em média em mais de 0.25
litros a produção obtida com a dieta A. Estabeleça as hipóteses
nula e alternativa e execute o teste para α = .05 e α = .01.
Comente os resultados obtidos, relacionando-os, na medida do
possı́vel com os da alı́nea anterior
d) Quais os pressupostos que teve de assumir para realizar os testes
paramétricos? Porque é(são) necessária(s) tal(tais) asserção(ões)?
e) Uma forma alternativa de realizar a experiência teria sido
seleccionar aleatoriamente 5 vacas, as quais seriam submetidas
durante 6 meses à dieta A e outras 5 vacas que seriam submeti-
das durante o mesmo perı́odo de tempo à dieta B. Discuta quais
as vantagens e inconvenientes desta alternativa.

1.14 Certo experimentador pretende avaliar se a temperatura média diária


de Março no Porto é inferior em mais de 2o C à de Lisboa. Seguindo
uma técnica adequada, seleccionaram-se aleatòriamente 9 dias de
Março e para cada um desses dias foi então anotada a temperatura
média diária para o Porto e Lisboa, tendo-se verificado os seguintes
valores
44 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

Dia 1 2 3 4 5 6 7 8 9
Porto 9.2 13.4 11.5 12.4 8.4 7.5 10.2 12.0 11.1
Lisboa 12.0 17.0 14.6 15.7 11.3 10.7 13.1 11.9 13.7

a) Diga, justificando, se se trata de um caso de amostras indepen-


dentes ou emparelhadas.

Suponha agora que se verificam as condições necessárias para a aplica-


ção de um teste paramétrico.

b) Face à questão inicialmente levantada no enunciado, estabeleça


as hipóteses nula e alternativa. O teste associado é unilateral
ou bilateral?
c) Teste as hipóteses acima, para α = .05 e α = .01. Discuta
sucintamente os resultados.
d) Pretende-se agora saber se é de admitir, para um valor de α =
.05, que a temperatura média diária no mês de Março em Lisboa
é, em média, três graus superior à do Porto. Determine um
intervalo de confiança adequado para responder à questão.
e) Diga o que teve de assumir para poder utilizar o teste paramétrico
e determinar o Intervalo de Confiança da forma que o fez. Dis-
cuta a importância dessa(s) asserção( oes).

1.15 Certo experimentador pretende avaliar se a temperatura máxima


diária de Janeiro, em determinado local, é, em termos médios, mais
de dois graus centı́grados mais elevada do que a temperatura máxima
diária, no mesmo local, no mês de Fevereiro. Seguindo uma técnica
adequada, seleccionaram-se aleatòriamente 9 dias de Janeiro e 9 dias
de Fevereiro, tendo sido anotada a temperatura máxima diária para
cada um desses dias, no local de estudo. Os valores obtidos (em
graus centı́grados) foram os seguintes:
Janeiro 9.2 13.4 11.5 12.4 8.4 7.5 10.2 12.0 11.1
Fevereiro 12.0 17.0 14.6 15.7 11.3 10.7 13.1 11.9 13.7

a) Diga, justificando, se se trata de um caso de amostras indepen-


dentes ou emparelhadas.

Suponha agora que se verificam as condições necessárias para a aplica-


ção de um teste paramétrico.
Exercı́cios • 45

b) Face à questão inicialmente levantada no enunciado, estabeleça


as hipóteses nula e alternativa. O teste associado é unilateral
ou bilateral?
c) Teste as hipóteses acima, para α = .05 e α = .01. Discuta
sucintamente os resultados.
d) Pretende-se agora saber se é de admitir, para um valor de
α = .05, que a temperatura máxima diária no mês de Fevereiro
é, em média, três graus superior à de Janeiro. Determine um
intervalo de confiança adequado para responder à questão.
e) Diga o que teve de assumir para poder utilizar o teste paramétri-
co e determinar o Intervalo de Confiança da forma que o fez.
Discuta a importância dessa(s) asserção(ões).

1.16 Pretende-se comparar a produção de duas cultivares de trigo, C1 e


C2. Um investigador pensa ter razões para postular que a cultivar
C2 tem uma produção que, em termos médios, é superior em mais
de 1t/ha à da cultivar C1. Decide então montar um ensaio num
terreno homogéneo que para o efeito foi dividido em 2 talhões, tendo-
se por escolha aleatória decidido semear a cultivar C1 no talhão 1 e
a cultivar C2 no talhão 2. Findo o ciclo vegetativo foi realizada a
colheita em 5 áreas de 1m2 escolhidas aleatòriamente em cada um
dos talhões. Os valores das produções de grão obtidos, em gramas,
foram os seguintes:
Cultivar C1 378 420 380 450 400
Cultivar C2 535 595 525 585 540
Responda às seguintes questões, justificando sempre adequadamente
as suas respostas.
a) Trata-se de um caso de amostras independentes ou emparel-
hadas?
Utilizando a abordagem paramétrica estudada nas aulas, responda
às seguintes alı́neas:
b) Estipule as hipóteses nula e alternativa face ao cenário exposto.
Teste tais hipóteses para α = .05 e α = .01 . Comente breve-
mente os resultados.
c) Determine um Intervalo de Confiança bilateral, correspondente
a uma probabilidade de .95, para a diferença das médias popula-
46 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

cionais das produções das duas cultivares. Relacione o resultado


obtido com os resultados de b).
d) Qual deveria ser a dimensão comum das amostras para que,
utilizando um α = 0.05, fosse possı́vel determinar o valor da
diferença das produções médias com um erro (semi-amplitude
de um IC bilateral) não superior a 25 gramas?
e) Quais são os pressupostos que teve de assumir para poder
realizar a abordagem paramétrica? Porque são necessários tais
pressupostos?
f) De entre os testes paramétricos estudados, pensa poder aplicar
algum deles para verificar se algum(ns) dos pressupostos que
teve de assumir para a realização da abordagem paramétrica
é(são) ou não plausı́vel(is)?

1.17 Certo experimentador pensa poder afirmar que, para formas com
idêntico grau de dificuldade na identificação, em termos médios,
as pessoas se apercebem dessas formas com a vista direita, a uma
distância que em média excede em mais de 15cm a distância a que
se apercebem de uma forma equivalente, com a vista esquerda. Com
a finalidade de testar esta sua hipótese, o investigador obteve duas
formas desenhadas a preto em fundo branco, com idêntico grau de di-
ficuldade de identificação e decidiu então seleccionar aleatòriamente 6
pessoas da população de interesse, fazendo sempre as pessoas identifi-
carem a forma 1 com a vista direita e a forma 2 com a vista esquerda.
Registou então a distância, em metros, a partir da qual as pessoas
identificavam correctamente a forma correspondente, com a vista di-
reita e com a vista esquerda. Os resultados foram os seguintes:
Pessoa
1 2 3 4 5 6
Vista direita 3.76 2.54 3.96 3.21 2.80 3.52
Vista esquerda 3.51 2.40 3.62 2.96 2.53 3.21

a) Diga se as duas amostras (correspondentes à vista direita e à


vista esquerda) são independentes ou emparelhadas. Justifique
sumariamente.

Assumindo que se encontram reunidas as condições necessárias para


a utilização de uma abordagem paramétrica, responda às alı́neas
seguintes.
Exercı́cios • 47

b) Face ao enunciado acima explicite as hipóteses nula (H0 ) e al-


ternativa (H1 ). Teste estas hipóteses para α = .05 e α = .01 .
A que conclusões chegou?
c) Deduza um IC (Intervalo de Confiança) unilateral, para a média
das diferenças, correspondente a uma probabilidade de 1 − α,
que seja adequado para ser utilizado no teste das hipóteses em
b). Determine então o valor do(s) limite(s) desse IC para uma
probabilidade 1 − α = .95 . Confronte o resultado obtido com o
de b).
d) Qual deveria ser a dimensão da amostra para que, utilizando
um α = 0.5, fosse possı́vel determinar a média da diferença da
distância de correcta visão para as duas vistas, com um erro
(semi-amplitude de um IC bilateral) não superior a 5cm?
e) Que pressupostos teve de admitir para poder realizar a abor-
dagem paramétrica? Porque são importantes tais pressupostos?

1.18 Certo experimentador pensa poder afirmar que em termos médios,


para determinados sons, gerados por uma fonte emissora com deter-
minadas caracterı́sticas por ele bem definidas, as pessoas se aperce-
bem deles com o ouvido direito, a uma distância que em média ex-
cede em mais de 10cm a distância a que se apercebem do mesmo som
gerado pela mesma fonte emissora, com o ouvido esquerdo. Com a
finalidade de testar esta sua hipótese, o investigador decidiu então
seleccionar aleatòriamente 5 pessoas da população de interesse nas
quais mediu a audição do ouvido esquerdo e outras 5 pessoas nas
quais mediu a audição do ouvido direito. Registou então a distância,
em metros, a partir da qual as pessoas ouviam o referido som. Os
resultados foram os seguintes:

Dist.s para os ouvidos direitos 2.84 3.96 3.21 3.04 3.52


Dist.s para os ouvidos esquerdos 2.10 3.20 2.76 2.53 2.91

a) Diga se as duas amostras são independentes ou emparelhadas.


Justifique.
b) Face ao enunciado acima explicite as hipóteses nula (H0 ) e al-
ternativa (H1 ). Teste estas hipóteses para α = .05 e α = .01 .
A que conclusões chegou?
c) Qual(ais) foi(ram) o(s) pressuposto(s) necessário(s) para a reali-
zação do teste paramétrico que acabou de levar a efeito?
48 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

d) Deduza um IC (Intervalo de Confiança), para o(s) parâmetro(s)


em estudo (ou para determinada função do(s) parâmetro(s) em
estudo), correspondente a uma probabilidade de 1−α, que seja
adequado para ser utilizado no teste das hipóteses em b). De-
termine então o valor do(s) limite(s) desse IC para uma proba-
bilidade 1 − α = .95 . Confronte o resultado obtido com o de
b).
e) Qual deveria ser a dimensão comum das amostras para se poder,
para um valor de α = .05, determinar com um erro (semi-
amplitude de um IC bilateral) inferior a 25cm o parâmetro ou
função dos parâmetros que temos vindo a estudar e a testar?
f) Que comentário particularmente relevante acha que se pode
fazer a respeito da experiência levada a cabo?
g) Teste se o que teve de assumir para poder realizar a abordagem
paramétrica que levou a cabo é ou não plausı́vel (utilize α =
0.05).

1.19 Num estudo sobre rebentos micropropagados foram seleccionados


aleatoriamente 6 rebentos, de entre os muitos rebentos de determi-
nado clone que se encontravam disponı́veis e depois de plantados no
novo meio foi medido o seu comprimento (em mm) ao 15.o e ao 25.o
dia. O experimentador acha que entre o 15.o e o 25.o dia terá havido,
em termos médios, um aumento de comprimento de mais de 5mm.
Os comprimentos observados (em mm) foram os seguintes:
Rebento
1 2 3 4 5 6
15.o dia 12 15 14 16 17 14

25.o dia 18 21 21 20 24 22

a) Acha que se trata de amostras independentes ou emparelhadas?


Justifique.
b) Explicite as hipótese nula e alternativa para o problema em es-
tudo, sob uma forma que seja adequada à realização do teste
paramétrico estudado nas aulas. Realize então tal teste, uti-
lizando α = 0.05 e α = 0.01. A que conclusões chega?
c) Diga o que teve de assumir para que a realização do teste
paramétrico em b) seja válida. Porque é(são) necessário(s)
tal(is) pressuposto(s) para a realização do teste paramétrico?
Exercı́cios • 49

d) Supondo que a abordagem paramétrica é adequada, deduza um


IC para a média da diferença, correspondente a uma probabil-
idade de 1 − α relativo às hipóteses que formulou em b). De-
termine a(s) estimativa(s) de tal IC para α = 0.05 e α = 0.01 e
relacione com os resultados que obteve em b).
e) Qual deveria ser a dimensão da amostra para que, utilizando um
α = 0.05, fosse possı́vel determinar o valor médio da diferença,
com um erro (semi-amplitude de um IC bilateral) inferior a
1mm?

1.20 Existem 2 processos quı́micos passı́veis de serem utilizados na produção


de determinado composto. Todavia, o processo B, sendo mais dis-
pendioso, só será posto em prática se conduzir a produções que,
em termos médios, excedam em mais de 5µmol (5 micro-moles) as
produções obtidas com o processo A. Certo experimentador, que de-
fende exactamente esta hipótese, decidiu amostrar 6 implementações
de cada um destes processos. As quantidades de composto obtidas
(em µmol) foram as seguintes:
Processo A 25 21 19 28 23 31
Processo B 38 31 27 38 36 39

a) Diga, justificando, se se trata de um problema de amostras em-


parelhadas ou independentes.
b) Estabeleça as hipóteses nula e alternativa para o problema em
estudo e teste-as para α = 0.05 e α = 0.01. Diga por palavras
suas a que conclusões chegou.
c) Deduza a expressão para um Intervalo de Confiança, correspon-
dente a uma probabilidade de 0.95 que lhe permita testar as
hipóteses em b). Determine a estimativa desse Intervalo de
Confiança, face às amostras obtidas. Como relaciona o resul-
tado obtido com o resultado de b)?
d) Deduza a estatı́stica utilizada no teste em b) e a sua distribuição.
e) Quais os pressupostos que teve de admitir para poder realizar o
teste em b) e o Intervalo de Confinça em c)? Porque são impor-
tantes tais pressupostos? Execute os testes que achar adequa-
dos para saber se deverá ou não admitir que tais pressupostos
se verificam.
50 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

1.21 Um criador de vacas acha que a dieta B, quando administrada du-


rante 1 mês, é passı́vel de conduzir a um aumento de peso que em
termos médios excede em mais de 5Kg o aumento de peso obtido
com a aplicação da dieta A durante um perı́odo de tempo idêntico.
Por forma a testar a sua hipótese, seleccionou aleatoriamente de uma
grande manada, dois grupos de 5 vacas cada um, tendo sido admin-
istrada a dieta A a um dos grupos e a dieta B ao outro grupo, durante
1 mês, no fim do qual foi avaliado o aumento de peso (em Kg) para
cada vaca. Os dados obtidos foram os seguintes:
Vaca
1 2 3 4 5
dieta A 8.5 12.0 6.5 11.0 4.0
dieta B 23.5 19.5 17.0 14.0 21.5
a) Diga, justificando, se se trata de um problema de amostras em-
parelhadas ou independentes.
b) Estabeleça as hipóteses nula e alternativa para o problema em
estudo e teste-as para α = 0.05 e α = 0.01. Diga por palavras
suas a que conclusões chegou.
c) Deduza a expressão para um Intervalo de Confiança, correspon-
dente a uma probabilidade de 0.95 que lhe permita testar as
hipóteses em b). Determine a estimativa desse Intervalo de
Confiança, face às amostras obtidas. Como relaciona o resul-
tado obtido com o resultado de b)?
d) Deduza a estatı́stica utilizada no teste em b) e a sua distribuição.
e) Quais os pressupostos que teve de admitir para poder realizar o
teste em b) e o Intervalo de Confinça em c)? Porque são impor-
tantes tais pressupostos? Execute os testes que achar adequa-
dos para saber se deverá ou não admitir que tais pressupostos
se verificam.

1.22 Um criador de vacas acha que a dieta B, quando administrada du-


rante 1 mês, é passı́vel de conduzir a um aumento de peso que em
termos médios excede em mais de 3Kg o aumento de peso obtido
com a aplicação da dieta A durante um perı́odo de tempo idêntico.
Por forma a testar a sua hipótese, seleccionou aleatoriamente de uma
grande manada, dois grupos de 5 vacas cada um, tendo sido admin-
istrada a dieta A a um dos grupos e a dieta B ao outro grupo, durante
1 mês, no fim do qual foi avaliado o aumento de peso (em Kg) para
cada vaca. Os dados obtidos foram os seguintes:
Exercı́cios • 51

Vaca
1 2 3 4 5
dieta A 8.5 12.0 6.5 11.0 4.0
dieta B 22.5 18.5 16.0 13.0 20.5
a) Diga, justificando, se se trata de um problema de amostras em-
parelhadas ou independentes.
b) Estabeleça as hipóteses nula e alternativa para o problema em
estudo e teste-as para α = 0.05 e α = 0.01. Diga por palavras
suas a que conclusões chegou.
c) Deduza a expressão para um Intervalo de Confiança, correspon-
dente a uma probabilidade de 0.95 que lhe permita testar as
hipóteses em b). Determine a estimativa desse Intervalo de
Confiança, face às amostras obtidas. Como relaciona o resul-
tado obtido com o resultado de b)?
d) Deduza a estatı́stica utilizada no teste em b) e a sua distribuição.
e) Quais os pressupostos que teve de admitir para poder realizar o
teste em b) e o Intervalo de Confinça em c)? Porque são impor-
tantes tais pressupostos? Execute os testes que achar adequa-
dos para saber se deverá ou não admitir que tais pressupostos
se verificam.

1.23 Num estudo sobre possı́veis diferenças de audição entre o ouvido


esquerdo e o direito numa dada população, o experimentador tem
como hipótese que as pessoas se apercebem, em termos médios, de
um dado som com o ouvido esquerdo a uma distância inferior em
mais de 2 metros do que com o ouvido direito. Com a finalidade
de testar a sua hipótese, seleccionou aleatoriamente 6 pessoas dessa
população, sobre as quais registou a distância a que se apercebiam,
com o ouvido esquerdo, e com o ouvido direito, de um determinado
som emitido por uma fonte sonora. Os resultados obtidos foram os
seguintes (em metros):
Dist. (em m) a que se apercebe o som
ouvido direito (X1 ) 12.5 12.0 16.5 13.0 14.0 15.0
ouvido esquerdo (X2 ) 12.5 8.5 8.0 11.0 12.5 10.0
a) Diga, justificando, se se trata de um problema de amostras em-
parelhadas ou independentes.
Responda às alı́neas b) a f), utilizando uma abordagem paramétrica.
52 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

b) Estabeleça as hipóteses nula e alternativa para o problema em


estudo e teste-as para α = 0.05 e α = 0.01. Diga por palavras
suas a que conclusões chegou.
c) Deduza a expressão para um Intervalo de Confiança, correspon-
dente a uma probabilidade de 0.99 que lhe permita testar as
hipóteses em b). Determine a estimativa desse Intervalo de
Confiança, face às amostras obtidas. Como relaciona o resul-
tado obtido com o resultado de b)?
d) Deduza a estatı́stica utilizada no teste em b) e a sua distribuição.
e) Quais os pressupostos que teve de admitir para poder realizar o
teste em b) e o Intervalo de Confinça em c)? Porque são impor-
tantes tais pressupostos? Execute os testes que achar adequa-
dos para saber se deverá ou não admitir que tais pressupostos
se verificam.
f) Determine a dimensão que deveria ter a amostra, para que para
α = 0.05 consigamos determinar a diferença das médias com um
erro (semi-amplitude do IC bilateral) inferior a 1m.
g) Utilize agora um teste não paramétrico para testar hipóteses,
de alguma forma semelhantes às de b).
h) Acha que o teste mais adequado é o teste não-paramétrico ou
o teste paramétrico?

1.24 Num estudo sobre dois processos de deposição de um material semi-


condutor, o experimentador tem como hipótese que o processo B
conduz a espessuras de deposição, em média, inferiores em mais de
2µm, em relação às obtidas com o processo A. Com a finalidade de
testar a sua hipótese, seleccionou aleatoriamente 6 placas obtidas
com o processo A e outras 6 obtidas com o processo B, sobre as
quais mediu a espessura da camada de material semi-condutor. Os
resultados obtidos foram os seguintes (em µm):
Espessura (em µm) a que se apercebe o som
Processo A (X1 ) 12.5 12.0 16.5 13.0 14.0 15.0
Processo B (X2 ) 12.5 8.5 8.0 11.0 12.5 10.0
a) Diga, justificando, se se trata de um problema de amostras em-
parelhadas ou independentes.
Responda às alı́neas b) a f), utilizando uma abordagem paramétrica.
Exercı́cios • 53

b) Estabeleça as hipóteses nula e alternativa para o problema em


estudo e teste-as para α = 0.05 e α = 0.01. Diga por palavras
suas a que conclusões chegou.
c) Deduza a expressão para um Intervalo de Confiança, correspon-
dente a uma probabilidade de 0.99 que lhe permita testar as
hipóteses em b). Determine a estimativa desse Intervalo de
Confiança, face às amostras obtidas. Como relaciona o resul-
tado obtido com o resultado de b)?
d) Deduza a estatı́stica utilizada no teste em b) e a sua distribuição.
e) Quais os pressupostos que teve de admitir para poder realizar o
teste em b) e o Intervalo de Confinça em c)? Porque são impor-
tantes tais pressupostos? Execute os testes que achar adequa-
dos para saber se deverá ou não admitir que tais pressupostos
se verificam.
f) Determine a dimensão que deveria ter a amostra, para que para
α = 0.05 consigamos determinar a diferença das médias com um
erro (semi-amplitude do IC bilateral) inferior a 1m.
g) Utilize agora um teste não paramétrico para testar hipóteses,
de alguma forma semelhantes às de b).
h) Acha que o teste mais adequado é o teste não-paramétrico ou
o teste paramétrico?

1.25 O responsável por um determinado laboratório de informática tem


como hipótese que os computadores com determinada arquitectura,
correndo o sistema operativo J e munidos do processador B execu-
tam uma tarefa importante para o laboratório, em termos médios, em
cerca de menos 1 segundo do que computadores com a mesma arqui-
tectura e correndo o mesmo sistema operativo, mas munidos do pro-
cessador A. Com a finalidade de testar a sua hipótese, o responsável
decidiu seleccionar aleatoriamente 5 computadores de entre os vários
que têm com a referida arquitectura e com o processador A e out-
ros 5 com o processador B. Os tempos de cálculo (em segundos)
para a referida tarefa, observados nos vários computadores, foram os
seguintes:
computador
1 2 3 4 5
processador A (X1 ) 12.1 13.7 13.2 13.9 13.4
processador B (X2 ) 10.0 12.0 11.0 12.1 11.2
54 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

a) Diga, justificando, se se trata de um problema de amostras em-


parelhadas ou independentes.
b) Estabeleça as hipóteses nula e alternativa para o problema em
estudo e teste-as para α = 0.05 e α = 0.01. Diga por palavras
suas a que conclusões chegou.
c) Deduza a expressão para um Intervalo de Confiança, correspon-
dente a uma probabilidade de 0.99 que lhe permita testar as
hipóteses em b). Determine a estimativa desse Intervalo de
Confiança, face às amostras obtidas. Como relaciona o resul-
tado obtido com o resultado de b)?
d) Deduza a estatı́stica utilizada no teste em b) e a sua distribuição.
e) Quais os pressupostos que teve de admitir para poder realizar o
teste em b) e o Intervalo de Confinça em c)? Porque são impor-
tantes tais pressupostos? Execute os testes que achar adequa-
dos para saber se deverá ou não admitir que tais pressupostos
se verificam.
f) Determine qual deveria ser a dimensão comum das duas amos-
tras, para que para α = 0.05 consigamos determinar a diferença
das médias com um erro (semi-amplitude do IC bilateral) não
superior a 1 segundo.

1.26 Num estudo sobre duas diferentes dietas para perús (dieta A e dieta
B), o criador de aves tem a hipótese de que a dieta A conduzirá,
ao fim de duas semanas, a um aumento de peso que, em média,
será superior em mais de 1.5Kg ao aumento de peso a que a dieta
B conduz, quando administrada durante o mesmo perı́odo de duas
semanas. Para executar um teste sobre a sua hipótese, foram admin-
istradas as duas dietas, durante duas semanas, a cada uma das duas
partes em que foi dividida a população de perús em determinado
aviário. Ao fim dessas duas semanas foram seleccionados aleatoria-
mente 6 perús da população que tinha sido sujeita à dieta A e outros
seis perús da população que tinha sido sujeita à dieta B e o ganho
em peso (nessas duas semanas) de cada um dos perús foi registado,
em Kilogramas.
Dieta A 2.7 2.5 2.6 2.0 2.8 1.9
Dieta B 0.6 0.8 0.1 0.5 0.7 0.4
Exercı́cios • 55

a) Diga, justificando, se se trata de um problema de amostras em-


parelhadas ou independentes.
b) Estabeleça as hipóteses nula e alternativa para o problema em
estudo e teste-as para α = 0.05 e α = 0.01. Diga por palavras
suas a que conclusões chegou.
c) Deduza a expressão para um Intervalo de Confiança, correspon-
dente a uma probabilidade de 0.95 que lhe permita testar as
hipóteses em b). Determine a estimativa desse Intervalo de
Confiança, face às amostras obtidas. Como relaciona o resul-
tado obtido com o resultado de b)?
d) Deduza a estatı́stica utilizada no teste em b) e a sua distribuição.
e) Quais os pressupostos que teve de admitir para poder realizar
o teste em b) e o Intervalo de Confiança em c)? Porque são
importantes tais pressupostos? Execute os testes que achar
adequados para saber se deverá ou não admitir que tais pressu-
postos se verificam.

1.27 Um especialista em informática pretende testar os tempos de ex-


ecução de 2 diferentes algoritmos (processos de cálculo), A e B, tendo
com hipótese que, em termos médios, o algoritmo B conduz a tempos
de cálculo inferiores em mais de 25µs. Com a finalidade de testar a
sua hipótese decidiu obter uma a.a. de 7 tempos de execução obtidos
com o algoritmo A e outra de 7 tempos de execução obtidos com o
algoritmo B, utilizando sempre a mesma máquina, a trabalhar sob
condições idênticas. Os tempos de execução obtidos (em µs) foram
os seguintes:
1 2 3 4 5 6 7
algoritmo A (X1 ) 131 147 142 149 144 152 137
algoritmo B (X2 ) 100 120 110 121 112 120 112
a) Diga, justificando, se as amostras são emparelhadas ou inde-
pendentes.

Utilizando uma abordagem paramétrica:


b) Estabeleça as hipóteses nula e alternativa para o problema em
estudo e teste-as para α = 0.05 e α = 0.01. Diga por palavras
suas a que conclusões chegou.
c) Deduza a expressão para um Intervalo de Confiança, correspon-
dente a uma probabilidade de 0.95 que lhe permita testar as
56 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

hipóteses em b). Determine a estimativa desse Intervalo de


Confiança, face às amostras obtidas. Como relaciona o resul-
tado obtido com o resultado de b)?
d) Deduza a estatı́stica utilizada no teste em b) e a sua distribuição.
e) Qual(ais) o(s) pressuposto(s) que teve de admitir para poder
realizar o teste em b) e o Intervalo de Confiança em c)? Porque
é (são) importante(s) tal(is) pressuposto(s)? Execute os testes
que achar adequados para saber se deverá ou não admitir que
tal(ais) pressuposto(s) se verifica(m).
f) Qual deveria ser a dimensão comum das amostras, para que
para α = 0.05 fosse possı́vel obter um Intervalo de Confiança
bilateral para µ1 − µ2 com uma semi-amplitude não superior a
5µs?
Utilizando uma abordagem não-paramétrica:
g) Execute um teste a hipóteses de alguma forma próximas às
de b), explicitando tais hipóteses e executando o teste para
α = 0.05 e α = 0.01.

1.28 Certo condutor tem como hipótese que no modelo M de automóveis


da marca C, o combustı́vel do tipo B permite, em termos médios,
uma quilometragem aos 50 litors que supera em mais de 20Km
aquela que em termos médios permite o combustı́vel do tipo A.
Para testar a sua hipótese decidiu seleccionar aleatoriamente 10 au-
tomóveis do modelo M da marca C, tendo então de entre esses 10
automóveis seleccionado aleatoriamente 5 que atestou com 50 litros
de combustı́vel do tipo A, tendo atestado os outros 5 com 50 litros
de combustı́vel do tipo B. As distâncias percorridas (em Km) pelos
automóveis, até esgotarem o combustı́vel, foram as seguintes:
Automóvel
1 2 3 4 5
Combustı́vel tipo A (X1 ) 625 670 632 654 662
Combustı́vel tipo B (X2 ) 694 668 687 692 712
a) Diga, justificando, se as amostras são emparelhadas ou inde-
pendentes.
b) Estabeleça as hipóteses nula e alternativa para o problema em
estudo e teste-as para α = 0.05 e α = 0.01. Diga por palavras
suas a que conclusão chegou.
Exercı́cios • 57

c) Deduza a expressão para um Intervalo de Confiança, correspon-


dente a uma probabilidade de 0.95 que lhe permita testar as
hipóteses em b). Determine a estimativa desse Intervalo de
Confiança, face às amostras obtidas. Como relaciona o resul-
tado obtido com o resultado obtido em b)?
d) Deduza a estatı́stica utilizada no teste em b) e a sua distribuição.
e) Qual(ais) o(s) pressuposto(s) que teve de admitir para poder
realizar o teste em b) e o Intervalo de Confiança em c)? Porque
é (são) importante(s) tal(is) pressuposto(s)? Execute os testes
que achar adequados para saber se deverá ou não admitir que
tal(ais) pressuposto(s) se verifica(m).
f) Qual deveria ser a dimensão comum das amostras, para que
para α = 0.05 fosse possı́vel obter um Intervalo de Confiança
bilateral para µ1 − µ2 com uma semi-amplitude não superior a
10Km?

1.29 Numa dada população, com idades compreendidas entre os 45 e os


55 anos, decidiu-se realizar um estudo sobre algumas medidas corpo-
rais. Com a finalidade de avaliar possı́veis diferenças no perı́metro
do pulso entre os dois sexos, seleccionaram-se aleatoriamente 6 pes-
soas de cada sexo, tendo sido medido o seu perı́metro do pulso. O
experimentador que realizou a experiência tem como hipótese que o
perı́metro do pulso será maior, em mais de 2cm, nos homens. Os
resultados foram os seguintes (em cm):
Mulheres 24.4 22.2 20.1 25.4 26.5 25.3
Homens 26.4 24.1 31.6 32.2 30.6 29.4
a) Pensa tratar-se de um caso de amostras emparelhadas ou inde-
pendentes? Justifique.
b) Utilizando uma abordagem paramétrica,
i) Estabeleça as hipóteses nula e alternativa para o estudo
em questão e teste-as para α = 0.05 e α = 0.01. Diga por
palavras suas a que conclusões chegou.
ii) Determine a expressão para um IC correspondente a uma
probabilidade de 1 − α para o parâmetro ou função de
parâmetros envolvidos no teste, correspondente ao teste das
hipóteses em i). Obtenha, para o problema em estudo, uma
estimativa desse IC, para α = 0.05 e relacione o resultado
obtido com os resultados em i).
58 • Cap.1 -Estimação Intervalar e Testes de Hipóteses

iii) Qual deveria ser a dimensão comum das duas amostras para
que para α = 0.05 tenhamos um IC bilateral com ampli-
tude não superior a 5cm, para o parâmetro ou função de
parâmetros que tem vindo a testar?
iv) Construa a estatı́stica utilizada no teste em i), a partir das
suas asserções e deduza a sua distribuição.
c) Utilize um teste não-paramétrico para testar hipóteses de al-
guma forma semelhantes às hipóteses em i), reformulando-as
adequadamente, se achar que tal é necessário (utilize α = 0.05 e
α = 0.01). O que acha da aplicação de um teste não-paramétrico
ao estudo em questão?

Você também pode gostar