Você está na página 1de 27

MAE0110 - Noções de Estatística

Aula 11 – 29/11
Prof. Igor
Exemplo 1: Um pesquisador deseja comparar o salário de
profissionais da saúde, de ambos os sexos. Para isso,
selecionou uma amostra aleatória de 50 profissionais, sendo
22 do sexo feminino e 28 do sexo masculino. Sabe-se, de
estudos anteriores, que o salário de profissionais da saúde
segue uma distribuição normal.

• As médias salarias da população são iguais?

Masculino Feminino
4708 4412 4010 3768
4603 3868 4122 3939
4017 4252 4344 4459
4534 4265 4446 3827
4402 4377 3938 4197
4526 4000 4514 4306
4584 3441 3400 3935
4594 4172 4264 3748
4236 4203 3850 3838
4817 4001 3676 4016
4008 4464 3604 4274
4083 4706
3788 4681
4009 4729
Comparação entre duas médias populacionais

Um problema comum é o de comparar as médias


(desconhecidas) de duas diferentes populações.

Na comparação de duas populações, dispomos de duas


amostras, em que são possíveis as seguintes situações:

2 amostras
 dependentes


variâncias pop. conhecidas


independentes iguais
variâncias pop.
desconhecidas diferentes
Comparação entre duas médias populacionais

Um problema comum é o de comparar as médias


(desconhecidas) de duas diferentes populações.

Na comparação de duas populações, dispomos de duas


amostras, em que são possíveis as seguintes situações:

2 amostras
 dependentes


variâncias pop. conhecidas


independentes iguais
variâncias pop.
desconhecidas diferentes
Exemplo 1

→ Interesse: Comparar as médias das duas populações.

As duas populações, de onde as amostras são provenientes,


são independentes e normalmente distribuídas;
- a população dos salários de profissionais da saúde do sexo
masculino tem média X e variância X2
 X ~ N(X, X2)
- a população dos salários de profissionais da saúde do sexo
feminino tem média Y e variância Y2
 Y ~ N(Y, Y2)
CASO 1: variâncias conhecidas
Queremos verificar se o salário das mulheres é menor do que o
dos homens.

(1) Hipóteses estatísticas:


H0: X = Y ou, equivalentemente, H0: X - Y = 0
H1: X < Y usando diferenças  H1: X - Y < 0

(2) Estatística de teste


• Estimador de X - Y : X - Y
• Distribuição amostral do estimador: Como X e Y são
independentes com distribuição normal, com médias X e Y
e desvio padrão X2 e Y2, respectivamente, então
 σ 2X σ Y2 
X − Y ~ N  μ X − μY , + ,
 n m
(2) Estatística de teste
Se as variâncias são conhecidas, a estatística de teste é
dada por
(X −Y )
Z=
σ 2X σ Y2  Sob H0, Z ~ N(0,1)
+
n m

(3) Nível de significância:  = 5%

(4) Calcular medidas necessárias:


Tamanho da amostra Média Informação dada:
Masculino (Y) 28 4302,86 X= 280 e Y= 300
Feminino (X) 22 4021,59
(4) Calcular medidas necessárias:
(4302,86 − 4021,59) 281,27
𝑧𝑜𝑏𝑠 = = = 3,388
280² 300² 83,01
+
22 28

(5A) Região de rejeição (teste unilateral superior)


A região de rejeição deve ter a forma: {Z ≥ zc}  𝑧𝑐 = ?
Da N(0,1), com  = 5%, zc = 1,645
 { Z ≥ 1,645}

(6A) Decidir e Concluir


zobs= 3,388  Região de Rejeição  rejeita-se H0
(5B) Nível descritivo P
P = P(Z ≥ 3,388) = 0,0352%.
(6B) Decidir e Concluir
P <   rejeita-se H0 8
Comparação entre duas médias populacionais

Um problema comum é o de comparar as médias


(desconhecidas) de duas diferentes populações.

Na comparação de duas populações, dispomos de duas


amostras, em que são possíveis as seguintes situações:

2 amostras
 dependentes


variâncias pop. conhecidas


independentes iguais
variâncias pop.
desconhecidas diferentes
CASO 2: variâncias desconhecidas, iguais
Exemplo 1: salário de profissionais da saúde. Queremos verificar
se o salário das mulheres é menor do que o dos homens.
Suponha agora: NÃO CONHECEMOS AS VARIÂNCIAS. Temos
apenas a informação de que SÃO IGUAIS (x= Y= ), mas não
sabemos o valor.
(1) Hipóteses estatísticas:
H0: X = Y ou, equivalentemente, H0: X - Y = 0
H1: X < Y usando diferenças  H1: X - Y < 0

(2) Estatística de teste


Temos que: 𝑋ሜ − 𝑌ሜ
(2) Estatística de teste
(X −Y )
T =  Sob H0, T ~ t (n+m-2).
2 1 1
Sp( + )
n m

Não conhecemos , precisamos estimar por:


( n − 1)s X2 + ( m − 1)sY2
s =
2
.
n+m−2
p

- A estimativa sp2 combina informação de ambas amostras


para se produzir uma estimativa mais confiável de 2;
- sp2 é média ponderada das duas variâncias amostrais sX2
e sY2, onde cada variância é ponderada pelos seus graus
de liberdade associados;
- Se n é igual a m, sp2 é a média aritmética simples; caso
contrário, maior peso é dado à variância da maior amostra.
(3) Calcular medidas necessárias:
Tamanho da amostra Média Desvio padrão
Masculino 28 4302,86 335,81
Feminino 22 4021,59 301,10

s2p= [(22-1)301,082+(28-1)335,742] / (22+28-2) = 103.065


sp = 321,085

(4302,87 − 4021,59)
∴ 𝑇𝑜𝑏𝑠 = = 3,075
1 1
321,085 +
22 28

(4) Nível de significância:  = 5%


(5A) Região de Rejeição
A região de rejeição deve ter a forma: T ≥ tc  tc = ?
De t(48 g.l.), com  = 5%, tc = 1,677
 T ≥ 1,677

(6A) Decidir e Concluir


Tobs = 3,075  rejeita-se H0

(5B) Nível descritivo P


P= P(T48 ≥ 3,075) = 0,174%

(6B) Decidir e Concluir


P <   rejeita-se H0
Comparação entre duas médias populacionais

Um problema comum é o de comparar as médias


(desconhecidas) de duas diferentes populações.

Na comparação de duas populações, dispomos de duas


amostras, em que são possíveis as seguintes situações:

2 amostras
 dependentes


variâncias pop. conhecidas


independentes iguais
variâncias pop.
desconhecidas diferentes
CASO 3: variâncias desconhecidas, diferentes
Exemplo 1: salário de profissionais da saúde. Queremos verificar
se o salário das mulheres é menor do que o dos homens.
Suponha agora: NÃO CONHECEMOS AS VARIÂNCIAS E
SABEMOS QUE SÃO DIFERENTES (x  Y ).

(1) Hipóteses estatísticas:

H0: X = Y ou, equivalentemente, H0: X - Y = 0


H1: X < Y usando diferenças  H1: X - Y < 0

(2) Estatística de teste

Temos que: 𝑋ሜ − 𝑌ሜ
Assim, ( X − Y ) − ( μ X − μY )
Z= ~ N (0, 1)
 σ X2 σ Y2 
 + 
 n m

Não conhecemos X2 e Y2  estimamos por sx2 e sY2.

Finalmente, a estatística de teste, sob H0, é


(𝑋ሜ − 𝑌)

𝑇=
𝑆𝑋2 𝑆𝑌2
+
𝑛 𝑚

Sob H0, T ~ t(), em que  é o número de graus de liberdade


dado por
[( s X2 /n ) + ( sY2 /m )]2
 = 2 2 .
[( s X /n ) /( n − 1) + ( sY /m ) / ( m − 1)]
2 2
(3) Nível de significância:  = 5%

(4) Calcular medidas necessárias:

Tamanho da amostra Média Desvio padrão


Masculino 28 4302,86 335,81
Feminino 22 4021,59 301,10

4302,86 − 4021,59
𝑡𝑜𝑏𝑠 = = 3,116
335,812 301,12
+
22 28

[(301,082 /22) + (335,74 2 /28)]2


 = = 47 ,1 .
[(301,08 /22) /(22 − 1) + (335,74 /28) /(28 − 1)]
2 2 2 2

Assim, usamos   47.


17
(5A) Região crítica

A região de rejeição deve ter a forma: T ≥ tc  tc = ?


De t(47 g.l.), com  = 5%, tc = 1,678
 T ≥ 1,678

(6A) Decidir e Concluir


tobs = 3,116  rejeita-se H0

(5B) Nível descritivo P


P = P(T47 ≥ 3,116) = 0,156%

(6B) Decidir e Concluir


P <   rejeita-se H0

18
Comparação entre duas médias populacionais

Um problema comum é o de comparar as médias


(desconhecidas) de duas diferentes populações.

Na comparação de duas populações, dispomos de duas


amostras, em que são possíveis as seguintes situações:

2 amostras
 dependentes


variâncias pop. conhecidas


independentes iguais
variâncias pop.
desconhecidas diferentes
CASO 4: Amostras pareadas
Exemplo 2: Uma empresa deseja estudar o efeito de uma pausa de
dez minutos para um cafezinho sobre a produtividade de seus
trabalhadores. Para isso, sorteou seis operários, e contou o número
de peças produzidas durante uma semana sem intervalo e uma
semana com intervalo. Os resultados sugerem se há ou não melhora
na produtividade? Caso haja melhora, qual deve ser o acréscimo
médio de produção para todos os trabalhadores da fábrica?

Operário 1 2 3 4 5 6
Sem intervalo 23 35 29 33 43 32
Com intervalo 28 38 29 37 42 30

Xi : número de peças produzidas pelo operário i na semana sem


intervalo
Yi : número de peças produzidas pelo operário i na semana com
intervalo
➢ As medidas são tomadas em um único “indivíduo” em dois
pontos distintos no tempo.

➢ Em geral, observações pareadas correspondem a medidas


tomadas antes e depois de uma dada intervenção -- cada
indivíduo é examinado antes que um certo tratamento seja
aplicado e novamente depois que o tratamento foi completado.

➢ Se as medidas são feitas no mesmo sujeito uma certa


variabilidade biológica é eliminada.
➢ não temos que nos preocupar com o fato de um sujeito
ser mais velho do que outro ou se um é homem e o outro é
mulher.

21
➢Outro tipo de emparelhamento: o pesquisador “casa” os
indivíduos de um grupo com aqueles de um segundo
grupo, de modo que os membros de um par sejam
parecidos (em relação a características, tais como, a idade
e o gênero).

➢ Planejamento empregado na tentativa de se controlar


fontes de variação que poderiam influenciar os resultados
da comparação.

➢ A intenção do emparelhamento é, portanto, fazer uma


comparação mais precisa.
Suponha que os dois grupos de observações possam ser
dispostos como a seguir:
Amostra 1 Amostra 2 di = yi - xi
x1 y1 d1 = y1 - x1
x2 y2 d2 = y2 - x 2
... ... ...
xn yn dn = yn - xn

Variável de interesse: D = Y – X ,
e uma amostra de D é d1, d2, ...dn (as diferenças amostrais).

23
Supondo Di  N(D, D2), para i = 1, ..., n,

numa situação geral, queremos testar as hipóteses:

H0: D = 0  a pausa para o café não produz efeito


H1: D > 0  a pausa para o café produz algum efeito

D
Estatística do teste: T=
SD n

Sob H0, a estatística T tem distribuição t-Student com n-1


graus de liberdade.
Voltando ao exemplo:
Gostaríamos de saber se há alguma evidência estatística de
que a pausa para o café aumenta a produtividade.

(1) Hipóteses:
H0: D = 0 H0: X = Y
que equivale a
H1: D > 0 H1: Y > X

D
(2) Estatística de teste: T = ~ t( n −1) , sob H 0 .
SD n

(3) Nível de significância:  = 5%.

25
(4) Calcular medidas necessárias
Amostra de pares  di = yi - xi: 5, 3, 0, 4, -1, -2
6

d i
9
d= i =1
= = 1,5 (média amostral das diferenças)
6 6
6

 i
( d − d ) 2

sD = i =1
= 2,88 (desvio padrão das diferenças)
6 -1
1,5
⇒ 𝑡𝑜𝑏𝑠 = = 1,275
2,88Τ 6

(5A) Região de Rejeição


Sob a hipótese nula H0,
T tem distribuição t-Student com 6 -1 = 5 graus de liberdade.
 = 5%  {T : T5  2,015 } 26
(5B) Nível descritivo:

P(T  1,275) = 12,91%

(6) Decidir e concluir


(A) tobs < 1,275  não se rejeita H0

(B) P >   não se rejeita H0

 não há evidência experimental para concluirmos que a


pausa para um cafezinho melhora a produtividade média..

Você também pode gostar