Você está na página 1de 54

TESTES DE HIPTESES COM DUAS AMOSTRAS

O teste de hipteses da diferena das mdias de duas populaes freqentemente utilizado para determinar se ou no razovel concluir que as mdias das duas populaes so diferentes. Por exemplo: de interesse do controle de qualidade determinar se o mesmo produto oferecido por dois fornecedores diferentes apresenta a mesma quantidade de peas com defeitos. Ao mdico do laboratrio farmacutico interessa determinar se o novo remdio para controle de diabetes eficiente acompanhando dois grupos de pacientes, o primeiro grupo que recebeu o remdio e o outro que recebeu apenas placebo, produto com a mesma forma, porm sem o elemento ativo.

O gerente de compras pode estar interessado em determinar se o mesmo produto oferecido por dois fornecedores diferentes apresenta o mesmo prazo real de entrega. Da mesma forma, o gerente de salrios necessita conhecer se os salrios da mesma categoria de trabalhadores tm o mesmo valor em duas cidades diferentes. Os exemplos mostram o objetivo do analista em determinar se h diferena entre as mdias de duas populaes independentes considerando que as respostas de um grupo so independentes das respostas do outro grupo.

TH Diferenas entre Mdias

Amostras Grandes

Qual a forma da distribuio da diferena de duas mdias? A resposta dada pelo teorema central do limite, que foi apresentado anteriormente. Se for retirado um numero grande de amostras das duas populaes, a distribuio da diferena das duas mdias ser aproximadamente normal. Para amostras grandes, n>30, o Z observado Zo obtido da normalizao da diferena entre as duas mdias utilizando a expresso:
Zo = ( X 1 X 2 ) ( 1 2 )
2 1 2 + 2 n1 n 2

Sendo as varincias das populaes desconhecidas, as varincias das amostras fornecero uma boa aproximao, sendo o denominador da frmula seguinte o erro amostral.
X 1 X 2 ( 1 2 )
2 2 S1 S2 + n1 n2

Zo =

Na clula F12 o modelo registra o Z observado, resultado obtido com:

Zo =

107 ,05 108 ,42 0 15 30 + 40 60

= 1,46

Na clula F13 calculado o p-value para duas caudas da distribuio. Como o p-value maior que o nvel de significncia =0,05, a hiptese nula deve ser aceita, pois h evidencias de que a diferena de mdias no seja significativa. Na clula F14 apresentada a deciso por extenso, Aceitar Ho ou Rejeitar Ho.

Esse procedimento com a distribuio Z deve ser aplicado quando as varincias das populaes so conhecidas, o que, na prtica, difcil de ocorrer. Da que se o tamanho de uma das amostras for igual ou menor que trinta e um, o modelo no apresentar os ttulos e resultados relevantes. Como em geral as varincias das populaes no so conhecidas, recomendado utilizar o procedimento com a distribuio t.

FdeA - Teste Z: Duas amostras para Mdias

Amostras Pequenas Varincias das Populaes Iguais

FdeA - Teste T: Duas amostras Varincias Eq.

Amostras Pequenas Varincias das Populaes Diferentes

O procedimento do teste de hipteses da diferena das mdias de duas populaes com varincias desconhecidas, ou presumindo que sejam diferentes, tem as mesmas premissas do procedimento do teste de hipteses com varincias iguais, incluindo as seguintes alteraes de clculo: Deve ser utilizada a estatstica teste t* definida com a expresso:

t* =

X1 X 2

2 S 12 S 2 + n1 n2

O teste t* pode ser aproximado ao teste t obtendo o nmero de graus de liberdade gl com a expresso:
S2 S2 1 + 2 n1 n 2
2 2

gl =

S2 S2 1 2 n1 n2 + n1 1 n2 1

Como, em geral, o resultado de gl no um nmero inteiro, deve ser adotado o nmero inteiro mais prximo.

FdeA - Teste T: Duas amostras Varincias Dif.

Amostras Emparelhadas

Quando for necessrio comparar, por exemplo, as vendas dirias de duas filiais que operam com os mesmos produtos, ou os resultados de um treinamento, confrontando o conhecimento antes e depois do treinamento, os procedimentos de teste de hipteses para diferena das mdias utilizados at este momento no podem ser aplicados, pois se referem a duas populaes independentes. Agora, necessitamos analisar duas populaes relacionadas, isto , duas populaes dependentes. Neste caso, a varivel de interesse ser a diferena entre os pares das duas amostras, no lugar das prprias amostras, que devem ter o mesmo tamanho.

Como premissa, a populao das diferenas tem distribuio aproximadamente normal e a amostra das diferenas extrada aleatoriamente da populao das diferenas. O procedimento o seguinte:

Das duas variveis X1 e X2 definidas pelos valores X11, X12, ... X1n e X21, X22, ... X2n formada a nova varivel D das diferenas entre esses valores D1= X11- X21, ... , Dj= X1j- X2j, ..., Dn= X1n- X2n. Na varivel D calculada a mdiaD e a varincia O t observado calculado com a frmula:
to = D 0 SD n

Definido o nvel de significncia , realizado o teste de hipteses.


Ho: D=0 H1: D0

FdeA Teste T: Duas amostras em Par para Mdias

Distribuio F

O teste de hipteses para a diferena das mdias utilizado para determinar se ou no razovel concluir que as mdias das duas populaes so diferentes. Tambm freqente verificar se ou no razovel concluir que as varincias das duas populaes so diferentes. Para verificar se duas populaes independentes tm a mesma varincia utilizada a estatstica da relao das varincias das amostras retiradas de duas populaes.
2 2 S 1 /S 2

Se as distribuies das duas populaes forem normais, ento a relao 2 2

S 1 /S 2

tem distribuio F.

Sempre que as distribuies das populaes forem normais, a distribuio F ser tambm utilizada para comparar simultaneamente duas ou mais mdias, procedimento denominado anlise da varincia.

As principais caractersticas da distribuio F so as seguintes: A distribuio F contnua e sempre positiva com valores no intervalo (0, +).

A distribuio F tem inclinao positiva. H uma famlia de distribuies F identificadas por dois parmetros, graus de liberdade do numerador 1 e graus de liberdade do denominador 2. A forma final da distribuio depende dos graus de liberdade 1 e 2, como mostra o slide da distribuio.

Exemplo

Calcular o F crtico Fc da distribuio F com probabilidade de 5% na cauda superior de superar o valor do F crtico, considerando que o nmero de graus de liberdade do numerador 6, e o do denominador, 10. Tradicionalmente, os clculos so realizados com a tabela da distribuio F. No captulo Tabelas do livro o leitor encontrar duas tabelas da distribuio F, uma para o nvel de significncia =0,01 e a outra para =0,05. A Tabela F_DISTR permite construir a tabela de valores crticos de F para qualquer valor de nvel de significncia.

A tabela seguinte apresenta parte da tabela da distribuio F para o nvel de significncia =0,05. Nos cabealhos das colunas esto registrados os graus de liberdade do numerador, e nos cabealhos das linhas, os graus de liberdade do denominador. O Fc da distribuio F com 6 graus de liberdade do numerador e 10 graus de liberdade do denominador correspondente ao nvel de significncia 0,05 na cauda superior obtido da tabela F 3,22. Para informar os valores que participam do F crtico, costuma-se escrever: Fc(;1;2)=Fc(0,05;6;10)=3,22. A frmula =INVF(0,05;6;10) retornar o Fc=3,2172. A frmula =DISTF(3,2173;6;10) retornar o valor 0,0500, que a probabilidade P(F3,2173) na cauda superior da distribuio F. Ou, a funo DISTF retornou o nvel de significncia 5%.

Como proceder se for necessrio realizar clculos na cauda inferior da distribuio F? Denominando FS ao F crtico da cauda superior e Fi ao F crtico da cauda inferior, para o nvel de 1 significncia , demonstra-se que: F ( ; ) =
i 1 2

F S ( 2 ; 1 )

Nessa expresso, 1 o nmero de graus de liberdade do numerador, e 2 o nmero de graus de liberdade do denominador. Observe que para o clculo do F crtico na cauda inferior utilizado o procedimento de clculo do F crtico da cauda superior, porm permutando os graus de liberdade.

Teste F

Freqentemente, necessrio verificar se ou no razovel concluir que as varincias das duas populaes so diferentes. O teste F um teste de hipteses utilizado para verificar se as varincias de duas populaes com distribuio normal so diferentes, ou para verificar qual das duas populaes com distribuio normal tm mais variabilidade. De outra maneira, conhecidas duas amostras com qualquer tamanho, o teste F d condies para determinar se as duas amostras pertencem mesma populao.

Exemplo

Verificar se h diferena nas varincias de duas populaes com distribuio normal conhecendo as medidas estatsticas registradas na tabela seguinte e extradas dessas populaes, considerando o nvel de significncia =5%.

Como os tamanhos das amostras so n1=17 e n2=21, a distribuio F possui 1=16 graus de liberdade do numerador e 2=20 graus de liberdade do denominador. O F crtico igual a Fc=2,18398, com =5%. Como Fo>Fc, a hiptese nula no deve ser aceita, h evidncia de que a diferena entre as varincias significativa. O p-value igual a 4,72%. Como ou p-value< a hiptese nula no deve ser aceita.

FdeA Teste F: Duas amostras para varincias

DISTRIBUIO 2

Na maioria dos testes de hipteses aplicados at este momento a distribuio da populao era conhecida. H casos em que a distribuio da populao no conhecida e se deseja verificar se um grupo de valores segue um determinado modelo de probabilidade terico utilizando a distribuio Qui-Quadrado, ou 2. O slide seguinte mostra uma das possveis distribuies 2 dependente do nmero de graus de liberdade gl.

As principais caractersticas da distribuio 2 so: A distribuio 2 contnua e sempre positiva com valores no intervalo (0, +), a distribuio 2 tem inclinao positiva. H uma famlia de distribuies 2 identificadas pelo parmetro graus de liberdade gl.

Questo

O diretor de RH da empresa multinacional deseja conhecer se o hbito de fumar observado dos funcionrios classificados por sexo na nova planta em outro pas diferente do hbito de fumar dos funcionrios da matriz considerado como hbito esperado. Os resultados da pesquisa esto registrados nos intervalos B3:D5 e B7:D9 da figura seguinte. Considerando o nvel de significncia de 5%, verificar se h diferena entre as duas filiais.