Você está na página 1de 14

Cap 10 do Livro

Estatística aplicada à administração e economia apresenta uma introdução conceitual


à ...Anderson,David R. / Sweeney,Dennis J. / Williams,Thomas A
(edição antiga)

COMPARAÇÕES ENVOLVENDO MÉDIAS

I – ESTIMATIVA DA DIFERENÇA ENTRE AS MÉDIAS DE DUAS POPULAÇÕES:


AMOSTRAS INDEPENDENTES.

A companhia XPTO opera duas lojas de departamentos, uma no centro da cidade e outra na
periferia. O gerente geral notou que os produtos que vendem bem em uma loja nem sempre
vendem bem na outra.. Isto pode ser atribuído à diferença entre as idades médias dos
clientes que compram nas duas lojas.

Definindo a população 1 como todos os clientes que compram na loja do centro e


população 2 como todos os clientes que compram na loja da periferia temos:

média das idades da população 1.


média das idades da população 2.
A diferença entre as duas médias será μ1 – μ2.

Para estimar μ1 – μ2 selecionaremos uma amostra aleatória simples de n 1 clientes da


população 1 e uma amostra aleatória simples de n2 clientes da população 2.

Como a amostra aleatória simples de n 1 clientes é selecionada independentemente da


amostra aleatória simples de n2 clientes, nós temos o caso de amostras aleatórias simples
independentes.

média de idade da amostra n1 do centro.


média de idade da amostra n2 da periferia.

Como é um estimador pontual de μ 1 e é um estimador pontual de μ 2, então


será um estimador pontual de μ1 – μ2.

Temos na tabela abaixo os seguintes dados:

Loja No de clientes Média de Idade Desvio Padrão


amostrados
Centro n1 = 36 40 anos s1 = 9 anos
Periferia n1 = 49 35 anos s2 = 10 anos

Então a estimativa pontual de μ1 – μ2 será 40 – 35 = 5 anos.


A distribuição amostral de será :

Valor esperado E( ) = μ1 – μ2

Desvio padrão
Onde desvio padrão da população 1;
desvio padrão da população 2;
n1 = tamanho da amostra da população 1; e
n2 = tamanho da amostra da população 2.

Se n1 ≥ 30 e n2 ≥ 30 a distribuição amostral de pode ser aproximada por uma


distribuição normal de probabilidades.

Estimativa por intervalo de μ1 – μ2 : Grande Amostra

A estimativa será : onde 1 – α é o coeficiente de confiança..

Se 🡺

Se 🡺

Quando são desconhecidos 🡺 e a estimativa será

No caso das lojas temos:

Usando um coeficiente de confiança 1 – α = 0,95, temos α/2 = 0,025 🡺 = 1,96

Como = 5, a estimativa será 5 ± 1,96 x 2,07 ou 5 ± 4,06

Estimativa por intervalo de μ1 – μ2 : Pequena Amostra

Neste caso, um ou ambos tamanhos da amostra são menores que 30, ou seja, n 1 < 30 e/ou
n2 < 30
A estimativa será

Se 🡺
Como geralmente o σ das populações é difícil de ser encontrado, recorre-se à variância

agrupada, onde:

Ou seja, s2 é o estimador agrupado de σ2 e


O valor para o cálculo dos graus de liberdade para achar t na tabela é n1 + n2 – 2

Exemplo: Um determinado banco desejava estudar a diferença de saldos médios entre duas
agências.

A tabela abaixo nos mostra os dados coletados

Agência Número de contas Saldo médio Desvio padrão


Jardim Botânico n1 = 12 R$ 1.000,00 s1 = R$ 150,00
Centro n2 = 10 R$ 920,00 s2 = = 120,00

O coeficiente de confiança utilizado será 1 – α = 0,90 α/2 = 0,05 GL = 12 + 10 – 2 = 20


e neste caso t = 1,725.

Logo 🡺 1.000,00 – 920,00 ± 1,725 x 58,79

80 ± 101,41.

Ou seja, a diferença μ1 – μ2 estará entre – R$ 21,41 e R$ 181,41.

Como o valor zero está dentro do intervalo de confiança, podemos dizer com 90% de
confiança que as médias não diferem entre as duas agências.

Exercícios 1, 2, 3, 4 e 7 do Livro texto.


II – TESTES DE HIPÓTESES DA DIFERENÇA ENTRE AS MÉDIAS DE DUAS
POPULAÇÕES: AMOSTRAS INDEPENDENTES.

Grande amostra ( n1 ≥ 30 e n2 ≥ 30 )

Como parte de um estudo para avaliar a qualidade educacional entre dois centros de
treinamento, um exame padronizado é aplicado aos indivíduos que são treinados nos dois
centros. As pontuações dos exames são o principal fator para avaliar quaisquer diferenças
entre os centros. As médias para os dois centros são:

pontuação média do exame para a população dos indivíduos treinados em A.


pontuação média do exame para a população dos indivíduos treinados em B.

Neste tipo de problema, considera-se, a princípio que, a qualidade educacional dos dois
centros é igual, assim sendo,

H0: μ1 – μ2 = 0
Ha: μ1 – μ2 ≠ 0.

Seguindo os procedimentos das aulas anteriores sobre testes de hipóteses, verificamos que
o teste é bicaudal e ztetste é dado por:

Se 🡺

Se 🡺

Quando são desconhecidos 🡺

Para α = 0,05, a regra de rejeição será:

Rejeitar H0 se zteste < -1,96 ou se zteste 1,96


Calculando-se os parâmetros das amostras acima temos:

n1 = 30 n2 = 40
= 82,5 = 78
s1 = 8 s2 = 10

Como zteste > 1,96 não se aceita H0 e concluiremos que os dois centros diferem em qualidade
educacional.

O raciocínio para o teste unicaudal é semelhante aos descritos anteriormente, utilizando-se


as seguintes hipóteses:

H0: μ1 – μ2 ≥ 0
Ha: μ1 – μ2 < 0 ou

H0: μ1 – μ2 ≤ 0
Ha: μ1 – μ2 > 0

Pequena amostra ( n1 < 30 e/ou n2 < 30 )

O procedimento é semelhante aos anteriores para pequena amostra, usando-se t com


n1 + n2 – 2 graus de liberdade.

O exemplo que se segue ilustra bem o assunto: Um novo pacote de software foi
desenvolvido para auxiliar os analistas a reduzir o tempo total exigido para conceber,
desenvolver e implementar um sistema de informações. Para avaliar os benefícios do novo
pacote de software, uma amostra aleatória de 24 analistas de sistemas foi selecionada. A
cada analista foram dadas especificações de um projeto hipotético e 12 foram instruídos a
desenvolver o sistema pela tecnologia corrente, e 12 foram treinados com o novo pacote de
software e em seguida desenvolveram o sistema utilizando a nova tecnologia.

Determinou-se o seguinte:

tempo médio de término do projeto para os analistas que usam a tecnologia corrente.
tempo médio de término do projeto para os analistas que usam a nova tecnologia.

O pesquisador responsável está buscando evidências que μ 2 é menor que μ1 e elaborou as


seguintes hipóteses:

H0: μ1 – μ2 ≤ 0
Ha: μ1 – μ2 > 0

A tabela abaixo mostra os dados coletados:

Sob a hipótese que a variância das populações sejam iguais, calcularemos a estimativa
agrupada de σ2 :
Usando α = 0,05 e sendo o teste monocaudal, a regra de rejeição será:

Rejeitar H0 se tteste > 1,717 pois t0,05 para 22 graus de liberdade (12 + 12 – 2) é 1,717

Como 2,16 é maior que 1,717, rejeitamos H0 o que significa que o novo pacote de software
realmente reduz o tempo médio de término dos projetos.

Exercícios 10, 11, 12, 13 e 15 do Livro texto.


III – INFERÊNCIAS SOBRE A DIFERENÇA ENTRE AS MÉDIAS DE DUAS
POPULAÇÕES: AMOSTRAS RELACIONADAS.

Suponha que uma empresa de manufatura tenha dois métodos pelos quais os empregados
podem realizar uma tarefa de produção. A empresa quer determinar qual dos dois métodos
possui a menor média. Seja:

tempo médio do método 1.


tempo médio do método 2

Não havendo indicação preliminar do método preferido, assumimos inicialmente que os


dois métodos tenham o mesmo tempo médio, ou seja: μ 1 = μ2 ou μ1 – μ2 = 0 e as hipóteses
serão:

H0: μ1 – μ2 = 0
Ha: μ1 – μ2 ≠ 0.

A escolha do procedimento amostral pode ser de dois tipos:


1 - Amostras independentes. Uma amostra aleatória simples de trabalhadores que
utilizam o método 1 e uma amostra aleatória simples de trabalhadores que
utilizam o método 2. Este procedimento foi estudado no item II.
2 - Amostras relacionadas. Uma amostra aleatória simples de trabalhadores é
selecionada. Cada trabalhador primeiro usa um método e depois o outro método,
sendo que a ordem dos métodos é atribuída aleatoriamente para cada trabalhador,
assim sendo, cada trabalhador fornece um par de dados sendo um valor para o
método 1 e outro para o método 2.

Sempre que possível o procedimento 2 deve ser deve ser empregado pois reduz o erro
amostral.
A tabela abaixo mostra os dados coletados.

Utilizando apenas a coluna de diferenças temos que:

H0: μd = 0
Ha: μd ≠ 0

Se H0 for rejeitada podemos concluir que as médias são diferentes.

Da tabela tiramos: e sd = 0,335

Considerando a população normalmente distribuída e α = 0,05, temos para t 0,025 com n – 1 =


5 graus de liberdade o valor de 2,571.

A regra de rejeição será: Rejeitar H0 se tteste < -2,571 ou tteste > 2,571, pois o teste é bicaudal.

Como 2,19 é menor que 2,571, não podemos rejeitar H0.

Usando o intervalo de confiança temos o seguinte:


Verifica-se que o intervalo vai de -0,05 minutos até 0,65 minutos. Como o zero está dentro
do intervalo, não podemos rejeitar H0.

Exercícios: 18, 19, 20 e 24 do Livro texto.

IV – ANÁLISE DA VARIÂNCIA – ANOVA

A análise da variância é uma técnica que permite testar a hipótese de que as médias de três
ou mais populações são iguais.

Exemplo: Uma empresa possui três fábricas localizadas em três cidades diferentes. Ela
deseja saber o grau de conhecimento de seus empregados sobre qualidade. Foram
selecionados aleatoriamente seis empregados de cada fábrica e a eles aplicado um teste. A
pontuação de cada um encontra-se na tabela abaixo.

Os gerentes querem usar esses dados para testar a hipótese de que a pontuação média de
cada teste é a mesma para todas as fábricas.

Definindo a população1 como todos os empregados da fábrica de Atlanta, população 2


como todos os empregados da fábrica de Dallas e população3 como todos os empregados
da fábrica de Seatle, temos:

= pontuação média do teste para a população 1


= pontuação média do teste para a população 2
= pontuação média do teste para a população 3

Embora não saibamos os valores de , e , queremos usar o resultado da amostra


para testar as seguintes hipóteses:
H0: = =
Ha: nem todas as médias das populações são iguais

A pontuação no teste é referida como variável dependente ou variável resposta , pois


depende da fábrica onde trabalha o empregado, ao passo que a fábrica ou seu local é
considerada como variável independente ou fator. Em geral, os valores de um fator
selecionado para investigação (pontuação obtida por cada empregado de uma determinada
fábrica) são referidos como níveis do fator ou tratamentos.

Hipóteses para Análise da Variância (ANOVA)

As hipóteses abaixo são exigidas para usar a análise da variância:

1 – Para cada população, a variável resposta é distribuída normalmente. No exemplo,


as pontuações no teste precisam ser distribuídas normalmente em cada fábrica.

2 – A variância de cada variável resposta é a mesma para todas as populações. As


variâncias nas pontuações do teste precisam ser as mesmas para todas as
populações.

3 – As observações precisam ser independentes. A pontuação do teste de um


empregado precisa ser independente da pontuação do teste de qualquer outro
empregado.

Se as médias para as três pontuações são iguais, esperamos que as médias das três amostras
estejam próximas uma das outras. Por outro lado, se as médias das amostras estiverem
muito afastadas isto nos leva a crer que as médias das pontuações das três populações serão
diferentes.

Só podemos verificar estatisticamente através da variabilidade das médias das amostras. Se


a variabilidade das médias das amostras for pequena, ela apóia H0, caso contrário apóia Ha.

Levando-se em conta as três hipóteses para ANOVA, se a hipótese nula é verdadeira,


podemos pensar que = 79, = 74 e = 66, da tabela anterior, como valores retirados
aleatoriamente da distribuição amostral de todos os empregados das três fábricas. Neste
caso, a média e a variância dos três valores podem ser usadas para estimar a média e a
variância da distribuição amostral.

No nosso exemplo, a melhor estimativa da média da distribuição de é a média das três


médias da amostra, ou seja, (79 + 74 + 66) / 3 = 73. Esta estimativa é chamada de média
global da amostra. Uma estimativa da variância da distribuição amostral de é fornecida
pela variância das três médias da amostra
Sabemos que temos então que , logo a estimativa de = n(estimativa
de )= onde n = 6 pois cada amostra tem 6 elementos.

O resultado é chamado de estimativa de tratamento-entre de .

A estimativa de tratamento-entre de é baseada na suposição que H0 seja verdadeira e,


neste caso, cada amostra vem da mesma população e há somente uma distribuição amostral
de .

Para ilustrar o que acontece quando H0 é falsa, suponha que todas as médias da população
difiram, neste caso, teremos três diferentes distribuições amostrais e será maior, fazendo
com que a estimativa de tratamento-entre de seja maior. Em geral, quando as médias
das populações não são iguais a estimativa de tratamento-entre superestimará ou seja, se
H0 for falsa.

A variação dentro de cada uma das amostras também influencia a conclusão na análise da
variância. Sabemos que uma amostra fornece uma estimativa não tendenciosa ou sem viés
de . Podemos então combinar as variâncias das amostras para obter a estimativa de .
Esta estimativa é chamada de estimativa-dentro de e é calculada do seguinte modo:

Estimativa de tratamento-dentro de = .

A estimativa de tratamento-dentro dá uma boa estimativa para em qualquer caso.

Como a estimativa de tratamento-entre superestima se H0 for falsa e a estimativa de


tratamento-dentro dá uma boa estimativa para em qualquer caso, a razão entre as duas
nos dará um valor que quanto mais próximo de 1 reforçará H 0 e quanto mais afastado
reforçará Ha.

No nosso caso temos .


Para rejeitar ou não H0 veremos mais adiante.

Podemos então generalizar para k médias de amostras com tamanhos n diferentes, teremos
então:

H0: = = = ........=
Ha: nem todas as médias das populações são iguais.
Onde

= média da j-ézima população


Assumiremos que uma amostra aleatória simples de tamanho n j tenha sido selecionada de
uma das k populações ou tratamentos. Seja:

= valor da observação i para o tratamento j.

= número de observações para o tratamento j.

= média da amostra para o tratamento j.

= variância da amostra para o tratamento j.


Média e Variância para o tratamento j.

Média global

Se as amostras têm o mesmo tamanho n então e deste modo,

no nosso caso
Estimativa do tratamento-entre da variância da população (MSTR = média quadrática
dos tratamentos)
Se chamarmos SSTR de então teremos
SSTR = soma quadrática dos tratamentos.
No nosso caso
SSTR = 6(79-73)2 + 6(74-73)2 + 6(66-73)2 = 516

Estimativa do tratamento-dentro da variância da população (MSE = média dos erros


quadráticos)

Se chamarmos SSE = então temos

SSE = soma dos erros quadráticos.


No nosso caso temos:
SSE = (6-1)34 + (6-1)20 + (6-1)32 = 430

Comparando as estimativas da variância: O Teste F.

A divisão ou razão de duas estimativas independentes para de duas populações normais


segue uma distribuição de probabilidades F. Portanto, se a hipótese nula é verdadeira e as
hipóteses ANOVA são válidas a distribuição amostral de MSTR / MSE é uma distribuição
F com k – 1 graus de liberdade no numerador e graus de liberdade no
denominador.
Dado um determinado nível de significância α e os graus de liberdade do numerador e

denominador, encontramos um valor F, que comparado ao F teste = nos levará ou não


à rejeição de H0.
Se Fteste ≤ F aceita-se H0, caso contrário rejeita-se H0.
Entrando-se na tabela F com: α = 0,05, com 3 – 1 = 2 graus de liberdade no numerador e
(6+6+6) – 3 = 15 graus de liberdade no denominador teremos para F = 3,68..

Como Fteste = nos dá que Fteste > F logo H0 deve ser rejeitada.

Exercícios: 26, 27 e 29 do Livro texto.

Você também pode gostar