Escolar Documentos
Profissional Documentos
Cultura Documentos
Aplicada a
Psicologia
UNIDADE II
Probabilidades, Testes de
Hipóteses e Amostragem
2022
Ficha Técnica:
Título: Estatística aplicada a Psicologia – Probabilidades, Testes de Hipóteses e Amostragem
Autor: Odete Omar e Didian Natividade
Revisor 1: Abiba Mamade e Amélia Mungoi
Revisor 2: Emílio Muchanga
Execução gráfica e paginação: Instituto Superior Monitor
2ª Edição: 2022
Adaptação por Instituto Superior Monitor Março de 2022
© Instituto Superior Monitor
Nenhuma parte desta publicação pode ser reproduzida ou transmitida por qualquer forma ou
por qualquer processo, electrónico, mecânico ou fotográfico, incluindo fotocópia ou gravação,
sem autorização prévia e escrita do Instituto Superior Monitor. Exceptua-se a transcrição de
pequenos textos ou passagens para apresentação ou crítica do livro. Esta excepção não deve de
modo nenhum ser interpretada como sendo extensiva à transcrição de textos em recolhas
antológicas ou similares, de onde resulte prejuízo para o interesse pela obra. Os transgressores
são passíveis de procedimento judicial.
ÍNDICE
ACERCA DESTA DISCPLINA ...................................................................................... 5
PRECISA DE AJUDA ........................................................................................................ 6
TRABALHOS ..................................................................................................................... 7
DURAÇÃO ......................................................................................................................... 7
TÉCNICAS DE ESTUDO .................................................................................................. 7
RESULTADO DE APRENDIZAGEM .............................................................................. 8
ESTRUTURA DA UNIDADE I ....................................................................................... 9
CAPÍTULO I – INTRODUÇÃO À ESTATÍSTICA APLICADA A PSICOLOGIA10
OBJECTIVOS DO CAPÍTULO ................................................................................ 10
1.1. RESUMO HISTÓRICO DAS PROBABILIDADES ................................................ 10
1.2. CONCEITOS DA TEORIA DE PROBABILIDADES ............................................. 12
1.2.1. EXPERIÊNCIA ALEATÓRIA ........................................................................ 13
1.2.2. ESPAÇO DE RESULTADOS .......................................................................... 13
1.2.3. ACONTECIMENTO ........................................................................................ 14
CONCEITOS DE PROBABILIDADES.................................................................... 14
1.3.2. CONCEITO FREQUENCISTA DE PROBABILIDADES ........................... 15
1.3.3. CONCEITO SUBJECTIVO DE PROBABILIDADES ................................. 15
1.3.4 PROBABILIDADE CONDICIONAL .............................................................. 16
1.3.5. Acontecimentos Independentes ........................................................................ 19
1.3.6. Acontecimentos Independentes e Mutuamente Exclusivos ........................... 20
EXERCÍCIOS PROPOSTOS..................................................................................... 23
CAPÍTULO II – TESTE DE HIPÓTESES .................................................................. 27
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 27
2.1. INTRODUÇÃO AO CAPÍTULO .............................................................................. 27
2.1. HIPÓTESE NULA E ALTERNATIVA ............................................................. 29
2.2. TIPOS DE ERRO E NÍVEL DE SIGNIFICÂNCIA ......................................... 30
2.3. TESTE DE HIPÓTESE PARA A MÉDIA ........................................................ 35
2.4. TESTE DE DIFERENÇA ENTRE MÉDIAS .................................................... 39
2.5. TESTE DE HIPÓTESE PARA PROPORÇÃO ................................................ 42
EXERCÍCIOS RESOLVIDOS................................................................................... 45
ANEXO I – TABELAS DE CONSULTA .................................................................. 50
EXERCÍCIOS DE APLICAÇÃO .............................................................................. 53
SUMÁRIO DO CAPÍTULO II................................................................................... 55
CAPÍTULO III – TEORIA DE AMOSTRAGEM ....................................................... 56
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 56
3.1. INTRODUÇÃO AO CAPÍTULO ....................................................................... 56
3.2. CONCEITOS ........................................................................................................ 57
3.3. PLANO DE AMOSTRAGEM............................................................................. 57
3.4. MÉTODOS DE SELECÇÃO DE AMOSTRA .................................................. 57
3.4.1. AMOSTRAGEM ALEATÓRIA SIMPLES ................................................... 57
3.4.2. AMOSTRAGEM SISTEMÁTICA .................................................................. 58
3.4.3. AMOSTRAGEM ESTRATIFICADA ............................................................. 58
3.4.4. AMOSTRAGEM POR CONGLOMERADO ................................................. 58
3.4.5. AMOSTRAGEM POR ESTÁGIOS MÚLTIPLOS ....................................... 58
3.4.6. AMOSTRAGEM MULTI-FÁSICA ................................................................ 59
EXERCÍCIOS .............................................................................................................. 59
QUADRO SINÓPTICO .............................................................................................. 61
CAPÍTULO IV – TEORIA DE ESTIMAÇÃO ............................................................ 62
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 62
4.1. CONCEITOS ............................................................................................................. 62
4.2. ESTIMAÇÃO PONTUAL ......................................................................................... 62
4.3. ESTIMACÃO INTERVALAR .................................................................................. 63
EXERCÍCIOS .............................................................................................................. 65
QUADRO SINÓPTICO .............................................................................................. 67
CAPÍTULO V – AMOSTRAGEM ALEATÓRIA SIMPLES .................................... 68
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 68
5.1. AMOSTRAGEM ALEATÓRIA SIMPLES SEM REPOSIÇÃO.............................. 68
5.2. AMOSTRAGEM ALEATÓRIA SIMPLES COM REPOSIÇÃO ............................. 69
EXERCÍCIOS .............................................................................................................. 70
CAPÍTULO VI – ESTIMAÇÃO DA MÉDIA .............................................................. 73
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 73
6.1. ESTIMADOR PONTUAL DE MÉDIA, .............................................................. 73
6.2. ESTIMADOR PONTUAL DA VARIÂNCIA, x2 .............................. 73
6.3. INTERVALO DE CONFIANÇA PARA MÉDIA, ....................................... 74
6.4. ESCOLHA DO TAMANHO DA AMOSTRA .......................................................... 75
EXERCÍCIOS .............................................................................................................. 79
SUGESTÕES DE LEITURA ............................................................................................. 81
ACERCA DESTA DISCPLINA
PRECISA DE AJUDA
No caso de dúvidas sobre os conteúdos desta unidade, por favor contacte o respectivo tutor.
O número do tutor será disponibilizado pela sua Faculdade, podendo também consultar os
contactos e horários do tutor através do site: https://www.ismonitor.ac.mz/ ou através da
página facebook: https://www.facebook.com/ismonitor/.
Uma vez que é um estudante universitário, as suas técnicas de aprendizagem deverão ser
distintas das que utilizava durante o ensino secundário, em regime presencial.
Nesta licenciatura, o aluno deverá assumir uma maior autonomia, isto é, uma maior
capacidade de gestão responsável do seu tempo.
Por este motivo, importa que construa um programa de estudos realista e que o cumpra
rigorosamente, seleccionando horários e locais tranquilos para estudar.
TRABALHOS
Depois de estudar cada capítulo desta unidade o estudante deve resolver todos os exercícios
de aplicação como forma de consolidação das matérias nela vertidas. Os exercícios de
aplicação não serão submetidos ao Instituto Superior Monitor.
DURAÇÃO
Tempo para leitura da unidade: 23 horas
Tempo para trabalhaos de pesquisa 11 horas
Tempo para a realização de exercícios práticos: 14 horas
Tempo para a realização de avaliação: 2 horas
TÉCNICAS DE ESTUDO
Por você ser um estudante universitário as suas técnicas de aprendizagem serão diferentes
das que usava nos tempos da escola secundária e na presença de um professor.
Neste curso você terá uma grande autonomia, isto é, RESPONSABILIDADE. Acima de
tudo, você fará uma gestão responsável do seu tempo.
Faça um programa de estudos realista e cumpra-o rigorosamente. Escolha horas e locais
tranquilos para os seus estudos.
Faça uso dos demais recursos referenciados na unidade e mobilize a sua motivação
profissional e/ou pessoal para adequar as suas actividades de estudo a outras
responsabilidades profissionais, sociais e pessoais. Partilhe as suas aprendizagens com os
outros.
É boa prática submeter os testes de cada disciplina de forma gradual, isso possibilitará-te a
avaliação do seu aproveitamento pedagógico, isto é, é sempre melhor conhecer a nota do
primeiro teste antes de submeter o segundo para em casos de insucesso saber redobrar o
esforço que lhe fará obter uma nota melhor. Contudo entregando todos os testes ao mesmo
tempo já anula a possibilidade de acompanhar o desempenho académico.
RESULTADO DE APRENDIZAGEM
ESTRUTURA DA UNIDADE I
A unidade é composta por seis (6) capítulos nomeadamente probabilidades e teste de
hipótese. Esta unidade visa dotar os estudantes de conhecimentos indispensáveis para
a análise de fenómenos aleatórios e formulação e teste de hipóteses.
OBJECTIVOS DO CAPÍTULO
Cinco décadas mais tarde, Galileu respondeu aos jogadores sobre uma questão que,
aparentemente, os preocupava: quando se lança três dados, o total de 10 pontos ocorre mais
vezes que um total de 9, o que lhe parecia contraditório uma vez que é igual o número de
combinações (6) que somam 9 (621, 531, 522, 441, 432, 432, 333) e 10 pontos (631, 622,
541, 532, 442, 433). Mas Galileu mostrou que é possível que os resultados tenham diferente
probabilidade se a ordem for também tomada em consideração e, nesse caso, o número de
resultado com soma igual a 9 é de 25, e com soma igual a 10, de 27, resultando em
25 27
probabilidades de e , respectivamente. O que muitos autores se admiram é que os
216 216
jogadores se tenham percebido desta diferença tão diminuta.
O estudo sistemático das leis de probabilidades teve um contributo importante com Pascal e
Fermat e a correspondência trocada entre ambos. Tudo começou quando Chevalier de Méré,
conhecido como escritor e ardente da corte de Luís XIV, consultou Fermat sobre problemas
de divisão de apostas e interrupções antes de se completar o jogo.
Blaise Pascal (1623 - 1665) era uma criança prodígio que aos dezasseis anos já tinha escrito
um livro e aos dezoito anos inventado uma máquina calculadora. Pierre de Fermat (1601 -
1665) era um jurista de Toulouse que nos tempos livres se dedicava ao estudo da matemática,
tendo já sido considerado como o maior matemático puro de todos os tempos.
Se de Cardano se pode afirmar que marcou o fim da pré-história da teoria das probabilidades,
Fermat e Pascal deram o passo decisivo no desenvolvimento desta teoria e na fundamentação
teórica da Inferência Estatística. No final do século XVII, Leibniz publicou duas obras, uma
sobre problemas combinatórios, e outra sobre a aplicação das probabilidades às questões
financeiras. Foi sob o seu conselho que Jacques Bernoulli estudou o assunto de modo que o
cálculo das probabilidades adquire finalmente o estatuto de ciência.
O teorema de Bernoulli apresenta pela primeira vez a correspondência entre frequências e
probabilidades, dando origem a um novo conceito de probabilidades. O conceito de
probabilidade inversa é definido por Thomas Bayes ainda no século XVIII. A importância
dos resultados de Bayes só vem a ser reconhecida quase dois séculos depois, quando se
forma, dentro da Estatística, uma nova corrente: a escola Bayesiana.
Durante o século XIX o desenvolvimento do cálculo das probabilidades deveu-se ao
contributo de três astrónomos: Laplace, Gauss e Quetelet. Muitos dos desenvolvimentos
posteriores, nomeadamente da escola russa (Chebyshev, Markov e Lyapunov), baseiam-se
na análise de observação da obra de Laplace. Gauss explanou uma teoria sobre a análise de
observação aplicável a qualquer ramo da ciência, contribuindo, assim, para alargar o campo
da aplicação do cálculo das probabilidades. Quetelet iniciou a sua aplicação aos fenómenos
sociais. A ele se deve a introdução do conceito de “homem médio” e a chamada de atenção
para a consistência dos fenómenos sociais.
Pearson, que se dedicou ao estudo da correlação, cuja descoberta é atribuída a Galton, foi um
entusiasta do evolucionismo de Darwin, desenvolveu extraordinariamente os métodos de
tratamento de dados, para além de se interessar pelo cálculo das probabilidades. Em 1894,
depois de analisar um elevado número de resultados das roletas num casino, chegou a
conclusão que estavam viciadas e que não serviam como laboratório para a análise das
probabilidades, em suma, a razão de ser dos casinos não era, de modo nenhum, científica.
Mas estas experiências no início da sua carreira não deixaram de ser úteis na aplicação que
fez da teoria das probabilidades à evolução biológica e a importantes descobertas estatísticas
como o teste do qui-quadrado, utilizado para testar se uma dada distribuição de frequência
segue determinada distribuição probabilística.
Gosset, ou seja, “Student” trabalhava para uma empresa de cerveja, a Guiness, e começou
uma nova fase nos estudos estatísticos com os métodos de tratamento de pequenas amostras.
Fisher deu, talvez, a mais importante contribuição à Estatística Matemática e à sua
divulgação. O livro que publicou em 1925, Statical Methods for Research Workers, permitiu
aos investigadores a familiarização necessária com os métodos estatísticos e a sua aplicação
a problemas práticos.
Muitos outros nomes poderiam ser referidos neste percurso de quase quatro séculos. Todos
contribuíram para que, quando Fisher publicou seu livro, há muito se tivesse deixado de
definir Estatística como “o estudo dos assuntos de Estado”, associando-a teoria das
probabilidades. Com o século XX, a Estatística tornou-se um instrumento de análise poderosa
aplicado em todas as áreas do saber e a que o desenvolvimento informático veio dar novo
fôlego.
1.2. CONCEITOS DA TEORIA DE PROBABILIDADES
Se lhe perguntassem o significado da seguinte frase “Se lançar uma moeda ao ar, a
1
probabilidade de sair face é “ ” a sua resposta talvez fosse: Só há dois resultados possíveis
2
com iguais hipóteses de ocorrerem. Mas suponha que lhe perguntavam também “qual é a
probabilidade de um carro avariar ao atravessar a ponte Armando Emílio Guebuza?”.
Também aqui existem apenas dois resultados possíveis: ao atravessar a ponte ou o carro
1
avaria ou não avaria. Mas já seria impossível responder que essa probabilidade é . A
2
1.2.3. ACONTECIMENTO
Considere a experiência aleatória que consiste no lançamento de um dado e cujo espaço de
resultados é: Ω = {1, 2, 3, 4, 5, 6}.
Sendo o espaço de resultados de um conjunto, é possível formar subconjuntos dos seus
elementos, como, por exemplo: A = {2}; B = {1, 3, 5}, C = {3, 6} Cujos significados são,
respectivamente A: saída de face 2; B: saída de face ímpar e C: saída de face divisível por 3.
A, B e C são simultaneamente subconjuntos de resultados possíveis da experiência aleatória.
Designam-se por acontecimentos.
Exemplo:
Admita-se a seguinte experiência aleatória: contagem do número de criança orfã, até ao
aparecimento de uma criança que tem os progenitores vivos. A experiência consiste, portanto,
em contar as crianças órfãs, interrompendo-se essa contagem no momento em que surgir uma
criança que tem os progenitores vivos. Como se poderá verificar, qualquer número inteiro
pode ser um resultado da experiência: Ω = {0, 1, 2, 3, 4,..., n, ... }.
Serão acontecimentos, por exemplo, os subconjuntos: A = {6} e B = {2, 4}.
CONCEITOS DE PROBABILIDADES
De acordo com a definição, e o método de cálculo, podem definir-se três conceitos de
probabilidade: clássico, empírica ou frequencista e subjectiva. As probabilidades que se
baseiam nas características intrínsecas dos acontecimentos são definidas segundo o conceito
clássico. Aquelas que se baseiam numa quantidade razoável de evidência objectiva são
empíricas ou frequencista, enquanto as probabilidades definidas com base em crenças ou
opiniões individuais se denominam subjectivas.
1.3.1 CONCEITO CLÁSSICO DE PROBABILIDADES
Se a uma experiência aleatória se podem associar N resultados possíveis, mutuamente
exclusivos e igualmente prováveis, e se n A desses resultados tiverem o atributo A, então a
n n
probabilidade de A é a fracção A , P[ A] = A . Onde n A é número de resultados favoráveis
N N
a A e N: número de resultados possíveis.
Repare-se que, para o conceito clássico de probabilidade, os resultados possíveis são todos
igualmente prováveis, isto é, têm igual probabilidade de se realizarem.
Exemplo
Consideremos a experiência aleatória que consiste no lançamento de uma moeda equilibrada
ao ar. Seja A o acontecimento: saída de face. O espaço de resultados será constituído por Ω
n 1
= {Face, Coroa}. A probabilidade de A será: P[ A] = A =
N 2
Exemplo:
Se o Primeiro-ministro afirmasse “a inflação para o próximo ano será de 3% com uma
probabilidade de 0,9” estaria a aplicar o conceito subjectivo ou personalista de probabilidade.
Uma outra figura política, da Oposição, diria certamente que tal meta seria difícil de atingir,
e sendo instada a quantificar o que para ela era “difícil” poderia mesmo afirmar: “Tal nível
de inflação só será atingido com uma probabilidade de 0,25”. Também esta figura política
estará, deste modo, a aplicar o conceito subjectivo de probabilidade.
Axiomas da Teoria das Probabilidades
Da necessidade de sistematização dos conceitos empregues na Teoria das Probabilidades e
da construção de um corpo teórico coerente surgem os três axiomas em que se baseiam todos
os desenvolvimentos posteriores deste campo das matemáticas. Assim, consideramos que P
(.) é uma função que associa a todos o acontecimento A definido em Ω um número
compreendido no intervalo [0, 1] e que satisfaz os seguintes axiomas:
Axiomas:
1) P [A] ≥ 0 A Ω
2) P [Ω] =1 (Ω é o acontecimento certo)
3) Sendo A e B acontecimentos mutuamente exclusivos definidos em “Ω”, ou seja A
B = Ø, tem-se que: P [A B] = P [A] + P [B]
Exemplo (2): Uma certa Universidade colectou a seguinte informação sobre os seus estudantes:
Marketing 70 50 120
Estatística 50 10 60
400
P(F ) = = 0.4
1000
200
P ( A) = = 0.2
1000
80
P(A F ) = = 0.08
1000
Portanto, a probabilidade de que o (a) estudante seja mulher e que esteja frequentando o curso de
Contabilidade é de 0.08. Agora, a Universidade pretende saber a probabilidade de que o (a)
estudante esteja a frequentar o curso de Contabilidade dado que o (a) estudante é mulher, ou seja,
P( A| F ) .
P(A F ) 0.08
P(A| F ) = = = 0.20
P(F ) 0.4
e P A B C =
18 12 6 1
Com probabilidades P[ A] = , P[ B ] = , P[C ] = .
36 36 36 36
Como se pode verificar PA B C = PA.PB..PC . No entanto, apenas os
acontecimentos A e B são independentes, sendo A e C, e B e C dependentes entre si, pois:
PA B = PA.P[ B]; P[ A C] P[ A].P[C]; P[ B C] P[ B].P[C]
Em experiência aleatória ligadas a jogos de azar é, em geral, fácil verificar a existência ou
não de independência dos acontecimentos. Noutros casos, porém, só depois do exame
rigoroso de todas as condições se poderá concluir acerca da independência dos
acontecimentos.
Atrasada 75
Cancelado 25
Total 1000
O ISM está interessado em saber a probabilidade de entrega do teste antes da hora prevista ou
atrasado? Usando as probabilidades de cada evento acima apresentado e o facto de que estes
eventos serem mutuamente exclusivos, teremos:
P[ Aj ] P[ B Aj ]
P[ Aj B] = n
, Para j= 1,2,...,n.
P[ A ] P[ B A ]
i =1
i i
P[ A j B] P[ Aj ] P[ B Aj ]
Demonstração: P[ Aj B] = = n
P[ A ] P[ B A ]
P[ B]
i i
i =1
P(E M ) 0.52
P(E | M ) = = = 0.91
P(M ) 0.57
P(M E)
P(M | E) =
P(E)
P (E | M ) P (M ) 0.52
= = = 0.56
P (E | M ) P (M ) + P (E | F ) P (F ) 0.93
Exemplo (2): Uma fábrica de cachimbo utiliza 3 máquinas de acabamento com volume
diário de produção respectivamente, de 500,1000 e 2000 unidades. De acordo com a
experiência anterior sabe-se que a percentagem de cachimbos defeituosos originados por
cada máquina é, respectivamente, de 0,005; 0,008 e 0,01. Sabendo que um cachimbo foi
encontrado defeituoso pretende apurar-se qual a máquina que, com maior probabilidade de o
ter gerado.
Para resolver o problema devemos em primeiro lugar definir todos os acontecimentos
A1- Um cachimbo escolhido por acaso da produção diária foi produzido pela máquina 1
A2- Um cachimbo escolhido por acaso da produção diária foi produzido pela máquina 2
A3- Um cachimbo escolhido por acaso da produção diária foi produzido pela máquina 3
B - Um cachimbo escolhido por acaso da produção diária é defeituoso
Pretendemos calcular as P[ Ai B] (i= 1,2,3) e ordena-las por ordem decrescente.
Construindo um quadro:
AI P[ AI ] P[ B / A] P[ Ai ]. P[ B / A] P[ Ai / B]
1 P[ B ] = 0,0087 1
EXERCÍCIOS PROPOSTOS
1. Suponha que: P [A] = 0,4; P [B] = 0,3; P [C] = 0,7; P [Ā B] = 0,1; P [A B C ] =
0,1. Calcule P [A B A ]. R: 0,5
a) Tendo comprado um produto nessa loja e verificado que apresentava deficiência, qual
o seu fornecedor mais provável?
5. As famílias da cidade A escolhem uma das três alternativas para fazer férias: praia, campo
ou ficar em casa. Durante a última década, verificou-se que escolhiam aquelas
alternativas respectivamente 50%, 30% e 20% das famílias da referida cidade. A
probabilidade de descansar durante as férias está ligada á alternativa escolhida: 0,4; 0,6 e
0,5 conforme se tenha ido a praia, para o campo ou ficado em casa.
QUADRO SINÓPTICO
constância lógica, ou seja, definir a relação lógica existente entre os seus pressupostos e
consequências.
Formulação de hipótese
As hipóteses poderão ser formuladas de vários modos, mas o mais aconselhável é a que
articula entre si variáveis que intervém na resolução do problema. O seu modo mais geral de
formulação é sob forma de afirmação dedutiva e positiva que se procura depois com a
investigação verificar se é ou não válida.
Exemplos:
• A classe social da mãe influencia no tempo de amamentação do filho;
• O reforço do professor tem como efeito a melhoria do desempenho do estudante;
• Adolescentes, filhos de pais ou mães viúvas ou divorciados passam a ter auto-estima
menor quando os seus pais se casam novamente;
• Os católicos tendem a ser menos favoráveis ao divórcio do que os protestantes;
• Pesquisadores médicos afirmam que a temperatura média do corpo humano não é
igual a 37 ºC;
• Um novo fertilizante utilizado no cultivo de hortaliças aumenta a produtividade.
A dificuldade nestes casos (e daí a necessidade de métodos estatísticos) é que a característica
de interesse varia em cada amostra. A temperatura média do corpo humano varia de pessoa
para pessoa. Ora, a produtividade vária de solo para solo. Os testes de hipóteses através da
amostra permitem analisar e distinguir entre resultados que podem ocorrer facilmente e os
que dificilmente ocorrem.
A lógica de um Teste de Hipótese
Decisão a ser tomada
População
Valor hipotético do Não rejeitar a hipótese
parâmetro; 455 Diferença Pequena
Questão a ser feita
Qual é a magnitude da
diferença entre o valor
observado da estatística e o
valor hipotético do parâmetro?
Exemplo s:
1. Para decidir se a lâmpada do tipo A é melhor que a lâmpada do tipo B levantam-se
as seguintes hipóteses:
H 0 (hipótese nula): não há diferença entre os dois tipos de lâmpadas;
para rejeitar esta hipótese. Por isso é preferível dizer “não rejeitar H 0 ” a dizer “a
aceitar H 0 ”.
Repare que ao testarmos uma hipótese nula chegamos a uma conclusão de rejeitá-la ou não
rejeitá-la. Entretanto devemos lembrar que tais conclusões ora são correctas, ora são
incorrectas, mesmo quando fazemos tudo correctamente. O risco que se corre de tomar uma
decisão errada é exactamente o preço a ser pago por estar trabalhando em uma situação onde
a variabilidade é inerente.
• Não se rejeitar a hipótese de a empresa ser inocente, quando de facto esta cometeu
uma infracção fiscal: Não rejeitar H 0 sendo H 0 falsa.
2.2.1. Definição
Os dois tipos de erro que podem ser cometidas são os seguintes:
Erro tipo I: rejeitar H 0 sendo H 0 verdadeira (erro de rejeição);
Erro tipo II: não rejeitar H 0 sendo H 0 falsa (erro de não rejeição)
A ocorrência de cada tipo de erro está associada a uma probabilidade. A probabilidade de se
cometer o erro do tipo I é geralmente designada nível de significância alfa ( ) , isto é, e
a probabilidade de se rejeitar a hipótese nula sendo ela verdadeira. Por outro lado, a
probabilidades de se cometer o erro tipo II, é normalmente designado por beta ( ) , isto é,
é a probabilidade de não se rejeitar H 0 sendo H 0 falsa. A diferença 1 − é chamada a
potência de teste, ou seja, a proporção da confiança que se tem ao se rejeitar a hipótese nula.
Erro tipo I
Rejeitar a hipótese (rejeição de uma
Decisão correcta
nula hipótese nula
verdadeira)
Decisão
Exemplo:
O director comercial de uma cadeia de lojas pretende comparar duas técnicas de vendas, A e
B, para o mesmo produto. Utilizando a técnica de vendas A a quantidade de produto vendido
por dia é em média de 816 Kg com um desvio padrão de 45 Kg. Adoptando a nova técnica
de vendas de B espera-se aumentar a quantidade de vendas diárias.
Para testar tal hipótese registou-se a quantidade diária de vendas do produto durante 50 dias,
obtendo-se um valor médio de 839. Pode aceitar-se a hipótese a um nível de significância de
0,01?
Seja x = “quantidade de produto vendida num dia com a técnica de vendas B”.
Hipóteses estatísticas
H 0 : = 816 Kg (Não há alteração na quantidade média de vendas);
2 x−
Pelo Teorema do Limite Central x ~ N ; Z =
1
~ N (0; 1) . Sob o
n 45
50
pressuposto de H 0 ser verdadeira, = 816 Kg , logo a estatística do teste é
45 2 x − 816
x ~ N 816, ou Z = ~ N (0, 1) .
50 45
50
Região Crítica
Para que valores da estatística do teste será de rejeitar a hipótese nula?
Quanto maior for o valor da média amostral (x ) , relativamente a 816, mais credível se torna
a hipótese H 1 e consequentemente, mais a decisão se encaminha no sentido de rejeitar H 0 .
Então, fixando um ponto xc superior a 816, a regra de decisão será: rejeitar H 0 se x xc ,
caso contrário, não rejeitar H 0 . xc . Dá-se o nome de ponto crítico.
1 Amostras com uma dimensão suficientemente grande (n > 30) tendem a distribuir-se normalmente.
0.4
0.3
Região de
0.2
rejeição
Região de
0.1
não rejeição
0.0
0
xc
Sendo a hipótese H 0 verdadeira, a probabilidade de a estatística de teste assumir valores na
região de rejeição é pequena. Estes valores são mais plausíveis se a hipótese H 1 for
verdadeira. Fixamos o nível de significância em 0,01.
Isto significa que ao rejeitarmos a hipótese H 0 podemos estar a cometer um erro tipo com
probabilidade de 0,01. Por outra palavras, a chance de rejeitarmos a hipótese
H 0 : = 816 Kg quando de facto = 816 , é quantificada em 1%.
Vamos calcular o ponto crítico xc associado a este nível de significância.
x − 816 xc − 816
P( x xc | = 816) = 0.01 P = 0.01
45 45
50 50
xc − 816 xc − 816
P Z = 0.01 P Z 45 = 0.99
45
50 50
xc − 816
= 2.326 xc = 830.8
45
50
0.4
0.3
H 0 : 0
H1 : 0 0.2
0.1
0.0
0
0.4
0.3
H 0 : 0
H1 : 0 0.2
0.1
0.0
0
Teste Bilateral
0.4
0.3
H 0 : = 0
0.2
H1 : 0
0.1
2 2
INSTITUTO SUPERIOR MONITOR
34
WWW.ISMONITOR.AC.MZ 0.0 0
Estatística Aplicada a Psicologia
Note que o teste é feito usando-se / n no denominador, uma vez que esse é o desvio
padrão da média.
A hipótese H 0 é rejeitada se Z0 Z /2 , onde Z /2 é um valor limite da distribuição normal
reduzida tal que a probabilidade de se obter valores externos a Z /2 é “”.
Exemplo:
A resistência à tracção do aço inoxidável produzido numa usina permanecia estável, com
uma resistência média de 72 kg/mm2 e um desvio padrão de 2,0 kg/mm2. Recentemente, a
máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas.
76,2 78,3 76,4 74,7 72,6 78,4 75,7 70,2 73,3 74,2
Presuma que o desvio padrão seja o mesmo que antes do ajuste. Podemos concluir que o
ajuste mudou a resistência à tracção de aço? (Adopte um nível de significância de 5%)
Definição da Hipótese
H 0 : = 72 kg / mm 2
H 1 : = 72 kg / mm 2
Estatística do Teste
Sendo x = 75,0 = 75,0 e s = 2 kg / mm2 , temos:
X − o 75 − 72 3
Z cal = = = = 4, 74
n 2 10 0, 6325
Isso significa que a média da amostra retirada aleatoriamente da produção está a 4,74 desvios
padrão da média alegada em H 0 que é 72.
Região Crítica
Distribution Plot
Normal, Mean=0, StDev=1
0.4
0.3
Density
0.2
0.1
0.025 0.025
0.0
-1.96 0 1.96
X
Regra de Decisão
Como o valor crítico para 5% é 1,96 desvios (Z tabelado), estamos na região de rejeição de
H0 .
Conclusão
H 0 é rejeitada e concluímos que a resistência à tracção do aço mudou.
Exemplo.
Um processo deveria produzir bancadas com 0,85 m de altura. O engenheiro desconfia que
as bancadas que estão sendo produzidas são diferentes que o especificado. Uma amostra de
8 valores foi colectada e indicou X = 0,87 . Sabendo que o desvio padrão é = 0, 010 , teste
a hipótese do engenheiro usando um nível de significância =0,05.
H o : = 0,85
H1 : 0,85
0,87 − 0,85
Zo = = 5, 66
0, 010 / 8
Zo = 5,66 Z0,025 = 1,96 Rejeita-se H 0 .
Exemplo:
Numa determinada avenida, quando é utilizado o radar, são verificadas em média 7
infracções diárias por excesso de velocidade. O chefe de polícia acredita que este número
pode ter aumentado. Para verificar isso, o radar foi mantido por 10 dias consecutivos. Os
resultados foram:
8, 9, 5, 7, 8, 12, 6, 9, 6, 10
Os dados trazem evidência de aumento nas infracções?
Definição da Hipótese
H0 : = 7
H1 : 7
Estatística do Teste
Temos X = 8 , não conhecendo , estimamos por S (desvio-padrão da amostra), logo, S =
2,10. O desvio padrão foi estimado a partir de uma pequena amostra deve-se usar a estatística
t - student.
X − o 8 −7 1
tcal = = = =1,5
S n 2,10 10 0, 666
Isso significa que a média da amostra retirada aleatoriamente da produção está a 1,5 desvios-
padrão da média alegada em H 0 que é 7.
Região Crítica
O valor tabelado de t depende do nível de significância (5%) e dos graus de liberdade, que
são função do tamanho da amostra: GL = n – 1 = 9. Nesse exemplo, t crítico = 1,833
0.4
0.3
0.2
0.1
0.0
0
t c = 1.883
Decisão
O valor calculado de t está dentro da região de não rejeição de H 0 .
Conclusão
Como aceitamos H 0 , a conclusão é que e não houve um aumento significativo no número
de infracções. Veja que, apesar de 8 ser maior que 7, a diferença não foi significativa para
concluir que o número de infracções aumentou. É como se não houvesse provas suficientes
para condenar o réu.
Exemplo:
Um empresário desconfia que o tempo médio de espera para atendimento de seus clientes é
superior a 20 minutos. Para testar essa hipótese ele entrevistou 20 pessoas e questionou
quanto tempo demorou para ser atendido. O resultado dessa pesquisa aparece a seguir:
22 20 21 23 22 20 23 22 20 24
21 20 21 24 22 22 23 22 20 24
X = 21,8 min
S = 1, 40 min
X − o 21,8 − 20
to = = = 5,75
S / n 1, 40 / 20
t0 = 5,75 t0,05,19 = 1,729 → Rejeita-se a hipótese nula.
Exemplo.
A cadeia de Lojas Arjo emite o seu próprio cartão de crédito. O administrador de crédito quer
verificar se o saldo não pago mensal é maior do que $ 400. O nível de significância é fixado
em 0,05. Uma amostra aleatória de 172 saldos não pagos revelou uma média amostral de $
407 e o desvio padrão amostral de $ 38. O administrador de crédito pode concluir que a média
populacional é maior que $ 400.
Estabeleça a Hipótese Nula e a Hipótese Alternativa.
H 0 : 400
H1 : 400
Estabeleça a regra de decisão.
H 0 é rejeitada se o z (calculado) > 1,645 (ver tabela distribuição normal).
Calcule o valor da estatística de teste.
407 − 400
z= = 2,42
38
172
Qual é a decisão sobre H 0 ?
H 0 é rejeitada. O administrador conclui que a média dos saldos não pagos é maior do que $
400.
Exemplo:
Dez cobaias foram submetidas ao tratamento de engorda com certa ração. Os pesos em
gramas, antes e após o teste são dados a seguir (supõe-se que provenham de distribuições
normais). A 1% de significância, podemos concluir que o uso da ração contribuiu para o
aumento do peso médio dos animais?
Cobaia 1 2 3 4 5 6 7 8 9 10
Antes 635 704 662 560 603 745 698 575 633 669
Depois 640 712 681 558 610 740 707 585 635 682
Trata-se de uma situação em que queremos comparar as médias de duas amostras com
distribuições normais, supondo que se trata da mesma população, mas em dois momentos
diferentes: antes e após um tratamento de engorda. Há interesse em verificar se a dieta
contribuiu para o peso médio dos animais: ou seja, queremos verificar se a média de peso
antes do tratamento é menor do que a média de peso após o tratamento (se a dieta fez efeito
os animais estarão em média mais pesados ao final do tratamento). Reparem que é exigido
que se tome uma decisão, o que configura um problema de teste de hipótese.
Iremos então aplicar um teste de diferenças entre médias para amostras relacionadas (mesma
população: antes e depois). O procedimento deste teste é descrito nos passos seguintes:
1º Enunciar as hipóteses
De acordo com o que foi dito acima queremos verificar se a média antes é menor do que a
média depois; o melhor ponto de partida, que servirá para a definição da hipótese H 0 , é que
a dieta não faz efeito, ou seja as médias antes e após o tratamento são iguais (costumamos
colocar em H 0 o contrário do que queremos provar), ou seja a diferença entre as médias deve
ser suposta igual a zero, teremos então:
H 0 : d = 0
Onde: d = antes − depois
H 1 : d 0
No presente problema temos uma amostra de apenas 10 elementos. Como a amostra tem
menos de 30 elementos vamos utilizar o teste t-Student.
0.4
0.3
0.2
0.1
0.0
0
− 2.82
Para valores maiores de -2,82 não rejeitaremos H 0 . Se tn-1 for menor do que -2,82
rejeitaremos H 0 (a média depois aumentou significativamente em relação à média antes da
dieta para que a diferença seja devida apenas ao acaso. Claro que há uma chance de 1% de
que venhamos a rejeitar H 0 sendo ela verdadeira.
Cobaia 1 2 3 4 5 6 7 8 9 10
Antes 635 704 662 560 603 745 698 575 633 669
Depois 640 712 681 558 610 740 707 585 635 682
d =
d i
=−
66
= −6.6 gramas
n 10
sd =
d − ( d )
i
2
i
2
/n =
882 − (−66) 2 / 10
= 7.04 gramas
n −1 10 − 1
d − 66
t n −1 = t10−1 = t 9 = = −2,96
(sd / n ) (7.04 / 10 )
Conforme foi visto anteriormente, se o valor da variável de teste fosse menor do que -2,82 a
hipótese H 0 seria rejeitada:
− 66
t n−1 = t10−1 = t 9 = = −2,96
(7.04 / 10 )
Assim, concluímos com 99% de confiança (ou uma chance de erro de 1%) que a dieta
contribuiu para o aumento do peso médio dos animais.
A hipótese nula é:
H 0 : P = P0
O problema fornece informações sobre a hipótese alternativa, que pode ser uma das
seguintes:
H1 : P P0 ou H1 : P P0 ou H1 : P P0
Fixar o nível de significância “α”.
2º Determinar a região crítica.
Neste caso, devemos determinar os pontos críticos e usando a tabela da
distribuição Normal.
3º Estatística de Teste
pˆ − p
A estatística teste a ser utilizada é Z =
p (1 − p )
n
4º Tirar conclusões.
Exemplo.
Um fabricante garante que 90% das peças que fornece à linha de produção de uma
determinada fábrica está de acordo com as especificações exigidas. A análise de uma amostra
de 200 peças revelou 25 defeituosas. A um nível de 5%, podemos dizer que é verdadeira a
afirmação do fabricante?
Estabelecemos as hipóteses
3. Como α = 0,05, e .
Distribution Plot
Normal, Mean=0, StDev=1
0.4
0.3
Density
0.2
0.1
0.025 0.025
0.0
-1.96 0 1.96
X
5. Conclusão: como -1,96 < Zobs = -1,178 < 1,96, não rejeitamos H0. Portanto, temos
evidências de que a afirmação do fabricante é verdadeira.
Exemplo:
As condições de mortalidade de uma região são tais que a proporção de nascidos que
sobrevivem até 60 anos é de 0,60. Testar esta hipótese ao nível de 5% de significância se em
1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até os 60 anos.
H0: p = 0,60
H1: p 0.6
Considerando, então, um teste bilateral e tendo = 5% tem-se que a região de aceitação é
constituída pelo intervalo RA = [-1,96, 196].
530
pˆ = = 0.53
1000
pˆ − p 0.53 − 0.6
A estatística do teste é: Z = = Z= = −4.52
p (1 − p ) 0.6(1 − 0.6)
n 1000
Como este valor não pertence a região de aceitação, pode-se rejeitar a hipótese nula, ao nível
de 5% de significância, isto é, neste caso, pode-se afirmar que a taxa dos que sobrevivem até
os 60 anos é menor do que 60%.
Exemplo:
Em uma região afectada por um surto epidémico, observou-se uma amostra de 2500
indivíduos, tendo-se encontrado 625 contaminados. Teste, ao nível de significância 5%, se a
proporção de indivíduos contaminados é significativamente diferente a 20%.
H0: p = 0.20
H1: p 0.20
625
pˆ = = 0.25
2500
pˆ − p 0.25 − 0.2
Z= = = 6.25
p (1 − p ) 0.2(1 − 0.2)
n 2500
Como =0.05 e Z crítico =1.96 <6.25, então, há evidências para rejeitar H0.
Exemplo.
No passado, 15 % das solicitações postais feitas por uma instituição de caridade resultaram
em contribuição financeira. Uma nova carta de solicitação foi redigida. Esta nova carta
elevou a taxa de contribuição? A nova carta é enviada a uma amostra de 200 pessoas e 45
responderam com uma contribuição. Ao nível de significância de 0,05 pode-se concluir que
a nova carta é mais efectiva?
Estabeleça a Hipótese Nula e a Hipótese Alternativa:
H 0 : p 0,15
H1 : p 0,15
Estabeleça a regra de decisão
H0 é rejeitada se o Z (calculado)> 1,645.
Calcule o valor da estatística de teste
45
− 0,15
z= 200 = 2,97
(0,15)(0,85)
200
Dado que o z efectiva = 2,97> z crítico (1,645), H0 é rejeitada. A nova carta é mais efectiva.
EXERCÍCIOS RESOLVIDOS
1. Lance uma moeda e um dado, seja S o espaço amostral constituído dos doze
elementos:
S = {H1, H2, H3, H4, H5, H6, T1, T2, T3, T4, T5, T6}
a) Escreva explicitamente os seguintes eventos: A = {caras e um número par
aparecem}, B = {um número primo aparece}, C = {coroas e um número ímpar
aparecem}.
b) Idem, o evento em que: (a) A ou B ocorrem, (b) B e C ocorrem, (c) somente B
ocorre.
c) Quais dos eventos A, B e C são mutuamente exclusivos?
Resolução:
a) Para obter A, escolhemos os elementos de S constituídos de um H e um número
par: A = [H2, H4, H6].
Para obter B, escolhemos os pontos de S constituídos de números primos: B =
[H2, H3, H5, T2, T3, T5].
Para obter C, escolhemos os pontos de S constituídos de um T e um número
ímpar: C = [T1, T3, T5].
b) (a) A ou B = A B = [H2, H4, H6, H3, H5, T2, T3, T5].
(b) B e C = B C = [T3, T5]
(c) Escolhemos os elementos de B que não estão em A e C:
B A c C c = [H3, H5, T2].
1
4. A probabilidade de um homem viver mais dez anos é e a probabilidade de a sua esposa
4
1
viver mais dez anos é . Encontre a probabilidade de:
3
a) Ambos estarem vivos dentro de 10 anos.
b) Pelo menos um estar vivo dentro de dez anos.
c) Nenhum estar vivo dentro de dez anos.
d) Somente a esposa estar viúva dentro de dez anos.
Resolução:
Seja A = evento em que o homem esteja vivo em dez anos, e B = evento em que sua esposa
1 1
esteja viva em 10 anos; então P ( A) = e P( B) =
4 3
a) Procuramos P ( A B ) . Como A e B são independentes;
1 1 1
P( A B) = P( A) P( B) = =
4 3 12
b) Procuramos P ( A B ) .
1 1 1 1
P( A B) = P( A) + P( B) − P( A B) = + − =
4 3 12 2
c) Procuramos P( Ac B c ) .
1 3 1 2
Agora P( A c ) = 1 − P( A) = 1 − = e P( B c ) = 1 − 1 − P( B) = 1 − =
4 4 3 3
Além disso, como Ac e B c são independentes,
3 2 1
P( A c B C ) = P( A c ) P( B c ) = =
4 3 2
1 3
d) Procuramos P( A c B) . Como P( A c ) = 1 − P( A) = 1 − = e Ac e B são
4 4
1
independentes P( A c B) = P( A c ) P( B) =
4
5. Uma companhia de seguros iniciará uma campanha extensa de propaganda para
vender apólices de seguro de vida, se verificar que a quantia média segurada por
família é inferior a $ 10.000,00. Tomou-se uma amostra aleatória de 50 família que
acusou um seguro médio de $ 9.600,00 com desvio padrão de $ 1.000,00. Com base
na evidência amostral, a um nível de significância de 5%, a campanha deve ser
iniciada ou não? (Passos: defina as hipóteses, faça o teste, tome a decisão).
Resolução:
As hipóteses a formular são:
H 0 : = 10.000
H 1 : 10.000
0.4
0.3
0.2
0.1
0.0
-1.64 0
A estatística de teste (Z) calculada “cai” na região crítica (área sombreada), com efeito
rejeita-se a hipótese nula, isto é, há evidência amostral é suficiente para se afirmar que
a quantia média segurada é inferior a $ 10.000,00 devendo-se deste modo avançar com
a campanha de propaganda.
6. Um relatório de uma companhia afirma que 40% de toda a água obtida, através de
poços artesianos no nordeste, é salobra. Há muitas controvérsias sobre essa
informação, alguns dizem que a proporção é maior, outros que é menor. Para diminuir
as dúvidas, 400 poços foram sorteados e observou-se, em 120 deles, água salobra.
Qual será a conclusão ao nível de 5%?
Resolução:
As hipóteses a formular são:
H 0 : P = 0.4
H 1 : P 0.4
120
pˆ = = 0.3,
400
Distribution Plot
Normal, Mean=0, StDev=1
0.4
0.3
Density
0.2
0.1
0.025 0.025
0.0
-1.96 0 1.96
X
Segunda decimal de z
0 1 2 3 4 5 6 7 8 9
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
Parte inteira e primeira decimal de z
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
EXERCÍCIOS DE APLICAÇÃO
1. Uma operação de linha de produção foi programada para colocar 320 mg de detergente
em pó em cada caixa de papelão. Uma amostra de caixas de papelão é periodicamente
seleccionada e pesada para determinar se está ocorrendo subenchimento ou sobre
enchimento. Se os dados da amostra levarem à conclusão de subenchimento ou sobre
enchimento, a linha de produção será paralisada e calibrada para se obter o enchimento
apropriado das caixas.
a) Formule as hipóteses nulas e alternativa que auxiliarão a decisão de paralisar e
calibrar a linha de produção.
b) Comente a conclusão quando H0 não pode ser rejeitada.
c) Comente a conclusão quando H0 pode ser rejeitada.
2. Os americanos gastam uma média de 8,6 minutos por dia lendo jornais. Um
pesquisador acredita que os indivíduos nas posições de gerência gastam mais do que
o tempo médio nacional por dia lendo jornais. Uma amostra dos indivíduos em
posições de gerência será seleccionada pelo pesquisador. Os dados sobre os tempos
de leitura dos jornais serão usados para testar as seguintes hipóteses nula e alternativa.
H0: = 8,6
H1: 8,6
a) Qual é o erro do tipo I? Quais são as consequências de se cometer esse erro?
b) Qual é o erro do tipo II? Quais são as consequências de se cometer esse erro?
3. O pessoal de vendas da Carpetland tem tido vendas de $ 8 000 por semana, em média.
Paulo Ferreira, o vice-presidente da empresa, propôs um plano de compensação com
novos incentivos de vendas. Paulo espera que os resultados de um período de vendas
experimentais lhe possibilitem concluir que o plano de compensação aumenta as
vendas médias por vendedor.
a) Desenvolva as apropriadas hipóteses nula e alternativa. Qual é o erro do tipo I
nessa situação? Quais são as consequências de se cometer esse erro?
b) Qual é o erro do tipo II nessa situação? Quais são as consequências de se cometer
esse erro?
4. Historicamente, em certa cidade, a variável aplicação em caderneta de poupança tem
média de 420 unidades monetárias, com desvio padrão de 100 unidades monetárias.
Foi feita uma suposição, que actualmente esta situação tenha se alterado. Para testar
tal suposição, tomou-se uma amostra de 100 depositantes, que acusou uma média de
415 unidades monetárias. Usando =5%, pode-se concluir que houve alteração?
R: z = -0,5; Não rejeitar H0.
5. Um fabricante de conservas anuncia que o conteúdo líquido das latas de seu produto
é, em média, de 2000 gramas, com desvio padrão de 40 gramas. A fiscalização de
pesos e medidas investigou uma amostra aleatória de tamanho 64, de um lote de 500
SUMÁRIO DO CAPÍTULO II
No capítulo II você aprendeu a formular a hipótese nula e a hipótese alternativa, desenvolver
ou escolher a estatística de teste e tomar a decisão relativa as hipóteses formuladas. A
formulação das hipóteses é baseada na hipótese ou na questão de pesquisa do investigador.
Geralmente, ao que o investigador tenciona testar é atribuído a hipótese alternativa e a
hipótese nula faz uma negação total ou parcial da hipótese alternativa. A escolha da estatística
de teste tem em conta a distribuição da população, a dimensão da amostra e o conhecimento
ou não do desvio padrão populacional. Escolhida a estatística do teste e processado o teste
segue-se a decisão sobre rejeitar ou não rejeitar a hipótese nula. Qualquer decisão que
viermos a tomar após a realização do teste, está sujeita a uma certa margem de erro. Ao
rejeitarmos a hipótese nula corremos o risco de estar a cometer o erro do tipo I, isto é, estar
a rejeitar a hipótese nula enquanto ela é verdadeira. Por outro lado, ao não rejeitar a hipótese
nula, você poderá estar cometendo o erro tipo II, isto é, não rejeitar a hipótese nula enquanto
ela é falsa. Em geral, você aprendeu a implementar os principais testes de hipótese
nomeadamente testes da média e teste de proporção. Na próxima unidade (Amostragem) você
vai aprender as principais técnicas de levantamento oficial de dados, a determinar ou
optimizar a dimensão da amostra e técnicas de confecção de questionário.
3.2. CONCEITOS
População – conjunto de unidades bem definidas com características comuns, tempo
e no espaço. A população deve ser definida claramente e em termos daquilo que se
pretende conhecer.
Unidade – qualquer elemento individual da população.
Amostra – uma parte ou subconjunto da população usada para obter informação
acerca do todo.
Variável – característica de uma unidade que será medida na unidade de amostra
aos princípios de teoria de probabilidade nem sempre é o de mais fácil aplicação, sobre
tudo porque exige que se atribua a cada elemento da população um único número.
A amostragem aleatória simples pode ser feita com reposição (cada elemento da
população pode entrar mais de uma vez na amostra) ou sem reposição (cada elemento da
população só (pode entrar uma vez na amostra).
3.4.2. AMOSTRAGEM SISTEMÁTICA
É uma versão da amostragem aleatória simples. A sua aplicação requer que a população
seja ordenada de tal modo que cada um dos seus elementos possa ser unicamente
identificado pela posição. O primeiro elemento a fazer parte da amostra é escolhido de
forma aleatória os restantes elementos são obtidos mediante a adição de um rácio.
3.4.3. AMOSTRAGEM ESTRATIFICADA
Este método consiste em dividir a população em grupos relativamente homogéneos e
mutuamente exclusivos, chamados estratos, e seleccionar amostras aleatórias simples
independentes em cada estrato. Se o número de elementos de cada amostra estiver de
acordo com a proporção do estrato na população diremos que se obteve uma amostra
global estratificada proporcionalmente. Se, no entanto, todas as amostras tiverem o
mesmo número de elementos, o resultado de cada estrato deve ser pesado pela proporção
desse extracto na população.
No caso da amostragem estratificada não proporcional, a extensão da amostra dos vários
estratos não é proporcional a extensão desses estratos em relação ao universo. Há
situações em que esse procedimento é o mais adequado, particularmente naquelas em que
se tem interesse em comparar vários estratos.
3.4.4. AMOSTRAGEM POR CONGLOMERADO
Tal como na amostragem estratificada, na amostragem por conglomerados, a população
é dividida em grupos, ou conglomerados, este tipo de amostragem torna-se
particularmente útil quando a população se encontra dividida num número reduzido de
grupos, caracterizados por terem uma dispersão idêntica a população total. Primeiro
selecciona se aleatoriamente alguns dos grupos e em seguido, inclui-se na amostra todos
os indivíduos pertencentes aos grupos seleccionados, tira-se de um processo amostral
causal simples em que cada unidade é o conglomerado. Este tipo de amostragem exige
que se disponha de uma lista dos grupos e não uma lista completa dos elementos da
população, como é o caso das amostragens anteriores.
Um exemplo deste tipo de amostragem é o caso em que se pretende fazer uma sondagem
de opinião aos alunos de uma escola (população) da qual apenas se dispõe de uma lista
das turmas (grupos de alunos). Uma amostra por conglomerados obtêm-se seleccionando
uma amostra aleatória de turmas e inquerindo dentro de cada turma escolhida todos os
alunos.
3.4.5. AMOSTRAGEM POR ESTÁGIOS MÚLTIPLOS
A população encontra-se dividida em vários grupos e seleccionam se aleatoriamente
alguns desses grupos. No passo seguinte, também os elementos de cada grupo são
EXERCÍCIOS
Dê o seu conceito de amostra representativa.
1. Diferencie a população alvo da população a inquerir.
2. Quais são as etapas a seguir num levantamento por amostragem?
3. Porque é que em muitos estudos recorre-se a levantamentos por amostragem e não a
levantamentos censitários?
4. Comente ou critique a frase abaixo:
a) Os resultados obtidos através de um levantamento censitária são mais credíveis
que os obtidos através de um levantamento por amostragem.
b) O tipo de amostragem a ser usado depende da população a inquerir e do objectivo
do estudo.
5. Analise a veracidade da frase: “Em qualquer plano de amostragem sempre deve-se
incluir o passo referente a inquirição da população.”
QUADRO SINÓPTICO
4.1. CONCEITOS
Diz-se que ̂ é um estimador se for uma estatística amostral que simplesmente pode ser uma
regra ou fórmula ou método que nos diz como estimar o parâmetro da população. A todo
valor numérico particular obtido pela aplicação do estimador é chamado de estimativa.
Nota: As estatísticas são amostrais e os parâmetros são populacionais.
lim P(ˆ n − ) = 1, 0
n→
TEOREMA
Se X = ( x1 , x2 , ..., xn ) for uma amostra de tamanho n, obtida de pelo método da
amostragem aleatória simples e cumpre-se que:
lim E (ˆ ) = e lim Var (ˆ ) = 0
n → n →
EXEMPLO
1. Mostre que a média e um estimador não-enviesados da média populacional .
Resolução.
Por definição temos que para estimadores não-enviesados E(ˆ ) = , atendendo ao
facto de
x1 + x2 + ... + xn
x=
n
Vem que
x + x + ... + xn 1 + + ... +
E 1 2 = E ( x1 + x2 + ... + xn ) = =
n n n
(x − x) 2
3. Mostre que S 2 = i =1
é um estimador enviesado da variância populacional
n
2.
Resolução
Para tal, basta mostrar que E ( S 2 ) 2 .
1 1
E ( S 2 ) = E ( xi2 − 2 xi x + x 2 ) = E ( x 2
i
) − nE ( x 2 )
n n
Vejamos que
Var ( xi ) = E ( xi2 − 2 = 2
2
Var ( x ) = E ( x 2 ) − 2 =
n
Substituindo
E (S 2 ) =
1
n
n 2 + n 2 − 2 − n 2
2
= (n − 1) 2
n
4. Verifique se a média é um estimador consistente da média populacional.
Resolução
Para garantir a consistência de um estimador deve verificar as condições
Calculando
x + x2 + ... + xn 2
lim E 1 = e lim Var ( x ) = =0
x →
n x → n
Logo a média e um estimador consistente da média populacional.
EXERCÍCIOS
1. Dê exemplos de estimadores.
2. As estimativas podem ser populacionais?
3. Se um estimador for consistente, será ele eficiente? Justifique.
4. Quais são as propriedades dos estimadores
5. Quais são os passos necessários na construção de um intervalo de confiança?
6. Sejam x1 , x2 , ..., x6 variáveis aleatórias independentes, identicamente distribuídas de
forma normal com a média e variância 2 . Considere os seguintes estimadores:
x + x 2 + x3 + 3 x5
a) ˆ1 =
5
2 x1 + x2 + x3 + x4
b) ˆ 2 =
4
x1 + x 2 + x3 + x4 + x5
c) ˆ 3 =
5
x1 + x2 + x3 + x4
d) ˆ 4 =
4
x1 + x2 + x3 + x4 + x5
e) 5 =
6
(x − x) 2
8. Mostre que S 2 = i =1
é um estimador não-enviesado da variância
n −1
populacional 2 .
9. Suponha que as alturas de 100 estudantes do sexo feminino do ISM representam uma
amostra aleatória das alturas em polegadas. Determine as estimativas não-enviesadas
e eficientes da verdadeira média e da verdadeira variância.
QUADRO SINÓPTICO
NOTAÇÕES
Ao seleccionar uma amostra nós estamos interessados em medir ou registar a variável ou
características em estudo para cada unidade que entra na amostra. Portanto, a
característica não tem que ser necessariamente numérica podendo ser categórico, por
exemplo, a classe social a que um indivíduo pertence. Comummente usa-se letras
maiúsculos para representar as características da população e as minúsculas para
representar as da amostra
Uma população de dimensão N , podemos representa-la por x1 , x 2 , ..., x N , sendo estes X
os membros da população.
N
1
(ii) A média da população X = =
N
X
i =1
i ;
X X
(iii)A razão entre dois totais e duas médias R = ou R =
Y Y
Resolução
Enumerando a população de 1 até 200 e iniciando a leitura da tábua de números
aleatória cita nos anexos, por exemplo, na terceira coluna, primeira linha, obter-se-ão
os seguintes números aleatórios com 3 algarismos (já que o número total de operários
tem 3algarimos).
660 que se rejeita, 083,..., 009, 148,..., 154,..., 200, 165, 058, 191,..., 172,..., 100,...,
019,..., 111,..., 116,..., 011, que farão parte da amostra.
Assim escolher-se-á o 9º, 11º, 19º da primeira linha de montagem 3º, e o 20º da 5ª
linha de montagem 11º, 16º da 6ª linha de montagem e assim sucessivamente.
3. A demanda pelo produto X, na primeira semana de Dez/03, em 35 estabelecimentos
comerciais revelou os seguintes valores:
35; 19; 20; 22; 36; 42; 25; 42; 20; 28; 24; 23; 29; 33; 37; 14; 22; 35; 30; 30; 38; 39;
28; 27; 21; 27; 32; 49; 18; 26; 24; 33; 34; 29; 39.
a) Extrair uma amostra aleatória simples de tamanho 8 calcular a estimativa da
demanda média, o desvio padrão e a demanda total verificada naquela semana.
Assuma que a população esta enumerada o primeiro elemento é o primeiro na
lista e o último é o último da lista.
Resolução:
Iniciando leitura na primeira coluna e primeira linha (tabela dos números
aleatórios) obtemos a amostra com os elementos seguintes 27; 20; 30; 24; 25; 21;
22; 28.
A estimativa da demanda média é de 24.625 com um desvio em relação a média
de 3.5431. Estima-se que a demanda total verificada naquela semana tenha sido
de xT = Nx = 35 24.625 = 861.88
EXERCÍCIOS
1. Diferencie a amostragem aleatória simples com reposição de amostragem aleatória
simples sem reposição.
2. De que depende a decisão sobre o tipo de amostragem aleatória simples a usar?
3. Comente a frase seguinte: “A porção de números aleatórios obtidos através da roleta
constitui uma amostra aleatória simples”
4. Os empregados de uma firma tem etiquetas de identificação numeradas
consecutivamente de 101 a 873. Deve se escolher um comité de segurança de 10
x
n
i
E(x) = i =1
= . Sendo n o tamanho de amostra e
isto é, c
n () N o tamanho da população.
QUADRO SINÓPTICO
2
Var ( x ) = (1 − f )
n
n
Onde: f = é a fracção amostral como já foi referido.
N
Observe que a variância amostral de x reduzida pelo factor f, quando comparado com
o resultado análogo para população infinita. Este efeito é conhecido como correcção da
população finita. Por sua vez, mede a precisão de x em relação a µ, permitindo assim a
comparação deste com outros estimadores. A expressão em si contém a dimensão da
amostra, este facto permite a determinação da dimensão da amostra necessária de modo
a obter x com precisão desejada.
1 n
s12 =
n − 1 i =1
( xi − x ) 2
Ou
1 n
s 22 =
n i =1
( xi − x ) 2
P(− Z 1 − f − x; Z 1 − f − x) = 1 −
2 n 2 n
P( x − Z 1− f x + Z 1− f ) = 1−
2 n 2
Assim, será o nível de significância, o erro que se estará cometendo ao afirmar que o
intervalo contém o parâmetro. Deste modo a probabilidade de o intervalo
x − Z 1− f x + Z 1− f (população finita)
2 n 2 n
dizendo que se reconhecemos 100 amostras e para cada fosse calculado um intervalo
semelhante a aquele seriam 100 (1 − ) os intervalos que conteriam a verdadeira média
dessa população.
Observe que se a população for infinita a estatística fulcral será dada por
xi −
Z=
n
Assim, o intervalo construído para a média dessa população será
x − Z x + Z
2 n 2 n
xi −
t= distribuição t de Student
1− f
n
Compondo os intervalos
x − t ,( n −1) 1 − f x + t 1 − f (população finita)
,( n −1)
2 n 2 n
s s
x − t ,( n −1) x + t (população infinita)
,( n −1)
2 n 2 n
Z
2
2 d2
n0 = 2 = onde: V = 2
representa a variância da população desejada. O
d V Z
2
n
resultado n 0 é aceitável, a não ser que 0 seja grande. Caso seja, estão, calculamos n
N
usando
n0
n=
n
1+ 0
N
EXEMPLOS
1. Para investigar a taxa de abastecimento não relacionado com feriados num sector
da indústria foi realizado um inquérito. Recolheu uma amostra aleatória de 1000
indivíduos de um total de 36000 trabalhadores, aos quais foram questionados
sobre os dias que tinham faltado ao trabalho nos últimos 6 meses. Os resultados
foram.
Número de faltas 0 1 2 3 4 5 6 7 8 9
Número de
trabalhadores 451 162 187 112 49 21 5 11 2 0
Resolução
Para estimar o número médio de faltas ao nível deste sector nos últimos 6 meses
pode-se usar a média amostral.
x = 1.296
A variância amostral é dada por
sˆ 2 = 2.397
Recorrendo a aproximação a distribuição normal, obtemos um intervalo de
confiança a 95% para µ dado por
1000
1.296 1.96 2.397 1 − / 100 = 1.201; 1.391
2
36000
2. Seja X a duração da vida de uma peça de equipamento tal = 5 horas. Admita
que 100 peças foram ensaiadas fornecendo uma duração de vida média de 500
horas que se deseja obter um intervalo de 95% para verdadeira média
populacional.
Resolução
Já que n 30 , variância populacional é conhecida usaremos a distribuição
normal.
Temos:
x ~ N (500; 25)
Então:
x ~ N ( ; 0.25)
1 − = 0.95 → = 0.05 → Z = 1.96
2
7.27; 10.13
Nota: se n 30 e for desconhecido poderemos usar S como uma boa
estimativa de . Esta estimação será melhor quanto maior for o tamanho da
amostra.
EXERCÍCIOS
1. O que representa o valor de ?
2. Desenhe um fluxograma que mostre a regra de decisão na construção de
intervalos de confiança da média, na escolha do tipo de distribuição a usar, sendo
a variância populacional conhecida ou desconhecida e considerando o tamanho
da amostra.
3. Como interpretaria 100 intervalos de confiança construídos para a média
populacional na base de 100 amostras retiradas da mesma população. Grau de
confiança de 0.95.
4. Cada um dos 60 investigadores num grupo de estaticistas obteve de forma
independente um intervalo de confiança 95% para a média populacional
(considerada normal) dum organismo sujeito a presença de determinada
substância química. Diga se considera verdadeiras ou falsas as afirmações
seguintes:
a) Espera-se que 57 intervalos conterão a verdadeira média populacional;
b) A probabilidade de µ pertencer ao Intervalo de Confiança é de 0.95.
c) A precisão de um intervalo de confiança diminui quando se aumenta o nível
de confiança metendo-se a dimensão da amostra fixa.
5. Comente a frase seguinte: “A dimensão da amostra é determinada tendo em conta
o objectivo do estudo, isto é, a características a estimar”.
6. Na prática 2 não conhecido, e a fórmula para o cálculo da dimensão da amostra
presume que 2 seja conhecido. Enumere e explique algumas formas que
permitam estimar 2 .
7. Uma amostra 320 família conduziu aos seguintes resultados.
Rapazes 5 4 3 2 1 0
Famílias 18 56 110 88 40 8
Construa um intervalo de confiança de 99% para o número médio de filhos
naquela população.
8. Determine o tamanho da amostra mínimo necessário para estimar µ, com uma
margem de erro inferior a 10% e um risco de não respeitar a margem de 10% e
2 = 0.6 .
9. Uma empresa pretende adquirir peças de peso médio especificado em 200g. Um
fabricante querendo estimar o verdadeiro peso médio num grande lote a fornecer
SUGESTÕES DE LEITURA