Você está na página 1de 81

Estatística

Aplicada a
Psicologia

UNIDADE II

Probabilidades, Testes de
Hipóteses e Amostragem

2022
Ficha Técnica:
Título: Estatística aplicada a Psicologia – Probabilidades, Testes de Hipóteses e Amostragem
Autor: Odete Omar e Didian Natividade
Revisor 1: Abiba Mamade e Amélia Mungoi
Revisor 2: Emílio Muchanga
Execução gráfica e paginação: Instituto Superior Monitor
2ª Edição: 2022
Adaptação por Instituto Superior Monitor Março de 2022
© Instituto Superior Monitor

Todos os direitos reservados por:


Instituto Superior Monitor
Av. Samora Machel, n. º 202 – 2.º andar
Caixa Postal 4388 Maputo
MOÇAMBIQUE

Nenhuma parte desta publicação pode ser reproduzida ou transmitida por qualquer forma ou
por qualquer processo, electrónico, mecânico ou fotográfico, incluindo fotocópia ou gravação,
sem autorização prévia e escrita do Instituto Superior Monitor. Exceptua-se a transcrição de
pequenos textos ou passagens para apresentação ou crítica do livro. Esta excepção não deve de
modo nenhum ser interpretada como sendo extensiva à transcrição de textos em recolhas
antológicas ou similares, de onde resulte prejuízo para o interesse pela obra. Os transgressores
são passíveis de procedimento judicial.
ÍNDICE
ACERCA DESTA DISCPLINA ...................................................................................... 5
PRECISA DE AJUDA ........................................................................................................ 6
TRABALHOS ..................................................................................................................... 7
DURAÇÃO ......................................................................................................................... 7
TÉCNICAS DE ESTUDO .................................................................................................. 7
RESULTADO DE APRENDIZAGEM .............................................................................. 8
ESTRUTURA DA UNIDADE I ....................................................................................... 9
CAPÍTULO I – INTRODUÇÃO À ESTATÍSTICA APLICADA A PSICOLOGIA10
OBJECTIVOS DO CAPÍTULO ................................................................................ 10
1.1. RESUMO HISTÓRICO DAS PROBABILIDADES ................................................ 10
1.2. CONCEITOS DA TEORIA DE PROBABILIDADES ............................................. 12
1.2.1. EXPERIÊNCIA ALEATÓRIA ........................................................................ 13
1.2.2. ESPAÇO DE RESULTADOS .......................................................................... 13
1.2.3. ACONTECIMENTO ........................................................................................ 14
CONCEITOS DE PROBABILIDADES.................................................................... 14
1.3.2. CONCEITO FREQUENCISTA DE PROBABILIDADES ........................... 15
1.3.3. CONCEITO SUBJECTIVO DE PROBABILIDADES ................................. 15
1.3.4 PROBABILIDADE CONDICIONAL .............................................................. 16
1.3.5. Acontecimentos Independentes ........................................................................ 19
1.3.6. Acontecimentos Independentes e Mutuamente Exclusivos ........................... 20
EXERCÍCIOS PROPOSTOS..................................................................................... 23
CAPÍTULO II – TESTE DE HIPÓTESES .................................................................. 27
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 27
2.1. INTRODUÇÃO AO CAPÍTULO .............................................................................. 27
2.1. HIPÓTESE NULA E ALTERNATIVA ............................................................. 29
2.2. TIPOS DE ERRO E NÍVEL DE SIGNIFICÂNCIA ......................................... 30
2.3. TESTE DE HIPÓTESE PARA A MÉDIA ........................................................ 35
2.4. TESTE DE DIFERENÇA ENTRE MÉDIAS .................................................... 39
2.5. TESTE DE HIPÓTESE PARA PROPORÇÃO ................................................ 42
EXERCÍCIOS RESOLVIDOS................................................................................... 45
ANEXO I – TABELAS DE CONSULTA .................................................................. 50
EXERCÍCIOS DE APLICAÇÃO .............................................................................. 53
SUMÁRIO DO CAPÍTULO II................................................................................... 55
CAPÍTULO III – TEORIA DE AMOSTRAGEM ....................................................... 56
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 56
3.1. INTRODUÇÃO AO CAPÍTULO ....................................................................... 56
3.2. CONCEITOS ........................................................................................................ 57
3.3. PLANO DE AMOSTRAGEM............................................................................. 57
3.4. MÉTODOS DE SELECÇÃO DE AMOSTRA .................................................. 57
3.4.1. AMOSTRAGEM ALEATÓRIA SIMPLES ................................................... 57
3.4.2. AMOSTRAGEM SISTEMÁTICA .................................................................. 58
3.4.3. AMOSTRAGEM ESTRATIFICADA ............................................................. 58
3.4.4. AMOSTRAGEM POR CONGLOMERADO ................................................. 58
3.4.5. AMOSTRAGEM POR ESTÁGIOS MÚLTIPLOS ....................................... 58
3.4.6. AMOSTRAGEM MULTI-FÁSICA ................................................................ 59
EXERCÍCIOS .............................................................................................................. 59
QUADRO SINÓPTICO .............................................................................................. 61
CAPÍTULO IV – TEORIA DE ESTIMAÇÃO ............................................................ 62
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 62
4.1. CONCEITOS ............................................................................................................. 62
4.2. ESTIMAÇÃO PONTUAL ......................................................................................... 62
4.3. ESTIMACÃO INTERVALAR .................................................................................. 63
EXERCÍCIOS .............................................................................................................. 65
QUADRO SINÓPTICO .............................................................................................. 67
CAPÍTULO V – AMOSTRAGEM ALEATÓRIA SIMPLES .................................... 68
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 68
5.1. AMOSTRAGEM ALEATÓRIA SIMPLES SEM REPOSIÇÃO.............................. 68
5.2. AMOSTRAGEM ALEATÓRIA SIMPLES COM REPOSIÇÃO ............................. 69
EXERCÍCIOS .............................................................................................................. 70
CAPÍTULO VI – ESTIMAÇÃO DA MÉDIA .............................................................. 73
OBJECTIVOS ESPECÍFICOS DO CAPÍTULO..................................................... 73
6.1. ESTIMADOR PONTUAL DE MÉDIA,  .............................................................. 73
6.2. ESTIMADOR PONTUAL DA VARIÂNCIA,  x2 .............................. 73
6.3. INTERVALO DE CONFIANÇA PARA MÉDIA,  ....................................... 74
6.4. ESCOLHA DO TAMANHO DA AMOSTRA .......................................................... 75
EXERCÍCIOS .............................................................................................................. 79
SUGESTÕES DE LEITURA ............................................................................................. 81
ACERCA DESTA DISCPLINA

Bem-vindo (a) ao ISM e a disciplina de Estatística aplicada a Psicologia!

Esta unidade é uma continuidade a disciplinas de Estatística I e II e faz parte de um conjunto


de disciplinas do curso à distância no Instituto Superior Monitor (ISM).

A disciplina de Estatística Aplicada a Psicologia – tem como objectivo apoiar ao estudante


a recapitular conceitos já apreendidos, com vista a desenvolver um conjunto de competências
profissionais como psicólogos no que diz respeito à pesquisa, na intervenção clínica, social
e educacional, usando como recurso a estatística.

A disciplina foi dividida em (três) unidades, para as quais se estabeleceram objectivos


específicos, a presente unidade é composta por seis capítulos que doravante serão abordados
na estrutura da unidade.
Estatística Aplicada a Psicologia

Cada unidade corresponde a cerca de 5 semanas de estudo. No final de cada unidade de


estudo irá encontrar um teste de avaliação que deverá ser respondido e enviado para o ISM
pelas seguintes vias: correio, entregue presencialmente na sede ou nos centros de recurso ou
digitalizado e enviado para o email: testes@ismonitor.ac.mz. Os testes devem ser enviados
ao fim de cada 5 semanas de estudo por forma a garantir o conhecimento atempado dos
resultados obtidos no mesmo. Não entregue os 3 testes ao mesmo tempo, pois assim não
estará a par da sua progressão e dos seus erros e melhorias que deve levar a cabo para ter
sucesso.
Na página do ISM www.ismonitor.ac.mz encontra todos os contactos. Deve estar sempre
atento aos contactos da direcção do seu curso, da coordenação e do tutor de cada uma das
disciplinas que frequenta.

No final de cada unidade é providenciada uma lista de bibliografia e de referências na internet


que poderá consultar. A biblioteca virtual do ISM inclui livros digitalizados, artigos, websites
e outras referências importantes para esta e outras disciplinas, que deverá utilizar na
realização de casos práticos. A biblioteca virtual pode ser consultada na página do ISM.

PRECISA DE AJUDA
No caso de dúvidas sobre os conteúdos desta unidade, por favor contacte o respectivo tutor.
O número do tutor será disponibilizado pela sua Faculdade, podendo também consultar os
contactos e horários do tutor através do site: https://www.ismonitor.ac.mz/ ou através da
página facebook: https://www.facebook.com/ismonitor/.

Uma vez que é um estudante universitário, as suas técnicas de aprendizagem deverão ser
distintas das que utilizava durante o ensino secundário, em regime presencial.
Nesta licenciatura, o aluno deverá assumir uma maior autonomia, isto é, uma maior
capacidade de gestão responsável do seu tempo.
Por este motivo, importa que construa um programa de estudos realista e que o cumpra
rigorosamente, seleccionando horários e locais tranquilos para estudar.

INSTITUTO SUPERIOR MONITOR


6
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

TRABALHOS

Depois de estudar cada capítulo desta unidade o estudante deve resolver todos os exercícios
de aplicação como forma de consolidação das matérias nela vertidas. Os exercícios de
aplicação não serão submetidos ao Instituto Superior Monitor.

DURAÇÃO
Tempo para leitura da unidade: 23 horas
Tempo para trabalhaos de pesquisa 11 horas
Tempo para a realização de exercícios práticos: 14 horas
Tempo para a realização de avaliação: 2 horas

TÉCNICAS DE ESTUDO
Por você ser um estudante universitário as suas técnicas de aprendizagem serão diferentes
das que usava nos tempos da escola secundária e na presença de um professor.
Neste curso você terá uma grande autonomia, isto é, RESPONSABILIDADE. Acima de
tudo, você fará uma gestão responsável do seu tempo.
Faça um programa de estudos realista e cumpra-o rigorosamente. Escolha horas e locais
tranquilos para os seus estudos.
Faça uso dos demais recursos referenciados na unidade e mobilize a sua motivação
profissional e/ou pessoal para adequar as suas actividades de estudo a outras
responsabilidades profissionais, sociais e pessoais. Partilhe as suas aprendizagens com os
outros.
É boa prática submeter os testes de cada disciplina de forma gradual, isso possibilitará-te a
avaliação do seu aproveitamento pedagógico, isto é, é sempre melhor conhecer a nota do
primeiro teste antes de submeter o segundo para em casos de insucesso saber redobrar o
esforço que lhe fará obter uma nota melhor. Contudo entregando todos os testes ao mesmo
tempo já anula a possibilidade de acompanhar o desempenho académico.

INSTITUTO SUPERIOR MONITOR


7
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

RESULTADO DE APRENDIZAGEM

No final da segunda unidade os estudantes deverão ser capazes de:

• Distinguir os conceitos da teoria de probabilidade e os conceitos de


probabilidades;

• Efectuar a análise de fenómenos aleatórios com recurso a métodos científicos;

• Formular uma hipótese para a investigação, desenvolver o respectivo teste e


tomar decisão mais acertada sobre a hipótese proposta para a investigação.

• Seleccionar o melhor método de amostragem para a recolha de dados em


função da natureza da pesquisa;

• Desenvolver estimadores para parâmetros populacionais.

INSTITUTO SUPERIOR MONITOR


8
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

UNIDADE I – ESTATÍSTICA APLICADA A PSICOLOGIA

ESTRUTURA DA UNIDADE I
A unidade é composta por seis (6) capítulos nomeadamente probabilidades e teste de
hipótese. Esta unidade visa dotar os estudantes de conhecimentos indispensáveis para
a análise de fenómenos aleatórios e formulação e teste de hipóteses.

O primeiro capítulo traz uma abordagem sobre os conceitos da teoria de


probabilidades, probabilidade clássica, probabilidade frequencista, probabilidade
subjectiva e probabilidade condicional. Ira-se discutir a distinção e a aplicabilidade
na vida prática destes conceitos, bem como a sua ligação aos fenómenos aleatórios.

O segundo capítulo visa discutir sobre a formulação de hipótese de pesquisa. Faz-se


neste capítulo uma descrição detalhada sobre o procedimento geral para a formulação,
teste e decisão sobre uma hipótese levantada. Devido a complexidade deste tema, o
capítulo apenas faz menção aos testes associados a média e proporção que são mais
frequentes em pesquisas quer qualitativas ou quantitativas.

O terceiro capítulo teoria de amostragem – uma abordagem aos principais


conceitos da teoria de amostragem, planos de amostragem e métodos de recolha de
dados;

O quarto capítulo teoria de estimação – noção de parâmetro populacional,


estimador, estimativa por ponto e por intervalo;

O quinto capítulo amostragem aleatória simples – processo de amostragem com


reposição e sem reposição;

O sexto capítulo estimação da média – estimativa pontual e intervalar e a dimensão


da amostra mais plausível para efeito de estimação da média populacional.

INSTITUTO SUPERIOR MONITOR


9
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

CAPÍTULO I – INTRODUÇÃO À ESTATÍSTICA APLICADA A


PSICOLOGIA

OBJECTIVOS DO CAPÍTULO

Findo este capítulo, o estudante será capaz de:


1. Definir os conceitos da teoria de probabilidades;
2. Distinguir a probabilidade clássica, frequencista e subjectiva;
3. Explicar o mecanismo de cálculo da probabilidade condicional;
4. Calcular a probabilidade de ocorrência de um evento.

1.1. RESUMO HISTÓRICO DAS PROBABILIDADES


Não é possível fazer a história da Estatística sem falar em probabilidades. Estas tiveram a sua
origem no estudo dos jogos de azar, já conhecidos dos Egípcios 3500 anos a.C. mas só no
século XVI se assiste à primeira tentativa de desenvolver uma teoria das probabilidades.
Cardano foi um dos primeiros cientistas a tentar descrever um método de cálculo das
probabilidades bem como as suas leis básicas. Cardano pode ser considerado um verdadeiro
cientista da Época Renascentista: escreveu sobre todas as áreas de estudo da época incluindo
matemática, a teologia, a cosmologia e medicina. Com o seu livro intitulado The book on
games of chance, Cardano não só explica as leis das probabilidades como analisa os jogos de
azar e ensina a jogar e a detectar os “batoteiros”. A sua experiência como jogador inveterado
ajuda-o a analisar correctamente os jogos de dados e a compreender, também de modo
correcto, o cálculo de probabilidade para os casos simétricos ou igualmente prováveis.
Nestes casos, a probabilidade de um acontecimento é o quociente entre o número de
resultados que permitem a realização desse acontecimento e o número total dos resultados
possíveis. Por exemplo, a probabilidade de que saia uma face par no lançamento de um dado
é , uma vez que há seis resultados possíveis 1, 2, 3, 4, 5, 6 e três deles são números pares
3
6
2, 4, 6. Uma importante lei probabilística descoberta por Cardano foi a lei de produto de
acontecimentos independentes. A probabilidade de sair “face” quando se lança uma moeda é
1 1
. A probabilidade de sair “face 2” quando se lança um dado é . A probabilidade de estes
2 6
dois acontecimentos ocorrerem quando se lança uma moeda e um dado é o produto das duas:
1 1 1
 = .
2 6 12

INSTITUTO SUPERIOR MONITOR


10
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Cinco décadas mais tarde, Galileu respondeu aos jogadores sobre uma questão que,
aparentemente, os preocupava: quando se lança três dados, o total de 10 pontos ocorre mais
vezes que um total de 9, o que lhe parecia contraditório uma vez que é igual o número de
combinações (6) que somam 9 (621, 531, 522, 441, 432, 432, 333) e 10 pontos (631, 622,
541, 532, 442, 433). Mas Galileu mostrou que é possível que os resultados tenham diferente
probabilidade se a ordem for também tomada em consideração e, nesse caso, o número de
resultado com soma igual a 9 é de 25, e com soma igual a 10, de 27, resultando em
25 27
probabilidades de e , respectivamente. O que muitos autores se admiram é que os
216 216
jogadores se tenham percebido desta diferença tão diminuta.
O estudo sistemático das leis de probabilidades teve um contributo importante com Pascal e
Fermat e a correspondência trocada entre ambos. Tudo começou quando Chevalier de Méré,
conhecido como escritor e ardente da corte de Luís XIV, consultou Fermat sobre problemas
de divisão de apostas e interrupções antes de se completar o jogo.
Blaise Pascal (1623 - 1665) era uma criança prodígio que aos dezasseis anos já tinha escrito
um livro e aos dezoito anos inventado uma máquina calculadora. Pierre de Fermat (1601 -
1665) era um jurista de Toulouse que nos tempos livres se dedicava ao estudo da matemática,
tendo já sido considerado como o maior matemático puro de todos os tempos.
Se de Cardano se pode afirmar que marcou o fim da pré-história da teoria das probabilidades,
Fermat e Pascal deram o passo decisivo no desenvolvimento desta teoria e na fundamentação
teórica da Inferência Estatística. No final do século XVII, Leibniz publicou duas obras, uma
sobre problemas combinatórios, e outra sobre a aplicação das probabilidades às questões
financeiras. Foi sob o seu conselho que Jacques Bernoulli estudou o assunto de modo que o
cálculo das probabilidades adquire finalmente o estatuto de ciência.
O teorema de Bernoulli apresenta pela primeira vez a correspondência entre frequências e
probabilidades, dando origem a um novo conceito de probabilidades. O conceito de
probabilidade inversa é definido por Thomas Bayes ainda no século XVIII. A importância
dos resultados de Bayes só vem a ser reconhecida quase dois séculos depois, quando se
forma, dentro da Estatística, uma nova corrente: a escola Bayesiana.
Durante o século XIX o desenvolvimento do cálculo das probabilidades deveu-se ao
contributo de três astrónomos: Laplace, Gauss e Quetelet. Muitos dos desenvolvimentos
posteriores, nomeadamente da escola russa (Chebyshev, Markov e Lyapunov), baseiam-se
na análise de observação da obra de Laplace. Gauss explanou uma teoria sobre a análise de
observação aplicável a qualquer ramo da ciência, contribuindo, assim, para alargar o campo
da aplicação do cálculo das probabilidades. Quetelet iniciou a sua aplicação aos fenómenos
sociais. A ele se deve a introdução do conceito de “homem médio” e a chamada de atenção
para a consistência dos fenómenos sociais.

INSTITUTO SUPERIOR MONITOR


11
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

A distinção entre Estatística e Probabilidades parece já ser impossível. Desde o final do


século XIX que muitos contribuíram para o desenvolvimento da Estatística com valiosas
antecipações que só mais tarde puderam ser plenamente compreendidas. De entre estes talvez
se possam destacar Karl Pearson, William Gosset que escreveu sob o pseudónimo de
“Student” e Ronald Fisher, pelo vigoroso impulso dado à Estatística.

Pearson, que se dedicou ao estudo da correlação, cuja descoberta é atribuída a Galton, foi um
entusiasta do evolucionismo de Darwin, desenvolveu extraordinariamente os métodos de
tratamento de dados, para além de se interessar pelo cálculo das probabilidades. Em 1894,
depois de analisar um elevado número de resultados das roletas num casino, chegou a
conclusão que estavam viciadas e que não serviam como laboratório para a análise das
probabilidades, em suma, a razão de ser dos casinos não era, de modo nenhum, científica.
Mas estas experiências no início da sua carreira não deixaram de ser úteis na aplicação que
fez da teoria das probabilidades à evolução biológica e a importantes descobertas estatísticas
como o teste do qui-quadrado, utilizado para testar se uma dada distribuição de frequência
segue determinada distribuição probabilística.
Gosset, ou seja, “Student” trabalhava para uma empresa de cerveja, a Guiness, e começou
uma nova fase nos estudos estatísticos com os métodos de tratamento de pequenas amostras.
Fisher deu, talvez, a mais importante contribuição à Estatística Matemática e à sua
divulgação. O livro que publicou em 1925, Statical Methods for Research Workers, permitiu
aos investigadores a familiarização necessária com os métodos estatísticos e a sua aplicação
a problemas práticos.
Muitos outros nomes poderiam ser referidos neste percurso de quase quatro séculos. Todos
contribuíram para que, quando Fisher publicou seu livro, há muito se tivesse deixado de
definir Estatística como “o estudo dos assuntos de Estado”, associando-a teoria das
probabilidades. Com o século XX, a Estatística tornou-se um instrumento de análise poderosa
aplicado em todas as áreas do saber e a que o desenvolvimento informático veio dar novo
fôlego.
1.2. CONCEITOS DA TEORIA DE PROBABILIDADES
Se lhe perguntassem o significado da seguinte frase “Se lançar uma moeda ao ar, a
1
probabilidade de sair face é “ ” a sua resposta talvez fosse: Só há dois resultados possíveis
2
com iguais hipóteses de ocorrerem. Mas suponha que lhe perguntavam também “qual é a
probabilidade de um carro avariar ao atravessar a ponte Armando Emílio Guebuza?”.
Também aqui existem apenas dois resultados possíveis: ao atravessar a ponte ou o carro
1
avaria ou não avaria. Mas já seria impossível responder que essa probabilidade é . A
2

INSTITUTO SUPERIOR MONITOR


12
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

simetria ou equiprobabilidade existente na primeira experiência (lançamento de uma moeda


ao ar) já não se verifica na segunda. Esta é a situação mais comum, a de experiências cujos
resultados são influenciados pelo acaso e aos quais estão associadas diferentes
probabilidades.

1.2.1. EXPERIÊNCIA ALEATÓRIA


São objectos de estudo na teoria das probabilidades os fenómenos aleatórios, ou seja,
acontecimentos influenciados pelo acaso. Na base desta teoria está o conceito de experiência
aleatórias, isto é, o processo de observação de acção cujos resultados, embora podendo ser
descritos no seu conjunto, não são determináveis á priori, antes de realizada a experiência.
Uma experiência aleatória tem como características:
• A possibilidade de repetição da experiência em condições uniformes;
• Não se poder dizer à partida qual o resultado (fenómeno aleatório) da experiência a
realizar, mas poder descrever-se o conjunto de todos os resultados possíveis;
• A existência de regularidade quando a experiência é repetida muitas vezes.
É com base nesta última característica que se desenvolve toda uma teoria e um conjunto de
modelos probabilísticos tendentes a explicar os fenómenos aleatórios e a dar uma indicação
da maior ou menor probabilidade da sua ocorrência. A experiência aleatória contrapõe-se à
experiência não aleatória ou determinística, aquela cujo resultado pode ser conhecido antes
da sua realização.
Por exemplo, o valor da velocidade de propagação do som (340m/s) é conhecido mesmo
antes de realizada a experiência, o mesmo acontecendo com medição da temperatura de
entrada em ebulição da água, cujo resultado (100°c) é conhecido a prior. Já o mesmo não
sucede quando lançamos ao ar um dado e observamos o número inscrito na fase voltada para
cima, embora podemos descrever o conjunto de todos os resultados que poderão ocorrer, mas
já é impossível, antes de efectuarmos o lançamento, afirmar qual a face que irá sair.

1.2.2. ESPAÇO DE RESULTADOS


Numa determinada experiência aleatória, o conjunto de todos os resultados possíveis
designa-se por espaço de resultados, e representa-se pela letra grega “Ω”. A indicação dos
elementos do espaço de resultados pode fazer-se, quer pela enumeração de todos os
elementos que o compõem (definição por extensão), quer pela descrição abreviada desses
elementos (definição por compreensão).
Exemplo:
Considere a experiência aleatória que consiste no lançamento de um dado e observação do
número inscrito na face de cima. O espaço de resultados é:
Ω = {1, 2, 3, 4, 5, 6}

INSTITUTO SUPERIOR MONITOR


13
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

1.2.3. ACONTECIMENTO
Considere a experiência aleatória que consiste no lançamento de um dado e cujo espaço de
resultados é: Ω = {1, 2, 3, 4, 5, 6}.
Sendo o espaço de resultados de um conjunto, é possível formar subconjuntos dos seus
elementos, como, por exemplo: A = {2}; B = {1, 3, 5}, C = {3, 6} Cujos significados são,
respectivamente A: saída de face 2; B: saída de face ímpar e C: saída de face divisível por 3.
A, B e C são simultaneamente subconjuntos de resultados possíveis da experiência aleatória.
Designam-se por acontecimentos.
Exemplo:
Admita-se a seguinte experiência aleatória: contagem do número de criança orfã, até ao
aparecimento de uma criança que tem os progenitores vivos. A experiência consiste, portanto,
em contar as crianças órfãs, interrompendo-se essa contagem no momento em que surgir uma
criança que tem os progenitores vivos. Como se poderá verificar, qualquer número inteiro
pode ser um resultado da experiência: Ω = {0, 1, 2, 3, 4,..., n, ... }.
Serão acontecimentos, por exemplo, os subconjuntos: A = {6} e B = {2, 4}.
CONCEITOS DE PROBABILIDADES
De acordo com a definição, e o método de cálculo, podem definir-se três conceitos de
probabilidade: clássico, empírica ou frequencista e subjectiva. As probabilidades que se
baseiam nas características intrínsecas dos acontecimentos são definidas segundo o conceito
clássico. Aquelas que se baseiam numa quantidade razoável de evidência objectiva são
empíricas ou frequencista, enquanto as probabilidades definidas com base em crenças ou
opiniões individuais se denominam subjectivas.
1.3.1 CONCEITO CLÁSSICO DE PROBABILIDADES
Se a uma experiência aleatória se podem associar N resultados possíveis, mutuamente
exclusivos e igualmente prováveis, e se n A desses resultados tiverem o atributo A, então a
n n
probabilidade de A é a fracção A , P[ A] = A . Onde n A é número de resultados favoráveis
N N
a A e N: número de resultados possíveis.
Repare-se que, para o conceito clássico de probabilidade, os resultados possíveis são todos
igualmente prováveis, isto é, têm igual probabilidade de se realizarem.
Exemplo
Consideremos a experiência aleatória que consiste no lançamento de uma moeda equilibrada
ao ar. Seja A o acontecimento: saída de face. O espaço de resultados será constituído por Ω
n 1
= {Face, Coroa}. A probabilidade de A será: P[ A] = A =
N 2

INSTITUTO SUPERIOR MONITOR


14
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

1.3.2. CONCEITO FREQUENCISTA DE PROBABILIDADES


Se em N realizações de uma experiência, o acontecimento A se verificou n vezes, diz-se que
n
a frequência relativa de A nas N realizações é f A = , sendo f A a frequência relativa do
N
acontecimento A.
Noutras N realizações da mesma experiência, desde que N seja suficientemente elevado, a
frequência relativa com que se realiza o acontecimento A é em geral diferente, mas próxima
da anterior. À medida que o número de provas aumenta, verifica-se uma regularidade das
frequências relativas, de tal modo que a irregularidade dos resultados individuais se opõe
uma certa regularidade estatística ao fim de uma longa serie de provas, isto é, f = n tende
A N
a estabilizar. É esta característica das experiências aleatórias que permite definir o conceito
frequencista de probabilidade.
Exemplo (1): A experiência aleatória que consiste na observação de um recém-nascido pode
considerar-se o exemplo típico para aplicação do conceito frequencista de probabilidade.
Porque esta experiência já se realizou inúmeras vezes e existem registos do seu resultado,
sabe-se que a probabilidade do sexo do recém-nascido ser masculino é de aproximadamente
0,52 e de ser feminino é de cerca de 0,48.
A utilização do conceito clássico de probabilidade teria conduzido ao valor de 0,5 para cada
uma das referidas probabilidades, o que constituiria um erro. Este seria proveniente do facto
de se considerarem equiprováveis os elementos do espaço de resultados Ω = {Masculino,
Feminino}, quando estes não são.

1.3.3. CONCEITO SUBJECTIVO DE PROBABILIDADES


Utilizando este conceito, a probabilidade de um acontecimento é dada pelo grau de
credibilidade ou de confiança que cada pessoa dá à realização de um acontecimento. Baseia-
se na informação quantitativa (ex: frequência de ocorrência de um acontecimento) e/ou
qualitativa (ex: informação sobre experiência passada em situações semelhantes) que o
decisor possui sobre o acontecimento em causa. Diferentes decisores podem atribuir
diferentes probabilidades ao mesmo acontecimento decorrentes da experiência, atitudes,
valores, entre outros que possuem.
Esta noção de probabilidade pode ser aplicada a experiência que, embora de resultado sujeito
ao acaso, não se podem efectuar várias vezes nas mesma condições, casos em que os
conceitos frequencista e clássico não se podem aplicar.

INSTITUTO SUPERIOR MONITOR


15
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Exemplo:
Se o Primeiro-ministro afirmasse “a inflação para o próximo ano será de 3% com uma
probabilidade de 0,9” estaria a aplicar o conceito subjectivo ou personalista de probabilidade.
Uma outra figura política, da Oposição, diria certamente que tal meta seria difícil de atingir,
e sendo instada a quantificar o que para ela era “difícil” poderia mesmo afirmar: “Tal nível
de inflação só será atingido com uma probabilidade de 0,25”. Também esta figura política
estará, deste modo, a aplicar o conceito subjectivo de probabilidade.
Axiomas da Teoria das Probabilidades
Da necessidade de sistematização dos conceitos empregues na Teoria das Probabilidades e
da construção de um corpo teórico coerente surgem os três axiomas em que se baseiam todos
os desenvolvimentos posteriores deste campo das matemáticas. Assim, consideramos que P
(.) é uma função que associa a todos o acontecimento A definido em Ω um número
compreendido no intervalo [0, 1] e que satisfaz os seguintes axiomas:
Axiomas:
1) P [A] ≥ 0 A  Ω
2) P [Ω] =1 (Ω é o acontecimento certo)
3) Sendo A e B acontecimentos mutuamente exclusivos definidos em “Ω”, ou seja A 
B = Ø, tem-se que: P [A  B] = P [A] + P [B]

1.3.4 PROBABILIDADE CONDICIONAL


A partir do momento em que se conhece a probabilidade de o acontecimento B (do espaço
de resultados Ω ocorrer, é possível calcular a probabilidade de qualquer outro acontecimento
A se realizar condicionado pelo acontecimento B. Por definição esta probabilidade é dada
por:
P[ A  B]
P [A | B] = se P [B]> 0
P[ B]
Isto é, a probabilidade de um acontecimento (A) condicionado pela ocorrência de outro (B)
é igual ao quociente entre a probabilidade de ambos se realizarem (A  B) e a probabilidade
do acontecimento dado.
Exemplo (1): Um jogador da lotaria compra três bilhetes para a extracção do Natal com os
números 01011, 15555 e 22444, realizando-se o sorteio entre um total de 40000 números, de
00000 a 39999. O acontecimento. A: o jogador obtém o primeiro prémio comporta três
resultados favoráveis: A = {01011, 15555, 22444} num total de 40000 resultados possíveis
Ω = {00000, 00001, …, 39999}.

INSTITUTO SUPERIOR MONITOR


16
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Aplicando o conceito clássico de probabilidade facilmente se obtém a probabilidade de o


3
jogador obter o primeiro prémio: P [A] =
40000
Admita-se agora que, no dia da extracção, o jogador soube acidentalmente que o número
premiado em primeiro lugar era um número par, embora não tivesse ainda conhecimento do
número premiado. Qual será agora a probabilidade do jogador obter o primeiro prémio
considerando a informação adicional de que, entretanto, tomou conhecimento? Isto é, qual a
probabilidade de o jogador obter o primeiro prémio dado que o número premiado é par?
O número de resultados favoráveis é agora apenas de 1, uma vez que o jogador apenas possui
um bilhete com número par, enquanto os resultados possíveis passaram a ser de 20000 (o
1
total de números pares nos 40000): P [A | B] =
20000
Sendo B: o primeiro prémio saiu a um número par.
A probabilidade anterior não representa a probabilidade absoluta ou total de A se realizar
(igual a 3/40000 como se viu anteriormente), mas a probabilidade de A condicionada pela
ocorrência de B, ou probabilidade de A dado B.
O facto de ser dado B opera uma redução no espaço de resultados, que passa de “Ω”,
constituído por 40000 resultados possíveis, para o próprio B, formado por apenas 20000
1
resultados. A probabilidade de A será então P[ A B] = , dividindo ambos os termos da
20000
1
fracção por 40000 obtém-se P[ A B] = 40000 ficando:
20000
40000
i) No denominador o número de resultados favoráveis a B sobre o número total
de resultados possíveis, isto é, a probabilidade de B;
ii) No numerador o quociente entre o número de resultados favoráveis á
ocorrência de A e B em simultâneo (A  B) e o número total de resultados
possíveis, ou seja, P [A  B].

Concluindo, a probabilidade de A dado B é igual:


1
PA  B 40000
PA B =
1
= =
PB 20000 20000
40000

INSTITUTO SUPERIOR MONITOR


17
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Exemplo (2): Uma certa Universidade colectou a seguinte informação sobre os seus estudantes:

Curso Homens Mulheres Total

Contabilidade 120 80 200

Finanças 110 70 180

Marketing 70 50 120

Administração 110 100 210

Estatística 50 10 60

Computação 140 90 230

Total 600 400 1000

Suponha que um estudante desta Universidade é seleccionado ao acaso, qual é a probabilidade de


que o (a) estudante seja mulher e que esteja frequentando o curso de Contabilidade?

Considere os seguintes eventos.

A = “o (a) estudante está cursando em Contabilidade”

F = “o (a) estudante é mulher”

Usando a informação apresentada na tabela acima, teremos:

400
P(F ) = = 0.4
1000
200
P ( A) = = 0.2
1000
80
P(A F ) = = 0.08
1000
Portanto, a probabilidade de que o (a) estudante seja mulher e que esteja frequentando o curso de
Contabilidade é de 0.08. Agora, a Universidade pretende saber a probabilidade de que o (a)
estudante esteja a frequentar o curso de Contabilidade dado que o (a) estudante é mulher, ou seja,
P( A| F ) .

Usando a regra de multiplicação, teremos:

P(A F ) 0.08
P(A| F ) = = = 0.20
P(F ) 0.4

INSTITUTO SUPERIOR MONITOR


18
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

1.3.5. Acontecimentos Independentes


Relacionando com o conceito de probabilidade condicionada está o conceito de
acontecimentos independentes. Assim, para dois acontecimentos A e B suceder que a
ocorrência ou não de algum deles não afecta a probabilidade de ocorrer o outro, isto é, se
PA B = PA ou se PB A = PB então A e B consideram-se acontecimentos
independentes.
De modo equivalente, podemos dizer que A e B são independentes se e só se a seguinte
condição for verificada: PA  B = PA.PB, isto é, se a probabilidade da sua intersecção
for igual ao produto das probabilidades de cada um deles.
Exemplo:
Seja a experiência aleatória que consiste no lançamento de dois dados regulares e
distinguíveis, cujo espaço de resultados é o conjunto
Ω ={ (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),
(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6). }
E os acontecimentos
A – a soma dos pontos dos 2 dados é par
B – a soma dos pontos dos 2 dados é múltipla de 3
C – a soma dos pontos dos 2 dados é maior que 9

e P A  B  C  =
18 12 6 1
Com probabilidades P[ A] = , P[ B ] = , P[C ] = .
36 36 36 36
Como se pode verificar PA  B  C = PA.PB..PC . No entanto, apenas os
acontecimentos A e B são independentes, sendo A e C, e B e C dependentes entre si, pois:
PA  B = PA.P[ B]; P[ A  C]  P[ A].P[C]; P[ B  C]  P[ B].P[C]
Em experiência aleatória ligadas a jogos de azar é, em geral, fácil verificar a existência ou
não de independência dos acontecimentos. Noutros casos, porém, só depois do exame
rigoroso de todas as condições se poderá concluir acerca da independência dos
acontecimentos.

INSTITUTO SUPERIOR MONITOR


19
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

1.3.6. Acontecimentos Independentes e Mutuamente Exclusivos


Sejam A e B dois acontecimentos tais que P[ A]  0 e P[ B ]  0
No caso dos acontecimentos serem incompatíveis (mutuamente exclusivos) tem-se, por
definição, ( A  B) = Ø e, consequentemente, P[ A  B ] = 0. Os acontecimentos não podem
ser independentes pois, para tal, e por definição de independência, seria
P[ A  B ] = P[ A]. P[ B ]  0 , pois ambos os acontecimentos têm probabilidades não nulas.
No caso dos acontecimentos serem independentes não podem ser mutuamente exclusivos,
pois se são independentes então, P[ A  B ] = P[ A]. P[ B ] é maior que zero.
Para serem simultameamente mutuamente exclusivos esta probabilidade teria de ser nula,
facto impossível a não ser que algum dos acontecimentos tivesse probabilidade nula, o que
não é o caso.
Assim, em geral, dois acontecimentos não podem ser simultaneamente independentes e
mutuamente exclusivos. Existe, no entanto, um caso particular em que tal pode ocorrer: é o
caso em que um dos acontecimentos é impossível, porque este é sempre independente e
mutuamente exclusivo de todo e qualquer outro acontecimento possível.
Exemplo: Na administração dos testes da disciplina Introdução às Ciências Sociais, durante um
período de dois anos, a actuação dos estudantes na realização dos testes obedeceu aos seguintes
resultados:

Realização do Testes – I.C.S Frequência

Antes da hora prevista 100

Na hora prevista 800

Atrasada 75

Cancelado 25
Total 1000

Considere os seguintes eventos.


A = “Entrega do teste antes da hora prevista”;
B = “entrega em atraso”.
Usando das frequências apresentadas na tabela acima, a probabilidade de cada evento será dada por:
100
P ( A) = = 0.1
1000
75
P ( B) = = 0.075
1000
Você deve notar que os eventos A e B são mutuamente exclusivos. Porquê?

INSTITUTO SUPERIOR MONITOR


20
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

O ISM está interessado em saber a probabilidade de entrega do teste antes da hora prevista ou
atrasado? Usando as probabilidades de cada evento acima apresentado e o facto de que estes
eventos serem mutuamente exclusivos, teremos:

P ( A  B ) = P ( A) + P ( B ) = 0.1 + 0.075 = 0.175

1.3.7. Fórmula de Bayes


O conceito de probabilidade condicionada revela-se muito importante e de larga utilização
quando se conhecem probabilidades condicionadas nas quais os acontecimentos
condicionantes definem uma partição em Ω.
Se A1, A2,..., An definem uma partição sobre Ω, então, para B definido em Ω:

P[ Aj ]  P[ B Aj ]
P[ Aj B] = n
, Para j= 1,2,...,n.
 P[ A ]  P[ B A ]
i =1
i i

P[ A j  B] P[ Aj ]  P[ B Aj ]
Demonstração: P[ Aj B] = = n

 P[ A ]  P[ B A ]
P[ B]
i i
i =1

Por definição de probabilidade de intersecção de dois acontecimentos (no numerador) e pelo


teorema da probabilidade total (dominador).
Exemplo (1): A tabela abaixo mostra as probabilidades de homens (M) e mulheres (F) sendo
empregados (E) ou desempregados (U) em alguma população (exclui aqueles que não desejam ser
empregado).

Homens (M) Mulheres (F) Total

Empregados 0.52 0.41 0.93

Desempregados 0.05 0.02 0.07

Total 0.57 0.43 1.00

Ache as seguintes probabilidades:

(a) A probabilidade condicional de emprego dado que a pessoa é masculina P ( E | M )

(b) A probabilidade condicional de ser masculino dado que a pessoa é empregada P ( M | E ) .

Usando os dados da tabela apresentadas acima temos:

INSTITUTO SUPERIOR MONITOR


21
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

P(E  M ) 0.52
P(E | M ) = = = 0.91
P(M ) 0.57

P(M  E)
P(M | E) =
P(E)
P (E | M ) P (M ) 0.52
= = = 0.56
P (E | M ) P (M ) + P (E | F ) P (F ) 0.93

Exemplo (2): Uma fábrica de cachimbo utiliza 3 máquinas de acabamento com volume
diário de produção respectivamente, de 500,1000 e 2000 unidades. De acordo com a
experiência anterior sabe-se que a percentagem de cachimbos defeituosos originados por
cada máquina é, respectivamente, de 0,005; 0,008 e 0,01. Sabendo que um cachimbo foi
encontrado defeituoso pretende apurar-se qual a máquina que, com maior probabilidade de o
ter gerado.
Para resolver o problema devemos em primeiro lugar definir todos os acontecimentos
A1- Um cachimbo escolhido por acaso da produção diária foi produzido pela máquina 1
A2- Um cachimbo escolhido por acaso da produção diária foi produzido pela máquina 2
A3- Um cachimbo escolhido por acaso da produção diária foi produzido pela máquina 3
B - Um cachimbo escolhido por acaso da produção diária é defeituoso
Pretendemos calcular as P[ Ai B] (i= 1,2,3) e ordena-las por ordem decrescente.

A1, A2, A3 definem uma partição em Ω visto que


3
i) Apenas as máquinas 1,2 e 3 produzem cachimbos, isto é, A i =1
i =

ii) Um cachimbo que é produzido numa máquina não é produzido noutra, Ai  Aj = Ø,


i # j; i, j= 1,2,3.
iii) Qualquer uma das máquinas produz cachimbos, P [Aj]> 0, i = 1,2,3.
As informações fornecidas no enunciado vão permitir utilizar a fórmula Bayes, para o cálculo
das probabilidades pretendidas.
Sabe-se pelo enunciado que a probabilidade de cada cachimbo ter sido produzido por cada
uma das máquinas é:
500 1 1000 2 2000 4
P [A1] = = ; P [A2] = = e P [A3] = =
3500 7 3500 7 3500 7
Conhecem-se também as probabilidades de um cachimbo ser defeituoso, dado que foi
produzido numa determinada máquina:
P[ B A1 ] = 0,005; P[ B A2 ] = 0,008 e P[ B A3 ] = 0,010

INSTITUTO SUPERIOR MONITOR


22
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Construindo um quadro:
AI P[ AI ] P[ B / A] P[ Ai ]. P[ B / A] P[ Ai / B]

A1 17 0,005 0,0007 0,08


A2 27 0,008 0,0023 0,26
A3 47 0,010 0,0057 0,66

 1 P[ B ] = 0,0087 1

Nota-se que P [B] foi calculada recorrendo ao teorema da probabilidade total.


Do quadro anterior retira-se a probabilidade de um cachimbo ter sido produzido pela máquina
3, sabendo que é defeituoso, é de 0,66; a mesma probabilidade para máquina 2 é de 0,26 e
para máquina 1 de 0,08.
Com base nestes resultados, a ordem de inspecção das máquinas deverá ser:
Em 10 lugar a máquina 3, Em 20 lugar a máquina 2, Em 30 lugar a máquina 1.

EXERCÍCIOS PROPOSTOS
1. Suponha que: P [A] = 0,4; P [B] = 0,3; P [C] = 0,7; P [Ā  B] = 0,1; P [A  B  C ] =
0,1. Calcule P [A  B A ]. R: 0,5

2. Considere os seguintes acontecimentos definidos em: “Ω”: A1, A2, e B em que P[ A1 B]


1 2
= e P[ A2 B] = . Comente as seguintes afirmações:
4 3
a) “A1 e A2 são acontecimentos mutuamente exclusivos”
b) “A1 e B são acontecimentos mutuamente exclusivos”
R: a) Nada se pode concluir com a informação disponível;
b) A1 e B não podem ser mutuamente exclusivos, logo a afirmação é falsa.

3. Três caçadores atiram a um pato de forma independente sendo de ½, ⅓ e ¼


respectivamente a probabilidade de acertar o alvo. Qual a probabilidade de que:
a) O pato seja atingido?
b) O pato seja atingido por pelo menos 2 caçadores?
3 7
R: a) ; b) .
4 24
4. Dos três fornecedores de certo produto para uma loja (em partes de 3%, 50% e 20%
respectivamente), todos fornecem produtos com deficiência, sendo a percentagem de
produtos defeituoso sobre o total fornecido por cada um deles de 7%, 5% e 4%
respectivamente.

a) Tendo comprado um produto nessa loja e verificado que apresentava deficiência, qual
o seu fornecedor mais provável?

INSTITUTO SUPERIOR MONITOR


23
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

b) Qual a probabilidade de um determinado produto escolhido ao acaso ter vindo do 10


fornecedor e apresentar deficiência?
R: a) O 20 fornecedor; b) 0,021.

5. As famílias da cidade A escolhem uma das três alternativas para fazer férias: praia, campo
ou ficar em casa. Durante a última década, verificou-se que escolhiam aquelas
alternativas respectivamente 50%, 30% e 20% das famílias da referida cidade. A
probabilidade de descansar durante as férias está ligada á alternativa escolhida: 0,4; 0,6 e
0,5 conforme se tenha ido a praia, para o campo ou ficado em casa.

a) Qual a probabilidade de uma família da cidade A descansar durante as férias?


b) Sabendo que determinada família descansou durante as férias, qual a alternativa, mas
provável de ter sido escolhido por esta família?
R: a) 0,48; b) a alternativa, mas provável é na praia.
6. Considere duas caixas A e B. A caixa A tem duas bolas verdes e uma branca e a B tem
duas bolas verdes e duas brancas. Uma destas caixas é seleccionada ao acaso. Duas bolas
foram retiradas também aleatoriamente e verificou-se que a primeira era branca e a
segunda também, tendo-se reposto a primeira bola depois de se verificar a sua cor.
4
Calcule a probabilidade de ter sido seleccionada a caixa A. R: .
13
7. A empresa Ómega produz bens de equipamento. A sua produção destina-se a dois
mercados externos: Estados Unidos da América (25%) e França (15%). A restante
produção é vendida internamente. Estudos efectuados permitiram concluir que 20% dos
bens produzidos para França sofrem de pequenas anomalias, enquanto 30% dos bens com
anomalias se destina ao mercado norte-americano. Sabe-se ainda que a percentagem de
bens com anomalias destinada ao mercado interno é metade da que se destina ao mercado
norte-americano.
a) A empresa confortada com esta situação defende que o máximo só 4% da sua
produção apresenta anomalias. Comente esta afirmação.
b) Se constatar que determinado bem apresenta anomalias, qual a probabilidade de
ser consumido internamente?
R: a) Incorrecta (é de 5,45%); b) 0,15
8. Numa sala de reuniões temos 4 gestores, cada um deles identificado com o nome
colocado num dístico sobre a mesa. À hora de almoço a empregada da limpeza abriu
inadvertidamente uma janela fazendo voar os dísticos, que se misturaram com mais
outros seis que se encontravam noutra mesa com nomes diferentes.
a) Qual a probabilidade de a empregada acertar nos nomes dos quatro gestores
quando voltar a colocar os dísticos em cima da mesa?

INSTITUTO SUPERIOR MONITOR


24
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

b) Sabendo que a empregada acertou nos quatro nomes, qual a probabilidade de os


colocar nos lugares certos?
R: a) 24/5040; b) 1/24

9. Um estudante efectuou um teste de resposta múltipla. Para as questões colocadas no teste,


o estudante ou conhece a resposta e nesse caso dá a resposta correcta ou não conhece a
resposta e nesse caso tenta adivinhar na esperança de acertar na resposta certa. Considere
ainda que existem 5 alternativas de resposta que são igualmente plausíveis. Coloque-se
no lugar do professor. Sabendo que o estudante acertou na resposta correcta, qual a
probabilidade de que o estudante conhecesse de facto a resposta certa?
p
R:
4 1
p+
5 5
10. O mercado de serviço telemóvel está dividido entre duas empresas, CELUM e CELDOIS,
com quotas, respectivamente, de 60% e 40%. O organismo regulador encomendou um
estudo de opinião do mercado do qual conclui que:
 70% Dos utilizadores de serviço telemóvel estão satisfeitos,
 Dos clientes de CELUM, 80% estão satisfeitos.
a) Qual a percentagem de clientes de CELDOIS que estão satisfeitos?
b) Qual a divisão do mercado, dentro dos clientes satisfeitos?
c) Qual a probabilidade de encontrar um cliente que tenha contrato com a CELUM
e se sinta insatisfeito?
R: a) 55%; b)68,57% e 31,43%; c)0,12

INSTITUTO SUPERIOR MONITOR


25
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

QUADRO SINÓPTICO

Conceitos da teoria de probabilidades Fenómeno ou experiência aleatória,


espaço de resultados e evento ou
acontecimento.
É aquela cujo resultado da mesma é
a) Experiência aleatória influenciado pelo acaso, sendo assim,
não se pode dizer à partida qual o
resultado da experiência a realizar.
É o conjunto que descreve todos os
b) Espaço de resultados resultados possíveis da experiência
aleatória. A qualquer subconjunto do
espaço de resultados recebe o nome de
acontecimento ou evento.
Conceitos de probabilidades Clássica, empírica e subjectiva) que se
distinguem pela definição e o método de
cálculo.
Probabilidade condicional São aquelas que têm como suporte o
conhecimento da probabilidade de
ocorrência de um ponto do espaço de
resultados e, os acontecimentos
independentes e mutuamente exclusivos

INSTITUTO SUPERIOR MONITOR


26
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

CAPÍTULO II – TESTE DE HIPÓTESES


OBJECTIVOS ESPECÍFICOS DO CAPÍTULO
Findo este capítulo o estudante será capaz de:
1. Definir hipóteses e Testes de Hipóteses;
2. Descrever os passos do procedimento de Teste de Hipóteses;
3. Distinguir entre Teste de Hipóteses Unilateral e Bilateral;
4. Realizar um teste para a média e proporção populacionais;
5. Descrever os erros estatísticos associados aos testes de hipóteses.

2.1. INTRODUÇÃO AO CAPÍTULO


Nas ciências do comportamento, efectua-se levantamento a fim de determinar o grau de
aceitação de hipótese baseados em teorias do comportamento. Formulada uma determinada
hipótese particular é necessário colectar dados empíricos e com base nestes dados decide-se
então sobre a validade ou não da hipótese. A decisão sobre a hipótese pode levar a rejeição,
revisão ou aceitação da teoria que a originou.
Para se chegar a conclusão que uma determinada hipótese deverá ser aceite ou rejeitada,
baseando-se em um conjunto particular de dados, é necessário dispor de um processo
objectivo que permita decidir sobre a veracidade ou falsidade de tal hipótese. A objectividade
deste processo deve ser baseada na informação proporcionada pelos dados, e como estes
dados, em geral, envolvem apenas parte da população que se pretende atingir, no risco que
se está disposto a correr de que a decisão tomada não esteja correcta.
Em estatística, uma hipótese é uma alegação, ou afirmação, sobre uma característica de uma
população. “Uma suposição que se faz de uma coisa possível ou impossível e da qual se tira
uma consequência”. Sendo, portanto, em investigação uma resposta suposta provável e
provisória a um problema, “um enunciado geral de relações entre variáveis”. Lacatos e
Marconi (1995).
De acordo com Sousa (1975) as Características da Hipótese Para se revestir de valor
operacional, uma hipótese deverá possuir as seguintes características a apresentar como
solução provisória para um problema levantado, uma vez que é uma resposta alternativa a
ser considerada segundo o seu grau de probabilidade;
1- Definir uma relação esperada entre duas ou mais variáveis, isto é definir quais as
soluções que se esperam referentes a relação ou diferentes relações ou diferenças
entre variáveis a analisar;

2- Basear-se em fundamentos teóricos ou empíricos a revelar constância lógica.


A hipótese deverá possuir coerência externa, isto é, estar em concordância com os estudos
teóricos ou conhecimentos empíricos existentes no campo do assunto que se estuda e

INSTITUTO SUPERIOR MONITOR


27
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

constância lógica, ou seja, definir a relação lógica existente entre os seus pressupostos e
consequências.
Formulação de hipótese
As hipóteses poderão ser formuladas de vários modos, mas o mais aconselhável é a que
articula entre si variáveis que intervém na resolução do problema. O seu modo mais geral de
formulação é sob forma de afirmação dedutiva e positiva que se procura depois com a
investigação verificar se é ou não válida.
Exemplos:
• A classe social da mãe influencia no tempo de amamentação do filho;
• O reforço do professor tem como efeito a melhoria do desempenho do estudante;
• Adolescentes, filhos de pais ou mães viúvas ou divorciados passam a ter auto-estima
menor quando os seus pais se casam novamente;
• Os católicos tendem a ser menos favoráveis ao divórcio do que os protestantes;
• Pesquisadores médicos afirmam que a temperatura média do corpo humano não é
igual a 37 ºC;
• Um novo fertilizante utilizado no cultivo de hortaliças aumenta a produtividade.
A dificuldade nestes casos (e daí a necessidade de métodos estatísticos) é que a característica
de interesse varia em cada amostra. A temperatura média do corpo humano varia de pessoa
para pessoa. Ora, a produtividade vária de solo para solo. Os testes de hipóteses através da
amostra permitem analisar e distinguir entre resultados que podem ocorrer facilmente e os
que dificilmente ocorrem.
A lógica de um Teste de Hipótese
Decisão a ser tomada
População
Valor hipotético do Não rejeitar a hipótese
parâmetro; 455 Diferença Pequena
Questão a ser feita

Qual é a magnitude da
diferença entre o valor
observado da estatística e o
valor hipotético do parâmetro?

Amostra Rejeitar a hipótese


Valor observado da Diferença Grande
estatística: 435

INSTITUTO SUPERIOR MONITOR


28
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

2.1. HIPÓTESE NULA E ALTERNATIVA


A hipótese nula é o que o seu nome sugere: na sua articulação anula o que se pressupõe
suceder. Define o contrário do que se espera afirmando que há igualdade quando se espera
que há diferença por exemplo. Sousa (2005).
A hipótese nula é importante na medida em que facilita o tratamento estatístico tornando-se
mais claro os procedimentos e evidentes resultados.
Existem duas hipóteses envolvidas em qualquer estudo deste tipo:
• A hipótese alternativa H 1 , que é, em geral, a hipótese proposto pelo
investigador;

• A hipótese nula H 0 , negação da hipótese anterior.

Exemplo s:
1. Para decidir se a lâmpada do tipo A é melhor que a lâmpada do tipo B levantam-se
as seguintes hipóteses:
H 0 (hipótese nula): não há diferença entre os dois tipos de lâmpadas;

H 1 (hipótese alternativa): A lâmpada do tipo A é melhor que a lâmpada do tipo B.


2.Para decidir se o novo processo de fabrico é melhor do que o anterior, o gestor de
produção da fábrica formula as seguintes hipóteses:
H 0 (hipótese nula): não há diferença entre os dois processos de fabrico;

H 1 (hipótese alternativa): o novo processo de fabrico é melhor do que o anterior.


3. Suponha que é feita uma auditoria à empresa do Sr. Zé das tintas, a qual resulta numa
acusação de infracção fiscal. Obviamente, se o fiscal das finanças não conseguir juntar provas
que sustentem a acusação, a empresa não é considerada culpada. As hipóteses são as
seguintes:
H 0 (hipótese nula): a empresa não cometeu uma infracção fiscal;

H 1 (hipótese alternativa): a empresa cometeu uma infracção fiscal.


Nesta situação podem ser tomadas duas decisões:

• Rejeitar a hipótese H 0 - a empresa é considerada culpada, isto é, aceita-se a


hipótese H 1 como sendo verdadeira;

• Não rejeitar H 0 - não se conseguiu provar a veracidade de H 1 e como tal, não se


pode rejeitar a hipótese H 0 , significa tão só, que não há provas (não há evidência)

INSTITUTO SUPERIOR MONITOR


29
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

para rejeitar esta hipótese. Por isso é preferível dizer “não rejeitar H 0 ” a dizer “a
aceitar H 0 ”.

Repare que ao testarmos uma hipótese nula chegamos a uma conclusão de rejeitá-la ou não
rejeitá-la. Entretanto devemos lembrar que tais conclusões ora são correctas, ora são
incorrectas, mesmo quando fazemos tudo correctamente. O risco que se corre de tomar uma
decisão errada é exactamente o preço a ser pago por estar trabalhando em uma situação onde
a variabilidade é inerente.

2.2. TIPOS DE ERRO E NÍVEL DE SIGNIFICÂNCIA


O investigador, ao tomar uma decisão de rejeitar ou não rejeitar a hipótese nula, ele está
sujeito a cometer dois tipos de erros, nomeadamente: Erro Tipo I e Erro Tipo II.
Relativamente ao exemplo anterior sobre a acusação de existência duma infracção fiscal na
empresa do Sr. Zé das tintas, há duas possibilidades de se tomar uma decisão errada:
• A empresa é considerada culpada quando de facto não cometeu nenhuma infracção
fiscal: Rejeitar H 0 sendo H 0 verdadeira;

• Não se rejeitar a hipótese de a empresa ser inocente, quando de facto esta cometeu
uma infracção fiscal: Não rejeitar H 0 sendo H 0 falsa.

2.2.1. Definição
Os dois tipos de erro que podem ser cometidas são os seguintes:
Erro tipo I: rejeitar H 0 sendo H 0 verdadeira (erro de rejeição);

Erro tipo II: não rejeitar H 0 sendo H 0 falsa (erro de não rejeição)
A ocorrência de cada tipo de erro está associada a uma probabilidade. A probabilidade de se
cometer o erro do tipo I é geralmente designada nível de significância alfa ( ) , isto é,  e
a probabilidade de se rejeitar a hipótese nula sendo ela verdadeira. Por outro lado, a
probabilidades de se cometer o erro tipo II, é normalmente designado por beta (  ) , isto é,
 é a probabilidade de não se rejeitar H 0 sendo H 0 falsa. A diferença 1 −  é chamada a
potência de teste, ou seja, a proporção da confiança que se tem ao se rejeitar a hipótese nula.

INSTITUTO SUPERIOR MONITOR


30
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Veja a tabela abaixo:

A hipótese nula é A hipótese nula é


verdadeira falsa

Erro tipo I
Rejeitar a hipótese (rejeição de uma
Decisão correcta
nula hipótese nula
verdadeira)
Decisão

Erro tipo II (Não


Não rejeitamos a rejeição de uma
Decisão correcta
hipótese nula hipótese nula
falsa)

2.2.2. Procedimento de Teste de Hipótese


Uma vez recolhida uma amostra, observamos o valor de alguma estatística (função da
amostra aleatória) cuja distribuição de probabilidade é conhecida sob o pressuposto de H 0
ser verdadeira. Tal estatística é chamada estatística de teste.
O valor de ( ) - nível de significância de teste e a distribuição de probabilidade da estatística
do teste são utilizados para definir a chamada região ou região de rejeição. Se o valor
observado da estatística do teste “cair” na região crítica, decidimos rejeitar H 0 ; Caso
contrário decidimos não rejeitar H 0 .
Em resumo, o processo geral consiste no seguinte:
1. Formar a hipótese nula ( H 0 ) e a hipótese alternativa ( H 1 ) ;

2. Especificar o nível de significância;


3. Escolher a estatística a usar e encontrar a sua distribuição de probabilidades sob o
pressuposto de H 0 ser verdadeira;

4. Determinar a região de rejeição;


5. Calcular o valor observado da estatística do teste;

6. Decidir rejeitar H 0 ou não rejeitar H 0 .

INSTITUTO SUPERIOR MONITOR


31
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Exemplo:
O director comercial de uma cadeia de lojas pretende comparar duas técnicas de vendas, A e
B, para o mesmo produto. Utilizando a técnica de vendas A a quantidade de produto vendido
por dia é em média de 816 Kg com um desvio padrão de 45 Kg. Adoptando a nova técnica
de vendas de B espera-se aumentar a quantidade de vendas diárias.
Para testar tal hipótese registou-se a quantidade diária de vendas do produto durante 50 dias,
obtendo-se um valor médio de 839. Pode aceitar-se a hipótese a um nível de significância de
0,01?
Seja x = “quantidade de produto vendida num dia com a técnica de vendas B”.
Hipóteses estatísticas
H 0 :  = 816 Kg (Não há alteração na quantidade média de vendas);

H1 :   816 Kg (A quantidade média diária de vendas aumenta).

 2  x−
Pelo Teorema do Limite Central x ~ N   ;   Z =
1
~ N (0; 1) . Sob o
 n  45
50
pressuposto de H 0 ser verdadeira,  = 816 Kg , logo a estatística do teste é
 45 2  x − 816

x ~ N  816,  ou Z = ~ N (0, 1) .
 50  45
50
Região Crítica
Para que valores da estatística do teste será de rejeitar a hipótese nula?
Quanto maior for o valor da média amostral (x ) , relativamente a 816, mais credível se torna
a hipótese H 1 e consequentemente, mais a decisão se encaminha no sentido de rejeitar H 0 .
Então, fixando um ponto xc superior a 816, a regra de decisão será: rejeitar H 0 se x  xc ,
caso contrário, não rejeitar H 0 . xc . Dá-se o nome de ponto crítico.

A região crítica (região de rejeição da hipótese nula) é então: xc ; + 

1 Amostras com uma dimensão suficientemente grande (n > 30) tendem a distribuir-se normalmente.

INSTITUTO SUPERIOR MONITOR


32
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

0.4

0.3

Região de
0.2
rejeição
Região de
0.1
não rejeição

0.0
0

xc
Sendo a hipótese H 0 verdadeira, a probabilidade de a estatística de teste assumir valores na
região de rejeição é pequena. Estes valores são mais plausíveis se a hipótese H 1 for
verdadeira. Fixamos o nível de significância em 0,01.
Isto significa que ao rejeitarmos a hipótese H 0 podemos estar a cometer um erro tipo com
probabilidade de 0,01. Por outra palavras, a chance de rejeitarmos a hipótese
H 0 :  = 816 Kg quando de facto  = 816 , é quantificada em 1%.
Vamos calcular o ponto crítico xc associado a este nível de significância.

 = 0,01 = P( Erro tipo I ) = P(rejeitar H 0 | H 0 é verdadeira)


= P( x  xc |  = 816) =·área da região sombreada.

 
 x − 816 xc − 816 
P( x  xc |  = 816) = 0.01  P   = 0.01 
 45 45 
 50 50 
   
 xc − 816   xc − 816 
P Z   = 0.01  P Z  45  = 0.99 
 45   
 50   50 
xc − 816
= 2.326  xc = 830.8
45
50

Ponto crítico: xc = 830.8 Região crítica: 830.8; + 


Decisão
Como na amostra foi observada uma média amostral x = 839 Kg , que cai dentro da região
crítica ( x = 839  830.8) , então a decisão é a de rejeitar H 0 . Concluímos que há evidências
de que a nova técnica de vendas B conduz a um aumento das vendas médias diárias, ao nível

INSTITUTO SUPERIOR MONITOR


33
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

de significância de 1%. Neste caso, diz-se que a média observada na amostra é


significativamente maior que 816.
Exemplo:
Suponha que a média amostral observada nos 50 dias é de 819 Kg. Para o mesmo nível se
significância do exemplo anterior, qual seria agora a decisão a tomar?
Não podemos concluir que a nova técnica de vendas B aumenta as vendas médias diárias. A
média observada na amostra não é significativamente maior que 816.
2.2.3. Testes Bilaterais e Unilaterais
Sem perda de generalidade vamos considerar que o parâmetro em teste é a média de uma
população,  . As hipóteses podem cair numa das seguintes situações gerais:
Teste Unilateral à Direita.

0.4

0.3

H 0 :   0
H1 :   0 0.2

0.1

0.0
0

Teste Unilateral à Esquerda

0.4

0.3

H 0 :   0
H1 :   0 0.2

0.1

0.0
0

Teste Bilateral

0.4

0.3

H 0 :  = 0
0.2 
H1 :   0 

0.1
2 2
INSTITUTO SUPERIOR MONITOR
34
WWW.ISMONITOR.AC.MZ 0.0 0
Estatística Aplicada a Psicologia

2.3. TESTE DE HIPÓTESE PARA A MÉDIA


A construção da estatística da amostra depende do parâmetro que está sendo testado, se for a
média populacional, a estatística estará baseada na distribuição da média amostral, se for a
proporção populacional, a estatística usará a proporção amostral e assim por diante.
Suponha que X é uma variável aleatória com média  desconhecida e variância conhecida.
E queremos testar a hipótese de que a média é igual a um certo valor especificado 0. O teste
de hipótese pode ser formulado como segue:
H o :  = 0
H1 :    0

Para testar a hipótese, toma-se uma amostra aleatória de n observações e se calcula a


estatística.
X − o
Zo = Se o desvio padrão populacional é conhecido.
/ n
X − o
Zo = , Se o desvio padrão não é conhecido, mas n é maior que trinta.
s/ n
X − o
to = , Se o desvio padrão não é conhecido e n é menor que trinta.
s/ n

Note que o teste é feito usando-se  / n no denominador, uma vez que esse é o desvio
padrão da média.
A hipótese H 0 é rejeitada se Z0  Z /2 , onde Z /2 é um valor limite da distribuição normal
reduzida tal que a probabilidade de se obter valores externos a  Z /2 é “”.
Exemplo:
A resistência à tracção do aço inoxidável produzido numa usina permanecia estável, com
uma resistência média de 72 kg/mm2 e um desvio padrão de 2,0 kg/mm2. Recentemente, a
máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas.
76,2 78,3 76,4 74,7 72,6 78,4 75,7 70,2 73,3 74,2
Presuma que o desvio padrão seja o mesmo que antes do ajuste. Podemos concluir que o
ajuste mudou a resistência à tracção de aço? (Adopte um nível de significância de 5%)
Definição da Hipótese
H 0 :  = 72 kg / mm 2
H 1 :  = 72 kg / mm 2

INSTITUTO SUPERIOR MONITOR


35
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Estatística do Teste
Sendo x = 75,0 = 75,0 e s = 2 kg / mm2 , temos:
X − o 75 − 72 3
Z cal = = = = 4, 74
 n 2 10 0, 6325
Isso significa que a média da amostra retirada aleatoriamente da produção está a 4,74 desvios
padrão da média alegada em H 0 que é 72.
Região Crítica

Distribution Plot
Normal, Mean=0, StDev=1

0.4

0.3
Density

0.2

0.1

0.025 0.025
0.0
-1.96 0 1.96
X

Regra de Decisão
Como o valor crítico para 5% é 1,96 desvios (Z tabelado), estamos na região de rejeição de
H0 .
Conclusão
H 0 é rejeitada e concluímos que a resistência à tracção do aço mudou.
Exemplo.
Um processo deveria produzir bancadas com 0,85 m de altura. O engenheiro desconfia que
as bancadas que estão sendo produzidas são diferentes que o especificado. Uma amostra de
8 valores foi colectada e indicou X = 0,87 . Sabendo que o desvio padrão é  = 0, 010 , teste
a hipótese do engenheiro usando um nível de significância =0,05.

INSTITUTO SUPERIOR MONITOR


36
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

H o :  = 0,85
H1 :   0,85

0,87 − 0,85
Zo = = 5, 66
0, 010 / 8
Zo = 5,66  Z0,025 = 1,96  Rejeita-se H 0 .
Exemplo:
Numa determinada avenida, quando é utilizado o radar, são verificadas em média 7
infracções diárias por excesso de velocidade. O chefe de polícia acredita que este número
pode ter aumentado. Para verificar isso, o radar foi mantido por 10 dias consecutivos. Os
resultados foram:
8, 9, 5, 7, 8, 12, 6, 9, 6, 10
Os dados trazem evidência de aumento nas infracções?
Definição da Hipótese
H0 :  = 7
H1 :   7
Estatística do Teste
Temos X = 8 , não conhecendo  , estimamos por S (desvio-padrão da amostra), logo, S =
2,10. O desvio padrão foi estimado a partir de uma pequena amostra deve-se usar a estatística
t - student.
X − o 8 −7 1
tcal = = = =1,5
S n 2,10 10 0, 666
Isso significa que a média da amostra retirada aleatoriamente da produção está a 1,5 desvios-
padrão da média alegada em H 0 que é 7.
Região Crítica
O valor tabelado de t depende do nível de significância (5%) e dos graus de liberdade, que
são função do tamanho da amostra: GL = n – 1 = 9. Nesse exemplo, t crítico = 1,833

INSTITUTO SUPERIOR MONITOR


37
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

0.4

0.3

0.2

0.1

0.0
0

t c = 1.883

Decisão
O valor calculado de t está dentro da região de não rejeição de H 0 .
Conclusão
Como aceitamos H 0 , a conclusão é que e não houve um aumento significativo no número
de infracções. Veja que, apesar de 8 ser maior que 7, a diferença não foi significativa para
concluir que o número de infracções aumentou. É como se não houvesse provas suficientes
para condenar o réu.
Exemplo:
Um empresário desconfia que o tempo médio de espera para atendimento de seus clientes é
superior a 20 minutos. Para testar essa hipótese ele entrevistou 20 pessoas e questionou
quanto tempo demorou para ser atendido. O resultado dessa pesquisa aparece a seguir:

22 20 21 23 22 20 23 22 20 24

21 20 21 24 22 22 23 22 20 24

A que conclusão chegou?


H o :  = 20 min
H1 :   20 min

X = 21,8 min
S = 1, 40 min

X − o 21,8 − 20
to = = = 5,75
S / n 1, 40 / 20
t0 = 5,75  t0,05,19 = 1,729 → Rejeita-se a hipótese nula.

INSTITUTO SUPERIOR MONITOR


38
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Exemplo.
A cadeia de Lojas Arjo emite o seu próprio cartão de crédito. O administrador de crédito quer
verificar se o saldo não pago mensal é maior do que $ 400. O nível de significância é fixado
em 0,05. Uma amostra aleatória de 172 saldos não pagos revelou uma média amostral de $
407 e o desvio padrão amostral de $ 38. O administrador de crédito pode concluir que a média
populacional é maior que $ 400.
Estabeleça a Hipótese Nula e a Hipótese Alternativa.
H 0 :   400
H1 :   400
Estabeleça a regra de decisão.
H 0 é rejeitada se o z (calculado) > 1,645 (ver tabela distribuição normal).
Calcule o valor da estatística de teste.
407 − 400
z= = 2,42
38
172
Qual é a decisão sobre H 0 ?

H 0 é rejeitada. O administrador conclui que a média dos saldos não pagos é maior do que $
400.

2.4. TESTE DE DIFERENÇA ENTRE MÉDIAS


Os exemplos a seguir referem-se aos testes de diferença entre médias para grupos
relacionados ou independentes.
2.4.1. Amostras Relacionadas

Exemplo:
Dez cobaias foram submetidas ao tratamento de engorda com certa ração. Os pesos em
gramas, antes e após o teste são dados a seguir (supõe-se que provenham de distribuições
normais). A 1% de significância, podemos concluir que o uso da ração contribuiu para o
aumento do peso médio dos animais?

Cobaia 1 2 3 4 5 6 7 8 9 10

Antes 635 704 662 560 603 745 698 575 633 669

Depois 640 712 681 558 610 740 707 585 635 682

INSTITUTO SUPERIOR MONITOR


39
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Trata-se de uma situação em que queremos comparar as médias de duas amostras com
distribuições normais, supondo que se trata da mesma população, mas em dois momentos
diferentes: antes e após um tratamento de engorda. Há interesse em verificar se a dieta
contribuiu para o peso médio dos animais: ou seja, queremos verificar se a média de peso
antes do tratamento é menor do que a média de peso após o tratamento (se a dieta fez efeito
os animais estarão em média mais pesados ao final do tratamento). Reparem que é exigido
que se tome uma decisão, o que configura um problema de teste de hipótese.

Iremos então aplicar um teste de diferenças entre médias para amostras relacionadas (mesma
população: antes e depois). O procedimento deste teste é descrito nos passos seguintes:

1º Enunciar as hipóteses

De acordo com o que foi dito acima queremos verificar se a média antes é menor do que a
média depois; o melhor ponto de partida, que servirá para a definição da hipótese H 0 , é que
a dieta não faz efeito, ou seja as médias antes e após o tratamento são iguais (costumamos
colocar em H 0 o contrário do que queremos provar), ou seja a diferença entre as médias deve
ser suposta igual a zero, teremos então:

H 0 : d = 0
Onde: d =  antes −  depois
H 1 : d  0

2º Estabelecer o nível de significância ou nível de confiança.

Conforme foi estabelecido no enunciado do problema:  = 0.01

3º Identificar estatística do teste.

No presente problema temos uma amostra de apenas 10 elementos. Como a amostra tem
menos de 30 elementos vamos utilizar o teste t-Student.

4º Definir a região crítica

Trata-se de um teste unilateral à esquerda (com 1% de significância), e a estatística do teste


é tn-1, então o valor crítico obtido da tabela da distribuição t-Student será:

t n −1; = t10−1;0.01 = −t 9;0.99 = 2.82

Observe a região crítica (sombreada) de H 0 na figura abaixo:

INSTITUTO SUPERIOR MONITOR


40
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

0.4

0.3

0.2

0.1

0.0
0

− 2.82

Para valores maiores de -2,82 não rejeitaremos H 0 . Se tn-1 for menor do que -2,82
rejeitaremos H 0 (a média depois aumentou significativamente em relação à média antes da
dieta para que a diferença seja devida apenas ao acaso. Claro que há uma chance de 1% de
que venhamos a rejeitar H 0 sendo ela verdadeira.

5º Calcular a diferença di entre cada par de valores

Para o conjunto sob análise teremos:

Cobaia 1 2 3 4 5 6 7 8 9 10

Antes 635 704 662 560 603 745 698 575 633 669

Depois 640 712 681 558 610 740 707 585 635 682

di -5 -8 -19 2 -7 5 -9 -10 -2 -13

di2 25 64 361 4 49 25 81 100 4 169

6º Calcular a diferença média e o desvio padrão da diferença média.

d =
d i
=−
66
= −6.6 gramas
n 10

sd =
 d − ( d )
i
2
i
2
/n = 
882 − (−66) 2 / 10 
= 7.04 gramas
n −1 10 − 1

7º Calcular o valor da estatística do teste.

d − 66
t n −1 =  t10−1 = t 9 = = −2,96
(sd / n ) (7.04 / 10 )

INSTITUTO SUPERIOR MONITOR


41
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

8º Decidir pela rejeição ou não de H0.

Conforme foi visto anteriormente, se o valor da variável de teste fosse menor do que -2,82 a
hipótese H 0 seria rejeitada:

− 66
t n−1 = t10−1 = t 9 = = −2,96
(7.04 / 10 )

Assim, rejeitamos H 0 a 1% de significância.

9º Interpretar a decisão dentro do contexto do problema.

Assim, concluímos com 99% de confiança (ou uma chance de erro de 1%) que a dieta
contribuiu para o aumento do peso médio dos animais.

Nota: Devido a complexidade do cálculo envolvido no teste de diferença de médias em


amostras independentes não vamos incluir nesta unidade. No entanto, o estudante deve
proceder uma investigação sobre este tópico.
2.5. TESTE DE HIPÓTESE PARA PROPORÇÃO
O teste para a proporção populacional é normalmente baseado na seguinte suposição: tem-se
uma população e tem-se uma hipótese sobre a proporção p de elementos da população que
possuem uma determinada característica. Esta proporção é supostamente igual a um
determinado valor p0.
O procedimento para fazer um teste de hipótese para a proporção populacional é semelhante
ao descrito anteriormente para o caso da média, e segue os seguintes passos. Vejamos os
passos para a construção do teste para proporção.
1º Estabelecer as hipóteses

A hipótese nula é:
H 0 : P = P0
O problema fornece informações sobre a hipótese alternativa, que pode ser uma das
seguintes:
H1 : P  P0 ou H1 : P  P0 ou H1 : P  P0
Fixar o nível de significância “α”.
2º Determinar a região crítica.
Neste caso, devemos determinar os pontos críticos e usando a tabela da
distribuição Normal.
3º Estatística de Teste

INSTITUTO SUPERIOR MONITOR


42
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

pˆ − p
A estatística teste a ser utilizada é Z =
p (1 − p )
n
4º Tirar conclusões.
Exemplo.
Um fabricante garante que 90% das peças que fornece à linha de produção de uma
determinada fábrica está de acordo com as especificações exigidas. A análise de uma amostra
de 200 peças revelou 25 defeituosas. A um nível de 5%, podemos dizer que é verdadeira a
afirmação do fabricante?
Estabelecemos as hipóteses

2. Fixemos o nível de significância α = 0,05.

3. Como α = 0,05, e .

4. Temos que e, sob a hipótese nula, . Assim,

Distribution Plot
Normal, Mean=0, StDev=1

0.4

0.3
Density

0.2

0.1

0.025 0.025
0.0
-1.96 0 1.96
X

5. Conclusão: como -1,96 < Zobs = -1,178 < 1,96, não rejeitamos H0. Portanto, temos
evidências de que a afirmação do fabricante é verdadeira.

INSTITUTO SUPERIOR MONITOR


43
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Exemplo:
As condições de mortalidade de uma região são tais que a proporção de nascidos que
sobrevivem até 60 anos é de 0,60. Testar esta hipótese ao nível de 5% de significância se em
1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até os 60 anos.
H0: p = 0,60
H1: p  0.6
Considerando, então, um teste bilateral e tendo = 5% tem-se que a região de aceitação é
constituída pelo intervalo RA = [-1,96, 196].
530
pˆ = = 0.53
1000
pˆ − p 0.53 − 0.6
A estatística do teste é: Z = = Z= = −4.52
p (1 − p ) 0.6(1 − 0.6)
n 1000
Como este valor não pertence a região de aceitação, pode-se rejeitar a hipótese nula, ao nível
de 5% de significância, isto é, neste caso, pode-se afirmar que a taxa dos que sobrevivem até
os 60 anos é menor do que 60%.
Exemplo:
Em uma região afectada por um surto epidémico, observou-se uma amostra de 2500
indivíduos, tendo-se encontrado 625 contaminados. Teste, ao nível de significância 5%, se a
proporção de indivíduos contaminados é significativamente diferente a 20%.
H0: p = 0.20
H1: p  0.20
625
pˆ = = 0.25
2500
pˆ − p 0.25 − 0.2
Z= = = 6.25
p (1 − p ) 0.2(1 − 0.2)
n 2500
Como  =0.05 e Z crítico =1.96 <6.25, então, há evidências para rejeitar H0.
Exemplo.
No passado, 15 % das solicitações postais feitas por uma instituição de caridade resultaram
em contribuição financeira. Uma nova carta de solicitação foi redigida. Esta nova carta
elevou a taxa de contribuição? A nova carta é enviada a uma amostra de 200 pessoas e 45
responderam com uma contribuição. Ao nível de significância de 0,05 pode-se concluir que
a nova carta é mais efectiva?
Estabeleça a Hipótese Nula e a Hipótese Alternativa:

INSTITUTO SUPERIOR MONITOR


44
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

H 0 : p  0,15
H1 : p  0,15
Estabeleça a regra de decisão
H0 é rejeitada se o Z (calculado)> 1,645.
Calcule o valor da estatística de teste
45
− 0,15
z= 200 = 2,97
(0,15)(0,85)
200

Dado que o z efectiva = 2,97> z crítico (1,645), H0 é rejeitada. A nova carta é mais efectiva.

EXERCÍCIOS RESOLVIDOS
1. Lance uma moeda e um dado, seja S o espaço amostral constituído dos doze
elementos:
S = {H1, H2, H3, H4, H5, H6, T1, T2, T3, T4, T5, T6}
a) Escreva explicitamente os seguintes eventos: A = {caras e um número par
aparecem}, B = {um número primo aparece}, C = {coroas e um número ímpar
aparecem}.
b) Idem, o evento em que: (a) A ou B ocorrem, (b) B e C ocorrem, (c) somente B
ocorre.
c) Quais dos eventos A, B e C são mutuamente exclusivos?
Resolução:
a) Para obter A, escolhemos os elementos de S constituídos de um H e um número
par: A = [H2, H4, H6].
Para obter B, escolhemos os pontos de S constituídos de números primos: B =
[H2, H3, H5, T2, T3, T5].
Para obter C, escolhemos os pontos de S constituídos de um T e um número
ímpar: C = [T1, T3, T5].
b) (a) A ou B = A  B = [H2, H4, H6, H3, H5, T2, T3, T5].
(b) B e C = B  C = [T3, T5]
(c) Escolhemos os elementos de B que não estão em A e C:
B  A c  C c = [H3, H5, T2].

INSTITUTO SUPERIOR MONITOR


45
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

c) A e C são mutuamente exclusivos, porque A C =  


2. Em certo colégio, 25% dos estudantes foram reprovados em matemática, 15% em
química e 10% em matemática e química ao mesmo tempo. Um estudante é
seleccionado aleatoriamente.
a) Se ele foi reprovado em química, qual a probabilidade de ele ter sido reprovado
em matemática?
b) Se foi reprovado em matemática, qual é a probabilidade de ter sido reprovado em
química?
c) Qual é a probabilidade de um estudante ter sido reprovado em matemática ou
química?
Resolução:
Sejam M = {estudantes que foram reprovados em matemática} e Q = {estudantes que
foram reprovados em química}; então:
P( M ) = 0.25, P(Q) = 0.15, P( M  Q) = 0.10
a) A probabilidade de um estudante ter sido reprovado em matemática, dado que o
P( M  Q) 0.10 2
foi em química, é P( M | Q) = = = .
P(Q) 0.15 3
b) A probabilidade de um estudante ter sido reprovado em química, dado que o foi
P(Q  M ) 0.10 2
em matemática, é p(Q | M ) = = = .
P( M ) 0.25 5
c) P( M  Q) = P( M ) + P(Q) − P( M  Q) = 0.25 + 0.15 − 0.10 = 0.30
3. Três máquinas A, B e C produzem, respectivamente, 60%, 30% e 10% do total de peças duma
fábrica. As percentagens de produção defeituosa destas máquinas são, respectivamente, 2%,
3% e 4%. Uma peça é seleccionada aleatoriamente e é defeituosa. Encontre a probabilidade
de a peça ter sido produzido pela máquina C.
Resolução:
Seja X = {peça defeituosa}. Procuramos P(C | X), a probabilidade de uma peça ter sido
produzida pela máquina C, dado que é defeituosa. Pelo teorema de Bayes,
P(C ) P( X | C )
P(C | X ) =
P( A) P( X | A) + P( B) P( X | B) + P(C ) P( X | C )
(0.10)(0.04) 4
=
(0.60)(0.02) + (0.30)(0.03) + (0.10)(0.04) 25

INSTITUTO SUPERIOR MONITOR


46
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

1
4. A probabilidade de um homem viver mais dez anos é e a probabilidade de a sua esposa
4
1
viver mais dez anos é . Encontre a probabilidade de:
3
a) Ambos estarem vivos dentro de 10 anos.
b) Pelo menos um estar vivo dentro de dez anos.
c) Nenhum estar vivo dentro de dez anos.
d) Somente a esposa estar viúva dentro de dez anos.
Resolução:
Seja A = evento em que o homem esteja vivo em dez anos, e B = evento em que sua esposa
1 1
esteja viva em 10 anos; então P ( A) = e P( B) =
4 3
a) Procuramos P ( A  B ) . Como A e B são independentes;

1 1 1
P( A  B) = P( A) P( B) =  =
4 3 12
b) Procuramos P ( A  B ) .
1 1 1 1
P( A  B) = P( A) + P( B) − P( A  B) = + − =
4 3 12 2
c) Procuramos P( Ac  B c ) .
1 3 1 2
Agora P( A c ) = 1 − P( A) = 1 − = e P( B c ) = 1 − 1 − P( B) = 1 − =
4 4 3 3
Além disso, como Ac e B c são independentes,
3 2 1
P( A c  B C ) = P( A c ) P( B c ) =  =
4 3 2
1 3
d) Procuramos P( A c  B) . Como P( A c ) = 1 − P( A) = 1 − = e Ac e B são
4 4
1
independentes P( A c  B) = P( A c ) P( B) =
4
5. Uma companhia de seguros iniciará uma campanha extensa de propaganda para
vender apólices de seguro de vida, se verificar que a quantia média segurada por
família é inferior a $ 10.000,00. Tomou-se uma amostra aleatória de 50 família que
acusou um seguro médio de $ 9.600,00 com desvio padrão de $ 1.000,00. Com base
na evidência amostral, a um nível de significância de 5%, a campanha deve ser
iniciada ou não? (Passos: defina as hipóteses, faça o teste, tome a decisão).

INSTITUTO SUPERIOR MONITOR


47
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Resolução:
As hipóteses a formular são:
H 0 :  = 10.000
H 1 :   10.000

x− 9600 − 10000 400  50


Z= = =− = −0,4  50 = −2,83
s/ n 1000 / 50 1000

0.4

0.3

0.2

0.1

0.0
-1.64 0

A estatística de teste (Z) calculada “cai” na região crítica (área sombreada), com efeito
rejeita-se a hipótese nula, isto é, há evidência amostral é suficiente para se afirmar que
a quantia média segurada é inferior a $ 10.000,00 devendo-se deste modo avançar com
a campanha de propaganda.
6. Um relatório de uma companhia afirma que 40% de toda a água obtida, através de
poços artesianos no nordeste, é salobra. Há muitas controvérsias sobre essa
informação, alguns dizem que a proporção é maior, outros que é menor. Para diminuir
as dúvidas, 400 poços foram sorteados e observou-se, em 120 deles, água salobra.
Qual será a conclusão ao nível de 5%?
Resolução:
As hipóteses a formular são:
H 0 : P = 0.4
H 1 : P  0.4
120
pˆ = = 0.3,
400

INSTITUTO SUPERIOR MONITOR


48
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

pˆ − p 0.3 − 0.4 0.1


Z= = =− = −40
p (1 − p ) 0.4(1 − 0.4) 0.4  0.6
n 400 400

Distribution Plot
Normal, Mean=0, StDev=1

0.4

0.3
Density

0.2

0.1

0.025 0.025
0.0
-1.96 0 1.96
X

Rejeita-se a hipótese nula, isto é, não há evidências suficientes para se afirmar


proporção é igual a 40%. Um teste unilateral à esquerda também rejeitaria a hipótese
nula. Nesta circunstância, há evidências de que a proporção seja menor.

INSTITUTO SUPERIOR MONITOR


49
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

ANEXO I – TABELAS DE CONSULTA

TABELA DE CONSULTA: DISTRIBUIÇÃO NORMAL

Distribuição Normal : Valores de P( Z < z ) = A(z)

Segunda decimal de z
0 1 2 3 4 5 6 7 8 9
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
Parte inteira e primeira decimal de z

1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

INSTITUTO SUPERIOR MONITOR


50
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

TABELA DE CONSULTA: DISTRIBUIÇÃO t-STUDANT

GL Nível de significância para teste bilateral


n-1 0.8 0.9 0.95 0.98 0.99 0.998 0.999
0.2 0.1 0.05 0.02 0.01 0.002 0.001
1 3.078 6.314 12.706 31.821 63.657 318.309 636.619
2 1.886 2.920 4.303 6.965 9.925 22.327 31.599
3 1.638 2.353 3.182 4.541 5.841 10.215 12.924
4 1.533 2.132 2.776 3.747 4.604 7.173 8.610
5 1.476 2.015 2.571 3.365 4.032 5.893 6.869
6 1.440 1.943 2.447 3.143 3.707 5.208 5.959
7 1.415 1.895 2.365 2.998 3.499 4.785 5.408
8 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 1.372 1.812 2.228 2.764 3.169 4.144 4.587
11 1.363 1.796 2.201 2.718 3.106 4.025 4.437
12 1.356 1.782 2.179 2.681 3.055 3.930 4.318
13 1.350 1.771 2.160 2.650 3.012 3.852 4.221
14 1.345 1.761 2.145 2.624 2.977 3.787 4.140
15 1.341 1.753 2.131 2.602 2.947 3.733 4.073
16 1.337 1.746 2.120 2.583 2.921 3.686 4.015
17 1.333 1.740 2.110 2.567 2.898 3.646 3.965
18 1.330 1.734 2.101 2.552 2.878 3.610 3.922
19 1.328 1.729 2.093 2.539 2.861 3.579 3.883
20 1.325 1.725 2.086 2.528 2.845 3.552 3.850
21 1.323 1.721 2.080 2.518 2.831 3.527 3.819
22 1.321 1.717 2.074 2.508 2.819 3.505 3.792
23 1.319 1.714 2.069 2.500 2.807 3.485 3.768
24 1.318 1.711 2.064 2.492 2.797 3.467 3.745
25 1.316 1.708 2.060 2.485 2.787 3.450 3.725
26 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 1.314 1.703 2.052 2.473 2.771 3.421 3.690
28 1.313 1.701 2.048 2.467 2.763 3.408 3.674
29 1.311 1.699 2.045 2.462 2.756 3.396 3.659
30 1.310 1.697 2.042 2.457 2.750 3.385 3.646
31 1.309 1.696 2.040 2.453 2.744 3.375 3.633
32 1.309 1.694 2.037 2.449 2.738 3.365 3.622
33 1.308 1.692 2.035 2.445 2.733 3.356 3.611
34 1.307 1.691 2.032 2.441 2.728 3.348 3.601

INSTITUTO SUPERIOR MONITOR


51
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

35 1.306 1.690 2.030 2.438 2.724 3.340 3.591


36 1.306 1.688 2.028 2.434 2.719 3.333 3.582
37 1.305 1.687 2.026 2.431 2.715 3.326 3.574
38 1.304 1.686 2.024 2.429 2.712 3.319 3.566
39 1.304 1.685 2.023 2.426 2.708 3.313 3.558
40 1.303 1.684 2.021 2.423 2.704 3.307 3.551
42 1.302 1.682 2.018 2.418 2.698 3.296 3.538
44 1.301 1.680 2.015 2.414 2.692 3.286 3.526
46 1.300 1.679 2.013 2.410 2.687 3.277 3.515
48 1.299 1.677 2.011 2.407 2.682 3.269 3.505
50 1.299 1.676 2.009 2.403 2.678 3.261 3.496
55 1.297 1.673 2.004 2.396 2.668 3.245 3.476
60 1.296 1.671 2.000 2.390 2.660 3.232 3.460
65 1.295 1.669 1.997 2.385 2.654 3.220 3.447
70 1.294 1.667 1.994 2.381 2.648 3.211 3.435
80 1.292 1.664 1.990 2.374 2.639 3.195 3.416
90 1.291 1.662 1.987 2.368 2.632 3.183 3.402
100 1.290 1.660 1.984 2.364 2.626 3.174 3.390
120 1.289 1.658 1.980 2.358 2.617 3.160 3.373
140 1.288 1.656 1.977 2.353 2.611 3.149 3.361
150 1.287 1.655 1.976 2.351 2.609 3.145 3.357
infin 1.287 1.654 1.975 2.350 2.607 3.142 3.352
0.1 0.05 0.025 0.01 0.005 0.001 0.0005
Nivel de significância para teste unilateral

INSTITUTO SUPERIOR MONITOR


52
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

EXERCÍCIOS DE APLICAÇÃO
1. Uma operação de linha de produção foi programada para colocar 320 mg de detergente
em pó em cada caixa de papelão. Uma amostra de caixas de papelão é periodicamente
seleccionada e pesada para determinar se está ocorrendo subenchimento ou sobre
enchimento. Se os dados da amostra levarem à conclusão de subenchimento ou sobre
enchimento, a linha de produção será paralisada e calibrada para se obter o enchimento
apropriado das caixas.
a) Formule as hipóteses nulas e alternativa que auxiliarão a decisão de paralisar e
calibrar a linha de produção.
b) Comente a conclusão quando H0 não pode ser rejeitada.
c) Comente a conclusão quando H0 pode ser rejeitada.
2. Os americanos gastam uma média de 8,6 minutos por dia lendo jornais. Um
pesquisador acredita que os indivíduos nas posições de gerência gastam mais do que
o tempo médio nacional por dia lendo jornais. Uma amostra dos indivíduos em
posições de gerência será seleccionada pelo pesquisador. Os dados sobre os tempos
de leitura dos jornais serão usados para testar as seguintes hipóteses nula e alternativa.
H0:  = 8,6
H1:   8,6
a) Qual é o erro do tipo I? Quais são as consequências de se cometer esse erro?
b) Qual é o erro do tipo II? Quais são as consequências de se cometer esse erro?
3. O pessoal de vendas da Carpetland tem tido vendas de $ 8 000 por semana, em média.
Paulo Ferreira, o vice-presidente da empresa, propôs um plano de compensação com
novos incentivos de vendas. Paulo espera que os resultados de um período de vendas
experimentais lhe possibilitem concluir que o plano de compensação aumenta as
vendas médias por vendedor.
a) Desenvolva as apropriadas hipóteses nula e alternativa. Qual é o erro do tipo I
nessa situação? Quais são as consequências de se cometer esse erro?
b) Qual é o erro do tipo II nessa situação? Quais são as consequências de se cometer
esse erro?
4. Historicamente, em certa cidade, a variável aplicação em caderneta de poupança tem
média de 420 unidades monetárias, com desvio padrão de 100 unidades monetárias.
Foi feita uma suposição, que actualmente esta situação tenha se alterado. Para testar
tal suposição, tomou-se uma amostra de 100 depositantes, que acusou uma média de
415 unidades monetárias. Usando =5%, pode-se concluir que houve alteração?
R: z = -0,5; Não rejeitar H0.
5. Um fabricante de conservas anuncia que o conteúdo líquido das latas de seu produto
é, em média, de 2000 gramas, com desvio padrão de 40 gramas. A fiscalização de
pesos e medidas investigou uma amostra aleatória de tamanho 64, de um lote de 500

INSTITUTO SUPERIOR MONITOR


53
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

dessas latas, verificando média de 1990 gramas. Fixado o nível de significância de


0,05, deverá o fabricante ser multado por efectuar a venda abaixo do especificado?
6. A vida média de uma amostra aleatória de 100 lâmpadas de certa marca é 1615 horas.
Por similaridade com outros processos de fabricação, supomos o desvio padrão
populacional conhecido e igual a 120 horas. Utilizando α =1%, desejamos testar se a
duração média de todas as lâmpadas dessa marca é maior de 1600 horas. Qual é a
conclusão?
7. A associação dos proprietários de indústrias metalúrgicas está muito preocupada com
o tempo perdido com acidentes de trabalho, normalmente distribuído, cuja média, nos
últimos tempos, tem sido de 60 horas/homem por ano e desvio padrão 20
horas/homem. Tentou-se um programa de prevenção de acidentes, após o qual foi
tomada uma amostra de nove indústrias e medido o número de horas/homem perdidas
por acidente, que foi de 50 horas. Ao nível de significância de 10%, há evidência de
melhoria?
8. Um fabricante de lâmpadas afirma que a duração média de seu produto é de 500 horas.
Acreditando que a média seja inferior à anunciada, um comprador seleccionou uma
amostra de 10 lâmpadas, de um lote de 200, que acusou média de 490 horas, com
desvio padrão de 12 horas. Realize o teste, com =1%. Suponha população Normal.
9. Um projecto de investimento está sendo avaliado. Uma situação envolvendo cenários
futuros forneceu os seguintes tempos de retorno do investimento (em anos): 2,8 – 4,3
– 3,7 – 6,4 – 3,2 – 4,1 – 4,4 – 4,6 – 5,2 – 3,9. Teste ao nível de 5%, a hipótese de que
a média de retorno seja igual a 4 anos.
R: t = 0,8; Não rejeitar Ho.
10. A indústria ABC, fabricante de um determinado equipamento electrónico, procedeu a
substituição de certo componente importado pelo similar nacional. Um comprador da
referida indústria supõe que tal substituição tenha diminuído a duração do produto que
antes era anunciada como sendo, em média de 200 horas. Para julgar sua suposição, o
comprador testou uma amostra de 10 unidades, verificando média de 197 horas, e
desvio padrão de 6,32 horas. Fixando o nível de significância em 0,05, e sabendo que
o tempo de duração é normalmente distribuído, estabeleça a conclusão alcançada pelo
comprador.
R: t = - 1,51 Não Rejeitar Ho.
11. Uma fábrica de cigarros anuncia que seu produto apresenta um conteúdo médio de
nicotina de 26 mg por cigarro, com desvio padrão de 3mg. Um laboratório resolve
testar esta afirmação, porque há suspeita que na realidade o conteúdo de nicotina é
superior ao mencionado pela indústria. Realiza 6 análises e obtém os seguintes índices
de nicotina por cigarro: 27 - 24 - 21 - 25 - 26 - 22. Qual a conclusão obtida, adoptando-
se um nível de significância de 1%?
12. Certa organização médica afirma que um novo medicamento é de qualidade superior
ao até então existente, que é 80% eficaz na cura de determinada doença. Examinada
uma amostra de 300 pessoas que sofriam da doença, constatou-se que 249 ficaram

INSTITUTO SUPERIOR MONITOR


54
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

curadas com o novo medicamento. Fixado o nível de significância em 5%, teste a


afirmação da organização.
R: z = 1,304 Não rejeitar Ho.
13. Um consumidor de certo produto denunciou seu fabricante afirmando que este coloca
no mercado uma quantidade de unidades defeituosas que supera 20% da quantidade
total. Uma investigação foi conduzida com uma amostra aleatória de 50 unidades, de
um lote de 400, das quais 28% acusaram defeito. Você diria que a investigação
fundamenta a denúncia? Use 10% de significância.
14. Os produtores de um programa de televisão acham que devem modificá-lo caso sua
assistência regular seja inferior a um quarto dos possuidores de aparelhos de TV. Uma
pesquisa foi feita em 400 domicílios, seleccionados aleatoriamente, mostrando que em
320 o programa não era assistido regularmente. Qual deve ser a decisão dos
produtores, com 3% de significância?
R: z = - 2,301 Rejeitar Ho.
15. Um banco de investimento calcula que 20% dos empréstimos são concedidos a
pequenas empresas. Com a finalidade de aumentar esta percentagem, o governo
resolveu subsidiar os juros para este tipo de empresa. Após algum tempo de vigência
desta política, o banco amostrou ao acaso 40 projectos de financiamento e verificou
que 12 deles se destinavam a pequenas empresas. Teste ao nível de 1% a hipótese de
que a política tenha sido bem-sucedida.

SUMÁRIO DO CAPÍTULO II
No capítulo II você aprendeu a formular a hipótese nula e a hipótese alternativa, desenvolver
ou escolher a estatística de teste e tomar a decisão relativa as hipóteses formuladas. A
formulação das hipóteses é baseada na hipótese ou na questão de pesquisa do investigador.
Geralmente, ao que o investigador tenciona testar é atribuído a hipótese alternativa e a
hipótese nula faz uma negação total ou parcial da hipótese alternativa. A escolha da estatística
de teste tem em conta a distribuição da população, a dimensão da amostra e o conhecimento
ou não do desvio padrão populacional. Escolhida a estatística do teste e processado o teste
segue-se a decisão sobre rejeitar ou não rejeitar a hipótese nula. Qualquer decisão que
viermos a tomar após a realização do teste, está sujeita a uma certa margem de erro. Ao
rejeitarmos a hipótese nula corremos o risco de estar a cometer o erro do tipo I, isto é, estar
a rejeitar a hipótese nula enquanto ela é verdadeira. Por outro lado, ao não rejeitar a hipótese
nula, você poderá estar cometendo o erro tipo II, isto é, não rejeitar a hipótese nula enquanto
ela é falsa. Em geral, você aprendeu a implementar os principais testes de hipótese
nomeadamente testes da média e teste de proporção. Na próxima unidade (Amostragem) você
vai aprender as principais técnicas de levantamento oficial de dados, a determinar ou
optimizar a dimensão da amostra e técnicas de confecção de questionário.

INSTITUTO SUPERIOR MONITOR


55
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

CAPÍTULO III – TEORIA DE AMOSTRAGEM


OBJECTIVOS ESPECÍFICOS DO CAPÍTULO
Findo este capítulo o estudante será capaz de:
• Definir o conceito de amostragem;
• Enumerar as vantagens e desvantagens de utilização da amostra
• Desenhar um plano de amostragem;
• Descrever os métodos de recolha de dados.

3.1. INTRODUÇÃO AO CAPÍTULO


A amostragem é mais atraente que o censo, dada as dificuldades que o censo apresenta
nomeadamente:
Custo de um censo supera ao de uma amostra;
Factores como o tempo podem apontar pela preferência de uma amostra que um
censo;
Os resultados obtidos amostra podem ser actualizados facilmente que os obtidos
através de um censo;
Para uma população infinita o censo e impraticável; Não obstante há ocasiões em
que o levantamento pode ser vantajoso:
Quando a população é pequena e o custo da realização do censo e o levantamento por
amostragem forem praticamente iguais;
Quando se exige precisão completa nos resultados;
Nas ocasiões em que já existe informação completa. Alguns exemplos da utilização
da amostragem:
Inspecção as empresas com o objectivo de descobrir até que ponto as leis são
cumpridas por estas;
Para estimar a magnitude da diferença no que concerne a compreensão verbal entre
as crianças residentes no meio rural e trabalho;
Sondagens a opinião pública que servem para conhecer a opinião da população sobre
variadas questões.

INSTITUTO SUPERIOR MONITOR


56
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

3.2. CONCEITOS
População – conjunto de unidades bem definidas com características comuns, tempo
e no espaço. A população deve ser definida claramente e em termos daquilo que se
pretende conhecer.
Unidade – qualquer elemento individual da população.
Amostra – uma parte ou subconjunto da população usada para obter informação
acerca do todo.
Variável – característica de uma unidade que será medida na unidade de amostra

3.3. PLANO DE AMOSTRAGEM


Após a definição dos dados que deverão ser recolhidos, o passo seguinte consiste em
definir um método de amostragem adequada, daí sugere a necessidade de desenhar um
plano de acordo com a população alvo assim como a definição da população a inquerir e
um processo adequado de administração de inquérito. O plano de amostragem deverá
começar por determinar qual o nível de extensão geográfica em que o processo de
amostragem deverá ser conduzido (mundial, nacional, regional, urbano, rural, grupos de
indivíduos, empresa, etc.).
A construção de amostra propriamente dita envolve etapas igualmente importantes, que
são:
(i) A identificação da população alvo ou população a inquirir;
(ii) O método de selecção de amostra;

(iii)A dimensão da amostra.

3.4. MÉTODOS DE SELECÇÃO DE AMOSTRA


Existem dois grandes métodos para seleccionar amostras; os métodos aleatórios e os
métodos não aleatórios. Os métodos de amostragem não aleatórios são de carácter
pragmático ou intuitivo. Um claro inconveniente destes métodos é o facto de que a
inclusão de um elemento da população na amostra e determinada por critérios
subjectivos.
Nesta unidade você vai aprender os métodos aleatórios que são de carácter probabilístico
onde cada unidade tem probabilístico de fazer parte de amostra o que não acontece para
métodos não aleatórios.

3.4.1. AMOSTRAGEM ALEATÓRIA SIMPLES


Também conhecida por amostragem casual, Randónia, acidental. Consiste basicamente
em atribuir a cada elemento do universo um número único para depois seleccionar alguns
elementos de maneira casual. Este procedimento, embora seja aquele que mais se ajuste

INSTITUTO SUPERIOR MONITOR


57
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

aos princípios de teoria de probabilidade nem sempre é o de mais fácil aplicação, sobre
tudo porque exige que se atribua a cada elemento da população um único número.
A amostragem aleatória simples pode ser feita com reposição (cada elemento da
população pode entrar mais de uma vez na amostra) ou sem reposição (cada elemento da
população só (pode entrar uma vez na amostra).
3.4.2. AMOSTRAGEM SISTEMÁTICA
É uma versão da amostragem aleatória simples. A sua aplicação requer que a população
seja ordenada de tal modo que cada um dos seus elementos possa ser unicamente
identificado pela posição. O primeiro elemento a fazer parte da amostra é escolhido de
forma aleatória os restantes elementos são obtidos mediante a adição de um rácio.
3.4.3. AMOSTRAGEM ESTRATIFICADA
Este método consiste em dividir a população em grupos relativamente homogéneos e
mutuamente exclusivos, chamados estratos, e seleccionar amostras aleatórias simples
independentes em cada estrato. Se o número de elementos de cada amostra estiver de
acordo com a proporção do estrato na população diremos que se obteve uma amostra
global estratificada proporcionalmente. Se, no entanto, todas as amostras tiverem o
mesmo número de elementos, o resultado de cada estrato deve ser pesado pela proporção
desse extracto na população.
No caso da amostragem estratificada não proporcional, a extensão da amostra dos vários
estratos não é proporcional a extensão desses estratos em relação ao universo. Há
situações em que esse procedimento é o mais adequado, particularmente naquelas em que
se tem interesse em comparar vários estratos.
3.4.4. AMOSTRAGEM POR CONGLOMERADO
Tal como na amostragem estratificada, na amostragem por conglomerados, a população
é dividida em grupos, ou conglomerados, este tipo de amostragem torna-se
particularmente útil quando a população se encontra dividida num número reduzido de
grupos, caracterizados por terem uma dispersão idêntica a população total. Primeiro
selecciona se aleatoriamente alguns dos grupos e em seguido, inclui-se na amostra todos
os indivíduos pertencentes aos grupos seleccionados, tira-se de um processo amostral
causal simples em que cada unidade é o conglomerado. Este tipo de amostragem exige
que se disponha de uma lista dos grupos e não uma lista completa dos elementos da
população, como é o caso das amostragens anteriores.
Um exemplo deste tipo de amostragem é o caso em que se pretende fazer uma sondagem
de opinião aos alunos de uma escola (população) da qual apenas se dispõe de uma lista
das turmas (grupos de alunos). Uma amostra por conglomerados obtêm-se seleccionando
uma amostra aleatória de turmas e inquerindo dentro de cada turma escolhida todos os
alunos.
3.4.5. AMOSTRAGEM POR ESTÁGIOS MÚLTIPLOS
A população encontra-se dividida em vários grupos e seleccionam se aleatoriamente
alguns desses grupos. No passo seguinte, também os elementos de cada grupo são

INSTITUTO SUPERIOR MONITOR


58
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

escolhidos aleatoriamente. Este processo pode multiplicar-se em mais de duas etapas se


os grupos estiverem divididos em subgrupos.
Um exemplo deste tipo de amostragem é o caso de sondagem de opinião aos alunos do
ensino secundário em que se pode começar por seleccionar aleatoriamente algumas
direcções. Em seguida, de cada uma delas, seleccionar aleatoriamente algumas escolas,
de cada uma das escolas, de cada uma das escolas escolhidas aleatoriamente algumas
turmas e finalmente de cada uma das turmas escolhidas seleccionar alguns alunos. Este
exemplo consiste em 4 etapas.
Como desvantagem deste método adianta-se que os possíveis erros de amostragem se
podem multiplicar, dado que ao longo deste processo se vão utilizando várias suba
mostras com a possibilidade de erros de amostragem em cada uma delas.
3.4.6. AMOSTRAGEM MULTI-FÁSICA
Neste caso em cada fase da amostragem consideram-se sempre os elementos da
população, obtendo-se de alguns mais informações do que de outros. Na primeira fase,
recolhem-se dados sobre determinadas características dos respondentes por exemplo, o
seu comportamento e frequência quanto ao consumo de determinado produto, variáveis
demográficas, tamanho das empresas, a sua disponibilidade para responder novamente a
um inquérito. Esta informação pode ser usada para a definição de uma lista dos possíveis
respondentes a segunda fase do inquérito. E então retirada desta lista uma segunda
amostra que responderá a um questionário com nível de profundidade mais elevado.
Deste modo, nem todos os inqueridos respondem a todas as questões, isto permite reduzir
os custos e permite ainda que a amostra principal seja utilizada como base de amostragem
para amostragens seguintes.

EXERCÍCIOS
Dê o seu conceito de amostra representativa.
1. Diferencie a população alvo da população a inquerir.
2. Quais são as etapas a seguir num levantamento por amostragem?
3. Porque é que em muitos estudos recorre-se a levantamentos por amostragem e não a
levantamentos censitários?
4. Comente ou critique a frase abaixo:
a) Os resultados obtidos através de um levantamento censitária são mais credíveis
que os obtidos através de um levantamento por amostragem.
b) O tipo de amostragem a ser usado depende da população a inquerir e do objectivo
do estudo.
5. Analise a veracidade da frase: “Em qualquer plano de amostragem sempre deve-se
incluir o passo referente a inquirição da população.”

INSTITUTO SUPERIOR MONITOR


59
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

6. Para cada alínea identifique a população, a variável de interesse e a unidade.


a) Um estudo revelou que 30% das mortes em Moçambique são causadas por
acidentes cardiovasculares.
b) Em Moçambique, as escolas localizadas no meio rural apresentam maior nível de
desistência que as localizadas do meio urbano.
c) A longa distância que as crianças moçambicanas estão sujeitas a percorrer até às
suas escolas, foi apontada como sendo a principal causa das desistências.
d) Indivíduos da cidade de Maputo com nível de formação básica apresentam maior
nível de insatisfação relativamente aos serviços públicos.
e) Maior parte dos residentes do bairro 25 de Junho tem a percepção de que a água
consumida por elas é de baixa qualidade.
7. Em cada alínea do exercício anterior indique e explique o processo de amostragem
usado.
8. Para cada uma das seguintes situações anterior indique e explique o processo de
amostragem usado.
a) O Conselho Universitário de uma Universidade deseja conhecer a opinião dos
alunos e professores sobre uma resolução a ser votada que estabelece horários
fixos para o atendimento de alunos pelos professores. Para compor a amostra
foram sorteados aleatoriamente 10% dos alunos matriculados e 10% dos
professores.
b) Um treinador de uma confederação desportiva deseja dividir 20 equipas em dois
grupos. Para o primeiro grupo, ele seleccionou aleatoriamente 10 equipas e
considera as 10 restantes para o segundo grupo.
c) Uma lista numerada contém 1000 nomes, numerados consecutivamente a partir
de 1. Iniciando-se do 15º nome, uma amostra foi composta considerando
sorteados os nomes referentes aos números 25,35,45,55, e assim sucessivamente
até que fossem escolhidos 100 nomes.
9. Complete:
a) A amostragem _____________________ pode ser feita com reposição ou sem
reposição.
b) Na amostragem ___________________ a selecção dos itens da população que
farão parte de amostra é feita seguindo uma sequência fixa, isto é, são escolhidos
os itens r, r+2k,r+3k, e assim por diante.
c) A amostragem ______________________ pressupõe a divisão da população em
subgrupos de itens similares, procedendo-se então a amostragem em cada
subgrupo.
d) A amostragem ______________________ pressupõe a disposição dos itens de
uma população global, procedendo-se a amostragem dos subgrupos.

INSTITUTO SUPERIOR MONITOR


60
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

QUADRO SINÓPTICO

Título Sub Título Conteúdo Importante

População é o conjunto de unidades bem


definidas com características comuns, no
Conceitos
tempo e no espaço. O subconjunto da
população denomina-se amostra.

O plano de amostragem deverá começar


Teoria de Amostragem

por determinar qual o nível de extensão


geográfica em que o processo de
amostragem devera ser conduzido sem se
Plano de
esquecer do intervalo de tempo
Amostragem
considerado. Em seguida, identificar a
população alvo ou a inquirir, o método de
selecção da amostra e dimensão da
amostra.

Existem dois grandes métodos para


seleccionar amostras; os métodos
aleatórios e os métodos não aleatórios. Os
Método de métodos de amostragem não aleatórios
selecção da são de carácter pragmático ou intuitivo.
amostra Um claro inconveniente destes métodos é
o facto de que a inclusão de um elemento
da população na amostra é determinada
por critérios subjectivos.

INSTITUTO SUPERIOR MONITOR


61
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

CAPÍTULO IV – TEORIA DE ESTIMAÇÃO


OBJECTIVOS ESPECÍFICOS DO CAPÍTULO
Findo este capítulo o estudante será capaz de:
• Distinguir os conceitos de parâmetro e estimador;
• Desenvolver uma estimativa pontual;
• Desenvolver uma estimativa intervalar

4.1. CONCEITOS
Diz-se que ̂ é um estimador se for uma estatística amostral que simplesmente pode ser uma
regra ou fórmula ou método que nos diz como estimar o parâmetro da população. A todo
valor numérico particular obtido pela aplicação do estimador é chamado de estimativa.
Nota: As estatísticas são amostrais e os parâmetros são populacionais.

4.2. ESTIMAÇÃO PONTUAL


Uma estimativa dada por um só valor é chamada de estimativa pontual do parâmetro. Por
exemplo se dissermos que x = 3,4 , então 3,4 é a estimativa pontual da média populacional.
Diremos que um estimador é de exalação apreciável se satisfaz as seguintes propriedades:
̂ deverá ser não-enviesado

Diz-se que ̂ é um estimador não-enviesado se E(ˆ ) =  .


Isto é, o valor esperado (média) de um estimador é igual ao respectivo parâmetro
populacional.
̂ deverá ser eficiente

Diz-se que ̂ é um estimador eficiente se dentre os estimadores não-enviesados de 


, ̂ é que tem menor variância.
̂ deverá ser suficiente

Diz-se que ̂ é um estimador suficiente de  se para sua obtenção usa-se toda a


informação relevante na amostra.
̂ deverá ser consistente

Diz-se que ̂ é um estimador consistente de  se:

lim P(ˆ n −    ) = 1,   0
n→

INSTITUTO SUPERIOR MONITOR


62
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Isto é, a probabilidade de o modulo da diferença entre o estimador e o respectivo


parâmetro ser menor que épsilon (um valor positivo próximo de zero) é igual a 1,
quando a dimensão da amostra tende para infinito.

TEOREMA
Se X = ( x1 , x2 , ..., xn ) for uma amostra de tamanho n, obtida de pelo método da
amostragem aleatória simples e cumpre-se que:
lim E (ˆ ) =  e lim Var (ˆ ) = 0
n → n →

Então, ̂ é um estimador consistente.


4.3. ESTIMACÃO INTERVALAR
De forma resumida podemos afirmar que para construir um intervalo de confiança é
necessário:
1. Encontrar um estimador pontual;
2. Estabelecer o nível de confiança - erro que estamos sujeitos ao afirmar que o
intervalo contém o verdadeiro parâmetro;
3. Conhecer a dimensão da amostra e o tamanho da população para o caso da
população finita.
4. Conhecer a distribuição amostral da variável aleatória utilizada para estimar o
parâmetro.
Os procedimentos envolvem a escolha de uma estatística adequada, que é comummente
designada por variável fulcral, que é a variável aleatória que contém na sua expressão o
parâmetro a estimar e não contém quaisquer outros parâmetros desconhecidos. Por
último, a sua distribuição não depende do parâmetro a estimar, nem quaisquer outros
valores que se desconheçam.

EXEMPLO
1. Mostre que a média e um estimador não-enviesados da média populacional  .
Resolução.
Por definição temos que para estimadores não-enviesados E(ˆ ) =  , atendendo ao
facto de
x1 + x2 + ... + xn
x=
n

INSTITUTO SUPERIOR MONITOR


63
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Vem que
 x + x + ... + xn  1  +  + ... + 
E 1 2  = E ( x1 + x2 + ... + xn ) = =
 n  n n

2. Mostre que para amostras de tamanho n , extraídas de uma população normalmente


distribuída com  e variância  2 , pela técnica de amostragem aleatória simples se
2
tem que Var ( x ) = .
n
Resolução
A média e calculada pela fórmula
x1 + x2 + ... + xn
x=
n
Calculando a variância da expressa acima e aplicando algumas propriedades.
 x + x 2 + ... + x n  1
Var 1  = 2 Var ( x1 ) + Var ( x 2 ) + ... + Var ( x n )
 n  n
1
= 2 ( 2 +  2 + ... +  2 )
n
n 2
= 2
n
2
=
n
n

 (x − x) 2

3. Mostre que S 2 = i =1
é um estimador enviesado da variância populacional
n
 2.
Resolução
Para tal, basta mostrar que E ( S 2 )   2 .

1  1
E ( S 2 ) = E   ( xi2 − 2 xi x + x 2 ) =  E ( x 2
i 
) − nE ( x 2 )
n  n
Vejamos que
Var ( xi ) = E ( xi2 −  2 =  2
2
Var ( x ) = E ( x 2 ) −  2 =
n

INSTITUTO SUPERIOR MONITOR


64
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Substituindo

E (S 2 ) =
1
n
n 2 + n 2 −  2 − n 2 
2
= (n − 1)   2
n
4. Verifique se a média é um estimador consistente da média populacional.
Resolução
Para garantir a consistência de um estimador deve verificar as condições

lim E ( x ) =  e lim Var ( x ) = 0


n → n →

Calculando
 x + x2 + ... + xn  2
lim E  1 = e lim Var ( x ) = =0
x →
 n  x → n
Logo a média e um estimador consistente da média populacional.
EXERCÍCIOS
1. Dê exemplos de estimadores.
2. As estimativas podem ser populacionais?
3. Se um estimador for consistente, será ele eficiente? Justifique.
4. Quais são as propriedades dos estimadores
5. Quais são os passos necessários na construção de um intervalo de confiança?
6. Sejam x1 , x2 , ..., x6 variáveis aleatórias independentes, identicamente distribuídas de
forma normal com a média  e variância  2 . Considere os seguintes estimadores:
x + x 2 + x3 + 3 x5
a) ˆ1 =
5
2 x1 + x2 + x3 + x4
b) ˆ 2 =
4
x1 + x 2 + x3 + x4 + x5
c) ˆ 3 =
5
x1 + x2 + x3 + x4
d) ˆ 4 =
4
x1 + x2 + x3 + x4 + x5
e)  5 =
6

INSTITUTO SUPERIOR MONITOR


65
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Diga qual(is) desse(s) estimador(es) é(são) não-enviesado(s) e qual é o mais eficiente.


7. Sejam x1 = 25, x2 = 30, x3 = 27, x4 = 35, x5 = 40 , as idades em anos dos estudantes
duma turma do primeiro ano de psicologia.
a) Com base nesses dados determine a estimativa não-enviesado da idade média e
desvio padrão.
b) Forme todas as amostras de tamanho três e calcule as médias de cada
2
c) amostra e comprove que E (x ) =  e Var ( x ) = .
n
d) Repita o exercício da alínea b) com amostras de tamanho 4.
n

 (x − x) 2

8. Mostre que S 2 = i =1
é um estimador não-enviesado da variância
n −1
populacional  2 .
9. Suponha que as alturas de 100 estudantes do sexo feminino do ISM representam uma
amostra aleatória das alturas em polegadas. Determine as estimativas não-enviesadas
e eficientes da verdadeira média e da verdadeira variância.

Alturas Número de Estudantes


60-62 5
63-65 18
66-68 42
69-71 27
72-74 8

INSTITUTO SUPERIOR MONITOR


66
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

QUADRO SINÓPTICO

Título Sub Título Conteúdo Importante

Diz-se que ̂ é um estimador se for uma estatística


amostral que simplesmente pode ser uma regra ou
formula ou método que nos diz como estimar o
parâmetro da população. A todo valor numérico
Conceitos particular obtido pela aplicação do estimador é
chamado de estimativa. Sendo uma estimativa,
naturalmente ela varia em função da amostra
seleccionada.

Uma estimativa dado por um só valor é chamado


de estimativa pontual do parâmetro populacional.
Por exemplo se dissermos que x = 10 , então 10 é
Teoria de Estimação

Estimação a estimativa pontual da média populacional. Diz-


Pontual se que um estimador e de exalação apreciável se
satisfaz as seguintes propriedades: deverá ser não-
enviesado, eficiente, suficiente e consistente.

A estimativa intervalar de um parâmetro, é um


intervalo fechado que se espera a um certo nível de
confiança que contenha o verdadeiro parâmetro da
população. De forma resumida podemos afirmar
que para construir um intervalo de confiança são
necessários os seguintes passos: Encontrar um
Estimação estimador pontual; Estabelecer o nível de
Intervalar confiança - erro que estamos sujeitos ao afirmar
que o intervalo contém o verdadeiro parâmetro;
Conhecer a dimensão da amostra e o tamanho da
população para o caso da população finita;
Conhecer a distribuição amostral da variável
aleatória utilizada para estimar o parâmetro.

INSTITUTO SUPERIOR MONITOR


67
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

CAPÍTULO V – AMOSTRAGEM ALEATÓRIA SIMPLES


OBJECTIVOS ESPECÍFICOS DO CAPÍTULO
Findo este capítulo, o estudante será capaz de:
1. Implementar a recolha de dados através da amostragem aleatória simples com
reposição;
2. Implementar a recolha de dados através da amostragem aleatória simples sem
reposição;
3. Descrever as vantagens e desvantagens de cada um dos procedimentos.

5.1. AMOSTRAGEM ALEATÓRIA SIMPLES SEM REPOSIÇÃO


Consideremos uma população razoavelmente homogénea de dimensão N , e dela
pretendemos extrair uma amostra aleatória de dimensão n em que todos os elementos
N!
são distintos, esta amostra e escolhida dentre as C nN = amostra distintas
n!( N − n)!
N!
possíveis. Isto é o mesmo que dizer que cada uma das C nN = tem
n!( N − n)!
N!
probabilidade igual ao inverso de C nN = de ser escolhida.
n!( N − n)!
Na prática, na amostragem aleatória simples é seleccionada unidade por unidade. As
unidades na população são enumeradas de 1 até N. E depois, números aleatórios entre 1
e N da tabela de números aleatórios são lidos em sequência até se atingir o número n ,
tamanho da amostra. As unidades que tomarem os números lidos da tabela constituirão a
amostra.
Em cada etapa da escolha, este processo dá aos números a mesma probabilidade de serem
escolhidos. Desta forma, ao usarmos a tabela dos números aleatórios o número que já foi
lido é ignorado.

NOTAÇÕES
Ao seleccionar uma amostra nós estamos interessados em medir ou registar a variável ou
características em estudo para cada unidade que entra na amostra. Portanto, a
característica não tem que ser necessariamente numérica podendo ser categórico, por
exemplo, a classe social a que um indivíduo pertence. Comummente usa-se letras
maiúsculos para representar as características da população e as minúsculas para
representar as da amostra
Uma população de dimensão N , podemos representa-la por x1 , x 2 , ..., x N , sendo estes X
os membros da população.

INSTITUTO SUPERIOR MONITOR


68
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Embora a amostragem seja realizada para diferentes objectivos, geralmente os interesses


centram-se em quatro características da população nomeadamente:
N n
N
(i) O total da população X T =  X i = NX = x i ;
i =1 n i =1

N
1
(ii) A média da população X =  =
N
X
i =1
i ;

X X
(iii)A razão entre dois totais e duas médias R = ou R =
Y Y

(iv) A proporção,  ou P, de membros da população que pertencem a determinada


categoria, etc.
N n
A expressão chamará de factor de expansão. Ao seu inverso , a razão entre o
n N
tamanho da amostra e o tamanho da população chamaremos de fracção de amostra e é
representada comummente pela letra f .
5.2. AMOSTRAGEM ALEATÓRIA SIMPLES COM REPOSIÇÃO
Este é um método de amostragem na qual cada elemento, xi é escolhido aleatoriamente
entre todos N elementos da população x1 , x 2 , ..., x N de forma que todos eles tenham a
1
mesma probabilidade de serem escolhidos, isto é P( X i = xi ) = . Isto corresponde a
N
extrair uma amostra aleatória de demissão n de uma distribuição uniforme discreta no
conjunto dos pontos x1 , x 2 , ..., x N .
Em cada etapa da escolha, este processo dá aos números a mesma probabilidade de serem
escolhidos. Desta forma, ao usarmos a tabela dos números aleatórios o número que já foi
lido poderá ser lido novamente.
EXEMPLO
1. Se uma população contém 5 unidades representadas por A, B, C, D, E, existem 10
amostra de tamanho 3 que são:

ABC ABD ABE ACD ACE


ADE BCD BCE BDE CDE
Podemos notar que não há letras repetidas, daí que este tipo de amostragem aleatória
simples é chamada de amostragem aleatória simples sem reposição.
Observe que, na amostragem aleatória simples com reposição obteria 5 3 amostras e
as amostras AAA, BBB, AAB, CCD, etc., também são consideradas.

INSTITUTO SUPERIOR MONITOR


69
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

2. Numa fábrica de electrodoméstico trabalham 200 operários em 10 linhas de


montagem. Em cada uma dessas linhas trabalham 20 operários. Pretende-se obter
uma amostra de 15 operários que semanalmente serão sujeitas a um teste de álcool.

Resolução
Enumerando a população de 1 até 200 e iniciando a leitura da tábua de números
aleatória cita nos anexos, por exemplo, na terceira coluna, primeira linha, obter-se-ão
os seguintes números aleatórios com 3 algarismos (já que o número total de operários
tem 3algarimos).
660 que se rejeita, 083,..., 009, 148,..., 154,..., 200, 165, 058, 191,..., 172,..., 100,...,
019,..., 111,..., 116,..., 011, que farão parte da amostra.
Assim escolher-se-á o 9º, 11º, 19º da primeira linha de montagem 3º, e o 20º da 5ª
linha de montagem 11º, 16º da 6ª linha de montagem e assim sucessivamente.
3. A demanda pelo produto X, na primeira semana de Dez/03, em 35 estabelecimentos
comerciais revelou os seguintes valores:
35; 19; 20; 22; 36; 42; 25; 42; 20; 28; 24; 23; 29; 33; 37; 14; 22; 35; 30; 30; 38; 39;
28; 27; 21; 27; 32; 49; 18; 26; 24; 33; 34; 29; 39.
a) Extrair uma amostra aleatória simples de tamanho 8 calcular a estimativa da
demanda média, o desvio padrão e a demanda total verificada naquela semana.
Assuma que a população esta enumerada o primeiro elemento é o primeiro na
lista e o último é o último da lista.
Resolução:
Iniciando leitura na primeira coluna e primeira linha (tabela dos números
aleatórios) obtemos a amostra com os elementos seguintes 27; 20; 30; 24; 25; 21;
22; 28.
A estimativa da demanda média é de 24.625 com um desvio em relação a média
de 3.5431. Estima-se que a demanda total verificada naquela semana tenha sido
de xT = Nx = 35  24.625 = 861.88

EXERCÍCIOS
1. Diferencie a amostragem aleatória simples com reposição de amostragem aleatória
simples sem reposição.
2. De que depende a decisão sobre o tipo de amostragem aleatória simples a usar?
3. Comente a frase seguinte: “A porção de números aleatórios obtidos através da roleta
constitui uma amostra aleatória simples”
4. Os empregados de uma firma tem etiquetas de identificação numeradas
consecutivamente de 101 a 873. Deve se escolher um comité de segurança de 10

INSTITUTO SUPERIOR MONITOR


70
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

pessoas, seleccionadas aleatoriamente. Como fazer a selecção do comité utilizando a


amostragem aleatória simples.
5. Suponha que Ana, Bernardo, Carlos e Dora constituem a população de um sector de
serviços da empresa X. Os quatros pretendem ter férias no mês de Agosto. Mas
apenas dois deles podem ir nesse período. Como escolheríamos essas pessoas? Será
que o método que sugeriu constitui uma das formas da amostragem aleatórias simples.
(sugira pelos menos duas formas).
6. A tabela abaixo apresenta dados referentes as despesas com alimentação Y e despesas
totais X em rupias, de uma população hipotética.

Família Despesa C Despesa Família Despesa de Despesa


alimentação
Alimentação Total Total
0 217.00 382.00 9 390.00 655.00
1 196.00 388.00 10 385.00 662.00
2 303.00 391.00 11 470.00 630.00
3 270.00 415.00 12 322.00 677.00
4 325.00 456.00 13 540.00 680.00
5 260.00 460.00 14 433.00 695.00
6 300.00 472.00 15 295.00 695.00
7 325.00 478.00 16 340.00 695.00
8 336.00 191.00 17 500.00 720.00

a) Extraia uma amostra de dimensão 7. (2ª coluna. 2ª linha).


b) Calcule a estimativa da despesa média em alimentação e da despesa total média.
c) Calcule as estimativas do desvio padrão de cada variável
d) Para a família 14 estima o valor gasto em alimentação.
7. Os dados seguintes referem se a tempos gastos (em minutos), por veículos de passeio
ao deslocarem sucessivas vezes de uma cidade A para cidade B:
126; 134; 140; 120; 124; 122; 118; 116; 124; 125; 124; 122; 125; 128; 130; 120; 122;
120; 114; 115; 130; 128; 126; 125; 124.
Numera os dados de 0 a 24, da esquerda para a direita e de cima para baixo:
a) Extrair, sem reposição, uma amostra aleatória simples de tamanho 6.
Iniciar a leitura na 16ª linha e 2ª coluna da TNA (tabela dos números aleatórios),
fazendo a de cima para baixo, da esquerda para direita.

INSTITUTO SUPERIOR MONITOR


71
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

8. Mostre que a média das medias amostrais é igual a media populacional,


( ) N

x
n

i
E(x) = i =1
=  . Sendo n o tamanho de amostra e
isto é, c
n () N o tamanho da população.

QUADRO SINÓPTICO

Título Sub Título Conteúdo Importante

Na amostragem aleatória simples sem


reposição, um elemento, uma vez
Amostragem seleccionado para fazer parte da
Amostragem Aleatória Simples

Aleatória amostra não poderá ser escolhido


Simples sem novamente. Sendo assim, amostra não
Reposição possuirá elementos semelhantes salvo
a existência de elementos semelhantes
na população.

A amostragem aleatória simples com


reposição diferentemente da
amostragem aleatória simples sem
Amostragem reposição, a amostra seleccionada
Aleatória poderá apresentar elementos
Simples com semelhantes não necessariamente
Reposição porque existem na população, mas
porque um elemento após ser
seleccionado volta a população e
poderá ser seleccionado novamente.

INSTITUTO SUPERIOR MONITOR


72
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

CAPÍTULO VI – ESTIMAÇÃO DA MÉDIA


OBJECTIVOS ESPECÍFICOS DO CAPÍTULO
Findo este capítulo o estudante será capaz de:
1. Determinar a estimativa pontual da média populacional;
2. Compor o intervalo de confiança para a média populacional;
3. Determinar o tamanho da amostra óptimo para a estimação da média.

6.1. ESTIMADOR PONTUAL DE MÉDIA, 


As análises feitas aos diferentes estimadores neste capítulo são enquadradas no contexto
da amostragem aleatória simples.
1 n
Um estimador de  , é simplesmente por: x =  xi
n i =1
Foi mostrado no capítulo 2 que x é estimador centrado de  além disso

2
Var ( x ) = (1 − f )
n
n
Onde: f = é a fracção amostral como já foi referido.
N
Observe que a variância amostral de x reduzida pelo factor f, quando comparado com
o resultado análogo para população infinita. Este efeito é conhecido como correcção da
população finita. Por sua vez, mede a precisão de x em relação a µ, permitindo assim a
comparação deste com outros estimadores. A expressão em si contém a dimensão da
amostra, este facto permite a determinação da dimensão da amostra necessária de modo
a obter x com precisão desejada.

6.2. ESTIMADOR PONTUAL DA VARIÂNCIA,  x2

Normalmente, não é conhecido o verdadeiro valor de  2 , assim é preciso estimá-lo


usando a amostra. Um estimador de  2 pode ser dado por

1 n
s12 = 
n − 1 i =1
( xi − x ) 2

Ou
1 n
s 22 = 
n i =1
( xi − x ) 2

INSTITUTO SUPERIOR MONITOR


73
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Foi mostrado no capítulo 2 que s 22 e estimador de  2 . Ao longo desta unidade usaremos


1 n
largamente s12 = 
n − 1 i =1
( xi − x ) 2 na qualidade de ser o melhor estimador de  2 . Assim

sendo, diremos que a variância do estimador da média amostral é


s12
Var ( x ) = (1 − f )
n
O erro padrão (standard error) de x e dado Var(x ) .

6.3. INTERVALO DE CONFIANÇA PARA MÉDIA, 


A construção de intervalo de confiança de µ requerer o conhecimento da distribuição de
probabilidade da estatística x e como estamos perante o caso da amostragem, teremos a
distribuição de amostragem da média amostral. Apoiando-se ao teorema central do limite
podemos concluir que a média amostral tem distribuição aproximadamente a normal.
2
x ~ N (  ; (1 − f ) )
n
Suponhamos que a variância populacional é conhecida e n  30 , então a estatística fulcral
será
xi − 
Z= ~ N (0; 1)

1− f
n
Compondo o intervalo
P(− Z   Z  Z  ) = 1 − 
2 2

 
P(− Z  1 − f − x;    Z  1 − f − x) = 1 − 
2 n 2 n

P( x − Z  1− f    x + Z 1− f ) = 1−
2 n 2

Assim,  será o nível de significância, o erro que se estará cometendo ao afirmar que o
intervalo contém o parâmetro. Deste modo a probabilidade de o intervalo
   
x − Z 1− f    x + Z 1− f  (população finita)
 2 n 2 n 

conter  é de (1 −  ) . O intervalo é aleatório porque os seus limites dependem da média


amostral que é aleatória. Tendo em vista a probabilidade (1 −  ) podemos afirmar

INSTITUTO SUPERIOR MONITOR


74
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

dizendo que se reconhecemos 100 amostras e para cada fosse calculado um intervalo
semelhante a aquele seriam 100 (1 −  ) os intervalos que conteriam a verdadeira média
dessa população.
Observe que se a população for infinita a estatística fulcral será dada por
xi − 
Z=

n
Assim, o intervalo construído para a média dessa população será
   
x − Z    x + Z 
 2 n 2 n

Supúnhamos que a variância populacional é desconhecida e n  30 , então a estatística


fulcral é

xi − 
t= distribuição t de Student

1− f
n

Neste caso precisa-se calcular a estimativa de  2 usando os dados amostrais. Lembramos


que
1 n
s2 = 
n − 1 i =1
( xi − x ) 2 , onde n − 1 representa os graus de liberdade

Compondo os intervalos
   
 x − t  ,( n −1) 1 − f    x + t 1 − f  (população finita)
,( n −1)
 2 n 2 n 
 s s 
 x − t  ,( n −1)    x + t  (população infinita)
,( n −1)
 2 n 2 n

6.4. ESCOLHA DO TAMANHO DA AMOSTRA


As amostras grandes aumentam a precisão de x como estimadores de µ. Não obstante,
os custos de amostragem também irão aumentar. Uma amostra demasiadamente grande
implica um desperdício de esforço e uma amostra demasiadamente pequena produzirá
uma estimação de precisão inadequada. O ideal seria estabelecermos a precisão desejada
ou o gasto máximo e escolher a dimensão da amostra de acordo com estas restrições. De
forma a alcançar esses objectivos é necessário ter em conta um leque de considerações.

INSTITUTO SUPERIOR MONITOR


75
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

(i) Conhecer o curso de amostragem para dada situação;


(ii) Saber como aferir da precisão dos estimadores;
(iii)Saber como equilibrar as necessidades em relação a várias características da
população que estejam a ser estimadas (características de interesse);
(iv) Como lidar com o desconhecimento de alguns parâmetros da população (por
exemplo, a variância da população) que podem afectar a precisão dos
estimadores.
A questão fulcral reside em estimar a média populacional utilizando x e garantindo que
a probabilidade da diferença absoluta de x e µ seja inferior a certa probabilidade pequena
e predefina. Isto é, procuramos encontrar o valor mínimo de n que assegura que
P(  − x  d )  
Para valores específicos de d (margem de erro) e  , probabilidade pequena (risco de
não respeitar a margem de erro). Apoiando se ao facto de a media apresentar distribuição
normal escrevemos
 −x d 
P   
  (1 − f )n  (1 − f )n 
 
Fazendo
d
Z 
2  (1 − f )n
E resolvendo a expressão em relação a n obtemos
2
 
 Z 
 
n  2 
 Z
2

1 2 
1+  
N d 
 

A primeira aproximação é dada por

INSTITUTO SUPERIOR MONITOR


76
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

 Z
2

  2 d2
n0 =  2  = onde: V = 2
representa a variância da população desejada. O
 d  V Z 
  2

n
resultado n 0 é aceitável, a não ser que 0 seja grande. Caso seja, estão, calculamos n
N
usando

n0
n=
n
1+ 0
N
EXEMPLOS
1. Para investigar a taxa de abastecimento não relacionado com feriados num sector
da indústria foi realizado um inquérito. Recolheu uma amostra aleatória de 1000
indivíduos de um total de 36000 trabalhadores, aos quais foram questionados
sobre os dias que tinham faltado ao trabalho nos últimos 6 meses. Os resultados
foram.

Número de faltas 0 1 2 3 4 5 6 7 8 9
Número de
trabalhadores 451 162 187 112 49 21 5 11 2 0

Resolução
Para estimar o número médio de faltas ao nível deste sector nos últimos 6 meses
pode-se usar a média amostral.
x = 1.296
A variância amostral é dada por
sˆ 2 = 2.397
Recorrendo a aproximação a distribuição normal, obtemos um intervalo de
confiança a 95% para µ dado por
  1000  
1.296  1.96 2.397  1 −  / 100  = 1.201; 1.391
2

  36000  
2. Seja X a duração da vida de uma peça de equipamento tal  = 5 horas. Admita
que 100 peças foram ensaiadas fornecendo uma duração de vida média de 500
horas que se deseja obter um intervalo de 95% para verdadeira média
populacional.

INSTITUTO SUPERIOR MONITOR


77
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

Resolução
Já que n  30 , variância populacional é conhecida usaremos a distribuição
normal.
Temos:
x ~ N (500; 25)
Então:
x ~ N (  ; 0.25)
1 −  = 0.95 →  = 0.05 → Z  = 1.96
2

Substituindo na fórmula e considerando a população infinita obtemos o seguinte


intervalo
499.02; 500.98
Nota: podemos dizer que 95% das vezes, o intervalo acima contém a verdadeira
média populacional. Veja que esta interpretação não é equivalente a interpretação
“95% é a probabilidade de µ cair dentro do intervalo” a segunda interpretação
está errada porque µ é um número e ele está ou não no intervalo.
3. De uma população sabe-se que N = 430 unidades e  2 = 85.6 . Qual deve ser o
tamanho da amostra necessária para estimar a média populacional com a margem
de erro de 1.9 e um risco de não respeitar a margem de erro de 0.1.
Resolução.
Encontremos a primeira aproximação do tamanho da amostra
d2 1.9 2 2 85.6
V= 2 = = 1.325 e n0 = = = 64.557
Z  / 2 1.68 2 V 1.325
Dai vem que
64.557
n = 56.129 , logo concluímos que n = 57 .
64.557
1+
430
1. A amostra seguinte 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população
aproximadamente normal. Construir um intervalo de confiança.
Resolução
Já que n  30 , a variância populacional é desconhecida usaremos a distribuição t-
Student com 9 graus de liberdade
x = 8.7 sˆ 2 = 4  = 0.05 → t9;0,025 = 2.262
Logo o intervalo será

INSTITUTO SUPERIOR MONITOR


78
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

7.27; 10.13
Nota: se n  30 e  for desconhecido poderemos usar S como uma boa
estimativa de  . Esta estimação será melhor quanto maior for o tamanho da
amostra.
EXERCÍCIOS
1. O que representa o valor de  ?
2. Desenhe um fluxograma que mostre a regra de decisão na construção de
intervalos de confiança da média, na escolha do tipo de distribuição a usar, sendo
a variância populacional conhecida ou desconhecida e considerando o tamanho
da amostra.
3. Como interpretaria 100 intervalos de confiança construídos para a média
populacional na base de 100 amostras retiradas da mesma população. Grau de
confiança de 0.95.
4. Cada um dos 60 investigadores num grupo de estaticistas obteve de forma
independente um intervalo de confiança 95% para a média populacional
(considerada normal) dum organismo sujeito a presença de determinada
substância química. Diga se considera verdadeiras ou falsas as afirmações
seguintes:
a) Espera-se que 57 intervalos conterão a verdadeira média populacional;
b) A probabilidade de µ pertencer ao Intervalo de Confiança é de 0.95.
c) A precisão de um intervalo de confiança diminui quando se aumenta o nível
de confiança metendo-se a dimensão da amostra fixa.
5. Comente a frase seguinte: “A dimensão da amostra é determinada tendo em conta
o objectivo do estudo, isto é, a características a estimar”.
6. Na prática  2 não conhecido, e a fórmula para o cálculo da dimensão da amostra
presume que  2 seja conhecido. Enumere e explique algumas formas que
permitam estimar  2 .
7. Uma amostra 320 família conduziu aos seguintes resultados.

Rapazes 5 4 3 2 1 0
Famílias 18 56 110 88 40 8
Construa um intervalo de confiança de 99% para o número médio de filhos
naquela população.
8. Determine o tamanho da amostra mínimo necessário para estimar µ, com uma
margem de erro inferior a 10% e um risco de não respeitar a margem de 10% e
 2 = 0.6 .
9. Uma empresa pretende adquirir peças de peso médio especificado em 200g. Um
fabricante querendo estimar o verdadeiro peso médio num grande lote a fornecer

INSTITUTO SUPERIOR MONITOR


79
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

ao seu maior cliente, seleccionou 35 pecas ao acaso que depois de pesadas


fornecera os seguintes valores:

x i = 7140 g (x i − x ) 2 = 560g 2


a) Apresente uma estimativa do peso médio das peças do lote.
b) Construa um intervalo com grau de confiança de 99% para o peso médio do
lote. A fracção de amostragem é desprezível.
c) A empresa deverá aceitar o lote?
10. Na estimação da media de uma população normal por meio de um intervalo de
confiança a 99%, qual deve ser a dimensão mínima da amostra para que a

amplitude daquele intervalo seja inferior a , sendo  conhecido.
9
11. Um estacão de rádio quer estimar o tempo médio que uma família dedica por dia
a ouvir a rádio. Foi recolhida uma amostra aleatória de 81 famílias tendo-se
calculado o tempo médio diário em 24 horas e um desvio padrão de 0.7 horas.
Naquela cidade, quanto tempo dedica, em média por dia uma família a ouvir
aquela rádio? Responda, fornecendo uma estimativa pontual e um intervalo de
confiança a 90%. Interprete o significado dos valores encontrados.
12. Duma população de 2400 estudantes residentes fora das residências
universitárias, foram escolhidas duas amostras independentes (sem reposição) de
tamanho 200e 400. Cada estudante foi perguntado sobre a distância entre sua casa
e a universidade. Os resultados amostrais foram os seguintes:
x = 5.14km, s12 = 3.8km2 , x2 = 4.9km e s 22 = 4.02km2 respectivamente.
Construa um intervalo de confiança a 99% para a distância média entre a
universidade e a zona de residência dos estudantes.
13. Para as famílias da tabela 3.1determine o tamanho da amostra mínimo necessário
para estimar a despesa média em alimentação com margem de erro aceitável de
52 unidades e um risco de 0.1 Extraia essa amostra e verifique se a condição
imposta se cumpre. Porquê? Média e variância populacional são  = 344.833
rupias e  2 = 8717.79 rupias 2 respectivamente.

INSTITUTO SUPERIOR MONITOR


80
WWW.ISMONITOR.AC.MZ
Estatística Aplicada a Psicologia

SUGESTÕES DE LEITURA

• BARROSO, M & Ramos, M (2003). Exercícios de Estatística Descritiva para as


Ciências Sociais.1ªed, Lisboa, Portugal, Edições Silabo.
• BUSSAB, W. (2002). Estatística Básica. 5ªed, São Paulo, Brasil, Editora Saraiva.
• CRESPO A. (1997). Estatística Fácil. 15ªed, Brasil, Editora Saraiva.
• GIL, A (1996). Projectos de Pesquisa, São Paulo, Atlas.
• GMURMAN, V. (1977). Teoria das Probabilidades e Estatística Matemática
(tradução para português em 1983). Moscovo, Rússia: Mir Moscou.
• LABROUSSE, C. (2002). Probabilidades. Resumos Teóricos. Exercícios Resolvidos.
Porto, Portugal: Rés.
• MARTINS, A. (2002). Estatística Geral Aplicada. 2ªed, Brasil, Editora Atlas.
• MEYER, P. (1995). Probabilidade. Aplicações à Estatística. 2ªed, Rio de Janeiro,
Brasil: Livros Técnicos e Científicos.
• MULENGA, A. (2004). Introdução à Estatística, Maputo.
• REIS E. (1996). Estatística Descritiva. 3ªed, Lisboa, Edições Sílabo.
• SPIEGEL, M. & SCHILLER, R. (2004). Probabilidades e Estatística. 2ªed, Brasil,
Editora Bookman.
• TOLEDO, G, & OVALLE, I. (1992). Estatística Básica. 2ªed, Brasil, Editora Atlas.
• REIS, E. (1994). Estatística Descritiva, Silabo, Lisboa.
• REIS, E. (1997). Estatística Aplicada. Volume 1, Silabo, Lisboa

INSTITUTO SUPERIOR MONITOR


81
WWW.ISMONITOR.AC.MZ

Você também pode gostar