EDUARDO MONDLANE
Faculdade de Educação
Elaborado por:
Xavier Muianga
1
Introdução .................................................................................................................... 4
Objectivos do Módulo ................................................................................................. 5
Recomendações para o estudo .................................................................................... 6
Unidade Didáctica 1: ................................................................................................... 7
Conceitos básicos de estatística .................................................................................. 7
1.1 Introdução .............................................................................................................. 7
Objectivos da Unidade 1 ............................................................................................. 8
Fontes de Informações e Recursos de Aprendizagem .............................................. 9
1.2 O que é Estatística? ............................................................................................... 9
1.3 Estatística Descritiva vs Estatística Inferencial ................................................ 10
1.4 População e Amostra........................................................................................... 12
1.5 Variáveis e suas classificações ............................................................................ 13
Tarefas ........................................................................................................................ 15
Auto-Avaliação .......................................................................................................... 16
Chave de Correção .................................................................................................... 18
Unidade Didáctica 2: ................................................................................................. 19
2.1 Introdução ............................................................................................................ 19
Objectivos da Unidade 2 ........................................................................................... 20
Fontes de Informações e Recursos de Aprendizagem ............................................ 21
2.2 O que é Amostragem? ......................................................................................... 21
2.3 Dimensionamento da amostra ............................................................................ 25
Tarefas ........................................................................................................................ 30
Auto-Avaliação .......................................................................................................... 33
Chave de Correção .................................................................................................... 34
Unidade Didáctica 3: ................................................................................................. 42
Objectivos da Unidade 3 ........................................................................................... 43
Fontes de Informações e Recursos de Aprendizagem ............................................ 44
Tarefas ........................................................................................................................ 50
Auto-Avaliação .......................................................................................................... 54
Chave de Correção .................................................................................................... 57
Unidade Didáctica 4: ................................................................................................. 63
Objectivos da Unidade 4 ........................................................................................... 64
Fontes de Informações e Recursos de Aprendizagem ............................................ 65
4.2 Experimento aleatório ......................................................................................... 65
4.3 Espaço amostral ................................................................................................... 66
4.4 Eventos ................................................................................................................. 66
4.4.1 Operações Com Eventos .................................................................................. 67
4.4.2 Eventos Mutuamente Excludentes E Coletivamente Exaustivos ................. 68
4.5 Probabilidade ....................................................................................................... 68
4.5.1 Eventos Complementares ................................................................................ 71
4.5.2 Eventos Independentes..................................................................................... 71
4.5.3 Eventos Mutuamente Exclusivos .................................................................... 72
Tarefas ........................................................................................................................ 73
Auto-Avaliação .......................................................................................................... 75
Chave de Correção .................................................................................................... 79
Unidade Didáctica 5: ................................................................................................. 87
2
5.1 Introdução ............................................................................................................ 87
Objectivos da Unidade 5 ........................................................................................... 88
Fontes de Informações e Recursos de Aprendizagem ............................................ 89
5.2 Variáveis aleatórias discretas e contínuas ......................................................... 89
5.2.1 Variáveis aleatórias discretas. ......................................................................... 89
5.3 Distribuição de probabilidade. ........................................................................... 90
5.4 Função de densidade de probabilidade. ............................................................ 91
5.5 Esperança matemática, variância e desvio padrão: propriedades. ................ 91
5.7 Distribuições de variáveis aleatórias discretas. ................................................ 91
5.7.1 Distribuição Uniforme. .................................................................................... 92
5.7.2 Distribuição de Bernoulli. ................................................................................ 92
5.7.3 Distribuição Binomial. ..................................................................................... 93
Tarefas ........................................................................................................................ 97
Auto-Avaliação .......................................................................................................... 99
Chave de Correção .................................................................................................. 101
Unidade Didáctica 6: ............................................................................................... 109
Objectivos da Unidade 6 ......................................................................................... 110
Fontes de Informações e Recursos de Aprendizagem .......................................... 111
6.2 Estimadores ........................................................................................................ 111
6.3 Intervalo de confiança para a média m de uma população normal ............. 114
6.4 Intervalo de confiança para a proporção p de uma população binomial.... 115
Tarefas ...................................................................................................................... 117
Auto-Avaliação ........................................................................................................ 120
Chave de Correção .................................................................................................. 124
Unidade Didáctica 7: ............................................................................................... 131
Objectivos da Unidade 7 ......................................................................................... 132
Fontes de Informações e Recursos de Aprendizagem .......................................... 133
7.2 Testes de hipóteses ............................................................................................. 133
Tarefas ...................................................................................................................... 139
Auto-Avaliação ........................................................................................................ 142
Chave de Correção .................................................................................................. 145
3
Introdução
Caro estudante nos dias de hoje, a Estatística ocupa um espaço de relevo nas sociedades
modernas, sendo indispensáveis para o desenvolvimento de qualquer área, seja ela económica,
social, e até educacional. A Estatística nos dias de hoje é uma ferramenta indispensável para
qualquer profissional que necessita analisar informações em suas tomadas de decisões diárias,
seja no seu trabalho ou na sua vida pessoal. Pode-se até pensar que suas técnicas nasceram neste
mundo contemporâneo em que se valoriza cada vez mais a rapidez e a agilidade das informações,
de um mundo onde o avanço tecnológico (através da criação de computadores que processam
uma imensa quantidade de dados em um "piscar de olhos") é constante. Porém a utilização da
estatística como suporte para a tomada de decisões não é de hoje, desde o mundo antigo existem
indícios de sua utilização.
O presente módulo visa facultar os estudantes com ferramentas teórico-práticas que os permitam
realizar análises estatísticas de situações educacionais, uma vez que, a posterior, estes
necessitarão aplicar os conhecimentos adquiridos sobre os métodos de colecta e interpretação de
dados para solucionar problemas - projectos de pesquisa. Neste contexto, uma variedade de
técnicas de análise serão introduzidas e exploradas, nomeadamente análise exploratória de dados,
estatística inferencial, correlação, t-testes, análise de variância, regressão linear, entre outros, com
o objectivo de tornar os estudantes do OGED exímio utilizador de conhecimentos estátisticos, sua
aplicacação geral e específica na área de organização e gestão da educação.
4
Objectivos do Módulo
Objectivos
Demonstrar uma compreensão das hipóteses estatísticas por detrás dos procedimentos
estatísticos.
5
Recomendações para o estudo
O módulo sobre Estatística Aplicada a Educação é um módulo que alia a teoria a prática, por isso,
durante o processo de aprendizagem, você será convidado a dedicar algum tempo para a
consolidação das teorias e prática apreendidas.
Durante o estudo deste módulo, por causa das matérias tratadas, é preciso que você, para além da
bibliografia fornecida, procure outras fontes tais como o material existente na Inernet, de forma a
consolidadar melhor os conhecimentos que vai construir ao longo do tempo em que o módulo vai
decorrer.
No final do estudo de cada unidade, procure resolver ou responder os exercícios colocados, que
servem para a consolidação das matérias do módulo. Não passe para a unidade seguinte sem ter a
certeza de que domina a anterior, e procure sempre que possível consolidar a matéria anterior, através
da resolução de exercícios recomendados em cada unidade.Assim, seja bem-vindo ao módulo e juntos
com os colegas e o tutor, temos a certeza que conseguiremos entender e dominar as matérias aqui
tratadas.
6
Unidade Didáctica 1:
1.1 Introdução
A estatística tem aplicações nos mais importantes ramos da ciência e torna-se a cada dia uma
importante ferramenta de apoio à tomada de decisão. O objetivo deste capítulo é introduzir
importantes conceitos em estatística, trabalhando a intuição do leitor para que este raciocine em cima
de problemas cujas soluções requerem o uso de técnicas estatísticas.
Para iniciar toda a discussão, primeiramente é necessário conhecer melhor o conceito de estatística. As
pessoas comumente escutam falar de estatísticas na mídia. Diariamente são divulgadas informações
tais como: índice de inflação, taxa de mortalidade, índice de desenvolvimento humano, proporção de
eleitores, dentre outras.
O primeiro cuidado que devemos tomar é distinguir as estatísticas (valores numéricos que resumem
informações) da Estatística que ganhou status de ciência. Nesta introdução, esta distinção será feita da
seguinte forma, a Estatística, enquanto ciência, terá sempre a primeira letra maiúscula.
7
Objectivos da unidade 1
Objectivos da Unidade 1
8
Fontes de Informação e Recursos de Aprendizagem
Fontes de Informações e Recursos de Aprendizagem
http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados
Definição: A Estatística é um conjunto de métodos e técnicas que auxiliam a tomada de decisão sob a
presença de incerteza.
A incerteza está relacionada com o que acontece em várias áreas do conhecimento, como por
exemplo: na física, nas ciências sociais, no comportamento humano, na economia e em ciências
naturais. A incerteza é consequência da variabilidade de um fenômeno e dificulta a tomada de
decisões exactas. O tamanho de uma peça de automóvel a ser produzida é uma quantidade incerta,
9
assim como o número de alunos que se vão se matricular em uma determinada disciplina no próximo
período letivo do num determinado curso de graduação. A forma adequada de lidar com a incerteza é
feita por meio do uso de idéias e métodos desenvolvidos na Estatística. Estes métodos básicamente
extraem informações de dados coletados e utilizam o cálculo de probabilidades para delimitar as
decisões com uma certa precisão.
A Estatística Descritiva (ou Dedutiva) tem como objetivo resumir as principais características em
um conjunto de dados fazendo uso de tabelas, gráficos e resumos numéricos. Ela descrever os dados e
pode ser comparado ao ato de tirar uma fotografia da realidade. Caso a câmera fotográfica utilizada
não seja adequada, ou esteja sem foco, o resultado, no caso a foto, pode sair distorcido. Portanto,
quem faz uso da estatística deve ter extremo cuidado em escolher os métodos e técnicas corretas para
resumir os dados.
As competências de um analista quantitativo durante a realização de uma análise descritiva podem ser
comparadas às de um detetive que procura evidências que o leve a formular hipóteses com base nas
suas ações.
10
A Estatística Inferencial ( ou Indutiva) tem como objectivo utilizar informações incompletas para
tomar decisões e tirar conclusões satisfatórias. O alicerce das técnicas de estatística inferencial está no
cálculo de probabilidades. As duas técnicas de estatística inferencial são: estimação e teste de
hipóteses.
Uma outra aplicação da estatística inferencial aparece no Exemplo 2 onde duas hipóteses são
colocadas em questão. Será que uma nova droga, a ser lançada, aumenta a produção de um hormônio
?
Exemplo 2: Um laboratório deseja verificar se uma nova droga aumenta a produção de testosterona
em homens com idade acima de 35 anos. Ao aplicá-la em um grupo de 40 indivíduos, constatou-se
que após um período de tempo a droga aumentou significativamente a quantidade do referido
hormônio.
Exemplo 3: Em uma fábrica de parafusos, a peça é considerada dentro da especificação caso seu
comprimento esteja no intervalo entre 4,8cm e 5,2cm. Os técnicos do Controle Estatístico de
Qualidade selecionam diariamente 100 parafusos fabricados e calculam o comprimento médio. Já
existe conhecimento prévio sobre a variabilidade nos tamanhos dos parafusos fabricados, caso o
comprimento médio esteja abaixo de 4,99 cm ou acima de 5,01 cm, o processo será interrompido.
11
1.4 População e Amostra
O uso da estatística inferencial oferece suporte à tomada de decisão com base em apenas uma parte
das informações que interessam no problema estudado. A partir de agora, vamos utilizar os conceitos
de população e amostra para representar, respectivamente, o conjunto total e o conjunto parcial
(incompleto) destas informações.
População é a conjunto de todas as unidades que possuem pelo menos uma característica em comum
que desejamos medir. Estas unidades podem ser pessoas, domicílios, bancos, universidades, etc. Em
muitas ocasiões o termo Universo é utilizado no lugar de População. Repare que na definição de
população não há nada que estabeleça que esta deve ser formada por uma grande quantidade de
unidades, mas sim, por todas as que estamos interessados em investigar.
Para tornar clara a definição das unidades que fazem parte da população em um levantamento de
dados é importante identificar 3 (três) elementos: a) uma característica em comum; b) a localização
temporal; e c) a localização geográfica.
12
peso em 2010
centros de saúde do distrito de
Região
Manjacaze
Sem uma clara definição dos 3 elementos, conforme fora feito nos exemplos acima, torna-se difícil
proceder a coleta de dados. Quando um estudo estatístico é feito levantando-se informações de todas
as unidades da população este chama-se Censo. Há casos em que o levantamento censitário é inviável,
como por exemplo em testes destrutivos. Ao estudar apenas parte da população para inferir sobre o
todo, o levantamento é dito ser por amostragem.
Um elemento importante para a retirada de uma amostra é a existência de um cadastro com a relação
de todas as unidades que compõe a população. Quando este cadastro não existe, não poderemos
selecionar diretamente as unidades e uma possibilidade é selecionar um grupo de unidades.
As variáveis quantitativas são aquelas que indicam quantidades e permite a realização operações
aritméticas; soma, subtração, divisão, multiplicação.
As variáveis quanlitativas são aquelas que indicam atributo como cor de pele, zona de moradia ou
classe social.
A classificação da variável vai ser determinante para o tipo de análise estatística a ser realizada. Sobre
uma variável qualitativa, não podemos calcular resumos numéricos tais como a média aritmética e
desvio-padrão. Por outro lado, o diagrama em setores (ou gráfico de circular), não é adequado para
representar as frequências das temperatura observadas durante um ano, pois serão muitos valores
diferentes e a consequente formação de muitas fatias.
As variáveis quantitativas possuem uma sub-classificação, elas podem ser discretas ou contínuas.
As Variáveis Quantitativas Discretas são aquelas que ocorrem quando os possíveis valores da
variável podem ser enumerados. Esta situação é típica de dados oriundos de contagens, como por
exemplo numero de filhos em familias residentes num certo quarteirão, o número diário de assaltos
em um quarteirão que pode assumir valores no conjunto {0, 1, 2, 3,…}.
As Variáveis Quantitativas Contínuas são aquelas que ocorrem nos casos em que a variável pode
assumir valores em um intervalo contínuo, por consequência os possíveis valores são infinitos e não-
enumeráveis. A variável idade, ou a altura dos estudantes da UEM, o peso das crianças que nasceram
na matrenidade de um posto de saúde em 2012, por exemplo, é uma variável contínua pois se for
medida com bastante precisão pode gerar como resultado 25,1023... centímetros de altura e, quanto
maior for a precisão, dificilmente dois indivíduos apresentarão alturas iguais.
13
Variáveis quantitativas.
Toda variável que não é quantitativa, será classificada como qualitativa. E possuem uma sub-
classificação, elas podem ser categóricas(classes ou níveis) ou nominais.
As Variáveis Qualitativas Ordinais são aquelas que são expressas em classes, níveis (ou categorias).
Ou são aquelas que tomam níveis e estes sejam ordenáveis, isto é, obedecem a uma certa ordem
crescente ou decrescente.
É importante ressaltar que esta ordenação nos níveis (categorias) da variável é natural tal como ocorre
com a variável classe social. Nesta situação, Classe X > Classe Y > Classe Z > Classe W. Como já foi
comentado, o tipo de variável determina o tipo de análise e, para variáveis qualitativas ordinais, um
resumo numérico, uma técnica gráfica ou até uma tabela de frequência deve incorporar a idéia de
ordenação.
As variáveis qualitativas Nomimais são aquelas que não tomam níveis e nem são ordenáveis, isto é,
são apenas nomes (atributos).
Além das classificações acima, vamos destacar uma outra situação em que a característica de interesse
é investigada ao longo do tempo (espaço) constituindo o que chamamos de uma série temporal.
14
TAREFAS
Tarefas
1. O que é Estatística?
4. Classifique as variáveis:
a) Estado Civil;
b) Região de Procedência;
15
Auto-Avaliação
Auto-Avaliação
1. População ou universo é:
a) Um conjunto de pessoas;
b) Um conjunto de elementos quaisquer
c) Um conjunto de pessoas com uma característica comum;
d) Um conjunto de elementos com pelo menos uma característica em comum;
e) Um conjunto de indivíduo de um mesmo município, estado ou país.
a) Universo;
b) Parte;
c) Pedaço;
d) Dados Brutos;
e) Amostra.
a) Estatística de População;
b) Estatística de Amostra;
c) Estatística Inferencial
d) Estatística Descritiva;
e) Estatística Grupal.
4. Ao longo das nossas aulas vimos que as Variáveis Aleatórias classificam-se em Discretas e
Continuas. Dê doies exemplo de cada uma delas.
5. Ao longo das nossas aulas vimos que as Variáveis Aleatórias classificam-se em Categóricas e
Nominais. Dê doies exemplo de cada uma delas.
6. Classifique as seguintes variáveis em: (QN) Qualitativa nominal, (QO) Qualitativa ordinal
(QC)Quantitativa contínua, (QD)Quantitativa discreta
16
h) ( ) Fator RH
i) ( ) Sexo
j) ( ) Comprimento de um segmento de reta
k) ( ) Área de um círculo
l) ( ) Raça
m) ( ) Quantidade de livros de uma biblioteca
n) ( ) Escolaridade dos funcionários de uma empresa
o) ( ) Religião
p) ( ) Salário dos empregados de uma empresa
q) ( ) Comprimento dos parafusos produzidos em uma fábrica
r) ( ) Estado civil
s) ( ) O nível sócio-econômico dos residentes em um bairro de Ipatinga
t) ( ) Tempo de vida de uma lâmpada
u) ( ) Profissão
v) ( ) Número de ações negociadas diariamente na bolsa de valores
w) ( ) Volume de água contida numa piscina
x) ( ) A classificação dos alunos no último vestibular
17
Chave de Correção
Chave de Correção
1. O que é Estatística?
R: A Estatística é um conjunto de métodos e técnicas que auxiliam a tomada de decisão sob a
presença de incerteza
4. Classifique as variáveis:
b) Estado Civil;
R: variável qualitativa Nominal
b) Região de Procedência;
R: variável qualitativa Nominal
18
Unidade Didáctica 2:
Técnicas de amostragem
2.1 Introdução
Por mais que o estudo de todos os elementos da população possibilite um preciso conhecimento das
variáveis que estão sendo pesquisadas, nem sempre é possível obter as informações de todos os
elementos da população. Limitações de tempo, custo e vantagens do uso de técnicas de inferência
justifica o uso de amostragens. Por essa razão, o mais frequente é trabalhar com uma amostra, ou seja,
com uma pequena parte dos elementos que compõe o universo. Torna-se claro que a
representatividade da amostra dependerá do seu tamanho e da forma como é coletada visando obter
uma amostra significativa, e que de fato represente toda a população.
Esta unidade vai se debruçar sobre algumas técnicas usadas na escolha das amostras, de tal modo que
elas sejam representativas, ou seja, guardar semelhanças com a população.
19
Objectivos da unidade 2
Objectivos da Unidade 2
20
Fontes de Informação e Recursos de
Aprendizagem
http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados
Existem vários métodos de amostragem, e elas podem ser classificadas em Amostragens não-
probabilística/não-aleatória e Amostragens probabilística/aleatória.
21
b) Intencional: Exemplo: Escolha de cada indivíduo. O pesquisador determina exatamente que
será observado, mas se esforça garantir a representatividade de sua escolha.
c) Amostragem por cotas: Apresenta maior rigor dentre as amostragens não probabilisticas.
Etapas: classificar a população; determinar a proporção da população para cada classe; e , fixar cotas
em observância a proporção das classes consideradas.
É utilizada quando não existe um cadastro da população que possibilite a realizacao do sorteio
necessário a amostragem aleatória mas, ao mesmo tempo, existe informaçãosuficiente sobre o perfil
populacional .
É o processo mais elementar e frequentemente utilizado. Todos os elementos da população têm igual
probabilidade de serem escolhidos. Para uma população finita o processo deve ser sem reposição.
Todos os elementos da população devem ser numerados. Para realizar o sorteio dos elementos
devemos usar a Tabela de Números Aleatórios.
b) Amostragem Sistemática
Trata-se de uma variação da amostragem aleatória simples, conveniente quando a população está
naturalmente ordenada, como fichas em uma Pasta, lista telefônica, etc.
Faz-se um sorteio entre os números 1, 2, 3, ..., k, e se obtém o valor i, onde será o meu primeiro
elemento, os demais elementos poderão ser calculados pelo termo geral de uma progressão aritmética
a seguir:
a i n 1 . K
A amostra sistemática é frequentemente utilizada em pesquisas que obrigam que a seleção seja feita
durante a etapa de coleta de dados, por pessoas que não estão familiarizadas com tabelas de números
aleatórios ou com uso de software.
22
Suponha que uma empresa de telefonia fixa deseja saber o grau de satisfação de seus usuários com
serviços prestados. O número de assinantes é da ordem de 50.000 e nós desejamos selecionar uma
amostra aleatória de 1.000 assinantes com o intuito de obter a avaliação sobre os serviços.
N = 50.000
n = 1.000
N
K
n
.
Isso implica que K 50
.
Fazendo-se um sorteio entre 1, 2, ..., 50, digamos que foi sorteado o número 10.
E assim sucessivamente, logo temos então os números 10, 60, 110, ... até 1.000 elementos
c) Amostragem estratificada
É um processo de amostragem usado quando nos deparamos com populações heterogêneas, no qual
pode-se distinguir subpopulações mais ou menos homogêneas, denominados estratos.
As diversas subamostras retiradas das subpopulações devem ser proporcionais aos respectivos
números de elementos dos estratos e guardarem a proporcionalidade em relação a variabilidade de
cada estrato, obtendo-se uma estratificação óptima.
Exemplo: Vamos obter uma amostra estratificada de 10% da população para a pesquisa da estatura de
90 alunos de uma escola sendo que destes 54 sejam meninos e 36 sejam meninas.
23
São, portanto dois estratos (gênero feminino e gênero masculino) e queremos uma amostra de 10% da
população.
Tomando na tabela de números aleatórios a primeira e a segunda coluna da esquerda, de cima para
baixo, obtemos os seguintes números:
57 28 92 90 80 22 56 79 53 18 53 03 27 05 40
Temos então:
28 22 53 18 03 – para os meninos;
57 90 80 56 – para as meninas;
24
A amostragem pode ser com ou sem reposição dos elementos.
Número de amostras = Nn
Se o processo de retirada dos elementos for sem reposição o número de amostras possíveis será:
Número de amostras:
!
! !
1°) Analise o questionário, ou roteiro da entrevista e escolha uma variável que julgue mais importante
para o estudo. Se possível, escolha mais do que uma variável.
4°) Se a variável escolhida for intervalar e a população considerada infinita, você poderá determinar o
tamanho da amostra pela fórmula:
onde: Z é a abscissa da distribuição normal padrão, fixado um nível de (1 - α)% de confiança para
construção do intervalo de confiança para a média.
25
Geralmente, utiliza-se Z = 2 , isto é, admite-se (1 - α)% = 95,5%.
σ é o desvio padrão da população, expressão na unidade variável. Você poderá avaliá-lo de, pelo
menos, uma das três maneiras:
- Especificações técnicas;
Obs.: Se o desvio padrão não for conhecido devemos utilizar um valor preliminar obtido por
processos como por exemplo, fazer uma aproximação atrevês da seguinte fórmula:
≅
4
ou realizar um estudo piloto, iniciando o processo de amostragem. Com base na primeira coleção de
pelo menos 31 valores amostrais selecionados aleatoriamente, calcular o desvio-padrão amostral e
utilizá-lo em lugar do desvio padrão populacional. Este valor pode ser refinado com a obtenção de
mais dados amostrais.
Sendo d o erro amostral, expresso na unidade da variável. O erro amostral é a máxima diferença que o
investigador admite suportar entre µ e X, isto é: |µ - X| < d , onde µ é a verdadeira média
populacional, que ele não conhece, e X será a média amostral a ser calculada a partir da amostra.
. .
1 .
onde:
N = tamanho da população;
6°) Se a variável escolhida for nominal ou ordinal, e a população considerada infinita, você poderá
determinar o tamanho da amostra pela fórmula:
. ̂.
onde:
Z = abscissa da distribuição normal padrão (veja comentaria do item 4°);
26
̂
̂ = estimativa da verdadeira proporção de um dos níveis da variável escolhida. Por exemplo, se a
variável escolhida for porte da empresa, ̂ poderá ser a estimativa da verdadeira proporção de grandes
empresas do setor que está sendo estudado.
E: 1 ̂
. 0,25
Onde :
d = erro amostral, expresso em decimais. O erro amostral neste caso será amáxima diferença que o
investigador admite suportar entre p e ̂ , isto é: p - ̂ < d , em que p é a verdadeira proporção, que ele
não conhece, e ̂ será a proporção (frequência relativa) do evento a ser calculado a partir da amostra.
Onde:
Z = abscissa da distribuição normal padrão (veja comentaria do item 4°);
N = tamanho da amostra.
Estas fórmulas são básicas para qualquer tipo de composição da amostra; todavia, existem fórmulas
específicas segundo o critério de composição da amostra.
Se o investigador escolhe mais de uma variável, deve optar pelo maior “n” obtido.
Exemplos:
27
a) Suponha que a variável escolhida em estudo seja o peso de certa peça e que a população seja
infinita. Pelas especificações do produto, o desvio padrão é de 10kg. Logo, admitindo um nível de
confiança de 95,5% e m erro amostral de 1,5kg, temos:
Ou seja: com uma amostra aleatória simples de 178 peças, há um erro máximo de 1,5kg para construir
um intervalo de confiança para o peso médio, com nível de confiança de 95,5%.
b) Admitimos os mesmos dados do exemplo anterior e uma população finita de 600 peças.
Logo:
Assim.
d) Admitir os mesmo dados do exemplo anterior e que a população de eleitores seja finita de 20.0000
eleitores.
Logo:
28
Se Z - 90% então
A segurir, ir na tabela da distribuição normal e ver em qual linha e coluna está o valor 0,450,
localizado vemos que o valor na linha é 1,6 e na coluna é 0,04, o que corresponde a 1,6+0,04=1,64.
Se Z - 98% então
A seguir ir na tabela da distribuição normal e ver em qual linha e coluna está o valor 0,490, localizado
vemos que o valor na linha é 2,3 e na coluna é 0,03, o que corresponde a 2,3+0,03=2,33
29
TAREFAS
Tarefas
1. Um estatístico deseja estimar a renda média para o primeiro ano de trabalho de um professor.
Quantos valores de renda devem ser tomados, se o estatístico deseja ter 95% de confiança em que
a média amostral esteja a menos de 500,00 Mt da verdadeira média populacional? Suponha que
saibamos, por um estudo prévio, que para tais rendas, σ = 6250,00 Mt.
2. Baseado nos dados do exercícios 1, utilize uma margem de erro maior, como 1.000,00 Mt e
determine qual seria o tamanho da amostra necessária nesta situação.
3. Uma pesquisa é planeada para determinar as despesas médicas anuais das famílias dos
empregados de uma grande eescola. A direcção da escola deseja ter 95% de confiança de que a
média da amostra está no máximo com uma margem de erro de ± 50,00 Mt da média real das
despesas médicas familiares. Um estudo-piloto indica que o desvio-padrão pode ser calculado
como sendo igual a 400,00 Mt.
a) Qual o tamanho de amostra necessário?
b) Se a direcção da escola deseja estar certa em uma margem de erro de ± 25, Mt que tamanho de
amostra será necessário?
4. O teste de QI padrão é planeado de modo que a média seja 100 e o desvio padrão para adultos
normais seja 15. Ache o tamanho da amostra necessária para estimar o QI médio dos instrutores
de estatística. Queremos ter 99% de confiança em que nossa média amostral esteja a menos de 1,5
pontos de QI da verdadeira média. A média para esta população é obviamente superior a 100, e o
desvio padrão é provavelmente inferior a 15, porque se trata de um grupo com menor variação do
que um grupo selecionado aleatoriamente da população geral; portanto, se tomamos σ =15,
estaremos sendo conservadores, por utilizarmos um valor que dará um tamanho de amostra no
mínimo tão grande quanto necessário.
Suponha σ =15 e determine o tamanho da amostra necessário.
5. Uma assistente social deseja saber o tamanho da amostra (n) necessário para determinar a
proporção da população atendida por uma Unidade de Saúde, que pertence ao município de
Matola. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é
desconhecido. Ela quer ter 90% de confiança que sua amostr e o erro máximo de estimativa (d)
seja de ± 5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?
30
6. Baseado nos dados do exercício 5, utilize uma margem de erro maior, como ± 0,20 (20%) e
determine qual seria o tamanho da amostra necessário quando o nível de confiança é 90% e
quando é 95%.
a) Calcular o tamanho da amostra para estimar a média, sendo d = 2.000,00 Mt, σ = 7.000,00 Mt e
(1 - α )% = 95,5%.
b) Retirar uma amostra aleatória simples, considerando o tamanho amostral obtidono item anterior.
c) Calcular sua média amostral.
d) Calcular o desvio padrão amostral.
e) Calcular a média da população e verifique se |µ - |≤d.
10. Qual é o tamanho da amostra que o Departamento de Trânsito da cidade de Maputo deve tomar para
estimar a porcentagem de semáforos defeituosos, se o objetivo é ter 95,5% de confiança em não
errar mais de 3%.
11. Estudos anteriores mostram que o desvio padrão da altura dos homens que estudam na Facudade de
educação é de 10cm. Querendo estimar a atura média de todos os homens dessa Facudade, com
tolerância de 3cm e probabilidade de 0,955, quantas observações deverão ser utilizadas?
31
12. Qual é o tamanho necessário da amostragem que um alfaiate deve usar se deseja estimar o tempo
médio que os fregueses levam ao trocador? Ele acha que o desvio padrão é de 3 minutos, com base
em amostras anteriores, e deseja estimar a média a menos de 1 minuto, usando um nível d 95,5%.
13. Na cidade de Maputo, há 10.000 árvores. Qual deve ser o tamanho da amostra que o Departamento
de Jardins precisa tomar para estimar a porcentagem de plantas que merecem podas, se o objetivo é
ter 99% de confiança de não errar mais de 3%?
14. Segundo dados de uma pesquisa anterior, 40% dos alunos de certa escola são camponeses. Admita
um erro de 2,5%, (1 - α)% = 95,5%, para dimensionar tamanho de amostra de camponeses. Sabe-se
que a escola tem 5.000 alunos matriculados.
32
Auto-Avaliação
Auto-Avaliação
1. Numa pesquisa para uma eleição presidencial, qual deve ser o tamanho de uma amostra aleatória
simples, se se deseja garantir um erro amostral não superior a 2% ?
2. Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certo
treinamento. Qual deve ser o tamanho da amostra aleatória simples que garanta um erro amostral
não superior a 5%?
3. Uma operadora telefônica pretende saber a opinião de seus assinantes comerciais sobre seus
serviços na cidade de Vargem Alegre. Supondo que há 25037 assinantes comerciais, e a amostra
precisa ter no mínimo 800 elementos. Mostre como seria organizada uma amostragem sistemática
para selecionar os respondentes.
4. Imagine que você tem 500 cadastros arquivados em sua escola e você quer uma amostra de 2%
desses cadastros. Como você obteria uma amostra sistemática?
33
Chave de Correção
Chave de Correção
1. Um estatístico deseja estimar a renda média para o primeiro ano de trabalho de um professor.
Quantos valores de renda devem ser tomados, se o estatístico deseja ter 95% de confiança em que
a média amostral esteja a menos de 500,00 Mtda verdadeira média populacional? Suponha que
saibamos, por um estudo prévio, que para tais rendas, σ = 6250,00 Mt
Queremos determinar o tamanho n da amostra, dado que a = 0,05 (95% de confiança). Desejamos que
a média amostral seja a menos de 500 Mt da média populacional, de forma que d = 500 . Supondo σ =
6250,00 Mt , aplicamos a equação abaixo, obtemos:
Devemos, portanto, obter uma amostra de ao menos 601 rendas de primeiro ano, selecionadas
aleatoriamente, da faculdade de educação que tenham feito um curso professorado. Com tal amostra
teremos 95% de confiança em que a média amostral difira em menos de 500,00 Mt da verdadeira
média populacional.
2. Baseado nos dados do exercícios 1, utilize uma margem de erro maior, como 1.000,00 Mt e
determine qual seria o tamanho da amostra necessária nesta situação.
Dados do problema:
Devemos, portanto, obter uma amostra de ao menos 151 rendas de primeiro ano, selecionadas
aleatoriamente, de professores da faculdade que tenham feito um curso de professorado. Com tal
amostra teremos 95% de confiança em que a média amostral difira em menos de 1.000,00 Mt da
verdadeira média populacional.
3. Uma pesquisa é planejada para determinar as despesas médicas anuais das famílias dos
empregados de uma grande empresa. A gerência da empresa deseja ter 95% de confiança de que
34
a média da amostra está no máximo com uma margem de erro de ± 50 Mt da média real das
despesas médicas familiares. Um estudo-piloto indica que o desvio-padrão pode ser calculado
como sendo igual a 400 Mt.
Dados do problema:
α = 0,05 (95% de confiança) Z = 1,96
d = 50 .
σ = 400 , aplicando a equação abaixo, obtemos:
Devemos, portanto, obter uma amostra de ao menos 246 despesas médicas, selecionadas
aleatoriamente, de famílias dos empregados. Com tal amostra teremos 95% de confiança em que a
média amostral difira em menos de 50 Mt da verdadeira média populacional.
b) Se a gerência deseja estar certa em uma margem de erro de ± 25 Mt, que tamanho de amostra
será necessário?
c)
Dado do problema:
Devemos, portanto, obter uma amostra de ao menos 984 despesas médicas, selecionadas
aleatoriamente, de famílias dos empregados. Com tal amostra teremos 95% de confiança em que a
média amostral difira em menos de 25 Mt da verdadeira média populacional.
4. O teste de QI padrão é planejado de modo que a média seja 100 e o desvio padrão para adultos
normais seja 15. Ache o tamanho da amostra necessária para estimar o QI médio dos instrutores
de estatística. Queremos ter 99% de confiança em que nossa média amostral esteja a menos de
1,5 pontos de QI da verdadeira média. A média para esta população é obviamente superior a 100,
e o desviopadrão é provavelmente inferior a 15, porque se trata de um grupo com menor variação
do que um grupo selecionado aleatoriamente da população geral; portanto, se tomamos σ =15,
estaremos sendo conservadores, por utilizarmos um valor que dará um tamanho de amostra no
mínimo tão grande quanto necessário. Suponha σ =15 e determine o tamanho da amostra
necessário.
Dado do problema:
α = 0,01 (99% de confiança) Z = 2,57
35
d = 1,5 .
σ = 15 , aplicando a equação abaixo, obtemos:
Devemos, portanto, obter uma amostra de ao menos 661 instrutores de estatística, selecionadas
aleatoriamente. Com tal amostra teremos 99% de confiança em que a média amostral difira em
menos de 1,5 da verdadeira média populacional.
5. Uma assistente social deseja saber o tamanho da amostra (n) necessário para determinar a
proporção da população atendida por uma Unidade de Saúde, que pertence ao município da
Matola. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é
desconhecido. Ela quer ter 90% de confiança que sua o erro máximo de estimativa (d) seja de ±
5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?
Dados do problema:
α = 0,1 (90% de confiança) Z = 1,645
d = 5% = 0,05 , aplicando a equação abaixo, obtemos:
Devemos, portanto, obter uma amostra de 271 pessoas para determinar a proporção da população
atendida na Unidade de Saúde, que se origina do município da Matola.
6. Baseado nos dados do exercício 5, utilize uma margem de erro maior, como ± 0,20 (20%) e
determine qual seria o tamanho da amostra necessário quando o nível de confiança é 90% e
quando é 95%.
Devemos, portanto, obter uma amostra de 17 pessoas para determinar a proporção da população
atendida na Unidade de Saúde, que se origina do município da Matola.
36
d = 20% = 0,20 , aplicando a equação abaixo, obtemos:
Devemos, portanto, obter uma amostra de 25 pessoas para determinar a proporção da população
atendida na Unidade de Saúde, que se origina do município da Matola.
a) Calcular o tamanho da amostra para estimar a média, sendo d = 2.000,00 Mt, σ = 7.000,00 Mt e
(1 – α)% = 95,5%.
Dados do problema:
(1 – α)% = 95,5%, Z = 2
d = 2.000,00 Mt
σ = 7.000,00 Mt aplicando a equação abaixo, obtemos:
b) Retirar uma amostra aleatória simples, considerando o tamanho amostral obtido no item anterior.
37
Utilizando uma tabela de números aleatórios obtemos os seguintes números para uma seleção de
34 números:
57, 28, 92, 90, 80, 22, 56, 73, 53, 18, 53, 03, 27, 05, 40, 54, 71, 61, 82, 89, 00 62, 94, 44, 97, 39,
60, 03, 41, 77, 28, 74, 00, 05, 62, 72, 80, 59, 38, 91, 01, 24, 44, 99, 92, 08, 58.
29, 34, 15, 26, 04, 16 18, 13, 10, 05, 13, 17, 18, 07, 14, 11, 21 36, 32, 17, 05, 12, 21, 30, 14, 17,
22, 15, 20, 26, 25, 30, 17, 09.
Dados do problema:
(1 - α)% = 95,5% e Z = 2
pˆ = qˆ = 0,5
d = 0,05 , aplicando a equação abaixo, obtemos:
38
9. Sendo pˆ = qˆ = 0,5 , população de 200.000, d = 0,05 e (1 - α)% = 95,5%, determinar o tamanho
amostral. Comparar com o resultados obtido no exercício 8.
Dados do problema:
(1 - α)% = 95,5% e Z = 2
N = 200.000
pˆ = qˆ = 0,5
d = 0,05 , aplicando a equação abaixo, obtemos:
Comparando os resultados, verifica-se que o cálculo do tamanho amostral para uma população de
200.000 dá, aproximadamente, o mesmo resultado, se considerarmos a população infinita.
10. Qual é o tamanho da amostra que o Departamento de Trânsito da cidade de Maputo deve tomar
para estimar a porcentagem de semáforos defeituosos, se o objetivo é ter 95,5 % de confiança em
não errar mais de 3 %.
Dados do problema:
(1 - α)% = 95,5 % e Z = 2
pˆ = qˆ = 0,5
d = 3% = 0,03 , aplicando a equação abaixo, obtemos:
11. Estudos anteriores mostram que o desvio padrão da altura dos homens que estudam na Faculdade
de Educação é de 10 cm. Querendo estimar a atura média de todos os homens dessa Faculdade,
com tolerância de 3cm e probabilidade de 0,955, quantas observações deverão ser utilizadas?
39
Dados do problema:
(1 - α)% = 95,5% e Z = 2
σ =10 cm
d = 3, aplicando a equação abaixo, obtemos:
12. Qual é o tamanho necessário da amostragem que um alfaiate deve usar se deseja estimar o tempo
médio que os fregueses levam ao trocador? Ele acha que o desvio padrão é de 3 minutos, com
base em amostras anteriores, e deseja estimar a média a menos de 1 minuto, usando um nível de
95,5%.
Dados do problema:
(1 - α)% = 95,5% e Z = 2
σ = 3cm
d = 1 , aplicando a equação abaixo, obtemos:
13. Na cidade de Maputo, há 10.000 árvores. Qual deve ser o tamanho da amostra que o
Departamento de Jardins precisa tomar para estimar a porcentagem de plantas que merecem
podas, se o objetivo é ter 99% de confiança de não errar mais de 3%?
Dados do problema:
N =10.000
(1 - α)% = 99% e Z = 2,57
pˆ = qˆ = 0,50
d = 3% = 0,03 , aplicando a equação abaixo, obtemos:
14. Segundo dados de uma pesquisa anterior, 40% dos alunos de certa escola são são camponeses.
Admita um erro de 2,5%, (1-a )% = 95,5%, para dimensionar tamanho de amostra de são
camponeses. Sabe-se que a escola tem 5.000 alunos matriculados.
Dados do problema:
N = 5.000
40
(1 - α)% = 95,5% e Z = 2
pˆ = 40% = 0,40
qˆ = (1- 0,4) = 0,60
d = 2,5% = 0,025 , aplicando a equação abaixo, obtemos:
15. 15) Um engenheiro encarregado do controle de qualidade deseja estimar a fração de artigos
defeituosos de um grande lote de lâmpadas. Com base em sua experiência, ele sabe que a fração
efetiva de lâmpadas defeituosas deve estar próxima de 0,2. Que tamanho deve ter uma amostra,
se ele desejar estimar a verdadeira fração de lâmpadas defeituosas com tolerância de 0,01, usando
um nível de confiança de 98%.
Dados do problema:
(1 - α)% = 98% e Z = 2,33
pˆ = 0,2
qˆ = (1- 0,2) = 0,8
d = 0,01, aplicando a equação abaixo, obtemos:
41
Unidade Didáctica 3:
3.1 Introdução
Os objetivos desta aula visam apresentar a você o processo de coleta, e análise de dados, os quais são
extremamente importantes tanto nas pesquisas de campo quanto nas pesquisas experimentais. Ao final
desta aula, você deverá esta apto a desenvolver métodos de observação da realidade, métodos de
experimentação, de coleta de dados, bem como a manipulação estatística de dados com sua exposição
a partir de gráficos e tabelas. Desta forma, você deverá saber como avaliar e interpretar criticamente
dados estatísticos e numéricos..
Esta unidade vai se debruçar sobre alguns do métodos estatísticos básicos de colecta e análise de
dados usados na Estatistica.
42
Objectivos da unidade 3
Objectivos da Unidade 3
43
Fontes de Informação e Recursos de
Aprendizagem
http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados
Não se deve coletar dados sem que antes se tenha definido claramente o problema ou situação
a ser enfrentada, bem como os objetivos com relação aos mesmos;
Os sistemas de medição (instrumento, operadores, método, meio) que serão utilizados devem
ser avaliados e ter capacidade de medição suficiente;
Os cálculos e leituras devem ser feitos com muita atenção para evitar distorções;
Devem ser utlizados métodos adequados para coleta de dados de acordo com o problema
estudado.
Uma amostra é uma parcela de uma população que pode conter informações sobre esta população.
Outra definição importante (para a escolha da técnica estatística e das interpretações dos resultados) é
a classificação dos dados.
44
3.3 Planeando a coleta de dados
Para estudarmos adequadamente uma população através de uma amostra, devemos planejar a coleta de
dados. Com este objetivo, formulamos algumas perguntas:
45
Construir uma metodologia para nos certificar de que todas as informações estão definidas;
Coletar os dados de forma consistente e honesta;
Certificar-se de que existe tempo suficiente para a coleta de dados;
Definir quais informações adicionais serão necessárias para estudos futuros, referências ou
reconhecimento.
Dado qualitativo nominal - Para o qual não existe nenhuma ordenação nas
possíveis realizações;
Dado qualitativo ordinal - Para o qual existe uma ordem em seus resultados.
Exemplo 1.3.1: Uma indústria de calculadoras eletrônicas, preocupada com vários defeitos que um de
seus produtos vem apresentando, fez um levantamento e constatou os seguintes problemas:
Este é um típico exemplo de dados qualitativos nominais. Nesta situação, para cada item inspecionado,
existe uma variável T que representa o tipo de defeito encontrado. Portanto, essa variável T pode assumir
os valores: T = A, T = B, ... ,T = G. Logo, por exemplo, para uma calculadora com defeito na cobertura
plástica, temos que T = A. A seguir, temos uma Tabela com os valores observados.
46
E 25
F 3
G 7
Neste exemplo, todos os defeitos apresentam o mesmo nível de severidade e portanto, não apresentamos
uma ordem entre os atributos (defeitos). Neste caso, temos um exemplo de dados qualitativos nominal.
Exemplo 1.3.2: Em um concurso público foram contabilizados os números de pessoas inscritas segundo
os níveis de escolaridade: fundamental completo, médio completo, superior completo e pós-graduação
completa. Segue abaixo a Tabela com os valores observados.
Neste exemplo, temos um ordem natural entre os atributos (nível de escolaridade) e consequentemente,
temos um exemplo de dados qualitativos ordinais.
Dados quantitativos
Neste caso, a característica observada assume valores numéricos que podem ser classificados em
"discretos" ou "contínuos".
Exemplo 1.3.3: Em um hospital, foram contabilizados o número de pessoas com diabetes em 20 grupos
de 1000 pessoas cada. Neste caso, obtemos os seguintes dados: 10, 12, 9, 11, 10, 8, 9, 10, 7, 10, 8, 9, 9, 10,
10, 11, 9, 11, 10, 10. Um possível resumo dos dados é desenvolvido na Tabela a seguir
47
12 / 1
Portanto, a variável "número de pessoas com diabetes" assume valores discretos, isto é, inteiros: ...,7,8,9,...
Exemplo 1.3.4: Numa fábrica de motores elétricos, o gerente de produção precisa avaliar o problema de
ruído excessivo do motor. Uma das possíveis causas está associada com variações no diâmetro do eixo.
Assim, o gerente de produção mediu o diâmetro do eixo de 200 motores e o resultado está apresentado na
Tabela a seguir. Os valores estão em milésimos de milímetros.
Podemos fazer a apuração considerando intervalos de medidas, como apresentado na Tabela a seguir
48
[4,6;4,8) /////////.../// 31
[4,8;5,0) //////////...////// 66
[5,0;5,2) //////////...///// 35
[5,2;5,4) //////////...// 25
[5,4;5,6) //////////// 11
[5,6;5,8) //// 4
Ao estabelecermos intervalos de classes, estamos admitindo que o eixo pode assumir qualquer valor entre
o limite inferior (inclusive) e o limite superior (exclusive).
Nº de
Nível escolaridade inscritos
Fundamental 451
Médio 627
Superior 292
Pós-graduação 95
Então, o gráfico de barras correspondente seria um gráfico onde os retângulos correspondentes a cada
nível de instrução teria a altura correspondente ao número de inscritos com o respectivo grau de
escolaridade. Podemos resolver este problema utilizando o software Action. O resultado é o seguinte
49
TAREFAS
Tarefas
a) Média Aritmética
b) Mediana
c) Moda
50
5. Para o execício anterior calcule:
a) Média Aritmética
b) Mediana
c) Moda
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
Graus Nº de Estudantes Fa
[53-59[ 2
[59-65[ 12
[65-71[ 10
[71-77[ 23
[77-83[ 14
[83-89[ 10
[89-95[ 5
[95-101[ 4
Total 80
a) O maior grau;
b) O menor grau;
c) A amplitude total;
51
e) Os graus dos cinco estudantes mais atrasados;
52
9. Os inquéritos realizados em 20 residências de diversas universidades de um determinado
país revelaram os seguintes valores para o número de estudantes de um determinado curso
por residência:
53
Auto-Avaliação
Auto-Avaliação
1. As taxas de juros recebidas por 10 ações durante um certo período foram (medidas em
porcentagens) 2,59; 2,64; 2,60; 2,62; 2,57; 2,61; 2,50; 2,63; 2,64. Calcule a média, a mediana, o
desvio padrão, a variância, valor mínimo, valor máximo, os quartis Q1 e Q3, assimetria e curtose.
2. Para facilitar um projeto de ampliação da rede de esgoto de uma certa região de uma cidade, as
autoridades tomaram uma amostra de tamanho 50 dos 270 quarteirões que compõem a região e
foram encontrados os seguintes números de casas por quarteirão:
b) E a moda?
54
5. Foram contabilizados o número de pessoas que foram atendidas em um dia em diversas áreas de
um hospital. Os resultados obtidos podem ser encontrados na tabela abaixo. Construa um gráfico
de barras correspondente.
6. Um hospital tem o interesse em determinar a altura média dos pacientes de uma determinada área
e relacioná-la com a incidência de determinada anomalia ortopédica. Foram selecionados 80
pacientes e as alturas (em m) podem ser encontradas na tabela abaixo. Construa a tabela de
distribuição de frequências por intervalos de classes e o histograma correspondente.
55
7. Em um hospital foram coletados os salários (em salários mínimos) de 36 funcionários. Os
resultados estão dispostos na tabela abaixo. Construa a distribuição de frequências em intervalos
de amplitude 2 e o histograma correspondente.
56
Chave de Correção
Chave de Correção
Xi fi fr % Fa Fr % ci ci.fi
[0-1[ 7 8,6 7 8,6 0,5 3,5
[1-2[ 8 9,8 15 18,4 1,5 12
[2-3[ 5 6,2 20 24,6 2,5 12,5
[3-4[ 0 - 20 24,6 3,5 0
[4-5[ 9 11,1 29 35,7 4,5 40,5
[5-6[ 23 28,4 52 64,1 5,5 126,5
[6-7[ 12 14,8 64 78,9 6,5 78
[7-8[ 0 - 64 78,9 7,5 0
[8-9[ 12 14,8 76 93,7 8,5 102
[9-10[ 5 6,2 81 100 9,5 47,5
Total 81 100 81 100 422,5
Xi fi fr % Fa Fr %
[9-10[ 5 6,2 5 6,2
[8-9[ 12 14,8 17 21
[7-8[ 0 - 17 21
[6-7[ 12 14,8 29 35,8
[5-6[ 23 28,4 52 64,2
57
[4-5[ 9 11,1 61 75,3
[3-4[ 0 - 61 75,3
[2-3[ 5 6,2 66 81,5
[1-2[ 8 9,8 74 91,3
[0-1[ 7 8,6 81 100
Total 81 100 81 100
Xi. fi 422,5
5,21
n 81
R: A média Aritmética é de 5,21
b) Mediana
,
5 1 5,5
R: A Mediana é de 5,5
c) Moda
Mo = 5,66
fmo fant. mo
limo Ai .
2 . .
23 9 14
5 1 . 5 1 . 5,66
2 23 9 12 46 21
R: A Moda é igual a 5,66
58
0 25 18 25 18 0
1 20 14 45 32 20
2 21 15 66 47 42
3 15 11 81 58 45
4 13 9 94 67 52
5 12 9 106 76 60
6 10 7 116 83 60
7 9 6 125 89 63
8 7 5 132 94 56
9 6 4 138 98 54
10 2 2 140 100 20
Totatl 140 100 472
b) Mediana
N 140 N 2 140 2
70 71
2 2 2 2
3 3 6
Me 3
2 2
R: A Mediana é igual a 3
c) Moda
Mo = 0
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
59
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
K =7
a = = 6,28 ≈ 6
A = 97-53 = 44
Graus Nº de Estudantes Fa
[53-59[ 2 2
[59-65[ 12 14
[65-71[ 10 24
[71-77[ 23 47
[77-83[ 14 61
[83-89[ 10 71
[89-95[ 5 76
[95-101[ 4 80
Total 80 80
a) O maior grau; 97
b) O menor grau; 53
c) A amplitude total;R=xmax. –xmin.= 97-53 = 44
d) Os graus dos cinco estudantes mais adiantados; 94,95,95,96,97
e) Os graus dos cinco estudantes mais atrasados;53,57,59,60,60
f) O grau do estudante classificado em 10o lugar;88
g) Quantos estudantes receberam grau igual ou superior a 75; 44
h) Quantos estudantes receberam grau abaixo de 85: 63
i) Qual a percentagem de estudantes que receberam graus entre 65 e 85, inclusive e = 65%
j) Quais os graus que não apareceram. = 54,55,56, 58,64,70,91,92.
60
7. A tabela que se segue mostra a distribuição de frequências dos salários, em meticais, de
65 trabalhadores duma determinada empresa. Com referência a essa tabela, determinar:
.
Média: ̅ ∑ 23,5
61
Calculando o desvio padrão tem-se:
∑ ∙
∑
̅ 23,5 635 545,2 89,8
√ √89,8 9,48
62
Unidade Didáctica 4:
Estatística Inferencial
4.1 Introdução
Embora o cálculo das probabilidades pertença ao campo da Matemática, sua inclusão aqui se justifica
pelo fato da maioria dos fenômenos de que trata a Estatística ser de natureza aleatória ou
probabilística. Consequentemente, o conhecimento dos aspectos fundamentais do cálculo de
probabilidades é uma necessidade essencial para o estudo da Estatística Inferencial.
Procuramos resumir aqui os conhecimentos que julgamos necessários para termos um ponto de apoio
em nossos primeiros passos no caminho da Estatística Inferencial. Esses passos serão apresentados no
capítulo seguinte, que trata da conceituação de variável aleatória e das principais distribuições de
probabilidades de variáveis discretas e contínuas.
63
Objectivos da unidade 4
Objectivos da Unidade 4
64
Fontes de Informação e Recursos de
Aprendizagem
http://www.portalaction.com.br/content/1-introdu%C3%A7%C3%A3o-%C3%A0-probabilidade
Experimentos Determinísticos: São aqueles cujos resultados podem ser determinados antes de sua
realização.
Por exemplo: quanto tempo levará um carro para percorrer um trajeto de 200 km numa velocidade média
de 100 km/h? Não é necessário executar o experimento para determinar a resposta: 2 horas.
65
c. que empate.
Como vimos, o resultado final depende do acaso. Fenômenos como esses são chamados fenômenos
aleatórios e os experimentos associados a eles de experimentos aleatórios.
Experimentos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes,
apresentam resultados imprevisíveis.
Ao conjunto formado por todos os possíveis e diferentes resultados de um experimento aleatório dá-se o
nome de espaço amostral ou conjunto universo, representado por S.
- lançamento simultâneo de dois dados: S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), ...., (6,6)}
Cada um dos elementos de S que correspondem a um resultado recebe o nome ponto amostral. Assim:
4.4 Eventos
Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório.
66
Se E ⊂ S e E é um conjunto unitário, E é chamado evento elementar.
A = { 2, 4, 6} ⊂ S; logo, A é um evento de S
Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser definidos pelas
sentenças:
Dois ou mais eventos de um mesmo espaço amostral podem ser agrupados em operações de união e
interseção, assim definidas:
A operação União (∪) dos eventos A e B gera um novo evento formado pelos elementos comuns
e não comuns dos dois conjuntos, A e B.
A operação Interseção dos eventos A e B gera um novo evento formados apenas pelos elementos
comuns aos dois conjuntos, A e B.
67
A união de um evento A e seu complemento à é o próprio espaço amostral S; isto é, A ∪ à = S.
São mutuamente excludentes se sua interseção for vazia: A ∩ B = ∅, pois os dois eventos não têm
nenhum elemento em comum. Ex: Os eventos Ca e Co resultantes do lançamento de uma moeda.
4.5 Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de
S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável.
Onde:
68
EXEMPLOS
S = {Ca,Co} ⇒ n(S) = 2
A = {Ca} ⇒ n(A) = 1
Logo:
1
2
O resultado acima nos permite afirmar que, ao lançarmos uma moeda equilibrada, temos 50% de chance
de que apareça cara na face superior.
Temos:
S = {1, 2, 3, 4, 5, 6} ⇒ n(S) = 6
Logo:
3 1
6 2
Temos:
S = {1, 2, 3, 4, 5, } ⇒ n(S) = 6
B = {1, 2, 3, 4, 5, 6} ⇒ n(B) = 6
Logo:
6
1
6
69
- a probabilidade do evento C “obter o número 4 na face superior”.
Temos:
S = {1, 2, 3, 4, 5, 6} ⇒ n(S) = 6
C = { 4 }⇒ n(C) = 1
Logo:
1
6
Temos:
S = {1, 2, 3, 4, 5, 6} ⇒ n(S) = 6
B = ∅ ⇒ n(D) = 0
Logo:
0
0
6
Algumas Propriedades:
P S 1
∅ 0
0 ≤ P(E) ≤ 1
70
1
p+q=1⇒q=1–p
1 4
1 1 ⇒ q
5 5
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles é independe do resultado
obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao
produto das probabilidades de realização de cada um dos eventos.
Lançando dois dados honestos simultaneamente, qual a probabilidade de obtermos 1 no primeiro dado e 5
no segundo dado?
71
Solução
⇒p
Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente
exclusivos, já que, ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma
das probabilidades de que cada um deles se realize:
EXEMPLO
Solução:
p ep , então p p =
72
TAREFAS
Tarefas
a) par:
b) múltiplo de 5?
4. Joga-se um dado honesto. O número que ocorreu (isto é, da face voltada para cima) é o coeficiente
b da equação x2 + bx - 1 = 0.
Determine:
b) a probabilidade de essa equação ter raízes reais, sabendo-se que ocorreu um número ímpar.
6. Um baralho tem 12 cartas, das quais 4 são ases. Retiram‐se 3 cartas ao acaso. Qual a
probabilidade de haver pelo menos um ás entre as cartas retiradas?
8. Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas?
9. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma
carta do segundo. Qual a probabilidade da carta do primeiro baralho ser um rei e a do segundo ser
o 5 de paus?
10. Uma urna A contém: 3 bolas brancas, 4 bolas pretas, 2 verdes; uma urna B contém: 5 bolas
brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é
73
retirada de cada urna. Qual é a probabilidade das três bolas retiradas da primeira, segunda e
terceira urnas serem, respectivamente, branca, preta e verde?
11. Considere o experimento que consiste no lançamento de um dado perfeito (todas as seis faces têm
probabilidades iguais). Com relação a esse experimento, considere os seguintes eventos:
12. Um juiz de futebol possui três cartões no bolso. Um é todo amarelo, outro é todo vermelho e o
terceiro é vermelho de um lado e amarelo do outro. Num determinado lance, o juiz retira, ao
acaso, um cartão do bolso e mostra a um jogador. A probabilidade de a face que o juiz vê ser
vermelha e de a outra face, mostrada ao jogador, ser amarela é: a. 1/2 b. 2/5 c. 1/5 d. 2/3
e. 1/6
13. Os bilhetes de uma rifa são numerados de 1 a 100. A probabilidade de o bilhete sorteado ser maior
que 40 ou número par é: a. 60% b. 70% c. 80% d. 90% e. 50%
14. Num único lance de um par de dados honestos, a probabilidade de saírem as somas “múltiplo de
4” ou “primo” é: a. 1/3 b. 1/4 c. 1/5 d. 2/3 e. 2/5
15. Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um
baralho de 52 cartas?
17. Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saía com o dobro de
frequência da face 1, e que as outras faces saíam com a frequência esperada em um dado não
viciado. Qual a frequência da face 1?
18. Dois dados são lançados conjuntamente. Determine a probabilidade da soma ser 10 ou maior que
10.
74
Auto-Avaliação
Auto-Avaliação
1. Considerando o experimento: lançar uma moeda comum e anotar o resultado, lançando em seguida um
dado comume anotando o resultado como um par (moeda, dado), descrever:
a) o espaço amostral S;
2. Fazendo duas retiradas consecutivas (com reposição) de bolas de uma urna que contém duas bolas
brancas, três bolas verdes e quatro bolas amarelas, qual será o espaço amostral?
3. Retirando, de uma só vez, duas bolas de uma urna que contém duas bolas brancas, três bolas verdes e
quatro bolas amarelas, qual será o espaço amostral?
a) o espaço amostral S;
a) o espaço amostral S;
75
c) o evento B ={os resultados são iguais};
2. Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ..., 49, 50. Determine a
probabilidade de:
b) a soma ser 9;
6. Uma carta é retirada ao acaso de um baralho de 52 cartas. Qual a probabilidade de que a carta retirada
seja uma dama ou uma carta de copas?
76
7. No lançamento de dois dados, qual a probabilidade de se obter um par de pontos iguais?
10. Duas cartas são retiradas ao acaso de um baralho de 52 cartas. Calcule a probabilidade de se obterem:
a) dois valetes;
a) três homens;
a) três caras;
d) nenhuma cara;
77
d) sair um 6 pelo menos.
78
Chave de Correção
Chave de Correção
S = { (ca, ca, ca); (ca, ca, co); (ca, co, ca); (ca, co, co); (co, ca, ca); (co, ca, co); (co, co, ca); (co, co, co)}
b) Duas retiradas consecutivas e sem reposição de bolas de uma urna que contém 3 bolas brancas, 2
bolas azuis e 4 bolas vermelhas.
Solução
Ω = {(b, b), (b, a), (b, v), (a, b), (a, a), (a, v), (v, b), (v, a), (v, v)}
c) par:
Solução
Temos 7 possibilidades de escolha do primeiro algarismo dos números e seis escolhas do segundo
algarismo (os números não podem ter algarismos repetidos). Assim, temos 7 . 6 = 42 caso possíveis.
Para o número ser par deverá terminar (unidade) em 2, 4 ou 6. Devemos ter 3 possibilidades (2, 4, 6)
associadas a 6 possibilidades (não podem ter algarismos repetidos). Assim, temos 3 . 6 = 18 casos
favoráveis. Logo a probabilidade será:
18 3
42 7
d) múltiplo de 5?
Solução
Casos possíveis = 42
Casos favoráveis = 1 x 6 = 6
6 1
ú 5
42 7
79
21. Em um lote de 12 peças, 4 são defeituosos. Sendo retirada uma peça, calcule:
Solução
4 1
ça defeituosa
12 3
Solução
8 2
ça não se defeituosa
12 3
Ou
Sendo este evento e o anterior complementares, temos :
ça não se defeituosa 1 ça defeituosa
1 3 1 2
ça não se defeituosa 1
3 3 3
22. Joga-se um dado honesto. O número que ocorreu (isto é, da face voltada para cima) é o coeficiente
b da equação x2 + bx - 1 = 0.
Determine:
Solução
Para que esta equação x2 + bx + 1, com b ∈ {1, 2, 3, 4, 5, 6}, tenha raízes reais, o discriminante
(Δ) dessa equação deve ser não-negativo. Como Δ = b2 – 4, então os valores possíveis de b são 2,
3, 4, 5 e 6, ou seja, existem 5 possibilidades para b.
1 1 1 1 1 5
equação ter raízes reais
6 6 6 6 6 6
d) a probabilidade de essa equação ter raízes reais, sabendo-se que ocorreu um número ímpar.
Solução
Sabendo que ocorreu um número ímpar (ou seja, 3 ou 5), temos do item (a) que a probabilidade
pedida é
80
1 1 2
equação ter raízes reais 1/3
6 6 6
Solução
S = O evento é formado pelos elementos A={(1, 4), (2, 3), (3, 2) e (4, 1)}. Como o número de
elementos de S é 36, temos:
4 1
P a soma é igual a 5
36 9
24. Um baralho tem 12 cartas, das quais 4 são ases. Retiram‐se 3 cartas ao acaso. Qual a
probabilidade de haver pelo menos um ás entre as cartas retiradas?
Solução
Num baralho padrão temos 52 cartas, como mostrado:
♥ 2 3 4 5 6 7 8 9 10 J Q K A
♦ 2 3 4 5 6 7 8 9 10 J Q K A
♣ 2 3 4 5 6 7 8 9 10 J Q K A
♠ 2 3 4 5 6 7 8 9 10 J Q K A
12 cartas, das quais 4 são ases.
Espaço amostral = U ; n(U) = 12 . 11. 10 = 1.320
Evento A = sair pelo menos um ás; Evento Acomplementar (Ã) = não sair ás.
336 14
Acomplementar
1.320 55
14
A 1 Ã 1
55
55 14 41
A
55 55
25. Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 52
cartas?
Solução
13 copas: ♥ 2 3 4 5 6 7 8 9 10 J Q K A
13 ouros: ♦ 2 3 4 5 6 7 8 9 10 J Q K A
81
13 naipe de paus: ♣ 2 3 4 5 6 7 8 9 10 J Q K A
13 espadas: ♠ 2 3 4 5 6 7 8 9 10 J Q K A
26. Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas?
Solução
4 1
de sair um rei
52 13
27. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma
carta do segundo. Qual a probabilidade da carta do primeiro baralho ser um rei e a do segundo ser
o 5 de paus?
Solução
P=1/13.1/52=1/676
28. Uma urna A contém: 3 bolas brancas, 4 bolas pretas, 2 verdes; uma urna B contém: 5 bolas
brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é
retirada de cada urna. Qual é a probabilidade das três bolas retiradas da primeira, segunda e
terceira urnas serem, respectivamente, branca, preta e verde?
Solução
P A P B eP C
82
1 1 4 1
P ABC
3 4 9 27
29. Considere o experimento que consiste no lançamento de um dado perfeito (todas as seis faces têm
probabilidades iguais). Com relação a esse experimento, considere os seguintes eventos:
Solução
Temos as probabilidades:
p I =1/2 ; p II ; p III ; p I ∩ II ; p II ∩ III ;
Resposta a)
Solução
Como P(II∩III) ≠ P(II) . P(III), os eventos II e III não são independentes entre
Solução
Solução
83
30. Um juiz de futebol possui três cartões no bolso. Um é todo amarelo, outro é todo vermelho e o
terceiro é vermelho de um lado e amarelo do outro. Num determinado lance, o juiz retira, ao
acaso, um cartão do bolso e mostra a um jogador. A probabilidade de a face que o juiz vê ser
vermelha e de a outra face, mostrada ao jogador, ser amarela é: a. 1/2 b. 2/5 c. 1/5 d. 2/3
e. 1/6
Solução
31. Os bilhetes de uma rifa são numerados de 1 a 100. A probabilidade de o bilhete sorteado ser maior
que 40 ou número par é: a. 60% b. 70% c. 80% d. 90% e. 50%
Solução
n(U) = 100
P A e B
N(A ∩B) = 30 ...... existem 60 números maiores que 40 e a metade deles, 30, são pares ⇒
=> P A ∩ B
P A∪B P A ∩ 80%
32. Num único lance de um par de dados honestos, a probabilidade de saírem as somas “múltiplo de
4” ou “primo” é: a. 1/3 b. 1/4 c. 1/5 d. 2/3 e. 2/5
Solução
84
P A ; B P A∩B 0
33. Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um
baralho de 52 cartas?
Solução
P A =1/4 e P B =1/4
P A∪B 1/2
Solução
A probabilidade de se ter um número não inferior a 5 é a probabilidade de se obter 5 ou 6.
Assim se:
P A e P B
P A∪B 1/3
85
35. Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saía com o dobro de
frequência da face 1, e que as outras faces saíam com a frequência esperada em um dado não
viciado. Qual a frequência da face 1?
Solução
2
3x x 1/9
6
P(1) = 1/9
36. Dois dados são lançados conjuntamente. Determine a probabilidade da soma ser 10 ou maior que
10.
Solução
A={ (4, 6), (5, 5), (6, 4)}, => n(A) =3; => P A
86
Unidade Didáctica 5:
5.1 Introdução
A estatística descritiva pode ser considerada como um conjunto de técnicas analíticas utilizado para
resumir o conjunto dos dados recolhidos numa dada investigação, que são organizados, geralmente,
através de números, tabelas e gráficos. Pretende proporcionar relatórios que apresentem informações
sobre a tendência central e a dispersão dos dados. Para tal, deve-se evidenciar: valor mínimo, valor
máximo, soma dos valores, contagens, média, moda, mediana, variância e desvio padrão.
Inferência estatística é o processo pelo qual é possível tirar conclusões acerca da população usando
informação de uma amostra, constituindo questão central, saber como usar os dados da amostra para
obter conclusões acerca da população. “ A estatística inferencial permite a generalização, a uma
população, de informações obtidas a partir de uma amostra representativa e a tomada de decisão”
87
Objectivos da unidade 5
Objectivos da Unidade 5
88
Fontes de Informação e Recursos de
Aprendizagem
http://www.ebah.com.br/content/ABAAAf55QAB/variaveis-aleatorias-discretas-continuas
http://www.professores.uff.br/patricia/images/stories/arquivos/2_vadiscreta.pdf
Portanto, variáveis aleatórias são variáveis numéricas às quais iremos associar modelos probabilísticos.
Veremos que uma variável aleatória tem um numero para cada resultado de um experimento e que uma
distribuição de probabilidades associa uma probabilidade a cada resultado numérico de um experimento.
89
Exemplos:
S={(c,c),(c,r),(r,c),(r,r)}
Empregamos a termo variável aleatória para descrever o valor que corresponde ao resultado de
determinado experimento. As variáveis aleatórias também podem ser discretas ou continuas e temos as
seguintes definições:
Variáveis aleatórias discretas – Admite um número finito de valores ou tem uma quantidade enumerável
de valores.
Variáveis aleatórias contínuas – Pode tomar um número infinito de valores, e esses valores podem ser
associados a mensurações em uma escala contínua.
X, p X , i 1, 2, … . . , n
90
5.4 Função de densidade de probabilidade.
É a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento
correspondente, isto é:
Existem características numéricas que são muito importantes em uma distribuição de probabilidades de
uma variável aleatória discreta. São os parâmetros das distribuições, a saber:
Esperança matemática (ou simplesmente média) – E (x) – é um número real, é também uma média
aritmética;
Variância – VAR (x) – é a medida que dá o grau de dispersão (ou de concentração) de probabilidade em
torno da média. O fato de conhecermos a média de uma distribuição de probabilidades já nos ajuda
bastante, porém, precisamos de uma medida que nos dê o grau de dispersão de probabilidade em torno
dessa média.
Um cuidado muito grande deve ser tomado ao se escolher uma distribuição de probabilidade que descreve
corretamente as observações geradas por um experimento. Primeiramente analisaremos as distribuições
discretas de probabilidades mais importantes e que descrevem as variáveis aleatórias comumente
encontradas na prática. Por último analisaremos algumas distribuições de v.a. contínuas de importância
similar.
91
5.7.1 Distribuição Uniforme.
É a mais simples de todas as distribuições discretas de probabilidade. É aquela na qual a v.a. assume todos
os seus valores com a mesma probabilidade. Tal distribuição é chamada distribuição uniforme. A
distribuição discreta uniforme é dada por:
onde x é um dos possíveis valores da v.a. X. Utilizamos aqui P(x,k) ao invés de p(x) para indicar que a
distribuição uniforme depende do parâmetro k. Este é o caso mais simples de v.a. discreta, onde cada
possível valor ocorre com a mesma probabilidade.
Definição: A variável aleatória discreta X, assumindo os valores x1,x2, ..., xn , tem distribuição uniforme ,
se e somente se,
Média:
Variância:
92
5.7.3 Distribuição Binomial.
Uma variável aleatória tem distribuição binomial quando o experimento ao qual está relacionada apresenta
apenas dois resultados (sucesso ou fracasso). Este modelo fundamenta-se nas seguintes hipóteses:
Define-se a Variável X que conta o número de sucessos nas n realizações do experimento. (X pode
assumir os valores 0, 1, 2, 3,..., n.).
Para X = 1, uma seqüência do tipo: 1000...0; 01000...0; 001000...0; será n seqüência, cada uma com um
único sucesso e n sequência, cada uma com um único sucesso e n-1 fracassos:
Para X = x, tem-se x sucessos e (n-x) fracassos, correspondendo às seqüências com x algarismos 1 e n-x
zeros. Cada sequência terá probabilidade e como há sequências distintas, tem-se:
Média:
93
Variância:
• Carros que passam por um cruzamento por minuto, durante certa hora do dia;
Média:
Variância:
OBS: Muitas vezes, no uso da binomial, acontece que n é muito grande e p é muito
94
6.5 Distribuição Geométrica.
Consideremos tentativas sucessivas e independentes de uma mesmo experimento aleatório. Cada tentativa
admite sucesso com probabilidade p e fracasso com probabilidade q; p + q = 1.
P (X = 2) = P (F ∩ S) = q·p;
E assim sucessivamente.
Média:
Variância:
Consideremos uma população com N elementos, dos quais r tem uma determinada característica (a
retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição, uma
amostra de tamanho n.
95
Para sabermos a função de probabilidade, consideramos que podemos tirar amostras sem reposição.
Os sucessos na amostra podem ocorrer com maneiras e fracassos de modos. Logo:
, .
Média.
E (X) = np
Variância.
96
TAREFAS
Tarefas
5. Os comprimentos das peças produzidas por determinada máquina têm distribuição normal com
uma média de 172 mm e desvio padrão de 5 mm. Calcule a probabilidade de uma amostra
aleatória simples de 16 peças ter comprimento médio
(a) entre 169 mm e 175 mm;
(b) maior que 178 mm;
(c) menor que 165 mm.
6. Uma amostra de tamanho n = 18 é extraída de uma população normal com média 15 e desvio
padrão 2,5. Calcule a probabilidade de que a média amostral
(a) esteja entre 14,5 e 16,0;
(b) seja maior que 16,1.
7. Qual deverá ser o tamanho de uma amostra aleatória simples a ser retirada de uma população
N(150; 132) para que Pr(|X μ| < 6, 5) = 0, 95?
8. Definimos a variável e = X −μ como sendo o erro amostral da média, onde X é a média de uma
amostra de tamanho n de uma população com média μ e desvio padrão σ.
(a) Determine E(e) e V ar(e).
(b) Se a população é normal com σ = 20, que proporção das amostras de tamanho 100 terá erro
amostral absoluto maior do que 2 unidades?
(c) Neste caso, qual deve ser o valor de δ para que Pr(| e | > δ)=0, 01?
(d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam
inferiores a 1 unidade?
9. O fabricante de uma lâmpada especial afirma que o seu produto tem vida média de 1600 horas,
com desvio padrão de 250 horas. O dono de uma empresa compra 100 lâmpadas desse
fabricante. Qual é a probabilidade de que a vida média dessas lâmpadas ultrapasse 1650 horas?
10. A máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com
média μ e desvio padrão 10 g.
(a) Em quanto deve ser regulado o peso médio μ para que apenas 10% dos pacotes tenham
menos do que 500 g?
(b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes
escolhidos ao acaso seja inferior a 2 kg?
11. Uma moeda é lançada 50 vezes, com o objetivo de se verificar sua honestidade. Se ocorrem 36
caras nos 50 lançamentos, o que podemos concluir?
12. A divisão de inspeção do Departamento de Pesos e Medidas de uma determinada cidade está
interessada em calcular a real quantidade de refrigerante que é colocada em garrafas de 2 litros,
no setor de engarrafamento de uma grande empresa de refrigerantes. O gerente do setor de
engarrafamento informou à divisão de inspeção que o desvio padrão para garrafas de 2 litros é
de 0,05 litro. Uma amostra aleatória de 100 garrafas de 2 litros, obtida deste setor de
97
engarrafamento, indica uma média de 1,985 litro. Qual é a probabilidade de se obter uma média
amostral de 1,985 ou menos, caso a afirmativa do gerente esteja certa? O que se pode concluir?
98
Auto-Avaliação
Auto-Avaliação
7. Seja X a variável aleatória que representa a pressão sanguínea. Suponhamos que a variável tem
distribuição normal de média µ e desvio padrão σ=8. Suponha que se toma uma amostra de 100
indivíduos cuja média é X =123. Determine um intervalo com 90% de confiança para a média.
8. Seja X a variável que representa a taxa normal de glicose no sangue. Suponhamos que essa
distribuição é normal com desvio padrão σ=6 mg/100ml de sangue. Determine o intervalo de
confiança com 95% de confiança para µ, sabendo que numa amostra aleatória de 25 indivíduos se
encontrou uma média X = 5 mg/100ml.
9. Foi determinada a taxa de glicose em 8 ratos, tendo sido encontrados os seguintes valores: 100;
87,5; 110; 99,5; 92,5; 94; 100; 100. Calcule, com base nestes dados, o intervalo de 95% de
confiança para a média da população.
10. Seja X a variável que representa a taxa de colesterol no plasma sanguíneo. A média desta variável
é µ e o desvio padrão é σ=20 mg/100ml de plasma. Qual o intervalo de confiança para o
parâmetro 100 desconhecido µ, quando foi recolhida uma amostra de 25 indivíduos para os quais
a média encontrada foi de 198 mg/100ml.
11. Seja X uma variável aleatória que representa a taxa normal de colesterol, supondo que com base
numa amostra de 25 indivíduos um investigador obteve a média X = 198 mg/100ml e o desvio
padrão s = 30 mg/100ml. a) Determine um intervalo de confiança a 90% para µ. b) Suponha agora
que eram 50 indivíduos. Quais os limites do intervalo de confiança?
12. Suponha a seguinte amostra proveniente de uma população com variância s2 = 64: 1, 20, 18, 19,
19, 15, 31, 12. Determine os intervalos de confiança de 95% e de 99% para µ
13. Uma amostra de 100 votantes escolhidos aleatoriamente de um distrito indicaram que 55% eram a
favor de um determinado candidato. Encontrar intervalos de confiança a 95% e 99% para a
proporção de todos os votantes nesse candidato.
14. Com base no problema anterior, qual o tamanho que a amostra deveria ter para se ter 95% e 99%
de confiança que o candidato seria eleito?
99
15. Em 40 lançamentos de uma moeda foram obtidas 24 caras. Encontrar um intervalo de confiança a
95% e a 99% para a proporção de caras que seriam encontradas num lançamento um número
infinito de vezes da moeda.
16. Um empacotador de sacos de 50 Kg de sal seleccionou uma amostra de 30 sacos cheios nas
últimas 24 horas. Cada saco é cuidadosamente cheio, tendo sido encontradas as seguintes
estatísticas: X = 50,22 Kg s2 = 0,24 Kg2 s = 0,49 Kg.
100
Chave de Correção
Chave de Correção
1. Os comprimentos das peças produzidas por determinada máquina têm distribuição normal com
uma média de 172 mm e desvio padrão de 5 mm. Calcule a probabilidade de uma amostra
aleatória simples de 16 peças ter comprimento médio
(a) entre 169 mm e 175 mm;
(b) maior que 178 mm;
(c) menor que 165 mm.
Solução
2. Uma amostra de tamanho n = 18 é extraída de uma população normal com média 15 e desvio
padrão 2,5. Calcule a probabilidade de que a média amostral
101
(a) esteja entre 14,5 e 16,0;
(b) seja maior que 16,1.
Solução
3. Qual deverá ser o tamanho de uma amostra aleatória simples a ser retirada de uma população
N(150; 132) para que Pr(|X μ| < 6, 5) = 0, 95?
Solução
102
4. Definimos a variável e = X −μ como sendo o erro amostral da média, onde X é a média de uma
amostra de tamanho n de uma população com média μ e desvio padrão σ.
(a) Determine E(e) e V ar(e).
(b) Se a população é normal com σ = 20, que proporção das amostras de tamanho 100 terá erro
amostral absoluto maior do que 2 unidades?
(c) Neste caso, qual deve ser o valor de δ para que Pr(| e | > δ)=0, 01?
(d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam
inferiores a 1 unidade?
Solução
103
Solução
Solução
104
5. O fabricante de uma lâmpada especial afirma que o seu produto tem vida média de 1600 horas,
com desvio padrão de 250 horas. O dono de uma empresa compra 100 lâmpadas desse fabricante.
Qual é a probabilidade de que a vida média dessas lâmpadas ultrapasse 1650 horas?
Solução
6. A máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com
média μ e desvio padrão 10 g.
105
(a) Em quanto deve ser regulado o peso médio μ para que apenas 10% dos pacotes tenham menos
do que 500 g?
(b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes
escolhidos ao acaso seja inferior a 2 kg?
Solução R:(a)
Então, na densidade normal padrão, à esquerda da abscissa temos que ter uma área
(probabilidade) de 0,10. Logo, essa abscissa tem que ser negativa. Usando a simetria da densidade
normal temos as seguintes equivalências:
106
Solução (b)
Sejam X1,X2, X3, X4 os pesos dos 4 pacotes da amostra. Queremos que ∑ X 2000g, isso é
equivalente a X 500. Logo,
Com a máquina regulada para 512,8g, há uma probabilidade de 0,00523 de que uma amostra de 4
pacotes apresente peso médio inferior a 500g. Note que com um pacote apenas, essa probabilidade
é de 10%. Por isso, as inspeções de controle de qualidade são sempre feitas com base em amostras
de tamanho n > 1.
7. Uma moeda é lançada 50 vezes, com o objetivo de se verificar sua honestidade. Se ocorrem 36
caras nos 50 lançamentos, o que podemos concluir?
Solução
Neste caso, a população pode ser representada por uma variável de Bernoulli X com parâmetro p,
isto é, X assume o valor 1 com probabilidade p na ocorrência de cara e assume o valor 0 com
probabilidade 1 − p na ocorrência de coroa. Para uma variável Bernoulli, temos que E(X) = p e V
ar(X) = p(1 − p). Como são feitos 50 lançamentos, o tamanho da amostra é 50 (n grande!) e, pelo
107
teorema limite central, X é aproximadamente normal com média E(X) = p e variância Var(X)
= . Suponhamos que a moeda seja honesta, isto é, que p = 1/2. Nestas condições, qual é a
probabilidade de obtermos 36 caras em 50 lançamentos? Com a hipótese de honestidade da
moeda, o teorema limite central nos diz que
108
Unidade Didáctica 6:
Estimação de parámetros
6.1 Introdução
A inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e testes de
hipóteses. Como exemplo de um problema de estimação de parâmetros, suponha que um engenheiro
de estruturas esteja analisando a resistência à tensão de um componente usado em um chassi de
automóvel. Uma vez que a variabilidade da resistência à tração está naturalmente presente entre os
componentes individuais, devido as diferenças nas bateladas da matéria-prima nos processos de
fabricação e nos procedimentos de medidas (por exemplo), o engenheiro está interessado na estimação
da resistência média à tração dos componentes. Na prática o engenheiro usará dados da amostra para
calcular um número que é, de algum modo, um valor razoável (ou tentativa) da média verdadeira. Este
número é chamado de estimativa..
109
Objectivos da unidade 6
Objectivos da Unidade 6
110
Fontes de Informação e Recursos de
Aprendizagem
http://www.portalaction.com.br/content/23-outras-estat%C3%ADsticas-descritivas
http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados
6.2 Estimadores
Como já comentamos, a inferência estatística tem por objetivo extrair informações sobre uma população a
partir de dados amostrais. Neste contexto, uma das etapas principais da obtenção dessas informações é a
estimação dos parâmetros. Considere o seguinte exemplo.
Considere o problema sobre determinar, em uma população, a proporção de pessoas acima de 40 anos que
sofrem de artrite. Vamos imaginar que, de uma amostra de 200 pessoas acima de 40 anos, foi verificado
que 12 pessoas têm artrite.
111
Desta forma, uma estimativa natural para a proporção seria de 12/200 = 6%. É claro que, neste caso,
estamos supondo que a amostra representa a população e claro que, caso retirássemos outra amostra da
população, possivelmente obteríamos uma estimativa diferente da anterior.
Considerando o caso geral em que temos uma amostra de n elementos, podemos definir a
seguinte variável aleatória:
tem distribuição binomial com parâmetros n e e representa o total de indivíduos na amostra que
possuem artrite. Desta forma, um possível estimador para a proporção é dado por
Desta forma, podemos concluir que, em média, o estimador é "igual" (está bastante próximo) de e
então, dizemos que o é um estimador não viciado (ou não viesado) de . Além disso, para amostras
grandes, a diferença entre o valor real e o estimador tende a ser pequena, já que, quando
, e, neste caso, dizemos que é um estimador consistente de p.
112
A seguir, verificaremos algumas propriedades das estatísticas utilizadas na inferência e métodos para
calcular estimadores, entre eles os métodos de momentos, de mínimos quadrados e de máxima
verossimilhança. Em seguida, estudaremos propriedades interessantes de estimadores.
Conhecendo-se uma amostra em concreto, é possível estimar os valores dos seus parâmetros
caracterizadores através de métodos probabilísticos. Por exemplo, suponhamos que numa fábrica
produtora de açúcar se pretende averiguar se o peso dos pacotes produzidos está, em média, dentro das
normas de qualidade exigíveis. Na impossibilidade de medição do peso de todos os pacotes, pela
morosidade e dispêndio de recursos que tal implicaria, a estatística permite que, a partir da observação de
uma única amostra, seja possível inferir entre que valores varia o peso médio com um grau de confiança
ou probabilidade elevado. Assim, ao recolher um determinado número de pacotes da produção total
aleatoriamente, é possível calcular o peso médio de acordo com as técnicas de estatística descritiva
apreendidas atrás. Claro que nada nos garante que esse valor coincide com o valor do parâmetro da
população em estudo. De facto, é até provável que não coincida e, mais, se recolhermos outro conjunto
idêntico de pacotes, o valor seja diferente. Isto é, para cada amostra de dimensão n recolhida, a estimativa
do parâmetro assumiria valores distintos. Então, como retirar conclusões? Como garantir algum nível de
rigor?
O método a estudar nesta secção – a estimação por intervalos – permite, a partir da recolha de uma única
amostra, aferir entre que valores seria de esperar que variasse o parâmetro de interesse se nos
empenhássemos a recolher um número infinito de amostras. Isto é, por exemplo, caso o valor amostral
fosse de 1,02 kg, este método poderia, por exemplo, permitir afirmar que seria altamente provável que o
peso dos pacotes produzidos estivesse a variar entre 0,92 kg e 1,12 kg. E esse resultado tem um
determinado nível de confiança associado: por exemplo, se dissermos que o nível de confiança ou certeza
implicado é de 95%, tal significa que, se nos fosse possível observar um número infinito de amostras, o
intervalo de valores apresentado corresponderia aos resultados obtidos em 95% delas (os valores mais
usualmente utilizados são 90%, 95% ou 99% de confiança). Caberia depois à empresa julgar se esses
seriam ou não valores aceitáveis e proceder aos eventuais reajustes necessários.
A partir do conceito de intervalo de confiança para um parâmetro, é fácil concluir que a sua especificação
implica conhecer:
113
Como parâmetros de interesse e para efeitos de exemplificação, vão considerar-se duas tipologias de
intervalo: o intervalo de confiança para a média de uma população normal e o intervalo de confiança para
a proporção de uma população binomial. Para efeitos de simplificação, vão considerar-se apenas exemplos
relativos a amostras de grande dimensão (na prática, n 100)
Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se necessário calcular a variável
reduzida correspondente:
X μ
Z σ ∩ N 0; 1
√n
Esta variável permitirá deduzir a fórmula geral do intervalo de confiança para a média m de uma
população normal:
σ σ
X c ;X c
√n √n
Isto é, em torno do valor do estimador, é definido um intervalo de variação onde é possível afirmar que o
parâmetro a estimar está contido com um grau de confiança δ . Esse intervalo de variação depende:
114
do valor crítico (c): quanto maior o valor c, maior a amplitude do intervalo. O valor crítico reflecte
o nível de confiança adoptado. Naturalmente, para que aumente a confiança de que o valor do
parâmetro a estimar está contido no intervalo, a sua amplitude deve aumentar também (no limite,
se o intervalo se alongasse de -∞ a +∞ a confiança seria total ou 100%). É possível encontrar o
valor c na tabela da normal (pois esta é a lei do estimador), da seguinte forma:
P(- c Z c) =
já que assim é possível definir a fórmula geral do intervalo, resolvendo a inequação em ordem ao
parâmetro, μ :
X μ σ σ
P c σ c δ P X c μ X c δ
√n √n
√n
Se o desvio - padrão da população fôr desconhecido, utiliza-se este intervalo considerando-se como
estimativa de s o desvio - padrão corrigido da amostra,
∑ ´ ´
ou seja, S´ , tal que X c ;X c
√ √
p 1 p
p ∩ N p;
n
Uma vez que apenas se encontra tabelada a distribuição N(0,1), torna-se necessário calcular a variável
reduzida correspondente:
p p
Z ∩ N 0; 1
p 1 p
n
Esta variável permitirá deduzir a fórmula geral do intervalo de confiança para a proporção p de uma
população binomial:
115
p 1 p p 1 p
p c ; p c
n n
Como é óbvio, pretende-se que o resultado possua o máximo de confiança possível. No entanto, se uma
maior confiança é pretendida na estimação, esta conduz a possibilidades de erro maiores, dado que um
elevado nível de confiança conduz a um intervalo maior e, como tal, a precisão da estimação diminui.
Exemplo:
Consideremos 3 afirmações de alunos que aguardam a saída das pautas de um exame de Estatística:
Afirm. 2: “Tenho quase a certeza que as pautas serão afixadas entre as 10h e as 11h
Afirm. 3: “Tenho a certeza absoluta que as pautas ou são afixadas às 10h30 ou já não são afixadas hoje”
Estas 3 afirmações permitem constatar facilmente que se se pretende maior confiança na estatística, se tem
que permitir que a possibilidade de erro aumente. Por outro lado, se se permitir que o erro diminua, os
extremos do intervalo aumentam, embora o resultado perca alguma precisão. No entanto, há que ter em
atenção que, se um intervalo de confiança tem uma amplitude demasiado grande, a estimativa não tem
utilidade. Cabe ao investigador gerir este “trade-off”.
Isto leva a uma questão importante: o dimensionamento de amostras. Até aqui, sempre se assumiu que as
dimensões são conhecidas à partida, sem referir como se determinam. No entanto, a resolução deste
problema tem um enorme interesse prático, já que (i) recolher e tratar uma amostra demasiado grande para
os resultados que se pretendem obter constitui um evidente desperdício de recursos e (ii) recolher uma
amostra cuja dimensão é insuficiente para retirar conclusões constitui um erro.
A dimensão das amostras aumentará se se pretender garantir maior precisão ao intervalo e/ou maior grau
de confiança.
No capítulo dedicado a aplicações estatísticas, será possível ver como é possível utilizar o conceito de
intervalo de confiança ao controlo estatístico de processos de qualidade.
116
TAREFAS
Tarefas
1. Suponha-se que se tem uma população normal com média m desconhecida e desvio - padrão 3, N
( , 9) e uma amostra de 121 observações. Deduza um intervalo de confiança para a m com 95%
de confiança.
2. Numa cidade pretende-se saber qual a proporção da população favorável a certa modificação de
trânsito. Faz-se um inquérito a 100 pessoas, e 70 declaram-se favoráveis. Determine um intervalo
de confiança a 95% para a proporção de habitantes dessa cidade favoráveis à modificação de
trânsito.
3. Uma máquina fabrica cabos cuja resistência à ruptura (em kg/cm2) é uma variável com
distribuição Normal de média 100 e desvio - padrão 30. Pretendese testar uma nova máquina que,
segundo indicações do fabricante, produz cabos com resistência média superior. Para isso,
observam-se 100 cabos fabricados pela nova máquina, que apresentam uma resistência média de
110 kg/cm2. Admita que o novo processo não altera o desvio padrão da resistência à ruptura dos
cabos.
a) Determine um intervalo de confiança a 95% para a resistência média à ruptura dos cabos
produzidos pela nova máquina.
5. Admita-se que a altura dos alunos de uma escola segue distribuição Normal com variância
conhecida e igual a 0,051. Admita-se ainda que foi recolhida uma amostra aleatória com dimensão
117
n=25 alunos e calculada a respectiva média amostral, tendo-se obtido o valor de 1,70m. Defina
um intervalo que, com probabilidade 95%, contenha o valor esperado da altura μ.
6. Numa fábrica, procura conhecer-se a incidência de defeituosos na produção de uma máquina. Para
tanto, colhe-se uma amostra de dimensão suficientemente grande (1600 artigos), onde 10% dos
artigos são defeituosos. Determine o intervalo de confiança para a referida proporção com 90% de
confiança.
7. O director fabril de uma empresa industrial que emprega 4000 operários emitiu um novo conjunto
de normas internas de segurança. Passada uma semana, seleccionou aleatoriamente 300 operários
e verificou que apenas 75 deles conheciam suficientemente bem as normas em causa. Construa
um intervalo de confiança a 95% para a proporção de operários que conheciam adequadamente o
conjunto das normas uma semana após a sua emissão.
b) Se se pretender que a amplitude do intervalo de confiança da alínea anterior não seja superior a
0,034, qual deve ser a dimensão mínima da amostra?
c) Sabendo que o intervalo de confiança determinado pela Direcção de Marketing foi [0,767; 0,833],
calcule o nível de confiança utilizado.
9. O gabinete de projectos de uma empresa de material de construção civil pretende estimar a tensão
de ruptura do material usado num determinado tipo de tubos. Com base num vasto conjunto de
ensaios realizados no passado, estima-se que o desvio - padrão da tensão de ruptura do material
em causa é de 70 psi. Deseja-se definir um intervalo de confiança a 99% para o valor esperado da
118
tensão de ruptura, pretendendo-se que a sua amplitude não exceda 60 psi. Qual o número de
ensaios necessário para definir tal intervalo?
10. A empresa SCB controla regularmente a resistência à ruptura dos cabos por si produzidos.
Recentemente, foram analisadas as tensões de ruptura de 10 cabos SCB-33R, seleccionados
aleatoriamente a partir de um lote de grandes dimensões, tendo sido obtida uma média de 4537
kg/cm2. Existe uma norma de 112 kg/cm2 em relação à variância, que é respeitada. O director
comercial pretende saber qual o intervalo de confiança, a 95%, para o valor esperado da tensão de
ruptura dos cabos do lote em causa. Defina esse intervalo.
11. Uma amostra de 50 capacetes de protecção, usados por trabalhadores de uma empresa de
construção civil, foram seleccionados aleatoriamente e sujeitos a um teste de impacto, e em 18
foram observados alguns danos. Construa um intervalo de confiança, a 95%, para a verdadeira
proporção p de capacetes que sofre danos com este teste. Interprete o resultado obtido.
12. Qual deve ser o número de habitantes da cidade do Porto a seleccionar aleatoriamente para estudar
a proporção de portuenses que usam óculos, de modo a garantir que um intervalo de confiança a
95% para essa proporção tenha uma amplitude não superior a 8 pontos percentuais?
119
Auto-Avaliação
Auto-Avaliação
1. Uma população tem uma média de 200 e um desvio padrão de 50. Amostras aleatórias simples de
tamanho 100 serão tomadas e calculada as suas média ̅ i .
3. Assuma que o desvio-padrão da população seja σ = 25. Calcule o erro-padrão das médias (σ ̅ i ),
para tamanhos de amostra de 50, 100, 150, e 200.
4. Suponha que uma amostra aleatória simples de tamanho 50 seja selecionada de uma população
com σ = 10. Encontre o valor do erro-padrão das médias em cada um dos seguintes casos (se
apropriado, use o fator de correção da população finita).
5. Uma população tem uma média de 400 e um desvio-padrão de 50. A distribuição de probabilidade
da população é desconhecida. Um pesquisador usará amostras aleatórias simples de 10, 20, 30 e
40 itens para coletar dados sobre a população. Com qual dessas alternativas de tamanho de
120
amostra seremos capazes de usar a distribuição normal de probabilidade para descrever a
distribuição amostral de ̅ ? Explique.
6. Uma população tem uma média de 100 e um desvio-padrão de 16. Qual é a probabilidade de uma
média da amostra estar dentro de ± 2 da média da população para cada um dos seguintes tamanhos
de amostra?
a) n = 20.
b) n = 50.
c) n = 100.
d) n = 200.
7. Uma amostra aleatória simples de tamanho 100 é selecionada de uma população com p = 0,4.
b) Qual o desvio-padrão p ?
8. Numa população, 40,0% apresentam certa propriedade. Uma amostra aleatória simples de
tamanho 200 será tomada e calculada a respectiva proporção p .
9. Assuma que a proporção da população seja 0,55. Calcule o erro-padrão da proporção para
tamanhos de amostras de 100, 200, 500 e 1000.
10. A proporção de uma população é 0,30. Qual é a probabilidade de que a proporção da amostra
esteja dentro de ± 0,04 da proporção da população para cada um dos seguintes tamanhos de
amostra:
121
a) n = 10
b) n = 100
c) n = 500
d) n = 1000
11. O tempo médio de viagem para o trabalho para os habitantes de Joinville é de 31,5 minutos com
desvio padrão de 12 minutos. Uma amostra de 25 residentes de Joinville é selecionada.
a) Qual é a probabilidade de que a média da amostra esteja dentro de ± 1 minuto para a média da
população?
b) Qual é a probabilidade de que a média da amostra esteja dentro de ± 3 minutos para a média da
população?
12. O Depto. de Estatística sobre o Trabalho relatou que a média salarial horária para indivíduos em
cargos executivos, administrativos e gerenciais é de 24,07 Mt com desvio-padrão de 5,00 Mt. Uma
amostra de 120 indivíduos dos cargos executivos, administrativos e gerenciais será selecionada.
a) Qual é a probabilidade de que a média da amostra esteja dentro de ± 50 centavos da média da
população?
b) Qual é a probabilidade de que a média da amostra esteja dentro de ± R$ 1,00 da média da população?
13. De acordo com um jornal, o número médio de dias por ano que as pessoas que viajam a negócios
estão na estrada é de 115. O desvio-padrão é de 60 dias por ano. Considere que uma amostra de 50
viajantes seja selecionada da população.
b) Qual é a probabilidade de que a média da amostra seja mais de 120 dias por ano?
c) Qual é a probabilidade de que a média da amostra seja mais de 135 dias por ano?
122
d) Qual é a probabilidade de que a média da amostra esteja dentro de ± 5 dias da média da população?
e) Como a probabilidade mudaria no item (d) se o tamanho da amostra fosse aumentado para 100?
14. Qual é o fator mais importante para as pessoas que viajam a negócios quando estão hospedados
em um hotel? De acordo com o mesmo jornal da questão anterior, 74,0% desses viajantes
declaram que ter um quarto para fumante é o fator mais importante. Considere uma amostra de
200 viajantes será seleciona.
15. Uma campanha de produção não é aceitável para embarque a clientes se uma amostra de 1000
itens contém 5,0% ou mais de itens defeituosos. Se uma campanha de produção tem uma
proporção de defeitos da população de p = 7,0%, qual é a probabilidade de que seja aceita ? E se a
exigência fosse numa amostra de apenas 25 itens?
16. A proporção de clientes de uma seguradora de automóveis que receberam pelo menos uma multa
nos últimos 5 anos é de 0,15. A probabilidade de que a proporção da amostra esteja dentro de ±
0,03 da proporção da população é de 0,6965. Qual o tamanho da amostra?
123
Chave de Correção
Chave de Correção
1. Suponha-se que se tem uma população normal com média m desconhecida e desvio - padrão 3, N
( , 9) e uma amostra de 121 observações. Deduza um intervalo de confiança para a m com 95%
de confiança.
Solução
Para os dados deste exercício, vem:
N= 121
3
c: P(-c Z c) = 95% D(c) = 95% c = 1,96
e logo
X c ;X c = X 1,96 ;X 1,96 = X 1,96 ;X 1,96
√ √ √ √
=X 0,535; X 0,535
2. Numa cidade pretende-se saber qual a proporção da população favorável a certa modificação de
trânsito. Faz-se um inquérito a 100 pessoas, e 70 declaram-se favoráveis. Determine um intervalo
de confiança a 95% para a proporção de habitantes dessa cidade favoráveis à modificação de
trânsito.
Solução
n=100
70
p 0,7
100
c: P(-c Z c) = 95% D(c) = 95% c = 1,96
124
e logo
p c ; p c =
, , , ,
0,7 1,96 ; 0,7 1,96 =
, . , , .
0,7 1,96 ; 0,7 1,96 =
= [0,6102;0,7898]
O intervalo [0,6102;0,7898] contém o verdadeiro valor do parâmetro p com probabilidade ou confiança de
95%. Ou seja, a proporção de habitantes favoráveis à modificação de trânsito está situada entre 61,02% e
78,98%, com probabilidade de 95%.
3. Uma máquina fabrica cabos cuja resistência à ruptura (em kg/cm2) é uma variável com
distribuição Normal de média 100 e desvio - padrão 30. Pretendese testar uma nova máquina que,
segundo indicações do fabricante, produz cabos com resistência média superior. Para isso,
observam-se 100 cabos fabricados pela nova máquina, que apresentam uma resistência média de
110 kg/cm2. Admita que o novo processo não altera o desvio padrão da resistência à ruptura dos
cabos.
a) Determine um intervalo de confiança a 95% para a resistência média à ruptura dos cabos
produzidos pela nova máquina.
Solução
30 30
X c ;X c = 110 1,96 ; 110 1,96 = 110 1,96 ; 110 1,96
√ √ 100 100
= [104,12;115,88]
Estima-se, com 95% de confiança, que a resistência média à ruptura dos cabos produzidos pela nova
máquina se situa entre 104,12 kg/cm2 e 115,88 kg/cm2.
125
b) Suponha que pretendíamos obter um intervalo de confiança com a mesma amplitude do
anterior, mas com nível de confiança de 99%. Quantos cabos deveriam ser observados?
Solução
Amplitude = 115,88 – 104,12 = 11,76
Sendo
X =110; σ = 30 ; 99%
c: P(-c Z c) = 99% D(c) = 99% c = 2,576, e logo
vem que
n 173 cabos.
4. Uma amostra de 20 cigarros é analisada para determinar o conteúdo de nicotina, observando-se
um valor médio de 1,2 mg. Sabendo que o desvio - padrão do conteúdo de nicotina de um cigarro
é 0,2 mg, diga, com 99% de confiança, entre que valores se situa o teor médio de nicotina de um
cigarro.
Solução
X segue N ; 0,22
n 20 ; X 1,2; σ 0,2 ; 99%
c: P(-c Z c) = 99% D(c) = 99% c = 2,576, e logo
, ,
X c ;X c 1,2 2,576 ; 1,2 2,576 X 1,96 ;X 1,96 1,085; 1,315
√ √ √ √
Estima‐se, com 99% de confiança, que o teor médio de nicotina de um cigarro se situa entre 1,085
mg e 1,315 mg.
5. Admita-se que a altura dos alunos de uma escola segue distribuição Normal com variância
conhecida e igual a 0,051. Admita-se ainda que foi recolhida uma amostra aleatória com dimensão
n=25 alunos e calculada a respectiva média amostral, tendo-se obtido o valor de 1,70m. Defina
um intervalo que, com probabilidade 95%, contenha o valor esperado da altura .
Solução
X segue N ; 0,051
n 25 ; X 1,70; σ 0,051 ; 95%
c: P(-c Z c) = 95% D(c) = 95% c = 1,96, e logo
√ , √ ,
X c ;X c 1,70 1,96 ;X 1,96 1,611;1,788
√ √ √ √
126
Estima‐se, com 95% de confiança, altura dos alunos situa‐se entre 1,611 m e 1,788 m.
6. Numa fábrica, procura conhecer-se a incidência de defeituosos na produção de uma máquina. Para
tanto, colhe-se uma amostra de dimensão suficientemente grande (1600 artigos), onde 10% dos
artigos são defeituosos. Determine o intervalo de confiança para a referida proporção com 90% de
confiança.
Solução
n 1600
p 10%
c: P(-c Z c) = 90% D(c) = 90% c = 1,645, e logo
e logo
, , , ,
p c ; p c 0,1 1,645 ; 0,1 1,645
[0,0876;0,1123]
Estima‐se, com 90% de confiança, que a proporção de artigos defeituosos na produção se situa entre
8,76% e 11,23%.
7. O director fabril de uma empresa industrial que emprega 4000 operários emitiu um novo conjunto
de normas internas de segurança. Passada uma semana, seleccionou aleatoriamente 300 operários
e verificou que apenas 75 deles conheciam suficientemente bem as normas em causa. Construa
um intervalo de confiança a 95% para a proporção de operários que conheciam adequadamente o
conjunto das normas uma semana após a sua emissão.
Solução
n 300
p 0,25
0,201;0,299
Estima-se, com 95% de confiança, que a proporção de operários que conheciam adequadamente o
conjunto das normas se situa entre 20,1% e 29,9%.
127
8. A Direcção de Marketing de uma empresa pretende conhecer a notoriedade da marca de
determinado produto. Nesse sentido, efectuou um inquérito junto de 1200 pessoas escolhidas
aleatoriamente, verificando que 960 a conheciam.
Solução
n 1200
p 0,8
[0,781;0,819]
Estima-se, com 90% de confiança, que a proporção de indivíduos conhecedores da marca se situa entre
78,1% e 81,9%.
b) Se se pretender que a amplitude do intervalo de confiança da alínea anterior não seja superior a
0,034, qual deve ser a dimensão mínima da amostra?
Solução
Amp.=Lim.Sup.-Lim.Inf. = (p c p c 2c
0,8 1 0,8
2. 1,645 0,034 1499
c) Sabendo que o intervalo de confiança determinado pela Direcção de Marketing foi [0,767; 0,833],
calcule o nível de confiança utilizado.
Solução
128
p 1 p
p c 0,833
, ,
Logo 0,8 c c 2,86
E D(2,86) na tabela N(0,1) vem igual a 99,6%, a que corresponde o nível de confiança utilizado
9. O gabinete de projectos de uma empresa de material de construção civil pretende estimar a tensão
de ruptura do material usado num determinado tipo de tubos.
Com base num vasto conjunto de ensaios realizados no passado, estima-se que o desvio - padrão da tensão
de ruptura do material em causa é de 70 psi. Deseja-se definir um intervalo de confiança a 99% para o
valor esperado da tensão de ruptura, pretendendo-se que a sua amplitude não exceda 60 psi. Qual o
número de ensaios necessário para definir tal intervalo?
Solução
n ? ; σ 70 ; 99%
c: P(-c Z c) = 99% D(c) = 99% c = 2,576, e logo
amplitude 2c Logo 2c 60 2 . 2,576 60 n 36
√ √ √
10. A empresa SCB controla regularmente a resistência à ruptura dos cabos por si produzidos.
Recentemente, foram analisadas as tensões de ruptura de 10 cabos SCB-33R, seleccionados
aleatoriamente a partir de um lote de grandes dimensões, tendo sido obtida uma média de 4537
kg/cm2. Existe uma norma de 112 kg/cm2 em relação à variância, que é respeitada. O director
comercial pretende saber qual o intervalo de confiança, a 95%, para o valor esperado da tensão de
ruptura dos cabos do lote em causa. Defina esse intervalo.
Solução
X segue N ; 112
n 10 ; X 4537; 10,58 ; 95%
c: P(-c Z c) = 95% D(c) = 95% c = 1,96, e logo
, ,
X c ;X c 4537 1,96 ; 4537 1,96 4530,5; 4543,5
√ √ √ √
Estima‐se, com 95% de confiança, que o tensão média de ruptura dos cabos se situa entre 4530,5
kg/cm2 e 4543,5 kg/cm2.
11. Uma amostra de 50 capacetes de protecção, usados por trabalhadores de uma empresa de
construção civil, foram seleccionados aleatoriamente e sujeitos a um teste de impacto, e em 18
foram observados alguns danos. Construa um intervalo de confiança, a 95%, para a verdadeira
proporção p de capacetes que sofre danos com este teste. Interprete o resultado obtido.
129
Solução
n 50
0,36
[0,22695;0,49305]
12. Qual deve ser o número de habitantes da cidade do Porto a seleccionar aleatoriamente para estudar
a proporção de portuenses que usam óculos, de modo a garantir que um intervalo de confiança a
95% para essa proporção tenha uma amplitude não superior a 8 pontos percentuais?
Solução
n=?
c: P(-c Z c) = 95% D(c) = 95% c = 1,96, e logo
amplitude p c p c 2. c 0,08
Considerando que a proporção amostral é a que maximiza a amplitude pior dos casos , isto é, que a
proporção amostral é 50% p 1 p ' 1 ‐ 2 pˆ 0 , vem que:
, . ,
2 . c 0,08 2.1,96 0,08 600
130
Unidade Didáctica 7:
Testes de hipóteses
7.1 Introdução
A inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e testes de
hipóteses. Todos os dias temos de tomar decisões respeitantes a determinadas populações, com base
em amostras das mesmas (decisões estatísticas). Nesta tomada de decisões, é útil formular hipóteses
sobre as populações, hipóteses essas que podem ou não ser verdadeiras. A essas hipóteses chamamos
hipóteses estatísticas, as quais geralmente se baseiam em afirmações sobre as distribuições de
probabilidade das populações ou sobre alguns dos seus parâmetros. Uma hipótese pode então ser
definida como uma conjectura acerca de uma ou mais populações. Trata-se de uma técnica para se
fazer inferência estatística. Ou seja, a partir de um teste de hipóteses, realizado com os dados
amostrais, pode-se inferir sobre a população. No caso das inferências através do Intervalo de
Confiança, busca-se “cercar” o parâmetro populacional desconhecido. Aqui formula-se uma hipótese
quanto ao valor do parâmetro, e pelos elementos amostrais faz-se um teste que indicará a aceitação ou
rejeição da hipótese formulada.
131
Objectivos da unidade 7
Objectivos da Unidade 7
132
Fontes de Informação e Recursos de
Aprendizagem
http://www.portalaction.com.br/content/23-outras-estat%C3%ADsticas-descritivas
http://www.portalaction.com.br/content/13-exposi%C3%A7%C3%A3o-dos-dados
Nos testes de hipóteses, e ao contrário dos intervalos de confiança, em vez de procurar uma estimativa ou
um intervalo para um parâmetro, admite-se ou avança-se um valor hipotético para o mesmo, utilizando
depois a informação da amostra para confirmar ou rejeitar esse mesmo valor. A hipótese a testar
denomina-se, pois, de H0 ou de hipótese nula. O objectivo é verificar se os factos observados a
133
contradizem, levando a optar pela hipótese alternativa H1. Isto é, a estratégia básica seguida no método de
teste de hipóteses consiste em tentar suportar a validade H1 de uma vez provada a inverosimilhança de H0.
Exemplo:
Registos efectuados durante vários anos permitiram estabelecer que o nível de chuvas numa determinada
região, em milímetros por ano, segue uma lei normal N(600;100). Certos cientistas afirmavam poder fazer
aumentar o nível médio das chuvas em 50 mm. O seu processo foi posto à prova e anotaram-se os
valores referentes a 9 anos: 510; 614; 780; 512; 501; 534; 603; 788; 650.
H 0: =600 mm
H 1: =650 mm
Este é um problema clássico de teste de hipóteses, em que está em causa aceitar ou rejeitar a hipótese nula,
em função dos resultados de uma amostra. Ao utilizar uma amostra de uma população, estamos a lidar
com leis de probabilidades, logo não é possível de saber se a hipótese nula é verdadeira ou falsa, mas
apenas medir as probabilidades envolvidas na tomada de decisão.
Ho : = 0
H1 : = 1
Ho : = 0
H1 : 0 ou : 0 ou : 0
Estes testes designam-se respectivamente de teste unilateral à direita, teste unilateral à esquerda e teste
bilateral.
Sendo os testes de hipóteses, portanto, um processo de inferência estatística onde se procuram tomar
decisões sobre a população com base numa amostra, é natural que envolvam alguma margem de erro e
que ocorram em situação de incerteza. Estes erros não podem ser completamente evitados mas, no
entanto, pode-se manter pequena a probabilidade de os cometer. Compete ao investigador decidir qual a
dose de risco de se enganar em que está disposto a incorrer. Vamos supor uma probabilidade de erro de,
por exemplo, 5%. Nesse caso, e avançada a hipótese nula Ho, o investigador só estaria disposto a rejeitá-la
se o resultado obtido na amostra fizesse parte de um conjunto de resultados improváveis que teriam
apenas, por exemplo, 5 chances em 100 de se produzir. Este tipo de formulação é conhecida como postura
134
conservadora. Ou seja, estamos mais propensos a achar que o novo processo não tem qualquer efeito sobre
o nível das chuvas (isto é, que tudo se mantém igual) do que investir no novo processo (mudar),
arriscando apenas quando houver evidências da amostra muito fortes a favor do novo. Para que esta
decisão possa ser tomada de uma forma controlada, é conveniente pois que, à partida, se fixe o valor a
partir do qual se considera improvável a validade da hipótese nula. Tal fixação corresponde à fixação da
regra de decisão do teste.
A formalização desta regra passa pela especificação de uma região de região de rejeição. A essa região,
isto é, ao conjunto de valores “improváveis” que conduzem à rejeição da hipótese nula dá-se o nome de
Região Crítica. Ao limite superior de risco, que na maior parte dos casos é de 10%, 5% ou 1%, dá-se o
nome de Nível de Significância do teste, sendo este que permite definir a condição de rejeição de Ho.
Como veremos no exemplo, existem também erros de 2ª espécie, cuja probabilidade se designa pela letra
. Em resumo:
Hipótese nula Ho
Decisão Hipótese Ho ser verdadeira: Hipótese Ho ser falsa
Aceitar Ho Decisão correcta (1- ) Erro de tipo II
Beta ( )
Rejeitar Ho Erro de tipo I Decisão correcta (1- )
Alfa ( )
Como decidir?
Visto que se trata de testar o valor de a variável de decisão será X . Considerando Ho verdadeira vem que
100
X ∩ N 600:
√9
Em princípio, grandes valores de X são improváveis, pelo que se opta pela seguinte regra de decisão:
Se X fôr demasiado grande, isto é, superior a um valor crítico c que tem apenas 5 chances em 100 de ser
ultrapassado, opta-se por H1 com probabilidade 5% de se estar a cometer um erro. Se tal não acontecer,
conserva-se Ho, por falta de provas suficientes para não o fazer.
Logo sendo
600
0,05 ≪ ≫ 0,05
600 100
√ √9
≪ ≫c 600 1,645. = 654,83(3)
135
A regra de decisão é, então, a seguinte:
A Região Crítica deste teste, isto é, o conjunto de acontecimentos que levam à rejeição de H0 corresponde
a todos os valores de X > 654,83(3).
Os dados recolhidos indicavam X = 610,2 mm, pelo que a decisão é conservar H0 , isto é, considerar que o
processo científico não produz efeitos.
No entanto, os erros incorridos não se ficam apenas pelos de 1ª espécie. Existem também erros de 2ª
espécie. Isto é, à partida parte-se do princípio que H0 é verdadeira e só se rejeitará essa hipótese se
ocorrerem acontecimentos pouco prováveis.
No entanto, é possível alternativamente partir do princípio que é H1 que é verdadeira, ou seja, considerar
que o processo científico é realmente eficaz no aumento do nível médio das chuvas, mas que,
infelizmente, o número de valores observado não permite observar resultados ou esses resultados foram
insuficientes.
100
X ∩ N 650:
√9
136
A probabilidade de rejeitar H1 erradamente, isto é, de se cometer um erro de 2ª
espécie, vem então igual a:
P(Rejeitar H1 / H1)=
0; 1 0,14 55,57 %
É através das probabilidades e que se procura o melhor teste de hipóteses, sendo o teste ideal o que
minimiza simultaneamente ambos os valores. No entanto, e como e se referem a realidades opostas e
variam em sentido contrário, tal não é possível. O que na maior parte dos casos se faz é fixar o (para
amostras de dimensão n) e tentar minimizar .
137
Chama-se potência de um teste à probabilidade de rejeitar H0 quando esta é falsa. Esta é uma decisão
certa, não implica erro, e é complementar do erro de 2ª espécie. Logo, quanto menor o erro de 2ª espécie,
maior será o valor da potência do teste e, logo, maior a sua qualidade (diz-se que o teste é mais potente) .
Quando H1 é uma hipótese composta (>, < ou ), a potência do teste é variável, dependendo do valor do
parâmetro que não é fixo. Nesse caso falase em função potência do teste = 1 - ( 1)
Passo No 2: Decidir qual estatística (estimador) será usada para julgar a Ho e a variável de decisão
138
TAREFAS
Tarefas
1. Suponha que o director de qualidade pretende averiguar se o peso dos pacotes de arroz produzidos
corresponde ao valor assinalado na embalagem. Seja X a variável que representa o peso de um
pacote de arroz. Suponha que X ∩N( ;0,012 ) e que se conhece a seguinte amostra:
1,02; 0,98; 0,97; 1,01; 0,97; 1,02; 0,99; 0,98 1,00.
Será que, para um nível de significância de 5% se pode dizer que o peso médio corresponde ao
peso de 1 kg assinalado na embalagem?
3. O peso dos pacotes de farinha de 1 kg, produzidos por uma fábrica, é uma variável normalmente
distribuída, com desvio padrão 0,01. Da produção de determinado dia é retirada uma amostra de
49 pacotes, com peso médio de 0,998 Kg.
Pode-se afirmar, a um nível de significância de 1%, que o peso médio dos pacotes de farinha
nesse dia não está de acordo com o peso indicado?
4. Numa região onde existem entre os maiores de 18 anos 50% de fumadores, é lançada uma intensa
campanha anti-tabaco. Ao fim de três meses, realiza-se um mini-inquérito junto de 100 cidadãos
com mais de 18 anos, registando-se 45 fumadores.
b) Em caso negativo, qual seria a dimensão da amostra a partir da qual aquela percentagem
permitiria afirmar que a cmapnha atingiu o fim em vista?
5. Um fabricante afirma que o tempo médio de vida de um certo tipo de bateria é de 240 horas, com
desvio-padrão de 20 horas. Uma amostra de 18 baterias forneceu os seguintes valores:
237 242 232
242 248 230
244 243 254
262 234 220
225 236 232
139
218 228 240
Supondo que o tempo de vida das baterias se distribui normalmente, poder-se-á concluir, a 5% de
significância, que as especificações não estão a ser cumpridas?
6. Uma empresa de cerâmica tem, em dada secção, fornos controlados por termóstatos para manter a
temperatura no interior dos fornos a 600 graus centígrados. A experiência tem demonstrado que a
variância dos valores da temperatura no interior desses fornos é de 360.
A empresa fornecedora dos fornos comercializa agora um novo tipo de controlador, que é
anunciado como garantindo que as temperaturas se mantêm dentro do limite desejado. Foram
registadas 5 medidas de temperatura de fornos regulados para 600o, utilizando novos
controladores:
620o 595o 585o 602o 608o
Para 5% de significância, poder-se-á concluir que a temperatura não se afasta significativamente
do valor desejado?
7. O peso dos ovos de chocolate produzidos numa fábrica segue distribuição normal com variância
90,25.
a) O fabricante diz que o peso médio é de 160g. Foi recolhida uma amostra de 100 ovos, cujo
peso médio foi de 158, 437g. Teste, a um nível de significância de 1%, se a afirmação do
fabricante pode ser considerada verdadeira, ou se, pelo contrário, o verdadeiro peso dos ovos será
menor.
9. Um molde de injecção tem produzido peças de um determinado material isolante térmico com
uma resistência à compressão com valor esperado de 5,18 kg/cm2 e variância 0,0625 (kg/cm2)2.
As últimas 12 peças produzidas nesse molde foram recolhidas e ensaiadas, tendo-se obtido para a
resistência média à compressão o valor de 4,95 kg/cm2.
140
10. Um jornal desportivo noticiou que o número de espectadores de um programa desportivo que é
apresentado na televisão aos domingos à noite está igualmente dividido entre homens e
mulheres. De uma amostra aleatória de 400 pessoas que vêem regularmente o referido programa,
concluiu-se que 240 são homens.
141
Auto-Avaliação
Auto-Avaliação
1. A resistência à tração do aço inoxidável produzido numa certa usina permanecia estável, com uma
resistência média de 72 kg/mm2 e um desvio-padrão de 2,0 2 kg/mm2 com distribuição normal.
Recentemente a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas.
Os testes apresentaram resistência média de 75 kg/mm2 . Considere que o desvio-padrão não mudou. Com
base nesses dados responda:
a) Com um nível de significância de 5% é possível afirmar que o valor médio não mudou? (Passos: defina
as hipóteses, faça o teste, tome a decisão).
2. A DeBug Company vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no
mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de eficiência de 380
horas.
a) Teste a afirmação da empresa, contra a alternativa que a duração é inferior a 400 horas, ao nível de
significância de 1%, se o desvio-padrão amostral é de 60 horas (considere distribuição normal). (Passos:
defina as hipóteses, faça o teste, tome a decisão).
3. Um comprador, ao receber de um fornecedor um grande lote de peças, decidiu inspecionar 200 delas.
Decidiu, também, que o lote será rejeitado se ficar convencido, ao nível de 5% de significância, de que a
proporção de peças defeituosas no lote é superior a 4%. Qual será sua decisão (aceitar ou rejeitar o lote) se
na amostra foram encontradas onze peças defeituosas?(Passos: defina as hipóteses, faça o teste, tome a
decisão).
142
4. Uma companhia de seguros iniciará uma campanha extensa de propaganda para vender apólices de
seguro de vida, se verificar que a quantia média segurada por família é inferior a 10.000,00 Mt. Tomou-se
uma amostra aleatória de 50 famílias que acusou um seguro médio de 9.600,00 Mt com desvio padrão de
1.000,00 Mt. Com base na evidência amostral, a campanha deve ser iniciada ou não (nível de 1% de
significância)? Quais as hipóteses necessárias? (Passos: defina as hipóteses, faça o teste, tome a decisão).
5. Uma amostra de 27 elementos forneceu s2 =2,12. Deseja-se saber se é possível afirmar, ao nível de 5%
de significância que a variância da população é inferior a 5? Quais as hipóteses necessárias? (Passos:
defina as hipóteses, faça o teste, tome a decisão).
6. Sejam μ1 e μ2 as vidas médias de duas marcas concorrentes de pneus radiais de tamanho P205/65R15.
Teste H0: μ1 - μ2 = 0 versus Ha: μ1 - μ2 0, no nível de significância de 0,05, usando os seguintes dados:
= 45, x = 42.500, s1 = 2200, n=45, y=40.400 e s2 =1900.
7. Testes de resistência à tensão foram realizados em dois graus diferentes de haste de arame, resultando
nos dados a seguir:
a) Os dados fornecem evidências convenientes para concluir que a resistência média real do grau 1078
excede a do grau 1064 por mais de 10 kg/mm2 ? Teste as hipóteses apropriadas, usando a abordagem do
valor P.
b) Calcule a diferença entre as resistências médias reais dos dois graus, de forma que forneça informações
sobre precisão e confiabilidade.
143
Suponha que o fabricante tenha escolhido o nível de significância 0,05. A avaliação em escala de 7 pontos
resultou nos seguintes parâmetros.
a) Defina as hipóteses
b) Faça o teste
c) Qual é a decisão do fabricante?
d) Qual seria a decisão se tivesse determinado o nível de significância de 0,10?
e) Qual nível de significância você teria escolhido (ANTES DE FAZER A PESQUISA)? Por quê?
144
Chave de Correção
Chave de Correção
1. Suponha que o director de qualidade pretende averiguar se o peso dos pacotes de arroz
produzidos corresponde ao valor assinalado na embalagem. Seja X a variável que representa o
peso de um pacote de arroz. Suponha que X ∩N( ;0,012 ) e que se conhece a seguinte
amostra:
1,02; 0,98; 0,97; 1,01; 0,97; 1,02; 0,99; 0,98 1,00.
Será que, para um nível de significância de 5% se pode dizer que o peso médio corresponde ao
peso de 1 kg assinalado na embalagem?
Solução
Passo 1
Formular as hipóteses:
Ho : =1
H1 : <1
Passo 2
A estatística a ser utilizada será a média amostral
Passo 3
A região crítica é formada por todos os valores menores ou iguais a c
Passo 4
Assumir um nível de significância de 5%
Passo 5
Para =5%, determinar a região de rejeição e aceitação. Logo, sendo
,
≪ ≫c 1 1,645. = 0,9945
Logo, RC = ]- ∞;0,9945]
145
Passo 6
Calcular a estatística X= ∑ X = 0,9933
Passo 7
Tomar a decisão
Como o valor da amostra foi 0,9933 e é menor que o valor crítico 0,9945, rejeita-se Ho
Ou seja, considera-se que o arroz contido em cada pacote era inferior ao indicado. No entanto, há
o risco de se mandar parar a produção para revisão do equipamento sem necessidade. Reduzindo a
probabilidade de isso ocorrer de 5% para 1%, vem:
A única mudança será no Valor Crítico, que de 0,9945 para 0,9922. Neste caso, aceitaremos Ho,
ou seja, consideraremos que não há qualquer anomalia na produção.
Solução
Passo 1
Formular as hipóteses:
Ho: p = 0,5
H1: p < 0,5
Passo 2
A estatística a ser utilizada será a proporção amostral, onde o cuidado deve ser
trabalhar com grandes amostras.
Passo 3
146
A região crítica é formada por todos os valores menores ou iguais a c
Passo 4
Assumir um nível de significância de 5%
Passo 5
Para =5%, determinar a região de rejeição e aceitação. Logo, sendo
,
P(p 0,05 ≪ ≫ P )=0,05 ≪ ≫
, , ,
, ,
≪ ≫ 1,645 . 0,442
Logo, RC = ]- ∞;0,442]
Passo 6
p = 0,45
Passo 7
Como o valor amostral 0,45 é maior que o valor crítico 0,442, não se rejeita Ho
Ou seja, apesar de apenas 45% dos habitantes se terem manifestado a favor da construção do
centro comercial, essa margem não é suficiente para decidir deixar de o construir.
3. O peso dos pacotes de farinha de 1 kg, produzidos por uma fábrica, é uma variável
normalmente distribuída, com desvio padrão 0,01. Da produção de determinado dia é retirada
uma amostra de 49 pacotes, com peso médio de 0,998 Kg.
Pode-se afirmar, a um nível de significância de 1%, que o peso médio dos pacotes de farinha
nesse dia não está de acordo com o peso indicado?
147
Solução
X segue N(m; 0,012)
n = 49
X= 0,998
α = 1%
H0 : μ = 1
H1 : μ < 1
1
0,01 ≪ ≫ 0,01
1 0,01
√ √49
1
≪ ≫ 2.326 ≪ ≫ 0,997
0,01
√49
Como X = 0,998 > c = 0,997, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (não se pode afirmar que o peso médio não esteja de acordo com o indicado).
4. Numa região onde existem entre os maiores de 18 anos 50% de fumadores, é lançada uma
intensa campanha anti-tabaco. Ao fim de três meses, realiza-se um mini-inquérito junto de
100 cidadãos com mais de 18 anos, registando-se 45 fumadores.
Solução
n = 100
p = 0,45
a = 1%
,
P X 0,01 ≪ ≫ P )=0,01 ≪ ≫
, , ,
148
0,5
≪ ≫ 2.326 ≪ ≫ 0,384
0,5 . 0,5
100
Como p = 0,45 > c = 0,384, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (a campanha não surtiu efeito).
d) Em caso negativo, qual seria a dimensão da amostra a partir da qual aquela percentagem
permitiria afirmar que a cmapnha atingiu o fim em vista?
Solução
, , ,
P X 0,01 ≪ ≫ P )=0,01 ≪ ≫
, , ,
0,45 0,5
≪ ≫ 2.326 ≪ ≫ 541
0,5 . 0,5
5. Um fabricante afirma que o tempo médio de vida de um certo tipo de bateria é de 240 horas,
com desvio-padrão de 20 horas. Uma amostra de 18 baterias forneceu os seguintes valores:
237 242 232
242 248 230
244 243 254
262 234 220
225 236 232
218 228 240
Supondo que o tempo de vida das baterias se distribui normalmente, poder-se-á concluir, a 5% de
significância, que as especificações não estão a ser cumpridas?
Solução
X segue N( ; 202)
n = 18
X= ∑ X = 237,05
= 5%
H0 : = 240
H1: < 240
149
P(Rejeitar Ho/Ho verdadeira) = = 1%
240
0,05 ≪ ≫ 0,05
240 20
√ √18
240
≪ ≫
20
1,645 ≪ ≫ 232,25
√18
Como X = 237,05 > c = 232,25, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (não se pode afirmar que as especificações não estão a ser cumpridas).
6. Uma empresa de cerâmica tem, em dada secção, fornos controlados por termóstatos para
manter a temperatura no interior dos fornos a 600 graus centígrados. A experiência tem
demonstrado que a variância dos valores da temperatura no interior desses fornos é de 360.
A empresa fornecedora dos fornos comercializa agora um novo tipo de controlador, que é
anunciado como garantindo que as temperaturas se mantêm dentro do limite desejado. Foram
registadas 5 medidas de temperatura de fornos regulados para 600o, utilizando novos
controladores:
620o 595o 585o 602o 608o
Para 5% de significância, poder-se-á concluir que a temperatura não se afasta significativamente
do valor desejado?
Solução
X segue N(μ;360)
n=5
X = ∑ Xi = 602
α 5%
H0: μ = 600
H1: μ > 600
P(Rejeitar Ho/Ho verdadeira) = α= 5%
600
≪ ≫
360
1,645 ≪ ≫ 613,96
√5
Como X= 602 < c = 613,96, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (a temperatura não se afasta significativamente do valor desejado).
150
7. O peso dos ovos de chocolate produzidos numa fábrica segue distribuição normal com
variância 90,25.
a) O fabricante diz que o peso médio é de 160g. Foi recolhida uma amostra de 100 ovos, cujo
peso médio foi de 158, 437g. Teste, a um nível de significância de 1%, se a afirmação do
fabricante pode ser considerada verdadeira, ou se, pelo contrário, o verdadeiro peso dos ovos será
menor.
Solução
a) X segue N(μ; 90,25)
n = 100
X = 158,437
α = 1%
H0: μ = 160
H1: μ < 160
P(Rejeitar Ho/Ho verdadeira) = α = 1%
1
≪ ≫ 2,326 ≪ ≫ 157,79
9,5
√100
Como X= 158,437 > c = 157,79, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (a afirmação do fabricante pode ser considerada verdadeira).
≪ ≫F 1,645 ≪ ≫ 5%
8. Um jornal semanário afirma ter atingido, numa região, a percentagem, até então nunca
atingida por qualquer semanário, de 60% de leitores que regularmente compram um jornal
desse tipo. Efetuando um inquérito junto de 600 leitores, 55% declararam adquirir, por hábito,
o semanário em causa.
Adoptando um nível de significância de 1%, pronuncie-se quanto à projecção que o semanário
reclama.
Solução
n = 600
151
p = 0,55
α=1%
H0: p = 0,6
H1: p < 0,6
P(Rejeitar Ho/Ho verdadeira) = α = 1%
,
P X 0,01 ≪ ≫ P )=0,01 ≪ ≫
, , ,
0,6
≪ ≫ 2.326 ≪ ≫ 0,5535
0,6 . 0,4
600
Como p = 0,55 < c = 0,5535, pertence à região crítica, logo rejeita-se Ho a um nível de
significância de 1% (o semanário não atingiu a projecção que reclama).
9. Um molde de injecção tem produzido peças de um determinado material isolante térmico com
uma resistência à compressão com valor esperado de 5,18 kg/cm2 e variância 0,0625
(kg/cm2)2. As últimas 12 peças produzidas nesse molde foram recolhidas e ensaiadas, tendo-
se obtido para a resistência média à compressão o valor de 4,95 kg/cm2.
Solução
,
P X 0,05 ≪ ≫ P √ ,
)=0,05 ≪ ≫
,
√ √
0,6
≪ ≫ 1.645 ≪ ≫ 5,061
0,0625
12
Como x = 5,18 > c = 5,061, não pertence à região crítica, logo não se rejeita Ho a um nível de
significância de 1% (as peças produzidas recentemente não são menos resistentes do que o habitual).
152
b) Qual a potência do teste efectuado anteriormente, admitindo que o valor esperado da
resistência à compressão das peças produzidas recentemente é de 4,90 kg/cm2?
Solução
Potência = 1-β
β = (Conservar Ho/H1 verdadeira)
, , ,
P X 0,05 ≪ ≫ P √ ,
)=0,05 ≪ ≫
,
√ √
5,061 4,9
≪ ≫ 1 – 0,01 1 0,5040 49,6%
0,0625
12
10. Um jornal desportivo noticiou que o número de espectadores de um programa desportivo que
é apresentado na televisão aos domingos à noite está igualmente dividido entre homens e
mulheres. De uma amostra aleatória de 400 pessoas que vêem regularmente o referido
programa, concluiu-se que 240 são homens.
Solução
n = 400
p = 0,6
α = 10 %
H0: p = 0,5
H1: p > 0,5
P(Rejeitar Ho/Ho verdadeira) = α = 10%
,
P X 0,1 ≪ ≫ P )=0,9 ≪ ≫
, , ,
0,5
≪ ≫ 1,282 ≪ ≫ 0,53205
0,5 . 0,5
400
153
154