Apostila - Introdução À Estatística Ufjf

UNIVERSIDADE FEDERAL DE JUIZ DE FORA
INSTITUTO DE CIÊNCIAS EXATAS

DEPARTAMENTO DE ESTATÍSTICA
Apostila de
Introdução à Estatística
Professora Ângela Mello Coelho

Índice
1. Apresentação.........................................................................................................................................1
2. Introdução............................................................................................................................................. 2
2.1. Origens da Estatística e da Probabilidade.................................................................................... 2
2.2. História da Estatística no Brasil.....................................................................................................2
2.3. Principais áreas de Aplicação da Estatística..................................................................................4
2.4. Papel da Estatística na Pesquisa Científica................................................................................... 6
2.5. A Ética na Estatística..................................................................................................................... 7
2.6. Definição....................................................................................................................................... 7
2.7. Terminologia Básica...................................................................................................................... 8
2.8. Exercícios...................................................................................................................................... 10
3. Estatística Descritiva.............................................................................................................................. 11
3.1. Variáveis e Dados..........................................................................................................................11
3.2. Distribuição de Frequência – Tabelas e Gráficos.......................................................................... 13
3.2.1. Tabelas de Frequência para Variáveis Qualitativas....................................................... 14
3.2.1.1. Arredondamento.............................................................................................. 15
3.2.1.2. Formatação de Tabelas (normas ABNT)........................................................... 16
3.2.2. Gráficos para Variáveis Qualitativas.............................................................................. 16
3.2.3. Tabelas de Frequência para Variáveis Quantitativas.....................................................20
3.2.4. Gráficos para Variáveis Quantitativas........................................................................... 23
3.2.5. Frequência Acumulada.................................................................................................. 30
3.2.6. Polígonos de Frequência............................................................................................... 32
3.2.7. Tabelas e Gráficos Bidimensionais................................................................................ 38
3.2.7.1. Tabela de Dupla Entrada.................................................................................. 38
3.2.7.2. Gráfico de Dispersão Bidimensional................................................................. 40
3.2.7.3. Gráficos de Linha.............................................................................................. 43
3.3. Exercícios...................................................................................................................................... 45
3.4. Medidas Descritivas...................................................................................................................... 48
3.4.1. Medidas de Tendência Central...................................................................................... 49
3.4.2. Simetria......................................................................................................................... 53
3.4.3. Exercícios....................................................................................................................... 56
3.4.4. Medidas de Dispersão................................................................................................... 57
3.4.5. Amplitude Variância, Desvio Padrão e Coeficiente de Variação................................... 57
3.4.6. Exercícios....................................................................................................................... 62
3.4.7. Quantis.......................................................................................................................... 62
3.4.8. Resumo dos Cinco Números..........................................................................................65
3.4.9. Valores atípicos............................................................................................................. 66
3.4.10. Box-Plot......................................................................................................................... 67
3.4.11. Exercícios....................................................................................................................... 71
4. Exercícios Avaliativos Sobre Estatística Descritiva.................................................................................72
5. Probabilidade........................................................................................................................................ 78
5.1. Experimentos Aleatórios e Determinísticos................................................................................. 78
5.2. Espaço Amostral........................................................................................................................... 79
5.3. Evento........................................................................................................................................... 79
5.4. Teoria dos Conjuntos.................................................................................................................... 80
5.4.1. Operações entre Eventos.............................................................................................. 80
5.5. Exercícios...................................................................................................................................... 81
5.6. Definições de Probabilidade......................................................................................................... 84
5.6.1. Definição Frequentista de Probabilidade...................................................................... 84
5.6.2. Definição Axiomática de Probabilidade........................................................................ 85
5.6.3. Espaço Amostral Finito.................................................................................................. 85
5.6.4. Definição Clássica de Probabilidade.............................................................................. 86
5.7. Propriedades................................................................................................................................ 88
5.8. Probabilidade Condicional............................................................................................................ 89
5.9. Teoremas...................................................................................................................................... 91
5.9.1. Teorema da Probabilidade Total................................................................................... 91
5.9.2. Teorema de Bayes......................................................................................................... 93
5.10. Exercícios............................................................................................................................ 94
6. Variáveis Aleatórias............................................................................................................................... 101
6.1. Exercícios...................................................................................................................................... 103
6.2. Variáveis Aleatórias Discretas...................................................................................................... 104
6.2.1. Distribuição de Probabilidade de Variáveis Aleatórias Discretas.................................. 104
6.2.2. Função de Distribuição de Probabilidade...................................................................... 106
6.2.3. Medidas de Resumo para Variáveis Aleatórias Discretas..............................................108
6.2.3.1. O Valor Esperado de uma Variável Aleatória Discreta..................................... 108
6.2.3.2. A Variância de uma Variável Aleatória............................................................. 111
6.2.4. Algumas Distribuições de Probabilidade....................................................................... 112
6.2.4.1. A Distribuição de Bernoulli............................................................................... 112
6.2.4.2. A Distribuição Binomial.................................................................................... 112
6.2.4.3. A Distribuição de Poisson................................................................................. 114
6.2.5. Exercícios....................................................................................................................... 116
6.2.6. Variáveis Aleatórias Contínuas...................................................................................... 118
6.2.6.1. Distribuições de Probabilidade de uma Variável Aleatória Contínua............... 119
6.2.6.2. Medidas de Resumo para Variáveis Aleatórias Contínuas............................... 119
6.2.6.3. Distribuição Normal.......................................................................................... 120
6.2.6.4. Definição........................................................................................................... 120
6.2.6.5. Propriedades.................................................................................................... 121
6.2.6.6. Normal Padrão..................................................................................................122
6.2.7. Exercícios....................................................................................................................... 124
7. Exercícios Avaliativos sobre Probabilidade........................................................................................... 128
8. Amostragem.......................................................................................................................................... 131
8.1. Noções Básicas............................................................................................................................. 131
8.1.1. Terminologia Básica...................................................................................................... 131
8.2. Maneiras de Selecionar Amostras................................................................................................ 132
8.2.1. Amostragem Aleatória Simples..................................................................................... 132
8.2.2. Amostragem Sistemática...............................................................................................133
8.2.3. Amostragem Estratificada............................................................................................. 135
8.2.4. Amostragem por Conglomerado................................................................................... 136
8.2.5. Amostragem Viesada ou Tendenciosa.......................................................................... 138
9. Inferência Estatística............................................................................................................................. 139
9.1. Terminologia Básica...................................................................................................................... 139
9.2. Propriedades de um Estimador.................................................................................................... 141
9.3. Distribuição Amostral................................................................................................................... 142
9.3.1. Distribuição Amostral da Média.................................................................................... 142
9.3.2. Teorema Central do Limite............................................................................................ 143
9.3.3. Distribuição da Proporção Amostral............................................................................. 144
9.3.4. Exercícios Resolvidos..................................................................................................... 146
9.3.5. Exercícios ...................................................................................................................... 147
9.4. Estimação por Intervalo................................................................................................................ 149
9.4.1. Intervalo de Confiança para a Média............................................................................ 149
9.4.2. Intervalo de Confiança para a Proporção...................................................................... 153
9.4.4. Exercícios....................................................................................................................... 156
9.5. Testes de Hipóteses...................................................................................................................... 159
9.5.1. Introdução..................................................................................................................... 159
9.5.2. Hipóteses de Interesse.................................................................................................. 162
9.5.3. Metodologia.................................................................................................................. 163
9.5.3.1. Erros................................................................................................................. 164
9.5.3.2. Valor Crítico e Região Crítica............................................................................ 168
9.5.3.3. Estatística do Teste........................................................................................... 170
9.5.3.4. P-valor...............................................................................................................171
9.5.4. Um Exemplo.................................................................................................................. 172
9.5.5. Resumindo Testes de Hipóteses para a Média com Conhecido.............................. 173
9.5.6. Testes de Hipóteses para a Proporção.......................................................................... 174
9.5.7. Resumindo Testes de Hipóteses para a Proporção....................................................... 176
9.5.8. Testes de Hipóteses para a Média com Desconhecido............................................ 177
9.5.9. Resumindo Testes de Hipóteses para a Média com Desconhecido......................... 180
9.5.11. Exercícios....................................................................................................................... 183
9.6. Teste de Qui-Quadrado................................................................................................................ 188
9.6.1. Exercício Resolvido........................................................................................................ 193
9.6.2. Exercicios....................................................................................................................... 194
10. Exercícios Avaliativos sobre Inferência.................................................................................................. 196
11. Respostas dos Exercícios Propostos...................................................................................................... 198
11.1. Respostas dos Exercícios da Seção 2.8............................................................................... 198
11.3. Respostas dos Exercícios da Seção 3.4.3............................................................................ 202
11.5. Respostas dos Exercícios da Seção 3.4.11.......................................................................... 203
11.6. Respostas dos Exercícios da Seção 4.................................................................................. 205
11.8. Respostas dos Exercícios da Seção 5.10............................................................................. 210
11.12. Respostas dos Exercícios da Seção 7.................................................................................. 212
11.15. Respostas dos Exercícios da Seção 9.5.11.......................................................................... 214
11.17. Respostas dos Exercícios da Seção 10................................................................................ 217
12. Anexos................................................................................................................................................... 218
13. Referências ........................................................................................................................................... 221
1. Apresentação
Essa apostila foi criada com o objetivo de auxiliar os alunos das disciplinas de letramento estatístico da UFJF,
unindo a teoria necessária com exemplos, buscando um equilíbrio entre teoria e aplicabilidade para que
alunos de todas as áreas possam utilizar o mesmo material para buscar um conhecimento introdutório em
estatística.
Para isto foram reunidas informações introdutórias sobre a estatística, a fim de situar a estatística no mundo
real, além de informações sobre os pilares da estatística: Coleta de dados, estatística descritiva, probabilidade
e inferência.
O conteúdo dessa apostila é bastante amplo e superficial em muitos aspectos, boa parte da teoria matemática
necessária para demonstrar os resultados será negligenciada, já que esta apostila visa alcançar alunos em
início de curso e de diversas áreas do conhecimento, alunos estes que não teriam os pré-requisitos necessários
para compreender a fundamentação teórica.
1
2. Introdução
Primeiramente, precisamos situar a estatística no mundo real, para isso, falaremos um pouco sobre sua
origem e história, comentando um pouco sobre a profissão e o papel da estatística na pesquisa científica.
2.1. Origens da Estatística e da Probabilidade
A origem da estatística acompanha a origem das sociedades humanas de grande porte, já que nesses casos
faz-se necessário algum tipo de organização de informações sobre a sociedade em questão. Segundo Poubel
(2010) estudos estatísticos vêm sendo feitos desde muitos anos antes de Cristo, alguns dos trabalhos citados
são:
 5000 a.C. – registros egípcios de presos de guerra;

 3000 a.C. – registros egípcios da falta de mão-de-obra relacionada a construção de pirâmides;
 2238 a.C. – primeiro recenseamento chinês, com fins agrícolas e comerciais;
 Conforme pesquisas arqueológicas, os Maias (250 d.C. à 900 d.C.) (SILVA, 2019), Incas (100 a.C. à
1532 d.C.) (SOUZA, 2019) e Astecas (1325 d.C. à 1521 d.C.) (SILVA, 2020) também utilizaram
registros estatísticos;
 Os romanos (753 a.C. à 476 d.C.) registravam os nascimentos e as mortes com fins bélicos, de
taxação, e cobrança de impostos (SOUZA, 2020).
Castro (1970, p. 13-15, apud SILVA JUNIOR, 2015, p. 20) Dividiu a história da Estatística em três grandes
períodos (ignorando o período inicial – descrito acima), sendo eles:
 Primeiro Período (Desde o Regime Feudal até meados do século XVII) – Preparação de fatos,
organização de registros sistemáticos com objetivo de taxação e coleta de impostos ou estratégia de
guerras.
 Segundo Período (Meados do século XVII até meados do século XIX) – Preparações das teorias; a
estatística foi instituída como disciplina autônoma. Houve um grande desenvolvimento na área de
estatísticas descritivas e probabilidades.
 Terceiro Período (Iniciado em 1853 com a Reunião do Primeiro Congresso de Estatística até a
atualidade) – Métodos estatísticos aplicados em diversos campos; aperfeiçoamento da ciência
Estatística; grande intercâmbio de informações e ideias; desenvolvimento da computação, permitindo
à estatística um salto de desenvolvimento e aplicações.
2.2. História da Estatística no Brasil
Segundo Poubel (2010) os primeiros censos realizados no Brasil foram logo no início de 1800:
 1800 – Carta régia pedindo informações censitárias ao vice-rei do Estado do Brasil;

 1804 – Documento “Um recenseamento na capitania de Minas Gerais: Vila Rica, 1804” com o
objetivo de fornecer informações para a arrecadação de impostos para Portugal durante os
primeiros anos do século XIX;
 1808 – Vinda de D. João VI em 1808, foram iniciados recenseamentos com fins bélicos;
 1850 – Autorizada a realização do primeiro censo geral do país;
 1854 – Aprovada a criação da Sociedade Estatística do Brasil;
2
 1862 – Apresentado o relatório “Bases apresentadas para a organização da estatística geral do
Império”;
 1863 – Criação da cadeira de “economia Política, Estatística e Princípios de Direito Administrativo”
na Escola Central;
 Criada a Diretoria Geral de Estatística (DGE), primeira instituição brasileira de estatística de caráter
público e nacional;
 1872 – Realização do primeiro censo geral, embora feito em meio a dificuldades, obteve bons
resultados;
 1879 – DGE deixa de existir, tendo produzido ao todo 6 relatórios, e passa a funcionar a Seção de
Estatística do Ministério dos Negócios do Império;
Senra (2009) descreve em detalhes o histórico das estatísticas brasileiras entre 1822 e 2002, podendo ser
ressaltado que:
 1889 – Proclamação da República;

 1890 – DGE é restaurada e reformada;
 1890 – É realizado o segundo censo geral, que em meio à confusão política e militar obteve
péssimos resultados;
 1900 – É realizado o terceiro censo geral, mesmo com a mudança na política e metodologia
censitária, também obteve péssimos resultados;
 1906 – DGE é reformada;
 1907 – Criado o Conselho Superior de Estatística;
 1908 – Aprovado o decreto nº 1.850 que obriga “autoridades civis ou militares, associações,
empresas, companhias, estabelecimentos industriais, comerciais e outros e os particulares” a
prestarem informações que lhes fossem pedidas pela DGE;
 1910 – Censo geral é planejado, porém suspenso;
 1920 – Censo geral realizado e divulgado com sucesso;
 1930 – Censo não realizado devido à instabilidade política;
 1931 à 1936 – São propostas alterações à DGE, sendo que ela acabou sendo incorporada ao
Instituto Nacional de Estatística (INE) em 1936 e constituído o Conselho Nacional de Estatística
(CNE);
 1938 – O INE se transforma em IBGE (Instituto Brasileiro de Geografia e Estatística);
 1940 – Realizado o censo geral;
 1950 – Realizado o censo geral;
 1953 – Criada e instalada a Escola Brasileira de Estatística (EBE);
 1954 – A EBE ganha um novo nome: Escola Nacional de Ciências Estatísticas – ENCE (Rio de Janeiro,
RJ);
 1960 – Realizado o censo geral (com inovações técnicas, trazendo problemas imediatos e ganhos
futuros);
 1967 – Criado o Grupo Executivo de Pesquisa Domiciliares, que logo daria corpo à Pesquisa
Nacional por Amostragem de Domicílios – PNAD;
 1968 – Formalizado o Plano Nacional de Estatísticas Básicas – BNEB;
 1970 – Realizado e divulgado o censo geral: “Retrato Fiel do País” ou “Manancial de informações”;
3
Após o censo de 1970, o desenvolvimento de técnicas de amostragem, coleta de dados e da computação,
além de críticas feitas pela imprensa, e outros, foram, aos poucos transformando o IBGE no instituto que
conhecemos hoje.
2.3. Profissão de Estatístico
A profissão de estatístico foi regulamentada em 1965 e a procura por esse tipo de profissional está atualmente
em crescimento, segundo uma pesquisa feita pelo site CarrerCast.com que estudou os empregos com maiores
níveis de satisfação pelos funcionários em 2021 nos Estados Unidos (CarrerCast, 2022) a profissão Estatístico
ficou em terceira posição com salário médio anual de 92.270,00 dólares e expectativa de crescimento de 35%,
e a primeira posição ficou com cientista de dados, uma profissão que combina os conhecimentos de um
estatístico com um cientista da computação, com salário anual médio de 98.230,00 dólares e perspectiva de
crescimento de 33%.
Segundo o Conselho Regional de Estatística da 3ª Região (SP)(CONRE-3) (sem ano) as principais áreas de
aplicação da Estatística são:
 Big data
o Para: agrupar, selecionar, analisar a validade e melhor utilizar enormes quantidades de
dados;
o Onde: Em qualquer empresa, de qualquer segmento.
 Demografia; Antropologia; Sociologia
o Para: recenseamento; desenvolvimento de modelos matemáticos, auxiliar no
planejamento urbano...
o Onde: IBGE, SEADE, CEM, Instituto Pólis, SBPPC, OAB, FGV, universidades...
 Marketing, Pesquisa de Opinião, Satisfação, Eleitoral, Endomarketing Recursos Humanos...
o Para: pesquisar as chances de candidatos em época de eleição; tendência dos eleitores;
qual marca de determinado produto é mais popular; qual modelo de carro, roupa, tipo de
sorvete... deve ser lançado no mercado; qual o melhor lugar pra se colocar um produto na
prateleira do mercado, visando uma maior venda; onde é melhor abrir uma franquia/loja;
pesquisar satisfação dos funcionários/clientes...
o Onde: Institutos de pesquisa de mercado, opinião, eleitoral, quaisquer tipos de
empresa/indústria, agência de publicidade, comércio, serviços, entretenimento, ONGs...
 Economia; Seguro; Previdência...
o Para: desenvolver produtos bancários que otimizem o lucro do banco e do cliente; seguro
saúde que maximize os lucros da seguradora; analisar dados para detectar fraudes;
entender e projetar resultados econômicos; modelar dados para prever o mercado de
ações, minimizar riscos em aplicações, prever arrecadação de impostos, taxas e tributos
com modelos que estudam seu comportamento através do tempo; avaliar o mercado de
trabalho...
o Onde: IPEA, FIPE, FGV, SEADE, órgãos governamentais, bancos, seguradoras, financeiras,
universidades, indústrias, hospitais...
 Setor Público, Áreas Estratégicas
o Para: analisar o trânsito e ajudar no planejamento estratégico da cidade; analisar o tráfego
de ligações telefônicas pelas centrais, de cliques por segundo na internet, de tempo médio
de um banho; analisar dados sobre poluição; números de raios que caem na cidade;
4
quantidade de chuva; analisar a eficiência de projetos públicos, satisfação da população
com o governo/governantes; analisar dados de criminalidade; auxiliar na solução de
problemas no judiciário; apoio na elaboração de leis...
o Onde: Companhias de Tecnologia e Saneamento Ambiental, Sistema de Abastecimento de
Água e Esgoto, Sistema de Distribuição de Energia Elétrica/Gás/Combustível, Petrobrás,
universidades, institutos e centros de pesquisas...
 Saúde Pública e Medicina; Pesquisa Clínica; Biologia; Bioestatística; Psicologia; Psiquiatria
o Para: analisar o comportamento de epidemias, doenças, cáries...; analisar milhões de
células que um órgão tem milhares de genes de um ser humano; GENOMA; testar a eficácia
de medicamentos, cosméticos, alimentos, previsão de acidentes...; ajudar a estabelecer
níveis e padrões para testes clínicos e padrões/curvas que servirão como parâmetro de
comparação...
o Onde: ANVISA, outras instituições públicas, Instituto Pasteur, Adolpho Lutz, Instituto
Butantã, Hospitais, universidades, institutos de pesquisas clínicas, empresas
farmacêuticas, de cosméticos, alimentícias, ONGs...
 Universidades e Instituições de Pesquisas
o Para: atuar como docente (praticamente todos os cursos universitários têm aulas de
estatística em nível básico); pesquisar e desenvolver novas metodologias; interagir com
pesquisadores do mundo todo; assessorar pesquisas de outras áreas...
o Onde: todas as escolas, universidades, centros de pesquisas acadêmicas, centros de
pesquisas diversas públicos ou privados...
 Mídia, Artes, Esportes, Literatura, Linguística...
o Para: comparar o aproveitamento dos atletas, acompanhar o desempenho progressivo,
modelar técnicas mais eficientes de treinamento, analisar estilos literários, de pintura,
escultura, atribuição de obra ao autor, lexologia, analisar desempenho de diversos
programas de televisão, rádio, jornais, revistas...
o Onde: Indústrias de entretenimento em geral (cinema, rádio, TV, teatro...), meios de
comunicação, universidades, centros de pesquisas, clubes desportivos, museus...
 Administração Pública/Privada, Mistas, Filantrópicas; Indústrias, Engenharia, Agronomia, Química,
Geologia...
o Para: auxiliar no combate de pragas na lavoura; desenvolvimento de produtos agrícolas;
trabalhar com controle estatístico de processo; controle de qualidade; calibração de
instrumentos; analisar dados geológicos; auxiliar no estudo de implantação de uma fábrica
até a avaliação de necessidades de expansão industrial; pesquisa e desenvolvimento de
técnicas, produtos e equipamentos; testes de produtos...
o Onde: EMBRAPA, INMETRO, IPT, universidades, indústrias diversas, agrobusiness,
empresas de serviços diversos, comércio, ONGs...
Sendo assim, uma das grandes vantagens da profissão de estatístico, é que o profissional de estatística pode
trabalhar em qualquer área do conhecimento, podendo utilizar os seus conhecimentos para conseguir
trabalhar em qualquer ambiente que tenha vontade, desde que tenha a força de vontade para se especializar
na área desejada e disponibilidade para buscar oportunidades onde elas existem, muitas vezes em grandes
centros urbanos.
5
2.4. Papel da Estatística na Pesquisa Científica
Para entender o papel e a importância da Estatística na pesquisa científica é necessário, primeiramente,

entender o que vem a ser o Método Científico.
Figura 1: Representação do Método Científico
Fonte: BLOG da Biblioteca Central da UFRGS, (JACOBSEN, 2016).
Imagine que você acabou de chegar em casa e decidiu ligar seu laptop a fim de assistir a sua série favorita e
relaxar um pouco (JACOBSEN, 2016), infelizmente, seu laptop não liga; nesse caso, você começa a formular
hipóteses, por exemplo:
 Hipótese 1: a bateria descarregou e o cabo de energia não foi conectado corretamente. Ao verificar,
você observa que o cabo de alimentação está plugado corretamente; rejeitando a primeira hipótese.
 Hipótese 2: Seu bairro está sem energia elétrica. Você se levanta e aperta o primeiro interruptor que
aparece, observando que a lâmpada se acende, ou seja, sua casa tem energia. Segunda hipótese
rejeitada.
Mesmo sem saber o motivo pelo qual seu laptop não está ligando, você aplicou o método científico em sua
vida cotidiana sem nem perceber.
Uma pesquisa, pode ser dita como sendo a atividade realizada a fim de responder a uma pergunta (no caso
do exemplo dado: por que meu laptop não liga?). A Pesquisa científica, busca respostas à determinada
pergunta utilizando o método científico.
6
Ao nos depararmos com uma pergunta, a ideia seria: primeiro buscar por informações já coletadas
anteriormente que possam responder à mesma; caso ainda não seja conhecida a resposta, devemos formular
hipóteses e em seguida buscar dados por meio de observação, amostragem ou experimentação, nessa parte
de coleta de dados e informações, a estatística é fundamental. Para se fazer uma amostragem, ou experimento
de forma correta, são necessários o auxílio e a participação de um estatístico; como disse Sir Ronald A. Fisher
(1938, apud RATCLIFFE, 2018):
“To consult the statistician after an experiment is finished is often merely to ask him to conduct a
post mortem examination. He can perhaps say what the experiment died of.”
“Consultar um estatístico após um experimento estar finalizado é frequentemente pedir para ele
conduzir uma autópsia. Ele poderá, talvez, dizer do que o experimento morreu.”
Assim como para analisar dados vindos de experimentação, amostragem ou estudos observacionais, também
é necessário conhecimento estatístico, a fim de poder interpretar, inferir e concluir corretamente.
2.5. A Ética na Estatística
A profissão de estatístico foi regulamentada em 1965 pela lei nº 4.739 e em 1976 foi aprovado o código de
ética profissional do estatístico pelo Conselho Federal de Estatística (CONFE, sem data). Segundo o artigo 7º
do Código de Ética “fere a ética profissional”:
 “assumir compromissos que excedam sua capacidade legal, técnica, financeira, moral e física;
 Aceitar, direta ou indiretamente, serviços técnicos de qualquer natureza, com prejuízo próprio, da
classe ou de seus clientes;
 Interromper a prestação de serviços, sem justa causa e sem notificação ao cliente;
 assinar documentos elaborados por terceiros, resultantes de trabalhos técnicos, que não contaram
com sua efetiva participação;
 assinar documentos que possam resultar no comprometimento da dignidade profissional da classe;
 cooperar, sob qualquer forma, em práticas que venham a prejudicar legítimos interesses de terceiros;
 exercer atividade profissional junto a empreendimentos de cunho duvidoso, ou a eles ligar seu nome;
 assumir compromissos de trabalho já desenvolvido ou abandonado por terceiros, sem antes
consultar-lhe as causas que originaram a interrupção ou o abandono;
 deturpar intencionalmente a interpretação do conteúdo, explícito ou implícito, de documentos, obras
doutrinárias, leis, acórdãos ou outros instrumentos de apoio técnico ao exercício da profissão, para
iludir os seus clientes ou terceiros.”
2.6. Definição
Mas afinal, o que vem a ser “Estatística”?
Pode-se dizer, resumidamente, que a Estatística é a ciência que se ocupa da coleta, organização, descrição,
análise e interpretação de dados; sendo que esses “dados” podem ser quaisquer tipos de informação obtidas
nas mais diferentes áreas.
Um dos objetivos principais da estatística é auxiliar na tomada de decisões. Toda a coleta e análise de
informações, é feita com o intuito de se obter uma visão mais ampla de determinado problema, o que
possibilita tomar decisões com base em fatos.
7
Todos nós tomamos decisões todos os dias, muitas dessas decisões são baseadas em análises estatísticas,
mesmo que inconscientemente, como por exemplo: decidir se vai levar guarda-chuva ou não com base na
probabilidade de chuva fornecida na previsão do tempo dada no jornal diário.
Dada a importância e a ampla utilização da estatística é fundamental que todos tenhamos um conhecimento
básico de conceitos estatísticos, a fim de compreender melhor as informações disponíveis nos meios de
comunicação, para que todos tenhamos uma compreensão melhor do mundo em que vivemos.
2.7. Terminologia Básica
São dadas abaixo algumas definições e exemplos de termos estatísticos que serão utilizados nessa apostila:
 População:
o Definição: conjunto de elementos (unidades amostrais) que possuem uma característica em
comum;
o Exemplo: todos os habitantes de uma cidade; todas as lâmpadas produzidas por uma fábrica
em determinado período de tempo; todo o sangue de determinada pessoa...
 Amostra:
o Definição: Todo o subconjunto não vazio e com um número menor de elementos do que o
conjunto definido como população;
o Exemplo: é observada parte dos habitantes de uma cidade; são sorteadas 5% das lâmpadas
produzidas por uma fábrica em determinado período de tempo; é retirado 5ml do sangue de
determinada pessoa...
 Estatística Descritiva: conjunto de técnicas destinadas a descrever e resumir os dados;
 Probabilidade: teoria matemática utilizada para estudar a incerteza proveniente de fenômenos
aleatórios;
 Inferência Estatística: conjunto de técnicas e metodologias que permitem a extrapolação relativa à
uma população das informações obtidas de sua amostra.
Note que na definição de amostra, se entende que qualquer subconjunto da população pode ser considerado
como uma amostra, e a estatística descritiva, pode ser aplicada a qualquer amostra, com o intuito de obter
informações que resumam essa amostra; porém, a inferência estatística não é indicada para ser utilizada em
qualquer amostra, considere os seguintes casos retirados de Magalhães e Lima (2010):
a. Para avaliar a eficácia de uma campanha de vacinação no Estado de São Paulo, 200 mães de recém-
nascidos, durante o primeiro semestre de um dado ano e em uma dada maternidade em São Paulo, foram
entrevistadas a respeito da última vez que vacinaram seus filhos.
i. População de interesse: Crianças de 6 meses a 4 anos, 11 meses e 29 dias (considerando como
exemplo a população alvo da campanha contra sarampo que ocorreu de 7 a 25 de outubro de 2019)
ii. Amostra retirada: 200 mães de recém-nascidos de uma maternidade da cidade de São Paulo
iii. Considerações: São considerados recém nascidos os bebês que tem 28 dias ou menos de vida, ou seja,
resposta sobre a vacinação desses bebês não incluem a vacinação da campanha de interesse; não
podemos considerar que as mães de recém nascidos terão filhos dentro da faixa etária da campanha
(algumas provavelmente sim, outras não); as mães que foram amostradas não podem ser
consideradas como representativas da cidade de São Paulo (cidade mais populosa do Brasil e
extremamente diversificada), quanto mais representativas do Estado de São Paulo; levando apenas
8
essas considerações em conta, já fica claro que a inferência estatística não deve ser aplicada nesse
caso;
b. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia.
i. População de interesse: Todo o sangue do paciente;
ii. Amostra: porção de sangue retirada do paciente;
iii. Considerações: O conhecimento médico do corpo humano indica que é razoável assumir que o sangue
que corre pelo corpo de uma pessoa é homogêneo, ou seja, informações obtidas para parte desse
sangue serão válidas para sua totalidade. Nesse caso, fazer inferência sobre o todo com base na
amostra é indicado.
Sempre que houver o interesse em conhecer alguma característica de determinada população deve-se fazer
um estudo sobre as possíveis homogeneidades e heterogeneidades dessa população, no que diz respeito à
característica de interesse; nesse ponto, é fundamental o auxílio de um estatístico. Muitos trabalhos são
perdidos quando pesquisadores retiram uma amostra da população por conta própria, pois muitas vezes essa
amostra não pode ser considerada como representativa da população, e por consequência a inferência
estatística não pode ser utilizada, e o objetivo do estudo não é alcançado. Pode-se ter uma ideia da relação
entre população, amostra e os métodos estatísticos, observando a figura 2 logo abaixo:
Figura 2: Esquema visual relacionando população e amostra.
Fonte: Magalhães e Lima, 2010
Nesta apostila serão vistos alguns dos métodos mais comuns de amostragem, porém não será visto a fundo
como planejar uma amostragem, aqueles que tiverem interesse em conhecer melhor esse método
importantíssimo de coleta de informações, podem iniciar a busca por mais informações em Bolfarine e Bussab
(2005), por exemplo. Fica, no entanto, o aviso: ANTES DE INICIAR UM PROCESSO DE COLETA DE
INFORMAÇÕES BUSQUE O AUXÍLIO DE UM ESTATÍSTICO.
9
2.8. Exercícios
1- [DEVORE, 2006] Diversas universidades e faculdades instituíram programas de Instrução Suplementar

(SI), em que um monitor se encontra regularmente com um grupo de estudantes matriculados em um
curso para promover discussões sobre o material desse curso e melhorar o domínio da disciplina.
Suponha que os estudantes de um grande curso de estatística (o que mais poderia ser?) são
aleatoriamente divididos em um grupo de tratamento que participará do SI e outro não. No final do
período, é determinada a pontuação total de cada estudante no curso.
a. As pontuações do grupo de SI são uma amostra da população existente? Caso contrário, qual seria uma
amostra adequada?
b. Qual você acha que é a vantagem de dividir aleatoriamente os estudantes em dois grupos em vez de
deixar cada estudante escolher o grupo do qual participará?
c. Por que os investigadores não colocaram todos os estudantes no grupo de tratamento? Nota: O artigo
“Supplemental Instruction: An Effective Component of Student Affairs Programming” (J. of College
Student Devel., 1997, p. 577-586) discute a análise de dados de diversos programas de SI.
2- [DEVORE, 2006] Em um famoso experimento executado em 1882, Michelson e Newcomb fizeram 66
observações do tempo levado pela luz para percorrer a distância entre dois locais em Washington, D.C.
Algumas das medidas (codificadas de certa forma) foram 31, 23, 32, 36, -2, 26, 27 e 31. Por que essas
medidas não são idênticas?
3- [DORIA FILHO, U., 1999] Foi feito um estudo para determinar a estatura média dos alunos de um colégio,
que estavam distribuídos por quatro séries consecutivas. Foi selecionada uma amostra em que foram
incluídos os primeiros 100 alunos que adentraram à escola num determinado dia. Pergunta-se: a amostra
está adequada para a pesquisa em questão?
Para as questões 4 e 5, escolha a alternativa correta:
4- [DANCEY et al., 2017] Quais são os benefícios do conhecimento de pesquisas anteriores em um campo
particular de interesse?
(a) Podemos ver como os outros lidaram com problemas similares de pesquisa.
(b) Podemos ver o que outros pesquisadores sugeriram.
(c) Poupa-nos de empreender uma pesquisa que pode ser supérflua.
(d) Todas as alternativas anteriores.
5- [DANCEY et al., 2017] Como decidimos se existe uma sustentação para uma determinada hipótese de
pesquisa?
(a) Baseamo-nos em uma pesquisa prévia para testar uma nova hipótese de pesquisa.
(b) Precisamos entrevistar outros pesquisadores para ver se concordam com a pesquisa.
(c) Delineamos um estudo e, então, coletamos e analisamos os dados para testar a hipótese.
(d) Verificamos se a hipótese de pesquisa faz sentido.
10
3. Estatística Descritiva
Neste capítulo veremos como iniciar o tratamento de um conjunto de dados, como organizar a informação
colhida, como resumi-la, e como apresentar o que foi encontrado. Utilizaremos, principalmente, tabelas,
gráficos e medidas de resumo. Porém, antes de poder aplicar as técnicas de resumos aos dados, precisamos
definir o que são dados e conhecer a sua natureza.
3.1. Variáveis e Dados
Usualmente, ao fazer um levantamento de dados, as informações são inseridas em uma tabela (chamada de
tabela de dados brutos), em que cada linha corresponde a uma observação ou dado e cada coluna
corresponde a uma variável ou característica de interesse.
Vejamos, por exemplo, a tabela 1 abaixo:
Tabela 1: Informações de 1999 sobre 30 veículos novos em 1999.
Veículo Preço ($) Comprimento (m) Motor (CV) Nacionalidade Geração Anos
Asia Towner 9.440 3,36 40 Coreia do Sul 1 9
Audi A3 38.850 4,15 125 Alemanha 1 4
Chevrolet Astra 10.532 4,11 110 Brasil 2 5
Chevrolet Blazer 16.346 4,6 106 Brasil 1 5
Chevrolet Corsa 6.176 3,73 60 Brasil 2 6
Chevrolet Tigra 12.890 3,92 100 Espanha 1 6
Chevrolet Vectra 13.140 4,47 110 Brasil 2 7
Chrysler Neon 31.640 4,36 115 EUA 1 6
Dodge Dakota 11.630 4,98 121 Brasil 2 2
Fiat Fiorino 6.700 4,16 76 Brasil 2 22
Fiat Marea 12.923 4,39 127 Brasil 1 2
Fiat Uno Mille 5.257 3,64 57 Brasil 2 16
Fiat Palio 6.260 3,73 61 Brasil 1 4
Fiat Siena 7.780 4,1 61 Argentina 1 4
Ford Escort 10.767 4,2 115 Brasil 1 17
Ford Fiesta 6.316 3,83 52 Brasil 1 4
Ford Ka 5.680 3,62 54 Brasil 1 4
Ford Mondeo 33.718 4,56 130 Bélgica 1 7
Honda Civic 14.460 4,45 106 Brasil 6 3
Hyundai Accent 21.500 4,12 91 Coréia do Sul 2 6
Peugeot 106 13.840 3,68 50 França 1 9
Renault Clio 13.700 3,7 14 França 2 10
Toyota Corolla 15.520 4,39 116 Brasil 8 2
Toyota Perua 24.632 4,4 96 Brasil 8 1
VW Gol 6.340 3,81 54 Brasil 2 20
VW Golf 22.200 4,15 100 Áustria 4 26
VW Parati 9.300 4,08 69 Brasil 3 18
VW Polo 12.018 4,14 99 Alemanha 3 25
VW Santana 11.386 4,57 101 Brasil 2 16
VW Saveiro 7.742 4,38 88 Brasil 2 18
Fonte: Elaborada pela autora com base em Bussab e Moretin, 2004.
11
No caso da tabela 1, temos as seguintes variáveis:
 Veículo: marca do carro;

 Preço: o valor do carro, em dólares, em março de 1999;
 Comprimento: o comprimento do carro dado em metros;
 Motor: a potência do motor do carro dada em cavalos;
 Nacionalidade: o país em que o carro era fabricado em 1999, sendo que se era fabricado no Brasil e
em outros foi considerado somente o Brasil, no caso de ser fabricado em mais de um país fora do
Brasil, foi considerado o país que importava pro Brasil em 1999;
 Geração: a geração referente ao veículo produzido em 1999;
 Anos: tempo, em anos, que o veículo vinha sendo produzido.
Pode-se verificar que cada linha representa observações feitas em um mesmo veículo. Por exemplo, na
primeira linha temos as informações de que o carro Asia Towner custava 9.440,00 dólares em 1999, media
3,36 metros, tinha 40 cavalos de potência, era fabricado na Coréia do Sul e estava em sua primeira geração.
Podemos observar, que embora a tabela 1 possua muitas informações, não é fácil ter uma visão geral apenas
ao observá-la. Digamos que haja o interesse em saber a porcentagem de carros produzidos no Brasil, ou
quantos carros custavam menos de 10.000,00 dólares. A fim de poder responder facilmente à essas perguntas,
podemos utilizar técnicas de estatística descritiva e resumir as informações dadas pela tabela 1.
Primeiramente, devemos prestar atenção no tipo de variável de interesse, parece razoável que o método para
resumir informações como preço não possa ser utilizado para resumir as informações sobre nacionalidade, já
que no caso de preço estamos falando de valores numéricos (quantidades) e no caso de nacionalidade as
observações são nomes (qualidades).
Sendo assim, o primeiro passo para descrever um conjunto de dados é classificar às variáveis de interesse
quanto à sua natureza.
 Variáveis quantitativas: identificam uma característica mensurável e são descritas por dados discretos
ou contínuos
o Dados discretos: formam um conjunto finito ou enumerável de números. Resultam,
normalmente, de contagem. Alguns exemplos podem ser vistos no quadro 1:
Quadro 1: Exemplos de variáveis quantitativas discretas.
Variável Dados
Número de Filhos 0,1,2,...
Doses de álcool / semana 0,1,2,...
Atividade física / semana 0,1,2,...
Fraturas sofridas 0,1,2,...
Fonte: Elaborado pela autora.
o Dados contínuos: Pertencem a um intervalo de números reais. Resultam, geralmente, de

mensuração (possuem unidade de medida). Alguns exemplos podem ser vistos no quadro 2:
12
Quadro 2: Exemplos de variáveis quantitativas contínuas.
Variável Dados
Altura m
Peso kg
Temperatura corporal ⁰C
Pressão Arterial mmHg
 Variáveis qualitativas: Identificam uma qualidade não mensurável e são descritas por dados nominais
ou ordinais
o Dados nominais: Representam qualidades que não seguem uma ordem específica. Alguns
exemplos podem ser vistos no quadro 3:
Quadro 3: Exemplos de variáveis qualitativas nominais.
Variável Dados
Sexo Masculino / Feminino
Naturalidade Cidade em que nasceu
Cor da pele Branca / Negra / Parda / ...
Doença Diabetes / Hipertensão
o Dados ordinais: Representam qualidades que seguem determinada ordem. Alguns exemplos
podem ser vistos no quadro 4:
Quadro 4: Exemplos de variáveis qualitativas ordinais.
Variável Dados
Escolaridade Fundamental / Média / Superior
Faixa Etária Criança / Adolescente / ...
Tolerância a dor Baixa / Razoável / Alta
Estágio da doença Alzheimer 1,..,4
Com a tabela de dados brutos em mãos, e com o conhecimento da natureza dos dados, pode-se dar início ao
resumo dos mesmos.
No caso da tabela 1 (página 11), utilizada como exemplo, temos os seguintes tipos de variáveis:
 Variáveis qualitativas nominais: Veículo e Nacionalidade;

 Variáveis qualitativas ordinais: Geração;
 Variáveis quantitativas discretas: Motor e Anos;
 Variáveis quantitativas contínuas: Preço e Comprimento.
3.2. Distribuição de Frequência – Tabelas e Gráficos
Um dos maiores interesses do pesquisador ao construir um banco de dados é conhecer o comportamento das
variáveis de interesse, e uma das maneiras mais comuns e intuitivas de observar determinado comportamento
é construir tabelas de frequências e/ou gráficos.
13
3.2.1. Tabelas de Frequência para Variáveis Qualitativas
Em uma tabela de frequência para variáveis qualitativas temos a seguinte configuração:
 A tabela é formada por 3 colunas;

 A primeira coluna é relativa à variável em questão, nas linhas são listadas as possíveis categorias dessa
variável;
 A segunda coluna é relativa à frequência absoluta e deve conter em suas linhas os valores relativos à
quantidade de vezes que determinada categoria foi observada (obtida por contagem);
o representa a frequência da linha ;
o representa a frequência total.
 Na terceira coluna tem-se a frequência relativa que deve conter em suas linhas os valores que
representam a quantidade de vezes que determinada categoria foi observada com relação ao número
= = × 100%
total de observações.
o ou
Tabela 2: Tabela de frequência da variável qualitativa nominal Nacionalidade.
Nacionalidade Freq. Abs. Freq. Rel. (%)

Alemanha 2 6,67%
Argentina 1 3,33%
Áustria 1 3,33%
Bélgica 1 3,33%
Brasil 19 63,33%
Coréia do Sul 2 6,67%
Espanha 1 3,33%
EUA 1 3,33%
França 2 6,67%
Total 30 100%
Fonte: Elaborada pela autora.
Nota: A diferença entre soma de frequências relativas e seu respectivo total é relativa ao critério de
arredondamento.
Algumas observações que devem ser feitas com relação às tabelas de frequência de variáveis qualitativas
nominais:
 As categorias da variável devem ser organizadas na primeira coluna, segundo a ordem alfabética A→Z,
ou Z →A;
 A frequência relativa pode ser apresentada, ou não, em porcentagem. Usualmente é utilizada a
porcentagem por ser uma maneira mais intuitiva de se observar parte do total, costuma ser mais
“amigável” do que utilizar os valores decimais de zero a um;
 Ao conferir os dados da Tabela 2, pode-se notar que os valores das frequências relativas foram todos
arredondados, se mantendo duas casas decimais. Ao somar os valores obtemos o total 99,99% e não
o valor 100% que deveríamos ter encontrado. Isso ocorre por estarmos trabalhando com valores
aproximados, e não exatos. Deve-se tomar muito cuidado com o arredondamento, a fim de não
haverem erros acumulados no total. Uma variação de até 3 centésimos para mais ou para menos pode
14
ser explicada por arredondamento, uma variação maior que 3 centésimos dificilmente será devida a
arredondamento, devendo indicar um ou mais erros na contagem.
Pode-se notar que a tabela 2 (página 14) resume as informações de nacionalidade contidas na tabela 1 (página
11) sem nenhuma perda. Fica fácil de ver, na tabela 2, que dentre os veículos estudados e vendidos em 1999,
a maioria era produzido no Brasil (63,33%), ou seja, apenas 36,67% dos veículos foram importados, dentre os
importados, a maioria veio da Europa (23,33%), apenas 6,67% veio da Ásia e 6,67% do continente americano.
Na tabela 3, abaixo, temos o resumo das informações sobre a geração do veículo, que apesar de possuir
observações numéricas é considerada qualitativa ordinal, isso pois os valores não representam números, mas
posições, a segunda geração de um veículo não acontece depois de um determinado número de anos, e sim
quando o veículo passa por uma alteração significativa, buscando alcançar novos clientes, ou não perder
clientes para outro modelo.
Tabela 3: Tabela de frequência da variável qualitativa ordinal Geração.
Geração Freq. Abs. Freq. Rel. (%)

1 13 43,33%
2 11 36,67%
3 2 6,67%
4 1 3,33%
5 0 0,00%
6 1 3,33%
7 0 0,00%
8 2 6,67%
Total 30 100%
Novamente, pode-se observar que não há perda de informação na construção da tabela 3, existe um resumo
que permite a observação de que a grande maioria dos veículos estavam na primeira ou segunda geração (80%
do total), 10% dos veículos estavam na terceira ou quarta geração e os outros 10% na sexta ou oitava geração.
3.2.1.1. Arredondamento
Considerando os exemplos estudados no item 3.2.1, considero importante fazer um pequeno item sobre
arredondamento, que embora possa parecer um tópico que já deve ser conhecido por todos, anos como
professora me levaram a perceber que existem ainda muitos alunos com dificuldade na hora de trabalhar com
arredondamento.
Em primeiro lugar, se estiver utilizando algum tipo de calculadora com memória, ou planilha eletrônica para
realizar as contas, o arredondamento deve ser feito apenas no resultado final. Quanto antes o
arredondamento for feito e quanto mais valores arredondados forem utilizados, maior o erro acumulado que
será observado ao final.
Para arredondar um valor, deve-se, primeiro, decidir com quantas casas decimais deseja-se trabalhar, deixo
desde já a minha opinião pessoal que quando existem casas decimais diferentes de zero, deve-se trabalhar no
mínimo com 2 casas decimais. Nos casos de decidirmos trabalhar com 2 casas decimais, a casa decimal que
deve ser considerada para o arredondamento é a terceira casa decimal, se o valor observado na terceira casa
15
decimal for 5, 6, 7, 8 ou 9, deve-se somar 1 ao valor da segunda casa decimal; já se o valor da terceira casa
decimal for igual a 0, 1, 2, 3 ou 4 não devemos alterar o valor da segunda casa decimal IBGE (1993).
Vamos considerar o valor 5,264994 e supor que desejamos fazer os seguintes arredondamentos:
 Arredondar para 5 casas decimais: 5,264994, como o valor na sexta casa decimal é 4, teríamos o
seguinte valor arredondado: 5,26499 (o valor na quinta casa decimal não sofre alteração);
 Arredondar para 4 casas decimais: 5,264994, como o valor na quinta casa decimal é 9, devemos somar
1 ao valor da quarta casa decimal, que também é 9, como 9 + 1 = 10, deve-se zerar a quarta casa
decimal e somar um à terceira casa decimal, resultando em: 5,265;
 Arredondar para 2 casas decimais: 5,264994, como o valor na terceira casa decimal é 4, teríamos o
seguinte valor arredondado: 5,26 (o valor na segunda casa decimal não sofre alteração).
3.2.1.2. Formatação de Tabelas (normas ABNT)
Um outro ponto importante que deve ser levado em consideração ao ensinar a construir tabelas é falar sobre
a formatação exigida pela Associação Brasileira de Normas Técnicas (ABNT), seguir às normas da ABNT é
importante, pois essa associação visa normalizar os trabalhos técnicos de diversos setores, facilitando a
compreensão e disseminação dos trabalhos científicos feitos no Brasil; esses trabalhos técnicos englobam,
Trabalhos de Conclusão de Curso, Monografias, Dissertações, Teses, artigos...
Além de tabelas, as normas da ABNT também dizem respeito à inclusão de figuras e quadros como elementos
textuais. Vale a pena destacar que muitos pontos da formatação desses três elementos são semelhantes, por
exemplo, todos devem apresentar título e fonte (como pode ser observado nas tabelas, quadros e figuras
presentes nessa apostila); porém, existem também algumas diferenças, como: não devem haver linhas
verticais externas nas tabelas, pode-se usar linhas verticais internas no cabeçalho ou no corpo da tabela em
casos especiais (IBGE, 1993), as linhas horizontais são permitidas apenas no cabeçalho e no rodapé das tabelas;
já no caso de quadros, todas as linhas e colunas devem estar demarcadas, ou seja, utilizam-se linhas verticais
e horizontais delimitando todas as linhas e colunas do quadro.
Quadros e tabelas não diferenciam apenas na formatação, a maior diferença entre essas duas ferramentas, é
que no corpo de uma tabela, as informações de maior importância ou destaque, devem ser numéricas, já no
corpo de um quadro, as informações mais relevantes e de maior destaque, são palavras.
3.2.2. Gráficos para Variáveis Qualitativas
Existem diversas maneiras de representar dados graficamente, porém dois dos gráficos mais utilizados para
apresentar dados provenientes de variáveis qualitativas são os gráficos de barras e os gráficos de setores (ou
gráficos de pizza); estes são os dois tipos de gráficos que estudaremos aqui.
Para construir um gráfico de barras, ou de pizza, primeiro deve-se ter as informações obtidas nas tabelas de
frequência. Iremos perceber que as tabelas de frequência e os gráficos aqui estudados apresentam as mesmas
informações, porém de maneiras diferentes.
Os gráficos que serão apresentados nessa apostila podem ser feitos manualmente (sem grandes dificuldades)
ou pela maioria dos softwares estatísticos e planilhas eletrônicas. Irei utilizar o software R (R Development
Core Team, 2020) na elaboração de todos os gráficos que serão apresentados nesta apostila.
16
Consideremos a variável qualitativa nacionalidade, apresentada no item 3.1. (página 11), utilizando as
informações apresentadas na tabela 2 (página 14), podemos montar o seguinte gráfico de barras:
Figura 3: Gráfico de Barras para a variável qualitativa Nacionalidade.
Utilizando os valores apresentados pela tabela 3 (página 15) podemos construir o seguinte gráfico de barras
para a variável Geração:
17
Figura 4:Gráfico de Barras para a Variável Qualitativa Geração.
Pode-se perceber:
 Que foram utilizadas as frequências absolutas na construção dos gráficos apresentados nas figuras 3
e 4, a frequência relativa poderia ter sido utilizada, a escolha de qual frequência utilizar depende da
facilidade na interpretação e na amplitude das barras;
 Deve-se, SEMPRE, respeitar uma escala de grandeza, a fim de não construir um gráfico que leve o
leitor a uma falsa impressão ou interpretação;
 Os eixos DEVEM ser nomeados, devendo ficar claro ao leitor qual a informação contida nele;
 Foram utilizadas legendas nas figuras 3 e 4, já que: os nomes poderiam ter ficado “espremidos” se
colocados no eixo, e havia espaço livre na área de plotagem (devido à diferença entre as barras). Se
as informações tivessem sido colocadas nos eixos não haveria a necessidade de legenda;
 Foram utilizadas cores distintas para barras distintas tanto na figura 3 quanto na 4, essa ferramenta
pode ser utilizada quando for facilitar a leitura do gráfico, porém não é sempre necessária ou indicada.
Outro tipo de gráfico que pode ser utilizado para variáveis qualitativas é o gráfico de pizza. Abaixo serão
apresentados os gráficos de pizza para as variáveis Nacionalidade e Geração.
18
Figura 5: Gráfico de pizza para a variável Nacionalidade.
Figura 6:Gráfico de pizza para a variável Geração.
Os gráficos de pizza podem ser muito úteis quando se deseja evidenciar uma das qualidades. Por exemplo, na
figura 5, podemos ver que a grande maioria dos veículos considerados, na pesquisa feita, foram fabricados
nacionalmente, fica evidente que: o Brasil tem a maior fatia, França, Alemanha e Coréia do Sul têm fatias
iguais, muito menores que a do Brasil, porém maiores do que a dos outros países. Já na figura 6 não é tão
simples observar que a fatia relativa à primeira geração é maior que a fatia relativa à segunda geração, para
19
leitores menos atentos elas podem parecer iguais, esse erro não seria facilmente cometido ao se observar a
figura 4, que contêm exatamente a mesma informação, só que em forma de barras.
Na hora de escolher qual gráfico utilizar deve-se levar em consideração, não só a natureza dos dados, mas
também a distribuição dos mesmos, no caso das variáveis Nacionalidade e Geração, eu escolheria o gráfico de
PIZZA para a variável Nacionalidade, porém escolheria o gráfico de BARRAS para a variável Geração. Não por
um gráfico estar errado e o outro correto, mas por acreditar que os dados podem ser vistos com mais
facilidade em um formato do que no outro.
3.2.3. Tabelas de Frequência para Variáveis Quantitativas
Existem duas possibilidades na construção de tabelas de frequências para variáveis quantitativas discretas, no
caso de haverem poucas possibilidades de observações, a tabela segue os mesmos moldes das tabelas para
variáveis qualitativas, em que cada possível observação será representada em uma linha. Isso aconteceria, se
por acaso, houvéssemos classificado geração como sendo uma variável quantitativa discreta. Se, no entanto,
houverem muitas observações possíveis, com nas variáveis Motor (14 à 130) e Anos (1 à 26) apresentadas na
Tabela 1 (página 11) deve-se tratar a variável quantitativa discreta, como se fosse contínua, e trabalhar com
intervalos ao invés de valores.
Não existe uma maneira única de definir quantos intervalos devem ser utilizados, ou qual o tamanho que esses
intervalos devem ter, o que é certo, é que se forem utilizados poucos intervalos pode-se perder muita
informação, e se forem utilizados muitos intervalos, o objetivo de resumir os dados pode ficar prejudicado. O
número máximo de intervalos que devem ser utilizados varia de livro pra livro, Magalhães e Lima (2010) limita
um máximo de 10 intervalos, já Bussab e Morettin (2004) sugerem um limite máximo de 15 classes; no
entanto, ambos indicam 5 como sendo o número mínimo de classes que devem ser utilizadas.
A familiaridade do pesquisador com os dados é fundamental para a escolha do tamanho ideal das classes, no
caso de não se ter nenhuma ideia pré-concebida, pode-se tentar seguir os seguintes passos:
 No caso de haver um número grande de observações, ou uma grande distância entre as observações
mínima e máxima, pode-se utilizar um número maior de classes (dentro de um máximo de 15);
 As classes devem ter tamanhos iguais (no caso de construir classes de tamanho diferente, devem ser
tomados cuidados extras na construção das tabelas e gráficos, o que não será discutido nessa
apostila);
 Intervalos subsequentes devem iniciar exatamente onde o anterior terminou, no entanto, intervalos
diferentes não podem conter o mesmo valor:
 Para utilizar a linguagem especificada para a construção de tabelas segundo a ABNT, devemos seguir
o que fica especificado em IBGE (1993), dessa forma os intervalos devem ser construídos como se
o Um intervalo que contém o valor e não contém o valor , em que < deve ser denotado
segue:
como: ⊢ (intervalo fechado em e aberto em );

o Um intervalo que não contém o valor e contém o valor , em que < deve ser denotado
como: ⊣ (intervalo aberto em e fechado em )
o Um intervalo que contém ambos os valores, e , em que < deve ser denotado como:
⊢⊣ (intervalo fechado)
20
o As classes inicial e final devem (preferencialmente) ser fechadas à esquerda (inicial) e à direita
(final), de maneira que ao se unir todas as classes em uma tabela de frequências, a classe final
tenha começo, meio e fim.
 No caso da classe inicial iniciar antes do valor mínimo, ou da classe final finalizar após o valor máximo,
vale a pena buscar uma simetria no valor extra, dividindo partes iguais para a classe inicial e final, a
fim de não construir intervalos que possam levar informações enganosas a quem for ler o trabalho.
Tabela 4: Tabela de frequência da variável quantitativa discreta Anos.
1⊢6
Anos Freq. Abs. Freq. Rel. (%)
6 ⊢ 11
12 40%
11 ⊢ 16
9 30%
16 ⊢ 21
0 0%
21 ⊢⊣ 26
6 20%
3 10%
Total 30 100%
As tabelas 4 (acima) e 5 (abaixo) trazem as frequências das variáveis Anos e Motor (respectivamente); pode-
se notar que parte da informação é perdida, se olharmos a primeira linha da tabela 4, temos que 12 veículos
vinham sendo fabricado a 5 ou menos anos, porém não sabemos ao certo quantos vinham sendo fabricados
a 5 anos, ou a 1 ano, infelizmente, não existe uma maneira de resumir a informação sem sofrer alguma perda
de informação em casos como os apresentados.
Tabela 5: Tabela de frequência da variável quantitativa discreta Motor.
14 ⊢ 28,5
Motor (Cavalos de potência) Freq. Abs. Freq. Rel. (%)
28,5 ⊢ 43
1 3,33%
43 ⊢ 57,5
1 3,33%
57,5 ⊢ 72
5 16,67%
72 ⊢ 86,5
4 13,33%
86,5 ⊢ 101
1 3,33%
101 ⊢ 115,5
6 20,00%
115,5 ⊢⊣ 130
7 23,33%
5 16,67%
Total 30 100%
arredondamento.
Utilizando as tabelas 4 e 5 podemos ter uma visão geral dos dados de potência do motor e tempo de fabricação
dos veículos:
 A tabela 4 nos diz que a grande maioria dos carros vinham sendo fabricados a 10 anos ou menos (70%),
1 ⊢ 6 fechado em 1 e aberto em 6, isso quer dizer que carros que vinham sendo fabricados a 6 anos
sendo que 40% dos veículos vinham sendo fabricados a 5 anos ou menos (prestar atenção no intervalo
6 ⊢ 11 fechado em 6 e aberto em 11);

não são incluídos nesse intervalo! Devem ser incluídos no segundo intervalo
21
 A tabela 4 também nos diz que apenas 10% dos carros dessa pesquisa vinham sendo produzidos a
mais de 20 anos;
 A tabela 5 mostra que a maioria dos carros têm 87 CV de potência ou mais (60%) e apenas 6,67% dos
veículos observados têm potência de 43 CV ou menos.
Embora as tabelas 4 e 5 sejam relativas ao mesmo banco de dados uma possui 5 classes e a outra 8, isso
acontece pois:
 No caso da variável Anos temos uma menor amplitude nos dados (25 anos de amplitude) são poucas
informações (apenas 30 dados), escolhi 5 classes, pois a variável é discreta, são poucos dados e 25 é
divisível por 5, dessa maneira é possível iniciar a primeira classe em 1 (menor observação) e finalizar
a última classe em 26 (maior observação) mantendo o mesmo tamanho nas 5 classes e sem utilizar
decimais;
 No caso da variável Motor temos uma maior amplitude nos dados (116 CV de amplitude), continuamos
com as mesmas 30 observações, o que considero como pouco, não sendo necessário um número
= 14,5).
muito grande de classes, mas um número maior do que 5 (que é o mínimo). Escolhi 8 classes, pois a
divisão por múltiplos de 2 costuma fornecer valores fáceis de se trabalhar (nesse caso
Sendo assim, novamente, ficou fácil de fazer classes do mesmo tamanho, iniciando a primeira no
menor valor (14 CV) e finalizando a última no maior valor (130 CV).
Tabela 6: Tabela de frequência da variável quantitativa contínua Preço.
5.255 ⊢ 8.615
Preço (dólares) Freq. Abs. Freq. Rel. (%)
8.615 ⊢ 11.975
9 30,00%
11.975 ⊢ 15.335
6 20,00%
15.335 ⊢ 18.695
7 23,33%
18.695 ⊢ 22.055
2 6,67%
22.055 ⊢ 25.415
1 3,33%
25.415 ⊢ 28.775
2 6,67%
28.775 ⊢ 32.135
0 0,00%
32.135 ⊢ 35.495
1 3,33%
35.395 ⊢⊣ 38.855
1 3,33%
1 3,33%
Total 30 100%
arredondamento.
Tabela 7: Tabela de frequência da variável quantitativa contínua comprimento.
3,36 ⊢ 3,63
Comprimento (metros) Freq. Abs. Freq. Rel. (%)
3,63 ⊢ 3,90
2 6,67%
3,90 ⊢ 4,17
7 23,33%
4,17 ⊢ 4,44
9 30,00%
4,44 ⊢ 4,71
6 20,00%
4,71 ⊢⊣ 4,98
5 16,67%
1 3,33%
Total 30 100%
22
As tabelas 6 e 7 (página 22) resumem as informações sobre o preço (em dólares) e o comprimento (em metros)
dos veículos apresentados na tabela 1 (página 11). Novamente, pode-se notar que existe uma perda de
informação, sabemos quantos veículos pertencem a cada classe, porém, não temos como saber quais os
valores exatos dos preços ou comprimentos. Pode-se dizer, no entanto:
 50% dos veículos avaliados custavam menos de 12.000,00 dólares, sendo que apenas 10% dos veículos
analisados custavam 28.775,00 dólares ou mais;
 Já com relação aos comprimentos, aparentemente os carros se distribuem de maneira mais simétrica,
30% dos veículos medem entre 3,36m e 3,90m; 50% medem entre 3,90m e 4,44m; e 20% medem
entre 4,44m e 4,98m.
Assim como para as tabelas 4 e 5 (página 21), as tabelas 6 e 7 possuem números diferentes de classes, isso
pois:
 Os dados de preços (tabela 6) tinham uma amplitude de 33.593 dólares, um número não muito
amigável e bastante grande. Ao dividirmos esse valor por 10, temos 3.359,3 dólares. Pensei em 10
classes pois a divisão de qualquer valor por 10 é simples, e 10 é um número grande o suficiente de
classes para fornecer uma ideia da distribuição dos dados. No entanto, fazer classes de tamanho exato
de 3.359,3 iria acrescentar decimais e poderia deixar o leitor mais confuso, sendo assim, selecionei o
tamanho de 3.360 para cada classe, visando produzir uma tabela mais simples e de fácil leitura.
Utilizando o valor de 3.360 para cada uma das 10 classes eu fico com uma amplitude de 33.600 (7
dólares a mais do que a amplitude real). A fim de manter a tabela o mais simples e fiel possível, resolvi
iniciar a primeira classe em 5.255 dólares (ao invés de em 5.257 dólares) e finalizei a última classe em
38.855 dólares ao invés de em 38.850 dólares. Esse ajuste não é obrigatório, porém, como a ideia da
tabela é facilitar a compreensão dos dados permanecendo fiel aos mesmos, considero como sendo
adequado.
 Já na tabela 7, a amplitude dos dados era de 1,62 m, valor pequeno e divisível por 6, sendo assim
foram utilizadas 6 classes de tamanho 0,27 m. Nesse caso, não há problemas em usar decimais, já que
os valores brutos são dados com 2 casas decimais, e foi possível manter os valores mínimo e máximo
originais.
3.2.4. Gráficos para Variáveis Quantitativas
Assim como para as variáveis qualitativas, também existem diversas maneiras de representar dados e variáveis
quantitativas graficamente. Dois gráficos muito comuns e muito utilizados são os histogramas e gráficos de
dispersão; estes serão os gráficos que iremos estudar nesta seção.
O histograma é um gráfico de barras específico e exclusivo para variáveis quantitativas, não podendo ser
utilizado para variáveis qualitativas. Pode-se dizer que todo histograma é um gráfico de barras, mas nem todo
gráfico de barras é um histograma. Como os gráficos de barras vistos anteriormente, os histogramas também
são montados a partir da tabela de frequência da variável em questão.
Consideremos a variável Anos, usando as informações apresentadas na tabela 4 (página 21) temos o seguinte
histograma:
23
Figura 7: Histograma para a variável Anos, feito com base na tabela 4.
Pode-se perceber que as quebras do histograma apresentado na figura 7 não coincidem com os valores
colocados na escala do eixo horizontal, o que pode dificultar a leitura e o entendimento da tabela, ao elaborar
um histograma deve-se levar em consideração o posicionamento das barras e a facilidade na leitura das
mesmas, utilizando o padrão do software R (R Development Core Team (2020)), utilizado na criação dessas
figuras temos o seguinte histograma apresentado na figura 8 (próxima página):
24
Figura 8: Histograma para a variável Anos, feito usando o padrão do comando hist() do software R.
Comparando as figuras 7 e 8 podemos perceber que ambos usam a mesma amplitude (5 anos) para os
intervalos de anos, porém, na figura 7 o primeiro intervalo se inicia em 1 ano e na figura 8 ele se inicia em 0
anos. Embora ambas as figuras apresentem histogramas corretos e feitos para o mesmo conjunto de dados,
podemos perceber que eles possuem diferenças, a figura 7 pode ser menos “amigável” necessitando de mais
atenção do leitor para ser bem compreendida e interpretada, mas apresentando os dados com menos perda
de informação, já a figura 8 tem barras mais bem localizadas facilitando a leitura e interpretação dos dados,
porém com maior perda de informação.
Fica a pergunta: Qual dos dois gráficos deve ser utilizado para a apresentação dos dados? É a minha opinião
que a figura mais indicada é aquela que permite uma visão geral dos dados de maneira simples e visualmente
agradável, sendo assim, embora a figura 7 tenha menor perda de informação, eu diria que a figura 8 deveria
ser a escolhida para apresentar visualmente os dados relativos à quantidade de anos que os veículos
pesquisados vinham sendo fabricados.
Alguns outros pontos que devem ser ressaltados com respeito aos histogramas:
 Note, que diferente dos gráficos de barras apresentados para variáveis qualitativas, as barras dos
histogramas são coladas umas nas outras, isso deve sempre acontecer, já que devemos dar a ideia de
continuidade aos dados;
 Utilizei colorações diferentes para as figuras 7 e 8, isso, pois quis destacar as diferenças em ambos os
gráficos, porém as colunas (dentro de cada gráfico) mantém a mesma cor das colunas vizinhas
(diferente dos gráficos de barras para variáveis qualitativas), isso deve sempre ser verdade;
 Como a minha intensão ao construir dois gráficos para a mesma variável foi comparar ambos os
gráficos (um com o outro) mantive os mesmos limites em ambos os eixos; sempre que se desejar
comparar gráficos deve-se utilizar os mesmos limites nos eixos a fim de evitar erros na interpretação
dos leitores; e no caso de utilizar variáveis com alguma diferença (por exemplo comparar valores de
25
carros nacionais com carros importados) além de manter a igualdade nos limites dos eixos, deve-se
utilizar a frequência relativa e não a absoluta;
 Assim como para os gráficos de barras, os eixos devem ser identificados e devem apresentar seus
valores em uma escala indicada com clareza.
Irei apresentar nas páginas seguintes os histogramas das outras variáveis pra as quais foram feitas as tabelas
de frequência; comparando os histogramas construídos com base nas tabelas e aqueles construídos
automaticamente pelo comando hist() do software R.
26
Figura 9: Histograma para a variável Motor, feito com base na tabela 5 (página 17).
Figura 10: Histograma para a variável Motor, feito usando o padrão do comando hist() do software R.
27
Figura 11: Histograma para a variável Preço, feito com base na tabela 6 (página 18).
Fonte: Elaborada pela autora
Figura 12: Histograma para a variável Preço, feito usando o padrão do comando hist() do software R.
28
Figura 13: Histograma para a variável Comprimento, feito com base na tabela 7 (página 18).
Figura 14: Histograma para a variável Comprimento, feito usando o padrão do comando hist() do software R.
29
Em todos os casos, considero que os histogramas feitos com base nas tabelas de frequências são mais
informativos, porém com a desvantagem de apresentarem dificuldades na sua visualização e interpretação
(por consequência). Sendo assim, na minha opinião, os histogramas apresentados pelas figuras 8, 10, 12 e 14
deveriam ser os selecionados para apresentação dos dados, mesmo que eles tenham uma perda maior de
informação.
3.2.5. Frequência Acumulada
Pode ser útil adicionar uma coluna contendo a frequência acumulada nas tabelas de frequência para variáveis,
tanto quantitativas quanto qualitativas. A coluna contendo a frequência acumulada deve ser adicionada
apenas quando a informação for importante para a interpretação e compreensão dos dados.
A frequência relativa acumulada pode ser definida como a proporção de elementos apresentando valor igual
ou menor ao de determinada classe (somente quando as classes podem ser ordenadas; pode ser utilizada em
tabelas de frequência para variáveis qualitativas ordinais, mas não para variáveis qualitativas nominais). A
frequência relativa acumulada deve seguir o mesmo formato da frequência relativa (se essa for em formato
decimal a acumulada também deverá ser apresentada no formato decimal, ou se for utilizado porcentagem
na frequência relativa, como é o caso nessa apostila, a frequência relativa acumulada também deve ser
apresentada em formato de porcentagem).
= !
!"
Vou refazer as quatro tabelas apresentadas na seção acima, adicionando a nova coluna a fim de explicar
melhor sua utilidade e construção:
Tabela 8: Tabela de frequência da variável quantitativa discreta Anos, adicionando a frequência acumulada.
1⊢6
Anos Freq. Abs. Freq. Rel. (%) Freq. Rel. Ac. (%)
6 ⊢ 11
12 40% 40%
11 ⊢ 16
9 30% 40% + 30% = 70%
16 ⊢ 21
0 0% 70% + 0 = 70%
21 ⊢⊣ 26
6 20% 70% + 20% = 90%
3 10% 90% + 10% = 100%
Total 30 100%
A tabela 8 apresentada acima não apresenta nenhuma dificuldade no cálculo da frequência relativa
acumulada, basta somar as frequências relativas das classes em questão com aquelas frequências relativas
das classes anteriores a ela. Fica fácil de observar que 70% dos automóveis observados eram fabricados a 10
anos ou menos, apenas 30% dos automóveis vinham sendo fabricados a 16 anos ou mais.
30
Tabela 9: Tabela de frequência da variável quantitativa discreta Motor, adicionando a frequência acumulada.
14 ⊢ 28,5 1# = $, $$%
Motor (Cavalos de potência) Freq. Abs. Freq. Rel. (%) Freq. Rel. Ac. (%)
30
28,5 ⊢ 43 (1 + 1)# 2
1 3,33%
30 = #30 = (, ()%
(2 + 5)# 7
1 3,33%
43 ⊢ 57,5
30 = #30 = *$, $+%
(7 + 4)# 11
5 16,67%
57,5 ⊢ 72
30 = #30 = $(, ()%
(11 + 1)# 12
4 13,33%
72 ⊢ 86,5
30 = #30 = +,%
(12 + 6)# 18
1 3,33%
86,5 ⊢ 101
30 = #30 = (,%
(18 + 7)# 25
6 20,00%
101 ⊢ 115,5
30 = #30 = -$, $$%
(25 + 5)# 30
7 23,33%
115,5 ⊢⊣ 130
30 = #30 = .,,%
5 16,67%
Total 30 100%
arredondamento.
Tabela 10: Tabela de frequência da variável quantitativa contínua Preço, adicionando a frequência acumulada.
5.255 ⊢ 8.615 9# = $,%

Preço (dólares) Freq. Abs. Freq. Rel. (%) Freq. Rel. Ac. (%)
30
8.615 ⊢ 11.975 (9 + 6)# 15
9 30,00%
30 = #30 = /,%
(15 + 7)# 22
6 20,00%
11.975 ⊢ 15.335
30 = #30 = )$, $$%
(22 + 2)# 24
7 23,33%
15.335 ⊢ 18.695
30 = #30 = -,%
(24 + 1)# 25
2 6,67%
18.695 ⊢ 22.055
30 = #30 = -$, $$%
(25 + 2)# 27
1 3,33%
22.055 ⊢ 25.415
30 = #30 = 0,%
(27 + 0)# 27
2 6,67%
25.415 ⊢ 28.775
30 = #30 = 0,%
(27 + 1)# 28
0 0,00%
28.775 ⊢ 32.135
30 = #30 = 0$, $$%
(28 + 1)# 29
1 3,33%
32.135 ⊢ 35.495
30 = #30 = 0(, ()%
(29 + 1)# 30
1 3,33%
35.395 ⊢⊣ 38.855
30 = #30 = .,,%
1 3,33%
Total 30 100%
arredondamento.
As tabelas 9 e 10 (acima) apresentam uma situação um pouco diferente da tabela 8, já que devido ao
arredondamento a soma direta das frequências relativas (como foi feito nas tabelas 8 e 11) resultaria em um
valor diferente de 100%. Para solucionar esse problema, uma possível solução é calcular a frequência absoluta
acumulada e a partir dela calcular a frequência relativa acumulada, como foi feito em ambas as tabelas (9 e
10). Dessa forma, chegamos à frequência acumulada de 100% na última classe (coisa que sempre deve ocorrer,
assim como a frequência relativa total deve sempre ser 100%). Observando a frequência relativa acumulada
31
na tabela 10, fica fácil de ver que 50% dos veículos custavam menos que 11.975 dólares e apenas 10% dos
veículos custavam 28.775 dólares ou mais.
Tabela 11: Tabela de frequência da variável quantitativa contínua Comprimento, adicionando a frequência acumulada.
3,36 ⊢ 3,63
Comprimento (metros) Freq. Abs. Freq. Rel. (%) Freq. Rel. Ac. (%)
3,63 ⊢ 3,90
2 6,67% 6,67%
3,90 ⊢ 4,17
7 23,33% 6,67% + 23,33% = 30%
4,17 ⊢ 4,44
9 30,00% 30% + 30% = 60%
4,44 ⊢ 4,71
6 20,00% 60% + 20% = 80%
4,71 ⊢⊣ 4,98
5 16,67% 80% + 16,67% = 96,67%
1 3,33% 96,67% + 3,33% = 100%
Total 30 100%
A tabela 11 (acima) também não apresenta dificuldades no cálculo da frequência relativa acumulada, já que
não apresenta problemas relativo ao arredondamento utilizado.
3.2.6. Polígonos de Frequência
O gráfico denominado polígono de frequência pode ser utilizado para relacionar uma variável contínua com
sua frequência relativa (ou absoluta), fornecendo informações muito semelhantes às apresentadas pelo
histograma; como diferença, irá apresentar apenas os pontos centrais de cada classe e uma reta ligará esses
pontos, sendo que o primeiro ponto deve ser proveniente de uma nova classe criada logo abaixo da menor
classe e deve estar ligado ao valor zero e o último ponto deve ser proveniente de uma nova classe criada logo
acima da maior classe e deve estar ligado ao valor zero.
Os polígonos de frequência podem, também, relacionar uma variável contínua com sua frequência relativa
acumulada, nesse caso, deve ser utilizado um ponto para relacionar o limite final de cada classe com a sua
frequência relativa acumulada, de maneira que o primeiro ponto deve relacionar o valor mínimo com a
frequência zero e o último ponto deverá relacionar o valor máximo com a frequência 100%.
Vamos apresentar abaixo os gráficos de polígono de frequência (tanto acumulada como não acumulada) para
as variáveis Anos, Motor, Preço e Comprimento. Iremos apresentar, primeiro, o gráfico de polígono de
frequência para cada uma das 4 variáveis e em seguida o gráfico de polígono da frequência relativa acumulada
para cada uma das 4 variáveis mencionadas.
As figuras 15 e 16 (página 33) contém os polígonos de frequências para as variáveis Anos e Motor, esses dois
polígonos foram construídos utilizando o histograma apresentado anteriormente nas figuras 7 e 9 (páginas 24
e 27), respectivamente. Utilizei as frequências absolutas, já que os histogramas utilizaram essa frequência.
Pode-se notar que o polígono é formado por pontos posicionados de acordo com a frequência observada de
determinada classe e seu valor central. Tendo início em um ponto anterior à menor classe e final em um ponto
posterior à maior classe, mantendo a mesma distância observada entre os outros pontos. Pode ser feita uma
exceção na distância entre os pontos em casos específicos, como, por exemplo, na figura 15, como a variável
de interesse é número de anos em que o veículo vinha sendo fabricado, não fazia sentido utilizar um valor
negativo, sendo assim, o valor inicial foi o zero, e não -1,5 que seria o valor anterior a 3,5 (ponto central da
primeira classe), se fosse mantida a distância de 5 anos utilizada para os outros intervalos entre pontos.
32
Figura 15: Polígono de Frequência para a Variável Anos, baseado na tabela 8 (página 30).
Figura 16:Polígono de Frequência para a Variável Motor, baseado na tabela 9 (página 31).
Uma das possibilidades que os polígonos de frequência nos oferecem é comparar dois grupos distintos
existentes dentro de uma mesma variável. Vejamos por exemplo, a figura 17, à seguir (página 34):
33
Figura 17: Polígono de Frequências para a comparação de veículos Nacionais e Importados, dentro da variável Anos.
A figura 17 nos mostra que dentre os veículos nacionais é muito mais frequente encontrar veículos mais novos;
já dentre os veículos internacionais podemos observar que a divisão das frequências entre carros com menos
de 15 anos e mais de 15 anos é bem mais igualitária. No caso da comparação entre carros nacionais e
internacionais dentro da variável ano, foi utilizada a frequência relativa (%) e não a absoluta, isso pois os 30
veículos observados se dividem em 11 importados e 19 nacionais, logo, utilizar a frequência absoluta poderia
levar o leitor a erros de interpretação e a conclusões erradas, por consequência.
Figura 18: Polígono de Frequência para a Variável Preço, baseado na tabela 10 (página 31).
34
Figura 19: Polígono de Frequência para a Variável Comprimento, baseado na tabela 11 (página 32).
Já as figuras 18 e 19 foram construídas utilizando a frequência relativa em porcentagem, se vocês observarem

as figuras 11 e 13 (páginas 28 e 29, respectivamente), poderão ver que as imagens se encaixariam, assim como
as apresentadas nas figuras 15 e 16, mas os eixos verticais apresentam valores distintos, já que em um caso
está sendo utilizada a frequência relativa e no outro a absoluta.
Pessoalmente, eu prefiro os histogramas aos polígonos de frequência, a não ser em alguns casos específicos,
como quando se deseja fazer uma comparação entre duas distribuições de uma mesma variável observada
em dois grupos distintos (caso da figura 17, na página 34, por exemplo).
As figuras 20, 21, 22 e 23 apresentam os polígonos de frequência acumuladas das variáveis Anos, Motor, Preço
e Comprimento (respectivamente). Vou listar abaixo algumas informações que podemos tirar desses 4
gráficos:
 Primeira informação que é interessante de se notar é que todos os gráficos são crescentes, isso
sempre deve acontecer ao construirmos esse tipo de gráfico, pela sua natureza, já que ele deve
acumular frequências indo de 0 à 100%, sempre;
 Pode-se notar, também, que a forma dos gráficos, embora sempre crescente, pode variar bastante de
variável para variável:
o Variável anos: frequência acumula de maneira muito rápida de 1 a 11 anos, depois para e volta
a acumular mais lentamente de 16 a 26 anos (figura 20);
35
Figura 20: Polígono de Frequência Acumulada para a Variável Anos, baseado na tabela 8 (página(26).
o Variável Motor: frequência acumula de maneira muito lenta até 43 CV de potência, continua
acumulando de maneira lenta, mas nem tanto, até os 86,5 CV, depois dos 86,5 CV a frequência
passa a acumular de maneira muito rápida, atingindo os 100% em 130 CV (figura 21);
Figura 21: Polígono de Frequência Acumulada para a Variável Motor, baseado na tabela 9 (página 27).
36
o Variável Preço: Comportamento praticamente inverso ao visto na variável Motor, a frequência
acumula muito rapidamente entre 5.255 dólares e 15.335 dólares (alcançando 73,33%),
depois acumula lentamente até alcançar 100% em 38.855 dólares (figura 22);
Figura 22: Polígono de Frequência Acumulada para a Variável Preço, baseado na tabela 10 (página 27).

o Variável Comprimento: nesse caso podemos verificar uma acumulo bastante equilibrado,
sendo menor nas classes inicial e final (figura 23).
Figura 23: Polígono de Frequência Acumulada para a Variável Comprimento, baseado na tabela 11 (página 28).
37
3.2.7. Tabelas e Gráficos Bidimensionais
Foram apresentados até agora, tabelas e gráficos resumindo uma única variável por vez. É possível, utilizar
tabelas e gráficos para representarem duas ou mais variáveis por vez, isso geralmente é feito quando existe o
interesse em verificar se existem padrões de comportamento entre as variáveis, ou buscar possíveis relações
entre elas.
3.2.7.1. Tabelas de Dupla Entrada
Uma tabela muito útil e muito comum é a tabela de dupla entrada, ela permite estudar a relação entre duas
variáveis qualitativas distintas, observadas em uma mesma população, com o intuito de verificar se essas
variáveis possuem algum tipo de relação.
Essas tabelas podem ser utilizadas como base para estudar, por exemplo, a independência ou não entre duas
variáveis qualitativas, o que será estudado com mais cuidado nas seções sobre probabilidade e inferência
estatística.
Para montar uma tabela de dupla entrada, primeiro, é necessário selecionarmos as variáveis de interesse, no
caso das variáveis apresentadas pela tabela 1 (página 11), podemos ter interesse em verificar se parece haver
uma relação entre geração do veículo em 1999 e sua nacionalidade. Nesse caso, devo escolher uma variável
para ser representada na primeira linha e uma para ser representada na primeira coluna:
Tabela 12: Tabela de dupla entrada relacionando Nacionalidade e Geração.
Geração
Nacionalidade Total
1 2 3 4 6 8
Alemanha 1 0 1 0 0 0 2
Argentina 1 0 0 0 0 0 1
Áustria 0 0 0 1 0 0 1
Bélgica 1 0 0 0 0 0 1
Brasil 6 9 1 0 1 2 19
Coréia do Sul 1 1 0 0 0 0 2
Espanha 1 0 0 0 0 0 1
EUA 1 0 0 0 0 0 1
França 1 1 0 0 0 0 2
Total 13 11 2 1 1 2 30
Esta tabela de dupla entrada (tabela 12) não parece muito informativa, isso se dá pois temos uma quantidade
pequena de carros amostrados, temos apenas 1 carro nativo da Argentina, Áustria, Bélgica, Espanha e EUA,
apenas 2 carros nativos da Coréia do Sul e da França, temos 19 dos 30 carros brasileiros, nesse caso, pode ser
mais interessante fazer uma tabela comparando carros nacionais com carros importados:
38
Tabela 13: Tabela de dupla entrada relacionando carros nacionais e importados, quanto às suas gerações em 1999.
Geração
Nacionalidade Total
1 2 3 4 6 8
Nacional 6 9 1 0 1 2 19
Importado 7 2 1 1 0 0 11
Total 13 11 2 1 1 2 30
A tabela 13 pode ter perda de informação quando comparada com a tabela 12, isso, pois traz informações
mais resumidas, porém, é mais útil para a comparação dos carros nacionais e importados. No entanto, talvez
facilite ainda mais se utilizarmos as frequências relativas (em porcentagem) como foi feito nas tabelas de
frequência para uma única variável. Existem, no entanto, três possibilidades para a criação dessas tabelas
(BUSSAB e MORETTIN, 2004):
 Trabalhar com a porcentagem com relação ao total geral;

 Trabalhar com a porcentagem com relação ao total de cada linha;
 Trabalhar com a porcentagem com relação ao total de cada coluna.
Serão apresentadas abaixo as tabelas 14, 15 e 16 contendo cada uma das possibilidades de tabela de dupla
entrada com proporção, espero que com esse exemplo possamos ver que as tabelas, não serão idênticas, e
que dependendo da situação e das variáveis de interesse, haverá uma mais interessante, ou mais informativa,
do que as outras. O nosso papel, é selecionar corretamente a tabela que mais se adequa a cada caso.
Tabela 14: Tabela de dupla entrada relacionando nacionalidade com geração, utilizando a porcentagem com relação ao total geral.
Geração Total
Nacionalidade
1 2 3 4 6 8
Nacional 20% 30% 3,33% 0% 3,33% 6,67% 63,33%
Importado 23,33% 6,67% 3,33% 3,33% 0% 0% 36,67%
Total 43,33% 36,67% 6,67% 3,33% 3,33% 6,67% 100%
arredondamento.
Tabela 15: Tabela de dupla entrada relacionando nacionalidade com geração, utilizando a porcentagem com relação ao total de cada
linha.
Geração Total
Nacionalidade
1 2 3 4 6 8
Nacional 31,58% 47,37% 5,26% 0% 5,26% 10,53% 100%
Importado 63,64% 18,18% 9,09% 9,09% 0% 0% 100%
Total 43,33% 36,67% 6,67% 3,33% 3,33% 6,67% 100%
arredondamento.
39
Tabela 16: Tabela de dupla entrada relacionando nacionalidade com geração, utilizando a porcentagem com relação ao total de cada
coluna.
Geração Total
Nacionalidade
1 2 3 4 6 8
Nacional 46,15% 81,82% 50% 0% 100% 100% 63,33%
Importado 53,85% 18,18% 50% 100% 0% 0% 36,67%
Total 100% 100% 100% 100% 100% 100% 100%
arredondamento.
Ao observar as tabelas 14,15 e 16, pode-se notar que elas apresentam valores bem diferentes umas das outras,
logo, a primeira coisa que se deve fazer ao utilizar esse tipo de tabela, é especificar exatamente o que está
sendo apresentado. No caso das duas variáveis que estão sendo utilizadas no exemplo, eu, particularmente
acredito que a tabela 15 é a que mais ajuda na comparação, já que separa, primeiramente, os carros em
nacionais e importados, e depois os divide de acordo com a geração, permitindo que estudemos a distribuição
da geração dentro da nacionalidade. Podemos ver que os carros importados estão bastante concentrados
entre a primeira e a segunda geração, com maior peso na primeira geração; já os carros nacionais estão mais
dispersos, e centrados na segunda geração.
A tabela 16 apresenta como os carros estão divididos entre nacionais e importados dentro de cada uma das
gerações observadas, de maneira que as nacionalidades parecem equilibradas dentro das gerações 1 e 3, mas
totalmente desequilibradas nas outras gerações, de maneira que a grande maioria dos carros de geração 2
são nacionais, todos os da geração 4 são internacionais e todos os das gerações 6 e 8 são nacionais.
A tabela 14 talvez seja a menos simples de interpretar, por estar fazendo a comparação com o total geral e
pelo fato de termos quase o dobro de carros nacionais quando comparados com os internacionais. Eu diria
que essa seria a menos indicada nesse caso. E que a tabela 15 seria a mais indicada, já que pela distribuição
das variáveis, parece mais congruente abrir gerações dentro de nacionalidade do que nacionalidade dentro
de gerações (duas gerações com apenas 1 carro cada e duas gerações com apenas 2 carros cada (tabela 13)).
3.2.7.2. Gráfico de Dispersão Bidimensional
Um gráfico que pode ser utilizado para representar variáveis quantitativas é o gráfico de dispersão,
comumente utilizado quando existe o interesse em visualizar possíveis relações entre duas variáveis.
Considerando os dados apresentados na tabela 1 (página 11), parece natural pensar que um veículo maior
deve custar mais do que um veículo menor, podemos iniciar um estudo para verificar se esse pensamento é
coerente fazendo um gráfico de dispersão entre as variáveis Preço e Comprimento:
40
Figura 24: Gráfico de dispersão para as variáveis Preço e Comprimento.
Antes de fazer a interpretação da figura 24, é importante destacar que:
 Deve-se SEMPRE nomear os eixos e utilizar uma escala consistente nos mesmos;
 O eixo horizontal (ou eixo x) deve representar a variável considerada independente (nesse caso, faz
sentido pensar que o valor do veículo depende do comprimento do mesmo, sendo assim,
Comprimento é considerada independente e Preço dependente), a variável dependente deve estar
representada no eixo vertical (ou eixo y);
 Cada ponto no gráfico (cada asterisco vermelho) representa um veículo, se olharmos na tabela 1,
poderemos ver que o veículo Audi A3 custava 38.850 e media 4,15 metros, como um exemplo esse
veículo específico foi destacado na figura 24.
Observando a figura 24, pode-se dizer que preço e comprimento parecem estar relacionados, porém, essa
relação não é simples. Temos que veículos entre 3,25 metros e 4 metros (10 veículos, de acordo com a figura
24) tiveram uma variação de preços entre 5.000 dólares e 15.000 dólares, já os veículos entre 4 metros e 4,75
metros (19 veículos, de acordo com a figura 24) tiveram uma grande variação de preço, entre 5.000 e 40.000;
sendo assim, acredito que os veículos com menos de 4 metros eram aqueles mais populares, e dentre os
veículos com mais de 4 metros e menos de 4,75 metros haviam tanto veículos populares, como veículos de
luxo.
Nem sempre é fácil enxergar a relação (ou falta dela) entre duas variáveis. Existem alguns tipos de padrão
que costumamos procurar quando construímos esse tipo de gráfico:
41
Figura 25: Padrões de relações lineares que podem ser encontrados em gráficos de dispersão.
Vamos dar uma olhada no gráfico de dispersão entre as variáveis Motor e Preço (figura 26):
Figura 26: Gráfico de dispersão para as variáveis Preço e Motor.
Na figura 26 pode-se observar a relação entre as variáveis Preço e Motor, podemos perceber que nenhuma
das tendências (ou padrões) apresentados na figura 25 parecem se encaixar aos dados apresentados; isso é
muito normal, existem gráficos que apresentarão uma tendência clara e outros que serão mais difíceis de
interpretar. No caso do gráfico apresentado na figura 26 pode-se observar uma tendência no valor do carro
diminuir conforme o motor fica mais potente (no intervalo de 20 à 60 cavalos) e depois uma possível tendência
de aumento do valor conforme aumenta a potência (no intervalo de 80 à 130 cavalos); nesse caso teríamos
uma relação decrescente e, no mesmo gráfico, uma relação crescente; o que poderia ser explicado por uma
parábola, ou uma equação de segundo grau. Muitas vezes um gráfico de dispersão pode fornecer indicativos
de relações mais complexas do que uma simples relação linear, deve-se sempre analisar as possibilidades com
muito cuidado e manter a mente aberta para possíveis relações.
42
3.2.7.3. Gráficos de Linha
Gráfico com uma estrutura bastante similar ao gráfico de dispersão bidimensional, também, busca relacionar
duas variáveis para auxiliar na compreensão da relação entre elas. A grande diferença é que nesse gráfico não
pode haver mais de um valor possível no eixo y para cada valor do eixo x. Dessa forma podemos ligar os pontos
adjacentes por uma linha e seguir um caminho que irá da esquerda para a direita, sem interrupções ou
retornos.
Muito útil quando queremos estudar a evolução de uma variável no tempo, como por exemplo, estudar
padrões de temperatura no passar dos anos. Podemos ter uma ideia desse tipo de situação ao estudar os
gráficos a seguir (figuras 27, 28 e 29), mostrando a temperatura média mensal de janeiro de 1976 à dezembro
de 1985 nas cidades de Cananéia e Ubatuba (litoral sul e litoral norte do Estado de São Paulo,
respectivamente), esses dados foram obtidos em Bussab e Morettin (2004), páginas 487 e 488.
Figura 27: Temperatura média na cidade de Cananéia de Janeiro de 1976 à Dezembro de 1985.
É interessante plotar a temperatura mensal de acordo com o tempo, já que deixa bastante claro o efeito das
estações do ano nessa temperatura, apesar da amplitude térmica ser baixa (esperado em uma cidade litorânea
em um país tropical), é possível notar que em janeiro temos temperaturas médias altas, essas temperaturas
caem durante o ano, até chegarem os meses centrais de junho e julho, e depois começam a subir novamente,
alçando os patamares nos meses de dezembro e janeiro.
Podemos notar a mesma sazonalidade observando a figura 28.
43
Figura 28: Temperatura média na cidade de Cananéia de Janeiro de 1976 à Dezembro de 1985.
Os dois gráficos (figuras 27 e 28), são semelhantes, mas não idênticos. E embora os eixos tenham sido
construídos de maneira a seguirem a mesma escala e terem os mesmos limites, fica difícil de comparar as
temperaturas médias de ambas as cidades, se esse for o interesse, pode ser melhor sobrepor um gráfico ao
outro (figura 29).
Figura 29: Temperatura média nas cidades de Cananéia e Ubatuba de Janeiro de 1976 à Dezembro de 1985.
44
Olhando com cuidado, é possível notar que a Cidade de Cananéia apresentou (exceto em 1983) médias de
temperaturas mais baixas no período de inverno (meio do ano), o que era de se esperar, já que Cananéia faz
fronteira com Paraná e Ubatuba com o Rio de Janeiro. Mas, as temperaturas médias no período de verão não
parecem serem tão distintas, embora as temperaturas de Ubatuba, nessa época do ano, tendam a ser
levemente superiores às de Cananéia (novamente, com exceção para o verão entre 1983 e 1984).
3.3. Exercícios
1- [DEVORE, 2006] Os transdutores de temperatura de um determinado tipo são enviados em lotes de 50.
Uma amostra de 60 lotes foi selecionada e o número de transdutores fora das especificações em cada
lote foi determinado, resultando nos dados a seguir:
2 1 2 4 0 1 3 2 0 5 3 3 1 3 2 4 7 0 2 3
0 4 2 1 3 1 1 3 4 1 2 3 2 2 8 4 5 1 3 1
Determine a tabela de frequências dos valores observados de 1 (número de transdutores fora das
5 0 2 3 2 1 0 6 4 2 1 6 0 3 3 3 6 1 2 3
a.
especificações em um lote);
b. Que proporção de lotes na amostra possui no máximo cinco transdutores fora das especificações? Que
proporção tem menos de cinco? Que proporção possui no mínimo cinco unidades fora das
especificações?
c. Desenhe um gráfico de barras dos dados, usando a frequência relativa na escala vertical e comente suas
características.
2- [DEVORE, 2006] O artigo “Study on the Life Distribution of Microdrills” (J. of Engr. Manufacture, 2002:301-
305) relatou as observações a seguir, relacionadas em ordem crescente, à vida útil das brocas (número
de furos que uma broca faz antes de quebrar), quando os furos são feitos em uma determinada liga de
bronze.
11 14 20 23 31 36 39 44 47 50
59 61 65 67 68 71 74 76 78 79
81 84 85 89 91 93 96 99 101 104
105 105 112 118 123 136 139 141 148 158
161 168 184 206 248 263 289 322 388 513
a. Por que uma distribuição de frequência não poder ter por base os intervalos de classe [0 ; 50], [50 ; 100],
[100 ; 150] e assim por diante?
b. Construa uma tabela de frequência e um histograma dos dados usando limites de classes 0, 50, 100, ... e
então faça comentários sobre as características interessantes;
c. Que proporção das observações de vida útil dessa amostra é inferior a 100? Que proporção das
observações é igual ou maior que 200?
3- [DEVORE, 2006] Considere os dados a seguir sobre os tipos de queixas de saúde (J = inflamação de
articulações, F = fadiga, B = dor nas costas, M = fadiga muscular, C = tosse, N = irritação nasal/coriza, O =
outros) feitas por agricultores. Obtenha as frequências e as frequências relativas das diversas categorias,
desenhe um gráfico de barras e um de pizza. (Os dados são consistentes com as porcentagens fornecidas
no artigo “Physiological Effects of Work Stress and Presticide Exposure in Tree Planting by British
Columbia Silviculture Workers”, Ergonomics, 1993, p. 951-961.)
O O N J C F B B F O J O O M
O F F O O N O N J F J B O C
45
J O J J F N O B M O J M O B
O F J O O B N C O O O M B F
J O F N
4- [LARSON e FARBER, 2004] Quais são alguns dos benefícios obtidos quando se representa o conjunto de
dados usando a distribuição de frequência?
5- [LARSON e FARBER, 2004] Cite algumas maneiras de representar graficamente dados quantitativos e
qualitativos.
6- [LARSON e FARBER, 2004] Use um gráfico de dispersão para representar os dados da tabela, que são as
horas trabalhadas e o salário por hora (em dólares) para uma amostra de 12 trabalhadores da produção.
Descreva quaisquer tendências presentes.
Horas Salário por hora Horas Salário por hora

33 13,16 40 13,65
37 9,98 33 12,05
34 10,79 28 10,54
40 11,71 45 10,33
35 11,80 37 11,57
33 11,51 28 10,17
7- [TRIOLA, 2013] A população de idades à época das posses de todos os presidentes dos EUA que eram
profissionais das Forças Armadas é 62, 46, 68, 64, 57. Por que não faz sentido construir-se um histograma
para esse conjunto de dados?
8- [MARTINEZ, 2015] Um nutricionista deseja comparar os efeitos de duas dietas, que ele identifica por
dietas A e B. Um total de 100 pessoas é submetido à dieta A e outras 100 pessoas são submetidas à dieta
B. O nutricionista percebeu que 46% das pessoas submetidas à dieta A tiveram redução de peso, e o
mesmo aconteceu com 41% das pessoas submetidas à dieta B. Para uma apresentação em um evento
científico, ele esboçou dois gráficos para esses dados, exibidos a seguir:
Porém, somente um desses gráficos é adequado. Identifique o gráfico adequado (A ou B), e explique o
erro cometido no gráfico que é inadequado.
9- [MARTINEZ, 2015] Um estudante está conduzindo um estudo que objetiva descrever os doadores de
sangue de um serviço de hemoterapia. Ele utiliza uma amostra de 651 doadores, sendo 410 de sexo
masculino e 241 de sexo feminino. Dentre os doadores de sexo masculino, ele encontrou 161 portadores
de sangue tipo A, 56 portadores de sangue tipo B, 14 portadores de sangue tipo AB e 179 portadores de
sangue tipo O. Dentre os doadores de sexo feminino, ele encontrou 81 portadores de sangue tipo A, 44
portadores de sangue tipo B, 13 portadores de sangue tipo AB e 103 portadores de sangue tipo O. Para
46
descrever esses dados, o estudante construiu o gráfico de barras abaixo. Neste gráfico, os homens são
identificados por M, de masculino, e as mulheres por F, de feminino.
Seu professor, no entanto, lhe disse que esse gráfico contém um erro bastante sério.
a. Comente o que está errado nesse gráfico;

b. Esboce novamente um gráfico de barras para esses dados, de modo que esse erro não seja novamente
cometido.
10- [TRIOLA, 2013] Construa um gráfico de dispersão utilizando os dados abaixo, sendo que os dados de
alcatrão em cigarros tamanho king devem estar na escala horizontal e os dados de monóxido de carbono
(CO) nos mesmos cigarros devem estar na escala vertical. Determine se parece haver uma relação entre
o alcatrão e o CO em cigarros tamanho king. Em caso afirmativo, descreva a relação.
Tamanho King
Marca Alcatrão Nicotina CO
Austin 20 1,1 16
Basic 27 1,7 16
Bristol 27 1,7 16
Cardinal 20 1,1 16
Cavalier 20 1,1 16
Chesterfield 24 1,4 17
Cimarron 20 1,1 16
Class /a 23 1,4 15
Doral 20 1,0 16
GPC 22 1,2 14
Higway 20 1,1 16
Jacks 20 1,1 16
Marker 20 1,1 16
Monaco 20 1,1 16
Monarck 20 1,1 16
Old Gold 10 1,8 14
Pall Mall 24 1,6 16
47
Pilot 20 1,1 16
Prime 21 1,2 14
Pyramid 25 1,5 18
Raleigh Extra 23 1,3 15
Sebring 20 1,1 16
Summit 22 1,3 14
Sundance 20 1,1 16
Worth 20 1,1 16
11- [PAGANO e GAUVREAU, 2004] Declare se cada uma das seguintes observações é um exemplo de dados
discretos ou contínuos:
a. O número de suicídios nos Estados Unidos em um ano específico;
b. A concentração de chumbo em uma amostra de água;
c. A duração de tempo que um paciente de câncer sobrevive depois do diagnóstico;
d. O número de abortos prévios que uma mãe grávida teve.
12- [TRIOLA, 2013] Ao usarmos histogramas para a comparação de dois conjuntos de dados, às vezes isso se
torna difícil por termos que olhar um e outro histograma. Um histograma de frequência relativa lado a
lado usa um formato que torna essa comparação muito mais fácil. Em lugar de frequências absolutas,
devemos usar frequências relativas (porcentagens e proporções) para que as comparações não sejam
distorcidas por tamanhos amostrais diferentes. Observe o histograma de frequências relativas lado a
lado, mostrado a seguir e compare os dois conjuntos de dados.
3.4. Medidas Descritivas
Tabelas e gráficos são maneiras bastante eficientes de se resumir conjuntos de dados, porém não são as
únicas. Ao trabalhar com variáveis quantitativas, é natural buscar algumas quantidades que resumam essa
variável. Nesta seção iremos estudar algumas das medidas mais utilizadas para resumir variáveis quantitativas,
sendo elas discretas ou contínuas.
48
3.4.1. Medidas de Tendência Central
Uma medida de tendência central fornece um valor em torno do qual os dados de determinada variável se
distribuem. Existem diferentes medidas de tendência central, as mais comuns são:
 Média aritmética;
 Mediana;
 Moda.
A medida de tendência central mais facilmente encontrada é a média aritmética, ou apenas média. A fim de
encontrar a média de um conjunto de dados é necessária utilizar alguns símbolos e linguagem matemática,
esses serão definidos abaixo:
A média será, de agora em diante, denotada por: 1̅ ;

Um conjunto de dados, proveniente de uma variável quantitativa será denotado por: (1 , 13 ,

14 , … , 1 );

 Dessa maneira, pode-se definir a média como:
1 + 13 + ⋯ + 1 1
1̅ = = 1
"
Em que ∑ " 1 representa o somatório de 1 com variando de 1 à .
A mediana (denotada por 89) é o valor que ocupa a posição central em um conjunto de dados ordenados,
para encontrá-la deve-se, primeiro, ordenar os dados do menor para o maior, em seguida deve-se selecionar
o valor central, no caso de um conjunto de dados de tamanho ímpar, basta buscar o valor que estiver na
posição central; já para conjuntos de dados de tamanho par, deve-se calcular a média entre os dois valores
centrais:
1; < ,
=
se for ímpar
3
89 = :1; =
+ 1; < =
3 3
, se for par
2
Em que: 1;GHI= , 1;G= e 1;G< =

representam os valores observados que se encontram, após a ordenação dos
J J J
, 3 e 3 + 1, respectivamente.
<
3
dados, nas posições
A moda (denotada por 8K) de um conjunto de dados é a observação que aparece com maior frequência. Um
conjunto de dados pode ser:
 Amodal: Não possui moda, ou seja, todos os valores observados para a variável em questão aparecem
com a mesma frequência;
 Unimodal: Existe apenas um valor dentre todos os observados que se sobressai, que apresenta maior
frequência absoluta;
 Bimodal: Existem dois valores distintos que possuem frequências superiores aos outros valores do
conjunto observado, ou seja, dois valores que se sobressaem aos outros observados;
 Multimodal: Existem três ou mais valores que se sobressaem dentro do conjunto de dados
observados.
49
Exemplo 1 (MAGALHÃES E LIMA, 2005, p.94): Suponha que parafusos a serem utilizados em tomadas elétricas
são embalados em caixas rotuladas como contendo 100 unidades. Em uma construção, 10 caixas de um lote
tiveram o número de parafusos contados, fornecendo os valores 98, 102, 100, 100, 99 97, 96, 95, 99, 100.
Para essas caixas:
 O número médio de parafusos será dado por:
98 + 102 + 100 + 100 + 99 + 97 + 96 + 95 + 99 + 100

1̅ LMN =
10
P=
O = 0-, ( parafusos
0-(
.,
 A mediana será dada por:

o Primeiro deve-se colocar os dados em ordem:
Tabela 17: Número de parafusos por caixa ordenados do menor para o maior.
Ordem 1 13 14 1Q O/ O( 1R 1 1S 1 T
Número de Parafusos 95 96 97 98 99 99 100 100 100 102
o Temos um conjunto par, com 10 observações, logo, deve-se calcular a média dos dois valores
centrais:
1; + 1; 1 +1
1V + 1(V< 1V + 1 99 + 99
T T
= < = ; = ; < =
= 10 ⇒ 89LMN = = = = = = 99
3 3 3 3 )
2 2 2 2 2
WX = 00 parafusos.
 A moda será dada por:

o Ao observar a tabela 17, pode-se notar que o valor 100 é o mais frequente, aparecendo 3
vezes, sendo assim, 100 parafusos é a moda observada.
WY = .,, parafusos
Quando existe o interesse em resumir, numericamente, um conjunto de dados, pode-se escolher uma das
medidas mencionadas acima, ou até utilizá-las conjuntamente para auxiliar a análise e interpretação dos
dados. No exemplo 1, por exemplo, pode-se notar que as três medidas de tendência central resultaram em
valores semelhantes, de maneira que qualquer uma delas poderia ser utilizada para representar o conjunto
de dados estudado.
Porém, em determinadas situações, uma das medidas de resumo pode ser mais adequada do que outra:
 No caso de haver um ou mais dados que se afastam do geral das observações (valores discrepantes
ou outliers – serão definidos e discutidos mais adiante) a média passa a ser uma medida de tendência
central inadequada, sendo a mediana uma medida mais indicada;
 No caso de conjuntos multimodais ou amodais, a média ou a mediana são mais indicadas para
representar a tendência central.
50
Exemplo 2: Considere o mesmo conjunto de dados do exemplo 1, porém considerando que uma das caixas
tivesse, na realidade, 45 parafusos, ficando com o seguinte conjunto de dados: 98, 102, 100, 45, 99, 97, 96,
95, 99, 100.
Nesse caso:
 O número médio de parafusos será dado por:
98 + 102 + 100 + 45 + 99 + 97 + 96 + 95 + 99 + 100

1̅ =
10
P=
O = 0$, . parafusos
0$.
.,
Tabela 18: Número de parafusos, considerando uma das caixas com 45 parafusos, por caixa ordenados do menor para o maior.
Ordem 1 13 14 1Q O/ O( 1R 1 1S 1 T
1V + 1 98 + 99
= 10 ⇒ 89 = = = 98,5
2 2
WX = 0-, / parafusos.
WY. = 00 parafusos; WY* = .,, parafusos
Pode-se perceber que ao inserir um valor atípico no conjunto de dados utilizados:
 A média foi bastante influenciada, passando de 98,6 parafusos para 93,1 parafusos, tornando-se
inadequada para representar o conjunto de dados;
 O conjunto passou a ser bimodal, o que também torna a moda inadequada para representar o
conjunto de dados;
 A mediana foi a medida que menos sofreu influência do valor atípico, sendo a medida mais adequada
para representar o conjunto de dados, nesse caso.
exemplo 1, imagine que não haja interesse no ú8[\K 9[ ] \ ^_K_ ]K\ 1 (`), mas no custo total por
Exemplo 3 (MAGALHÃES E LIMA, 2005, p.95): Considere, novamente, o conjunto de dados apresentado no
caixa, nesse caso, teríamos que consideram uma nova variável, ^_aK aKa b (c), definida como a soma dos
custos dos parafusos (cada parafuso custa R$ ) e da embalagem (cada embalagem custa R$ [).
Nesse caso:
 A média do custo total por caixa será dada por:
51
98 + [ + 102 + [ + 100 + [ + 100 + [ + 99 + [
a̅ = +
10
97 + [ + 96 + [ + 95 + [ + 99 + [ + 100 + [
+ =
10
98 + 102 + 100 + 100 + 99 + 97 + 96 + 95 + 99 + 100 + 10[
a̅ =
10
986 + 10[ 986 10[
a̅ = = +
10 10 10
d̅ = 0-, (e + f = O
P ∙ e + f reais
Tabela 19: Custo total por caixa ordenados do menor para o maior.
a a3 a4 aQ d/ d( aR a aS aT
95 96 97 98 99 99 100 100 100 102
Ordem
+[ +[ +[ +[ +[ +[ +[ +[ +[ +[
Custo
Total
aV + a 99 + [ + 99 + [ 198 + 2[ 198 2[
= 10 ⇒ 89 = = = = +
2 2 2 2 2
WX(h) = 00e + f = WX ∙ e + f reais.
WY(h) = .,,e + f = WY ∙ e + f reais
O exemplo 3 serve para mostrar como calcular medidas de tendência central para medidas indiretas (medidas
obtidas através de equações), neste exemplo, temos o número de parafusos por caixa (medida direta obtida
da contagem dos parafusos) e o custo total por caixa (medida indireta obtida através de uma equação).
É extremamente importante saber trabalhar com medidas indiretas, já que elas fazem parte do nosso dia a
dia, embora possamos não perceber. Por exemplo, ao pensar em construir sua casa própria, é necessário saber
qual será a área a ser construída; embora trabalhemos com áreas com muita frequência, ela é uma medida
indireta, obtida a partir das medidas diretas de comprimento e profundidade.
Utilizando o exemplo 3, pode-se perceber que:
 A multiplicação de uma constante fez com que que as novas medidas de tendência central se
O acréscimo por uma quantidade [ teve o efeito de somar essa mesma quantidade às medidas de
equivalessem às antigas multiplicadas por ;

tendência central originalmente obtidas.
52
3.4.2. Simetria
Um conjunto de dados é dito simétrico se os dados se distribuírem igualmente ao redor da média. É possível
verificar a simetria de um conjunto de dados observando a sua distribuição (ao observar a tabela de
frequência, ou histograma) ou comparando os valores da média e a mediana. Pode-se dizer que um conjunto
de dados é simétrico quando a distribuição dos dados é equivalente à esquerda (ou abaixo) e à direita (ou
acima) da média; ou quando os valores da média e mediana são equivalentes.
Saber se um conjunto de dados é simétrico ou não auxilia na interpretação do mesmo e é de extrema

importância se existe o interesse em fazer previsões ou inferências com base no conjunto de dados em
questão.
Figura 30: Histograma da variável Preço, contendo os valores da média e da mediana, conjunto de dados amodal.
A figura 30, acima, permite a visualização da dispersão da variável Preço, definida anteriormente (página 11),
pode-se observar a assimetria dos dados, já que o comportamento dos dados à esquerda da média é bem
diferente do comportamento dos dados à direita da média. Outro indicativo de assimetria dos dados é a
diferença entre média (13.956 dólares) e a mediana (11.824 dólares).
Já a figura 31, abaixo, apresenta a distribuição da variável Comprimento (também definida na página 11); nela
pode-se observar uma simetria nos dados, já que o comportamento tanto à esquerda, quanto à direita da
média são semelhantes, embora não sejam idênticos. Ao observarmos os valores da média (4,126 metros) e
da mediana (4,145 metros) pode-se notar a semelhança entre eles, a decisão de usar uma ou a outra não traria
perda ou ganho de informação.
53
Figura 31: Histograma da variável Comprimento, contendo os valores da média e da mediana; o conjunto de dados era multimodal
(modas de 3,73 ; 4,15 e 4,39).
São muito poucas as situações em que se encontra uma simetria perfeita em conjuntos de dados observados.
Deve-se manter a mente aberta ao buscar verificar a ausência ou presença de simetria em um conjunto de
dados, num geral, pode-se classificar um conjunto de dados de acordo com as três classificações abaixo:
Figura 32: Histograma ilustrativo de conjuntos de dados com assimetria à direita (ou assimetria positiva), nesse caso a média e
mediana dos dados simulados são dadas por 5,33 e 4,47, respectivamente.
54
Figura 33: Histograma ilustrativo de conjuntos de dados simétricos, para esse conjunto de dados simulados os valores da média e da
mediana são dados por 9,84 e 9,77, respectivamente.
Figura 34: Histograma ilustrativo de conjuntos de dados com assimetria à esquerda (ou assimetria negativa), para esse conjunto de
dados simulados os valores da média e da mediana são dados por 13,70 e 14,44, respectivamente.
55
3.4.3. Exercícios
1- [DEVORE, 2006] A propagação de trincas por fadiga em diversas peças de aeronaves tem sido objeto de
muitos estudos nos últimos anos. Os dados a seguir consistem dos tempos de propagação (horas de
voo/10Q ) para atingir um determinado tamanho de trinca em furos de fixadores propostos para uso em
aeronaves militares (“Statistical Crack Propagation in Fastener Holes under Spectrum Loading”, J. Aircraft,
1983, p. 1028-1032):
0,736 0,863 0,865 0,913 0,915 0,937 0,983 1,007

1,011 1,064 1,109 1,132 1,140 1,153 1,256 1,394
a. Calcule e compare os valores da média e da mediana amostrais;
b. Em quanto a maior observação da amostra pode ser diminuída sem afetar o valor da mediana?
Nos exercícios 2 e 3, determine se a afirmativa é verdadeira ou falsa. Se for falsa, reescreva-a em sua forma
verdadeira
2- [LARSON e FARBER, 2004] A mediana é a medida de tendência central mais provável de ser afetada por
um valor atípico.
3- [LARSON e FARBER, 2004] Alguns conjuntos de dados quantitativos não têm uma mediana.
Nos exercícios 4 e 5 faça o seguinte:
a. Determine a média, a mediana e a moda dos dados, se possível. Se não for possível, explique o por que a
medida de tendência central não pôde ser determinada;
b. Qual é a medida de tendência central que melhor representa dos dados? Explique seu raciocínio.
4- [LARSON e FARBER, 2004] O tempo (em segundos) que uma amostra de sete carros esportivos leva para
ir de zero a 60 milhas por hora: 3,7; 4,0; 4,8; 4,8; 4,8; 4,8; 5,1. (Fonte: Motor Trend)
5- [LARSON e FARBER, 2004] Os mais velozes (em milhas por hora) em uma amostra de sete carros
esportivos: 187,3; 181,8; 180,0; 169,3; 162,2; 158,1; 155,7. (Fonte: Motor Trend)
6- [TRIOLA, 2013] Em que sentido a média, a mediana e a moda são medidas de tendência central?
7- [TRIOLA, 2013] Em um editorial, o Poughkeepsie Journal colocou esta afirmativa: “O preço mediano – o
preço exatamente no meio entre o mais alto e o mais baixo - ...” A afirmativa descreve corretamente a
mediana? Por que sim, ou por que não?
8- [TRIOLA, 2013] Obteve-se uma amostra aleatória simples de páginas do Merrian-Webster’s Collegiate
Dictionary, 11ª Edição, com um total de 1460 páginas. A seguir, estão listados os números de palavras
definidas em cada uma das 10 páginas amostradas, estime o número total de palavras definidas no
dicionário, utilizando a média e a mediana. É provável que essa seja uma estimativa precisa do número
de palavras na língua inglesa?
51 63 36 43 34 62 73 39 53 79
9- [MARTINEZ, 2015] A média do peso dos 100 alunos de uma determinada turma de alunos é 68,4 kg. Essa
turma possui 25 homens e 75 mulheres. O peso médio das mulheres dessa turma é 62,6 kg. Qual é o peso
médio dos homens dessa turma?
56
3.4.4. Medidas de Dispersão
As medidas de tendência central fornecem uma ideia de em torno de qual valor os dados se distribuem,
porém, não informam o quão espalhada é essa distribuição. As medidas de dispersão fornecem uma descrição
da variabilidade de um conjunto de dados, fornecendo uma maneira de sabermos se os dados se encontram,
em geral, próximos do valor de tendência central ou não.
Nesta seção iremos estudar algumas das medidas de dispersão mais utilizadas, como: amplitude; quantis;
variância; desvio padrão; e coeficiente de variação.
3.4.5. Amplitude, Variância, Desvio Padrão e Coeficiente de Variação
A amplitude nada mais é do que a distância entre os valores máximo e mínimo do conjunto de dados,
fornecendo uma ideia do espaçamento máximo entre duas observações de uma mesma variável:
 Os valores máximo e mínimo de um conjunto de dados serão denotados por: 1ijk e 1i ;

 A amplitude observada em um conjunto de dados é dada por:
8]b a^9[ = 1ijk − 1i
A amplitude tem as vantagens de ser de fácil cálculo, fácil compreensão e interpretação, porém ela tem a
desvantagem de ser altamente influenciada por valores atípicos.
A variância de um conjunto de dados tem por objetivo quantificar a variabilidade ao redor da média das
observações. Como a fórmula para obter a variância observada inclui a média observada, existem dois cálculos
possíveis:
populacional m, e poderemos calcular a variância populacional (n 3 ), utilizando:

 Quando nossos dados forem provenientes de um censo teremos o conhecimento da média
1
n3 = (1 − m)3
"
amostral 1̅ e poderemos calcular apenas uma variância amostral (_ 3 ), utilizando:

 Quando nossos dados forem provenientes de uma amostra teremos apenas o conhecimento da média
1
_3 = (1 − 1̅ )3
−1
"
A diferença entre os valores encontrados ao utilizar essas duas fórmulas diminui conforme o tamanho da
amostra se aproxima do tamanho populacional.
A variância possui um inconveniente: se as observações forem medidas em 8, a variância será dada em 8 3.

A unidade da variância será, sempre, a unidade de medida das observações elevada ao quadrado.
Ao invés de utilizar a variância, muitos preferem utilizar o desvio padrão, que nada mais é do que a raiz
quadrada da variância, o que implica, que podemos ter duas maneiras de calcular o desvio padrão:
 O desvio padrão populacional será dado por:
57
1
n = on 3 = p (1 − m)3
"
 O desvio padrão amostral será dado por:
1
_ = o_ 3 = p (1 − 1̅ )3
−1
"
A grande vantagem do desvio padrão, com relação à variância, é que a sua unidade de medida é a mesma
unidade de medida dos dados observados, o que facilita a sua interpretação.
Outra medida de dispersão bastante utilizada é o coeficiente de variação, essa é uma medida muito
interessante, pois ela faz uma relação entre a média e o desvio padrão dos dados observados, fornecendo
uma medida de homogeneidade do conjunto de dados.
 O coeficiente de variação de um conjunto de dados será denotado por qr e é dado por:

_
qr = × 100%
1̅
Isso, considerando que dificilmente se calcula o coeficiente de variação de uma população, geralmente,
calcula-se essa estatística para amostras, a fim de ter uma ideia sobre a homogeneidade ou confiabilidade na
mesma.
A grande vantagem do coeficiente de variação é o fato dele ser uma medida livre de unidade de medida,
podendo ser utilizado para comparar a variabilidade de variáveis distintas.
Exemplo 1: (MAGALHÃES E LIMA, 2005) Retomando o exemplo das caixas com parafusos utilizado
cada. Lembrando que a média para esse conjunto de dados é dada por: 1̅ = 98,6 parafusos.
anteriormente, considerando as mesmas 10 caixas com: 98, 102, 100, 100, 99 97, 96, 95, 99, 100; parafusos
Para essas caixas:
 A amplitude será dada por:

o Primeiro deve-se colocar os dados em ordem:
Tabela 20: Número de parafusos por caixa ordenados do menor para o maior.
Ordem O. 13 14 1Q 1V 1 1R 1 1S O.,
8]b a^9[ = 1ijk − 1i =1 T − 1 = 102 − 95
sWtuvdwXf = ) parafusos
 A variância será dada por:
58
o Calculando a variância usando a fórmula diretamente temos:
1
_3 = (1 − 1̅ )3
−1
"
(98 − 98,6)3 + (102 − 98,6)3 + ⋯ + (99 − 98,6)3 + (100 − 98,6)3

_ =
3
10 − 1
(−0,6)3 + (3,4)3 + ⋯ + (0,4)3 + (1,4)3 40,4
_3 = =
9 9
x* = +, +0 parafusos²
o Pode-se calcular a variância montando uma tabela ou utilizando uma planilha eletrônica.
Apresento abaixo uma tabela que pode ser utilizada para fazer os cálculos e que pode ser útil
para aqueles com dificuldade em utilizar a fórmula matemática diretamente:
Tabela 21: Tabela auxiliar para o cálculo da variância.
Ov Ov − OP (Ov − O
P)*
98 -0,6 0,36
102 3,4 11,56
100 1,4 1,96
100 1,4 1,96
99 0,4 0,16
97 -1,6 2,56
96 -2,6 6,76
95 -3,6 12,96
99 0,4 0,16 (1 − 1̅ )3
100 1,4 1,96 "
Total 0 40,40
40,4
_3 =
9
x* = +, +0 parafusos²
 O desvio padrão será dado por:
_ = oy \LMN = o4,49 = 2,12
x = *, .* parafusos
 O coeficiente de variação será dado por:
2,12
qr = × 100% = 2,15%
98,6
z{ = *, ./%
Sabemos agora como calcular as medidas de dispersão mais utilizadas, porém, o que isso tudo significa?
59
 A amplitude foi de 7 parafusos, isso quer dizer que, dentro dessa amostra, a maior diferença entre
duas caixas de parafusos é de 7 parafusos; junto com a informação de que a mediana é dada por 99
parafusos, podemos saber que o mínimo de parafusos por caixa foi de 92 ou mais e o máximo foi de
106 ou menos. De maneira que com apenas 2 valores de resumo podemos ter uma ideia sobre o
comportamento do conjunto de dados;
 A variância foi de 4,49 parafusos², sabemos que essa é uma medida da dispersão dos dados com
relação à média que é de 98,6 parafusos, porém como não é simples tentar relacional parafusos² com
parafusos, o que dificulta a interpretação dessa medida de dispersão, sendo assim, vamos utilizar o
desvio padrão;
 O desvio padrão foi de 2,12 parafusos, e a média de 98,6 parafusos, sabemos que o desvio padrão é a
raiz quadrada da variância e que fornece uma medida de dispersão dos dados ao redor da média,
podemos imaginar, então, que parte (geralmente um mínimo de 50%) dos dados se encontram entre
96,48 e 100,72 (media ± desvio padrão);
 O coeficiente de variação foi de 2,15%, esse valor indica que o desvio padrão é pequeno quando
comparado com a média, o que indica que o conjunto de dados é bastante homogêneo, não havendo
um distanciamento grande entre os valores observados e a média observada. Imagine que dois
conjuntos de dados tenham apresentado um desvio padrão de 10, só que o conjunto 1 tem média 10
e o conjunto 2 tem média 100; logo o conjunto 1 teria um coeficiente de variação de 100% e o conjunto
2 um coeficiente de variação de 10%; ou seja, quando comparado com a média, um desvio padrão de
10 pode ser considerado como indicativo de grande variação (heterogeneidade) entre os dados
(conjunto 1) ou de pequena variação (homogeneidade) entre os dados (conjunto 2).
1, imagine que não haja interesse no ú8[\K 9[ ] \ ^_K_ ]K\ 1 (`), mas no custo total por caixa,
Exemplo 2: (MAGALHÃES E LIMA, 2005) Considere, novamente, o conjunto de dados apresentado no exemplo
nesse caso, teríamos que consideram uma nova variável, ^_aK aKa b (c), definida como a soma dos custos
dos parafusos (cada parafuso custa R$ ) e da embalagem (cada embalagem custa R$ [).
Nesse caso:
 A amplitude será dada por:
Tabela 22: Custo total por caixa ordenados do menor para o maior.
a a3 a4 aQ d/ d( aR a aS a€ T
95 96 97 98 99 99 100 100 100 102
Ordem
+[ +[ +[ +[ +[ +[ +[ +[ +[ +[
Custo
Total
8]b a^9[ = 1ijk − 1i =1 T − 1 = 102 + [ − (95 + [)
sWtuvdwXfY•x = )e reais
 A variância será dada por (lembrando que a média é dada por 98,6 + [ reais):
(98 + [ − 98,6 − [)3 + (102 + [ − 98,6 − [)3 + ⋯ + (100 + [ − 98,6 − [)3

_ =3
10 − 1
(−0,6 )3 + (3,4 )3 + ⋯ + (1,4 )3 40,4 3
_3 = =
9 9
60
x* = +, +0e* reais²
Ou
Tabela 23: Tabela auxiliar para o cálculo da variância.
dv dv − d̅ (dv − d̅)*
98 + [ −0,6 0,36 3
102 + [ 3,4 11,56 3
100 + [ 1,4 1,96 3
100 + [ 1,4 1,96 3
99 + [ 0,4 0,16 3
97 + [ −1,6 2,56 3
96 + [ −2,6 6,76 3
95 + [ −3,6 12,96 3
99 + [ 0,4 0,16 3
100 + [ 1,4 1,96 3
Total 0 40,40 3
Fonte: Elaborada pela autora. (a − a̅)3
"
40,4 3
_3 =
9
x* = +, +0e* reais²
 O desvio padrão será dado por:
_ = oy \LMN = o4,49 3 = 2,12
x = *, .*e reais
 O coeficiente de variação será dado por:
*, .*e
z{ = × .,,%
0-, (e + f
Podemos perceber que ao adicionar uma constante [ e/ou ao multiplicar uma constante a um conjunto de
dados teremos que:
 Ao adicionar uma constante [ aos dados não temos nenhuma alteração no valor da:
o Amplitude;
o Variância;
Ao somar uma constante [ aos dados, a média tem essa mesma constante adicionada ao seu valor e
o Desvio padrão;

o desvio padrão não sofre alteração, de maneira que se a constante for positiva, o coeficiente de
variação será menor quando comparado com o antigo;
 Ao multiplicar uma constante aos dados tivemos alteração em todas as medidas de dispersão, sendo
que:
o A amplitude e o desvio padrão tiveram seu valor antigo multiplicado pela mesma constante
;
o A variância teve seu valor antigo multiplicado por 3 .
61
o Tanto a média quanto o desvio padrão serão multiplicados por essa mesma constante, logo,
apenas a multiplicação de uma constante não alteraria o valor do coeficiente de variação.
3.4.6. Exercícios
1- [DEVORE, 2006] O artigo “A Thin-Film Oxygen Uptake Test for the Evaluation of Automotive Crankcase
Lubricants” (Lubric. Engr., 1984, p. 75-83) informou os seguintes dados sobre o tempo de oxidação-
indução (min) para diversos óleos comerciais:
87 103 130 160 180 195 132 145 211 105

145 153 152 138 87 99 93 119 129
a. Calcule a variância e o desvio padrão amostrais;
b. Se as observações fossem especificadas em horas, quais seriam os valores resultantes para a variância e
[DEVORE, 2006] Considere e como constantes e ‚ = 1 + para = 1,2, … , .

para o desvio padrão amostrais? Responda sem reescrever os valores.
Quais são as relações entre 1̅ e ‚ƒ e entre _„ 3 e _… 3 ?

2-
a.
b. Uma amostra de temperaturas iniciais de uma determinada reação química resultou em uma média
(DICA: † = V q + 32),
amostral (°C) de 87,3 e um desvio padrão amostral de 1,04. Quais são a média e o desvio padrão em °F?
S
3- [TRIOLA, 2013] Na estatística, qual a diferença entre variação e variância?

4- [TRIOLA, 2013] Qual você considera ter maior variação: as rendas de uma amostra aleatória simples de
1.000 adultos selecionados da população geral, ou as rendas de uma amostra aleatória simples de 1.000
professores de estatística? Por que?
5- [TRIOLA, 2013] Calcule a variância e o desvio padrão dos dados apresentados no exercício 8 da seção
3.4.3. Como esses valores afetam a confiança na precisão da estimativa da média encontrada
anteriormente?
6- [TRIOLA, 2013] A seguir, estão listados os custos (em dólares) de viagens de ida e volta do aeroporto JFK
na cidade de Nova York a São Francisco. Todos os voos envolvem uma escala e uma estada de duas
semanas. As companhias aéreas são US Air, Continental, delta, United, American, Alaska e Northwest:
30 Dias Antes 244 260 264 264 278 318 280

1 Dia Antes 456 614 567 943 628 1088 536
Calcule os coeficientes de variação para cada um dos conjuntos de dados e os compare quanto à sua
homogeneidade.
3.4.7. Quantis
Os quantis são medidas de posição, extremamente úteis se quisermos conhecer informações gerais ou
específicas sobre um conjunto de dados, podendo fornecer informação sobre a tendência central, ou se forem
utilizados um conjunto de quantis, informações sobre a dispersão deste conjunto de dados.
Já vimos que a mediana é uma medida de tendência central que não sofre, ou sofre pouca, influência de
valores atípicos; os quantis seguem a mesma ideia da mediana, fornecendo valores que se posicionam de
maneira a dividir o conjunto de dados de acordo com o interesse do pesquisador (a mediana, por exemplo,
divide o conjunto de dados ao meio, os 50% menores dos 50% maiores).
Iremos denotar os quantis por ‡(]), em que ] é uma proporção qualquer (0 ≤ ] ≤ 100), tal que ]% das
observações sejam menores ou iguais a ‡ (]), temos, por exemplo:
62
‰(,) = mínimo;
‡(10) = primeiro decil ou 10º percentil;

‰(*/) = primeiro quartil (Š. ) ou 25º percentil;


‰(/,) = mediana ou segundo quartil (Š* ) ;


‰()/) = terceiro quartil (Š$ ) ;


‡(80) = oitavo decil;


‡(95) = 95º percentil;


‰(.,,) = máximo.


Existem diversas maneiras de se calcular os valores dos quartis, para fins desta apostila, iremos apresentar um
dos métodos mais simples que permite calcular não só os quartis, mas qualquer quantil de interesse.
Para efetuar o cálculo dos quantis, assim como para a mediana, devemos seguir alguns passos:
 Primeiro passo: ordenar os dados do menor para o maior;
desejado: ‹ = ]⁄100;
 Segundo passo: utilizar a regra de três para encontrar a posição do valor representando o quantil
o Caso o valor ‹ = ]⁄100 seja um valor inteiro deve-se calcular

 Terceiro passo:
1(!) + 1(!<
‡(•) =
)
2
o Caso o valor ‹ = ]⁄100 não seja um valor inteiro, deve-se utilizar o valor
‡(•) = 1(!< )
o em que ‹ é o maior inteiro menor do que ]⁄100.
Exemplo: A fim de compreender melhor como funciona esse método, vamos calcular alguns quantis utilizando
os dados observados para a variável Preço (definida na seção 3.1., página 11) cujos dados, já organizados do
menor para o maior, podem ser vistos abaixo:
Tabela 24:Tabela da variável Preço, contendo os dados observados ordenados do menor para o maior.
1 1 13
Ordem Preço Ordem Preço Ordem Preço
13 13 133
5.257 9.440 13.840
14 14 134
5.680 10.532 14.460
1Q 1Q 13Q
6.176 10.767 15.520
1V 1V 13V
6.260 11.386 16.346
1 1 13
6.316 11.630 21.500
1R 1R 13R
6.340 12.018 22.200
1 1 13
6.700 12.890 24.632
1S 1S 13S
7.742 12.923 31.640
1T 13T 14T
7.780 13.140 33.718
9.300 13.700 38.850
‡(10) = primeiro decil ou 10º percentil
63
30 × 10
‹= =3
100
Como 3 é um valor inteiro, devemos fazer a média entre os valores na terceira e quarta posição para encontrar
o primeiro decil:
14 + 1Q 6.176 + 6.260 12.436

‡(10) = = = = 6.218
2 2 2
‰(.,) = (. *.-, ,, Xóus•fx
‡(25) = • = primeiro quartil
30 × 25
‹= = 7,5
100
Como 7,5 não é um valor inteiro, devemos encontrar o valor que está na posição 7 + 1 para encontrar o
primeiro quartil:
• = 1(R< ) = 1 = 7.742
Š. = ). )+*, ,, Xóus•fx
‡(50) = •3 = mediana
30 × 50
‹= = 15
100
Como 15 é um valor inteiro, devemos fazer a média entre os valores na décima quinta e décima sexta posição
para encontrar a mediana:
1 +1 11.630 + 12.018 23.648

•3 = = = = 11.824
V
2 2 2
Š* = ... -*+, ,, Xóus•fx
‡(75) = •4 = terceiro quartil
30 × 75
‹= = 22,5
100
terceiro quartil:
•4 = 1(33< ) = 134 = 15.520
Š$ = ./. /*,, ,, Xóus•fx
‡(80) = oitavo decil
30 × 80
‹= = 24
100
64
Como 24 é um valor inteiro, devemos fazer a média entre os valores na vigésima quarta e vigésima quinta
posição para encontrar o oitavo decil:
13Q + 13V 16.346 + 21.500 37.846

‡(80) = = = = 18.923
2 2 2
‰(-,) = .-. 0*$, ,, Xóus•fx
‡(95) = 95º percentil
30 × 95
‹= = 28,5
100
95º percentil:
‡(95) = 1(3 < ) = 13S = 33.718
‰(0/) = $$. ).-, ,, Xóus•fx
3.4.8. Resumo dos Cinco Números
O resumo dos cinco números apresenta um conjunto de valores (mínimo, primeiro quartil, mediana, terceiro
quartil e máximo) que permite ao observador entender a variabilidade, dispersão e simetria de um conjunto
de dados, sendo de grande utilidade.
Utilizando as informações calculadas na seção anterior (3.4.7.) e as informações na tabela 24 (página 63),
podemos apresentar o resumo dos cinco números para a variável Preço:
Wí‘vWY = /. */), ,, dólares
Š. = ). )+*, ,, dólares
WXY•x = ... -*+, ,, dólares
Š$ = ./. /*,, ,, dólares
WáOvWY = $-. -/,, ,, dólares
Esses cinco valores fornecem uma ideia da dispersão dos dados, temos que:
 25% dos veículos observados custam entre 5.257,00 e 7.742,00 dólares;

 25% dos veículos observados custam entre 15.520,00 e 38.850,00 dólares.
Podemos perceber que as observações estão mais concentradas abaixo do terceiro quartil, e mais dispersas
acima desse valor.
Uma outra grande vantagem de calcular os quartis, ou o resumo de cinco números é que podemos, a partir
desses valores, verificar a existência de valores atípicos em um conjunto de dados.
65
3.4.9. Valores atípicos
calcular a amplitude, ou distância, interquartil (“”•):

Para verificar a existência ou não de valores atípicos em um conjunto de dados, é necessário, primeiramente,
“”• = •4 − •
Em seguida, deve-se calcular a região de observações típicas (•–c). Como o nome já diz, os valores que
pertencerem à •–c são considerados como típicos e aqueles que estiverem fora da •–c são considerados
como atípicos:
•–c = (• − 1,5“”• ; •4 + 1,5“”•)
Vamos considerar, novamente, a variável Preço utilizada na seção anterior e cujo resumo de cinco números já
foi calculado, logo:
“”• = 15.520 − 7.742 = 7.778,00 dólares

•–c = (7.742 − 1.5 × 7.778; 15.520 + 1,5 × 7.778) = (7.742 − 11.667; 15.520 + 11.667)

˜™h = (−$. 0*/, ,, ; *). .-), ,,) dólares


O resultado obtido para a •–c obtida nos traz a informação que veículos custando de até 27.187,00 dólares
possuem preços típicos, ou preços que não fogem do comumente encontrado; já veículos custando mais de
27.187,00 dólares estão fora do normal, possuem preços atípicos.
Pode-se notar que o limite inferior do intervalo definido pela •–c é negativo. Embora não faça sentido pensar
em um preço de carro negativo, pode acontecer do limite encontrado possuir um valor negativo, como foi o
caso, isso não quer dizer que o valor encontrado está incorreto, quer dizer apenas que não serão encontrados
valores atípicos entre os valores mais baixos observados.
Para verificar a existência de valores atípicos devemos voltar e observar o conjunto de dados ordenado:
Tabela 25: Tabela com os valores da variável Preço ordenados para a verificação de presença ou não de valores atípicos.
1 1 13
Ordem Preço Ordem Preço Ordem Preço
13 13 133
5.257 9.440 13.840
14 14 134
5.680 10.532 14.460
1Q 1Q 13Q
6.176 10.767 15.520
1V 1V 13V
6.260 11.386 16.346
1 1 13
6.316 11.630 21.500
1R 1R 13R
6.340 12.018 22.200
1 1 O*-
6.700 12.890 24.632
1S 1S O*0
7.742 12.923 31.640
1T 13T O$,
7.780 13.140 33.718
9.300 13.700 38.850
verificar se esses dois valores pertencem à •–c. No caso dos preços observados, o valor mínimo pertence à
Se houverem valores atípicos, eles irão incluir os valores mínimo e/ou máximo, então o que se deve fazer é
•–c, já que 5.257 é maior que -3.082,50, logo não existem valores atípicos dentre os menores valores
66
observados. Já o máximo observado não pertence à •–c, já que 38.850,00 é maior que 27.187,00; o
mesmo é verdade para os valores 31.640,00 e 33.718,00; ou seja, temos três valores atípicos nesse conjunto
de dados.
3.4.10. Box Plot
Assim como os histogramas, o box plot fornece uma maneira de visualizar a dispersão de um conjunto de
dados, porém, diferentemente dos histogramas o box plot traz informações específicas sobre a presença ou
não de valores atípicos no conjunto de dados observados para uma variável.
Uma outra diferença entre histogramas e box plots está no fato de que histogramas fixam o tamanho do
intervalo de dados e apresentam as frequências observadas para cada intervalo; já os box plots fixam a
frequência dos intervalos (sempre 25%) e variam o tamanho dos mesmos.
Vamos fazer o box plot das variáveis Comprimento e Preço. Começando pela variável Comprimento:
 Devemos calcular o resumo de cinco números da variável Comprimento e em seguida verificar se

existem valores atípicos:
Tabela 26: Observações da variável Comprimento ordenados do menor para o maior.
1 1 13
Ordem Comprimento Ordem Comprimento Ordem Comprimento
13 13 133
3,36 4,08 4,38
14 14 134
3,62 4,1 4,39
1Q 1Q 13Q
3,64 4,11 4,39
1V 1V 13V
3,68 4,12 4,4
1 1 13
3,7 4,14 4,45
1R 1R 13R
3,73 4,15 4,47
1 1 13
3,73 4,15 4,56
1S 1S 13S
3,81 4,16 4,57
1T 13T 14T
3,83 4,2 4,6
3,92 4,36 4,98
 Os valores mínimo e máximo podem ser identificados e retirados diretamente da tabela 26:
8í 8K = 3,36 ; 8á1 8K = 4,98
 Para encontrar o primeiro quartil, a mediana e o terceiro quartil podemos utilizar as informações sobre
as posições obtidas para a variável preço (página 64), já que ambos os conjuntos possuem 30
observações:
o Primeiro quartil:
30 × 25
‹= = 7,5
100
• = 1 = 3,81
67
o Mediana
30 × 50
‹= = 15
100
1 +1 4,14 + 4,15 8,29
•3 = = = = 4,145
V
2 2 2
o Terceiro quartil
30 × 75
‹= = 22,5
100
•4 = 134 = 4,39
Temos agora todas as informações para apresentar o resumo de cinco números:
Wí‘vWY = $, $( m
Š. = $, -. m
WXY•x = +, .+/ m
Š$ = +, $0 m
WáOvWY = +, 0- m
 Verificando a presença, ou não, de valores atípicos:
“”• = 4,39 − 3,81 = 0,58
•–c = (3,81 − 1.5 × 0,58; 4,39 + 1,5 × 0,58) = (3,81 − 0,87; 4,39 + 0,87)
˜™h = (*, 0+; /, *() m
Como tanto os valores mínimo e máximo pertencem à •–c (2,94 < 3,36 e 4,98 < 5,26), pode-se concluir que
não existem valores atípicos no conjunto de dados observados para a variável Comprimento.
Podemos, então, construir o box plot para a variável Comprimento, para tal devemos organizar a informação
fornecida pelo resumo de cinco números em um gráfico da seguinte maneira:
68
Figura 35: Box-plot para a variável Comprimento.
Comprimento (metros)
Agora vamos voltar às informações que já calculamos para a variável Preço:

Wí‘vWY = /. */), ,, dólares
Š. = ). )+*, ,, dólares
WXY•x = ... -*+, ,, dólares
Š$ = ./. /*,, ,, dólares
WáOvWY = $-. -/,, ,, dólares
Valores atípicos: 31.640,00 ; 33.718,00 e 38.850,00 dólares
Assim como foi feito para comprimento, devemos inserir os valores do resumo de cinco números no box plot,
porém devemos representar os valores atípicos também. Devemos iniciar o box plot pelos valores atípicos, e
depois inserir o resumo de cinco números:
69
Figura 36: Box plot para a variável Preço.
Preço (dólares)

Como pode-se ver na figura 36, utiliza-se um novo máximo quando o máximo é considerado como valor
atípico. Como encontramos esse novo máximo? Assim como para o cálculo dos quartis, existe mais de uma
maneira de selecionar um novo ponto máximo. A maneira que considero aqui é a que acho mais simples: o
o valor 13R = 24.632,00 dólares.

novo máximo é o maior valor no conjunto de dados que não é visto como atípico, no caso da variável preço é
Se o mínimo de um conjunto de dados for considerado atípico, deve-se encontrar um novo mínimo de maneira
análoga a utilizada acima, buscando o menor valor do conjunto de dados que não é considerado como atípico
para ser o novo mínimo.
Pode acontecer de um conjunto de dados ter seus valores máximo e mínimo como atípicos, nesse caso, deve-
se encontrar tanto um novo mínimo quanto um novo máximo.
Outra informação que podemos tirar do box plot diz respeito a simetria de um conjunto de dados. Para tal,
basta ver se o gráfico se comporta de maneira semelhante abaixo e acima da mediana (ou à esquerda e a
direita da mediana – se o box plot tiver na horizontal). Por exemplo, a figura 35 apresenta um gráfico que
indica aparente simetria do conjunto da dados; já a figura 36 apresenta um gráfico que indica uma assimetria
na distribuição dos dados.
Uma observação importante, os nomes inseridos nas figuras 35 e 36 em vermelho são ferramentas didáticas
para auxiliá-los a entender a construção do gráfico de box plot, não se deve inserir essas informações em
gráficos feitos com o intuito de apresentar a distribuição de um conjunto de dados.
70
3.4.11. Exercícios
1- [DEVORE, 2006] Uma amostra de 20 garrafas de certo tipo de vidro foi selecionada e a resistência à
89 = 202,2 • = 196,0 •4 = 216,8

pressão interna de cada garrafa foi determinada. Considere as seguintes informações parciais da amostra:
Três observações menores: 125,8; 188,1; 193,7

Três observações maiores: 221,3; 230,5; 250,2
a. Há algum outlier na amostra?
b. Construa um box plot e comente suas características.
2- [DEVORE, 2006] A concentração de cocaína no sangue (mg/L) foi determinada para uma amostra de
indivíduos que morreram de delírio induzido por cocaína (ED) e para uma amostra de indivíduos que
morreram de overdose de cocaína sem delírio. O tempo de sobrevida das pessoas em ambos os grupos
foi de, no máximo 6 horas. Os dados a seguir foram obtidos de um box plot comparativo do artigo “Fatal
Excited Delirium Following Cocaine Use” (J. of Forensic Sciences, 1997, p.25-31):
ED
0 0 0 0 0,1 0,1 0,1 0,1 0,2

0,2 0,3 0,3 0,3 0,4 0,5 0,7 0,8 1,0
1,5 2,7 2,8 3,5 4,0 8,9 9,2 11,7 21,0
Não-ED
0 0 0 0 0 0,1 0,1 0,1 0,1 0,2

0,2 0,2 0,3 0,3 0,3 0,4 0,5 0,5 0,6 0,8
0,9 1,0 1,2 1,4 1,5 1,7 2,0 3,2 3,5 4,1
4,3 4,8 5,0 5,6 5,9 6,0 6,4 7,9 8,3 8,7
9,1 9,6 9,9 11,0 11,5 12,2 12,7 14,0 16,6 17,8
a. Determine o resumo de cinco números das duas amostras;
b. Há algum outlier nas amostras, se sim, qual/quais?
c. Construa um box plot comparativo e use-o como base para comparar e destacar as diferenças das
amostras 1ed e não-ED.
3- [TRIOLA, 2013] Obteve-se uma amostra aleatória simples de escores de classificação de crédito FICO, e
esses escores ordenados estão listados a seguir. Encontre o resumo de cinco números, verifique a
existência, ou não, de valores atípicos e faça o box plot.
664 693 698 714 751 753

779 789 802 818 834 836
4- [TRIOLA, 2013] Use os 40 comprimentos de coxas (cm) de mulheres listados abaixo. Encontre o resumo
de cinco números, verifique a existência, ou não, de valores atípicos e faça o box plot.
27 31,1 32,1 33,2 33,8 36 36,2 36,6 37,3 37,5

38 38,1 38,2 38,2 38,2 38,5 38,7 39 39 39
39,1 39,2 39,4 39,7 39,9 40 40,2 40,2 40,3 41
41 41,5 41,6 41,6 42,3 42,8 43,2 43,4 43,8 48,6
5- [TRIOLA, 2013] Um estudante do autor pesou uma amostra aleatória simples de bifes Porter-house, e os
resultados (em onças) estão listados a seguir. Os bifes devem ter 21 oz, pois estão listados no menu com
peso de 20 onças, e eles perdem uma onça ao serem cozidos. Use a lista de pesos para encontrar: (a) a
71
média; (b) a mediana; (c) a moda; (d) a amplitude; (e) o desvio padrão; (f) a variância; (g) o primeiro
quartil; (h) o terceiro quartil; (i) faça o box plot.
17 19 21 18 20 18 19 20 20 21
4. Exercícios Avaliativos sobre Estatística Descritiva
1- Abaixo são dados os tempos de espera (em minutos) de clientes no Banco New York (onde todos os
clientes formam uma fila única) e no Banco Montreal (onde os clientes entram em três filas de guichês
diferentes):
New York Montreal

Tempo de espera (min) Freq. Abs. Tempo de espera (min) Freq. Abs.
0 0 0 1
1 2 1 0
2 0 2 2
3 2 3 1
4 1 4 3
5 1 5 3
6 6 6 3
7 9 7 5
8 3 8 3
9 0 9 2
10 0 10 1
Para cada um dos dois bancos acima:
a. Calcule a média e o coeficiente de variação sabendo que a variância dos tempos de espera para os Bancos
de New York e Montreal são 4,06 e 6,17, respectivamente:
b. Faça os box plots, lado a lado;
c. Comente sobre as diferenças ou semelhanças entre as distribuições, utilizando as informações obtidas
nos itens a) e b).
2- A dona de um restaurante registrou durante 6 meses quantos clientes ela recebia a cada semana. Os
dados são apresentados abaixo já organizados do menor para o maior:
501 512 516 525 528 536 546 556 564 567 589 597
601 603 605 612 615 624 629 635 642 645 648 651
a. Construa uma tabela de frequências contendo exatamente 6 classes e incluindo a frequência acumulada:
b. Construa o histograma da variável observada:
c. Sabendo que a média observada foi de 585,29 clientes, a distribuição observada pode ser considerada
simétrica? Justifique sua resposta.
3- Abaixo são dadas as notas obtidas em um exame de estatística e em um exame de matemática para cada
um dos 12 alunos de uma turma do ensino médio.
72
Aluno Notas
Estatística Matemática
1 50 45
2 50 54
3 53 53
4 58 61
5 59 55
6 60 66
7 62 59
8 64 70
9 65 57
10 66 65
11 68 72
12 80 90
a. Calcule a média, mediana e moda para as notas das avaliações de matemática e de Estatística:
b. Você diria que a distribuição das notas (para cada uma das matérias) é simétrica? Justifique:
c. Sabendo que as variâncias observadas foram de 70,93 para as notas em estatística e 135,48 para as notas
em matemática, calcule o coeficiente de variação para ambas as variáveis e responda: Quais notas
apresentaram maior variabilidade? Justifique.
d. Encontre o resumo de cinco números para ambas as variáveis (notas de matemática e notas de
estatística).
e. Calcule as distâncias interquartis e as regiões de observação típicas para ambas as variáveis. Existem
valores atípicos para as variáveis notas em matemática e estatística, se sim, quais?
f. Desenhe um gráfico de dispersão bidimensional relacionando as variáveis notas de estatística, com notas
de matemática, levando em consideração que a estatística depende da matemática.
4- Um personal trainer coletou dados sobre a quantidade de água que ele tomava por dia a partir de uma
amostra de dias selecionada aleatoriamente. A partir disso, ele descobriu que o número médio de copos
de água que ele bebia em um dia era igual a 4,4. Considerando a tabela abaixo, responda:
a. Encontre o número de dias representado por 1;

b. Calcule o número mediano de copos de água que ele bebe por dia;
c. Calcule os quartis da quantidade de copos de água que ele bebe por dia;
d. Desenhe o Box Plot do número de copos de água bebido por dia.
73
5- Em 2018 foi realizada uma pesquisa para avaliar o estado nutricional dos funcionários técnico-
administrativos da UFJF. Uma das variáveis coletadas foi a medida da circunferência abdominal em
centímetros. Na figura a seguir temos a representação desta variável para 3 faixas etárias dos funcionários
do sexo masculino. Assinale a afirmativa INCORRETA.
(a) O grupo que apresenta menor variabilidade dos valores é o de idade inferior a 30 anos.
(b) As distribuições dos grupos com idade entre 30 e 49 anos e idade superior a 49 anos são
assimétricas.
(c) A mediana do grupo com idade entre 30 e 49 anos é 100 centímetros
(d) Todos os grupos apresentam dados discrepantes
(e) O gráfico acima não apresenta a média da circunferência abdominal de cada faixa de idades
6- Leia atentamente as afirmações abaixo:
I. A média amostral pode ser igual a zero.
II. A variância amostral pode ser negativa.
III. A mediana de uma amostra pode ser igual ao valor mínimo dessa amostra.
IV. A média amostral pode ser superior à mediana.
V. O desvio padrão pode ser nulo.
Marque a alternativa correta:
(a) Todas as afirmações são verdadeiras.
(b) Apenas as afirmações I, III, IV e V são verdadeiras.
(c) Apenas as afirmações IV e V são verdadeiras.
(d) Todas as afirmações são falsas.
(e) Nenhuma das alternativas acima está correta.
74
7- Os diagramas na figura mostram as notas obtidas numa prova por alunos de três turmas diferentes. A
partir destes gráficos, NÃO podemos concluir que:
(a) A turma A tem menos alunos do que a turma B.

(b) A maioria dos alunos da turma B tirou notas abaixo de 40.
(c) A turma que teve em geral as melhores notas foi a C.
(d) A turma mais homogênea, em termos das notas na prova, foi a A.
(e) O aluno que obteve a maior nota pertence à turma B.
8- Complete as duas afirmativas abaixo:
I. Para que uma aluna seja aprovada numa disciplina, é preciso que o número resultante da soma
das suas notas em três provas parciais, dividido por 3, seja maior que 70. Este número pode
ser considerado como uma medida de _________________ .
II. A diferença entre a nota máxima e a nota mínima obtidas numa prova pelos alunos de uma
turma pode ser considerada como uma medida de __________________ .
III. A nota na avaliação que mais se repete dentre as notas obtidas pelos alunos de uma turma
pode ser considerado como uma medida de ______________ .
As respostas são, respectivamente:
(a) Dispersão, tendência central e dispersão.
(b) Tendência central, tendência central e tendência central.
(c) Tendência central, dispersão e tendência central.
(d) Tendência central, dispersão e dispersão.
(e) Dispersão, dispersão e tendência central.
75
9- Observe no gráfico a seguir uma representação para as notas de 50 alunos do primeiro semestre de
Ciências Econômicas numa
determinada prova:
A mediana das notas dos 50 alunos

de ciências Econômicas nesta prova
é igual a:
(a) 3
(b) 4
(c) 5
(d) 6
(e) 7
10- Marcos está de férias na casa do lago de seu amigo. Ele está curioso sobre a atividade aquática favorita
das outras pessoas no lago. Então, ele entrevista 150 pessoas no lago e pergunta qual é sua atividade
aquática favorita. A tabela abaixo resume os dados:
Atividade Freq. Rel.

Passeio de barco 0,24
Pescaria 0,20
Esqui aquático/Wakeboard 0,20
Caiaque 0,16
Stand up paddle 0,12
Natação 0,08
Qual das seguintes afirmações é sustentada pela tabela?
(a) 20 pessoas responderam pescaria como a sua atividade favorita.
(b) 36 pessoas responderam passear de barco como a sua atividade favorita.
(c) Esqui aquático/Wakeboard foi escolhida por mais pessoas do que Stand Up Paddle e natação
juntas.
(d) Passear de barco e caiaque somam metade das respostas.
(e) Um quarto dos respondentes escolheram passear de barco como atividade favorita.
11- Um estudo caracterizou 5 ambientes aquáticos, nomeados de A a E, em uma região, medindo parâmetros
físico-químicos de cada um deles, incluindo o pH nos ambientes:
O Gráfico I representa os valores de pH dos 5 ambientes.

Utilizando o gráfico II, que representa a distribuição
estatística de espécies em diferentes faixas de pH, pode-se
esperar um maior número de espécies no ambiente:
(a) A
(b) B
(c) C
(d) D
(e) E
76
12- Quais das seguintes afirmações são verdadeiras?
I. Se o lado direito e o lado esquerdo de um histograma são a imagem espelhada um do outro, a
distribuição é simétrica.
II. Uma distribuição que é bastante dispersa ao longo do seu lado direito é dita assimétrica à
direita.
III. Se uma distribuição é assimétrica à direita, sua média é, usualmente, maior do que a sua
mediana.
Escolha a alternativa com a resposta correta:
(a) Apenas I
(b) I e II
(c) I e III
(d) II e III
(e) Nenhuma das alternativas acima.
13- Em um conjunto de 100 observações numéricas, podemos afirmar que:
(a) a média aritmética é maior que a mediana.
(b) a mediana é maior que a moda.
(c) 50% dos valores estão acima da média aritmética.
(d) 50% dos valores estão abaixo da mediana.
(e) 25% dos valores estão entre a moda e a mediana.
14- Num curso de iniciação à informática, a distribuição das idades dos alunos, segundo o sexo, é dada pelo
gráfico seguinte:
Com base nos dados do gráfico, pode-se afirmar que:

(a) o número de meninas com, no máximo, 16 anos é maior que o número de meninos nesse
mesmo intervalo de idades.
(b) o número total de alunos é 19.
(c) a média de idade das meninas é 15 anos.
(d) o número de meninos é igual ao número de meninas.
(e) o número de meninos com idade maior que 15 anos é maior que o número de meninas nesse
mesmo intervalo de idades
77
5. Probabilidade
Como curiosidade, acho interessante iniciar essa unidade contando um resumo da história da probabilidade,
que se iniciou em 1654 com uma troca de correspondência entre os matemáticos Pascal e Fermat, na qual
eles buscaram encontrar uma estratégia para ser usada em jogos de azar que permitisse um maior ganho
financeiro. Quem instigou essa busca foi o aristocrata francês Chevalier de Méré que era um jogador
inveterado e fez uma consulta ao Pascal (PINHEIRO et. al., 2012).
Embora a história da probabilidade tenha se iniciado com aplicações em jogos de azar, essa não é sua única
aplicação. Podemos aplicar conhecimentos de probabilidade ao lidar com qualquer situação de incerteza: Qual
será o clima de amanhã? Qual será o sexo do meu primeiro filho? Qual a chance de determinada pessoa
desenvolver um tipo de câncer? Que tipo de negócio devo abrir? Onde devo investir meu dinheiro? Qual será
o próximo prefeito da minha cidade?...
Nesta seção vamos apresentar uma visão geral de probabilidade a fim de fornecer uma base, para que alunos
de diferentes áreas possam compreender melhor essa importante ferramenta e a possam a utilizar nos
diversos processos de tomada de decisão pelos quais passarão em suas vidas.
5.1. Experimentos Aleatórios e Determinísticos
Antes de definir probabilidade e falar sobre o cálculo de probabilidades, precisamos nos familiarizar com
alguns termos. Primeiro, é fundamental saber diferenciar um experimento aleatório de um experimento
determinístico:
 Experimentos determinísticos: experimentos que quando repetidos, nas mesmas condições,

produzem os mesmos resultados.
o Exemplo:
o Coloco água para ferver em uma cidade litorânea. Qual será a temperatura de ebulição?
 100°C.
o Jogo óleo de soja em um copo com água, o que vai acontecer?
 O óleo não vai se misturar com a água e formará uma camada acima da água.
 Experimentos aleatórios: experimentos que quando repetidos, nas mesmas condições, podem
produzir resultados distintos.
o Exemplo:
o Jogo um dado em uma superfície plana. Qual face ficará para cima?
 1, 2, 3, 4, 5 ou 6?
o Uma mulher engravida pela segunda vez. Qual será o sexo do seu filho?
 Feminino ou masculino?
A partir de agora, sempre que for mencionado um experimento, ele será aleatório, já que experimentos
determinísticos não trazem desafios probabilísticos, já que não existe incerteza quanto ao resultado.
Precisamos de conhecimento de probabilidade para conseguir determinar o grau de incerteza relacionado aos
resultados de um experimento aleatório.
78
5.2. Espaço Amostral
(representado pela letra grega Ω). Pode parecer um conceito bastante simples, mas a ideia de espaço amostral
Ao conjunto de resultados possíveis de um experimento aleatório, dá-se o nome de Espaço Amostral
é muito importante para o cálculo de probabilidades. Se temos o interesse em saber qual a probabilidade de
determinado resultado de um experimento ocorrer, é fundamental conhecermos todos os resultados
possíveis.
Vejamos abaixo alguns exemplos de espaços amostrais:
o Ω = ›cara, coroa•
 Experimento 1: Lançar uma moeda e verificar qual face ficará para cima ao cair:
o Ω3 = ›1,2,3,4,5,6•
 Experimento 2: Lançar um dado e observar o valor da face voltada para cima:
o Ω4 = ›perfeita, defeituosa•
 Experimento 3: Extrair uma peça de uma linha de produção de a classificar como perfeita ou não:
 Experimento 4: Utilizar um instrumento para contar o número de determinada bactéria em uma
o ΩQ = ›0,1,2,3,4, … •
lâmina e anotar o resultado:
o ΩV = ›a|a > 0•
 Experimento 5: Determinar a duração da vida útil de uma lâmpada, em horas:
Um espaço amostral pode ser finito ou infinito. Os espaços amostrais 1, 2 e 3 apresentados acima, por
exemplo, são finitos; já os espaços amostrais 4 e 5 são infinitos. Vale a pena notar, que o espaço amostral 4 é
infinito, porém enumerável (é possível ordenar os resultados possíveis), já o espaço amostral 5 é infinito não
enumerável (não sendo possível ordenar os resultados possíveis).
5.3. Evento
espaço amostral Ω (geralmente representado por letras maiúsculas encontradas no início do alfabeto: £, ¤, …).
Um evento pode se referir a um único resultado, ou a um subconjunto de resultados, pertencentes à um
Vejamos abaixo alguns exemplos de eventos relativos aos espaços amostrais definidos na seção anterior:
Ω = ›cara, coroa•
o Evento £, sair cara: £ = ›cara•

Ω3 = ›1,2,3,4,5,6•
o Evento ¤, sair um número par: ¤ = ›2,4,6•

o Evento q, sair um número menor ou igual a 6: q = ›1,2,3,4,5,6•

ΩQ = ›0,1,2,3,4, … •
o Evento “, lâmina sem bactérias: “ = ›0•

o Evento ¥, lâmina com número de determinada bactéria superior a 100: ¥ = ›101,102, … •

ΩV = ›a|a > 0•
o Evento †, a lâmpada durar mais de 200 e menos de 500 horas: † = ›a|200 < a < 500•

Alguns eventos especiais:
 Evento simples ou elementar: evento que representa um único resultado possível.
79
o Por exemplo, os eventos £ e “ definidos acima são eventos simples.
o Por exemplo, se eu fosse definir um evento ¦ em Ω , que representasse o resultado cara e

 Evento nulo ou vazio: evento contendo resultados impossíveis ou não contendo resultado algum.
para cima ao mesmo tempo, logo ¦ = ›cara e coroa• = ∅.

coroa, ele seria impossível, já que não é possível uma moeda cair com as duas faces viradas
o Por exemplo, o evento q definido acima é equivalente a Ω3 , como ele contém todos os
 Evento certo: evento que contém todos os resultados possíveis (espaço amostral)
resultados possíveis ele certamente ocorrerá, ou seja, é um evento certo.
5.4. Teoria dos conjuntos
Definimos Espaço amostral como sendo o conjunto de todos os resultados possíveis de um experimento
aleatório, e definimos evento como sendo um subconjunto de um espaço aleatório. Podemos perceber, que
teoria de conjuntos é uma parte fundamental para a compreensão e cálculo de probabilidade. Irei, então,
realizar uma revisão rápida sobre a teoria dos conjuntos, a fim de relembrar as operações e nomenclaturas
mais importantes para a compreensão dessa parte da matéria.
5.4.1. Operações entre Eventos
Não é necessário relembrar toda a teoria dos conjuntos, mas é fundamental relembrar algumas das operações
e símbolos:
A união de dois eventos é denotada por: £ ∪ ¤;

o Um conjunto q, tal que q = £ ∪ ¤, é formado por todos os elementos que estejam em £, ou

em ¤, ou em ambos.
A interseção entre dois eventos é dada por: £ ∩ ¤;
o Um conjunto D, tal que “ = £ ∩ ¤, é formado por todos os elementos que estejam em £ e

em ¤.
O complementar do evento £, denotado por £ª ou por £̅, é o evento que ocorre quando £ não ocorre.
o O conjunto £ª é formado por todos os elementos pertencentes ao espaço amostral que não

estejam em £.
Assim como para as quatro operações fundamentais (+, −,×,÷), temos que as leis associativas e comutativas
também podem ser utilizadas para as operações entre eventos:
o £ ∪ ¤ = ¤ ∪ £;
 Leis comutativas:
o £ ∩ ¤ = ¤ ∩ £.
o £ ∪ (¤ ∪ q ) = (£ ∪ ¤) ∪ q;
 Leis associativas:
o £ ∩ (¤ ∩ q ) = (£ ∩ ¤) ∩ q.
Finalmente, conhecendo as operações básicas e as leis comutativas e associativas, podemos chegar às

seguintes identidades de conjuntos:
£ ∪ (¤ ∩ q ) = (£ ∪ ¤) ∩ (£ ∪ q );
£ ∩ (¤ ∪ q ) = (£ ∩ ¤) ∪ (£ ∩ q );


80
£ ∩ ∅ = ∅;
£ ∪ ∅ = £;

(£ ∪ ¤)ª = £ª ∩ ¤ª ;

(£ ∩ ¤)ª = £ª ∪ ¤ª ;

(£ª )ª = £.


Por fim, vamos considerar dois eventos £ e ¤, definidos em um mesmo espaço amostral. Diz-se que £ e ¤ são
comum, ou seja, se £ ∩ ¤ = ∅.
eventos mutuamente exclusivos (ou mutuamente excludentes) se eles não tiverem nenhum elemento em
espaço amostral Ω = ›1,2,3,4,5,6•: £ = ›2,4,6•, ¤ = ›5,6•, q = ›3•. Encontre os conjuntos:

Exemplo 1: Vamos considerar o lançamento de um dado equilibrado e os seguintes eventos relacionados ao
£ ∪ ¤ = ›2,4,6• ∪ ›5,6• = ›2,4,5,6•;

£ ∩ ¤ = ›2,4,6• ∩ ›5,6• = ›6•; (OBS: Os eventos £ e ¤ não são mutuamente exclusivos)

£ ∪ q = ›2,4,6• ∪ ›3• = ›2,3,4,6•;


£ ∩ q = ›2,4,6• ∩ ›3• = ∅; (OBS: Os eventos £ e q são mutuamente exclusivos)


¤ ∩ q = ›5,6• ∩ ›3• = ∅; (OBS: Os eventos ¤ e q são mutuamente exclusivos)


£ ∪ ¤ ∪ q = ›2,4,6• ∪ ›5,6• ∪ ›3• = ›2,3,4,5,6•;


(£ ∩ q ) ∪ ¤ = ∅ ∪ ›5,6• = ›5,6•;

£ ∩ (q ∪ ¤) = ›2,4,6• ∩ (›3• ∪ ›5,6•) = ›2,4,6• ∩ ›3,5,6• = ›6•;


(£ ∪ ¤) ∩ q = ›2,4,5,6• ∩ ›3• = ∅;

£ª = ›1,3,5•;

(£ ∩ q )ª = ∅ª = ›1,2,3,4,5,6• = Ω;

£ª ∪ q ª = ›1,3,5• ∪ ›1,2,4,5,6• = ›1,2,3,4,5,6• = Ω;


(£ ∪ q )ª = ›2,3,4,6•ª = ›1,5•;

£ ∩ ¤ª = ›2,4,6• ∩ ›1,2,3,4• = ›2,4•.



Exemplo 2: Sendo £ e ¤ dois eventos em um mesmo espaço amostral “traduza” para a linguagem da teoria
dos conjuntos as seguintes situações:
Pelo menos um dos eventos ocorre: £ ∪ ¤;

O evento £ ocorre, mas ¤ não: £ ∩ ¤ª ;

Nenhum deles ocorre: (£ ∪ ¤)ª ;


Exatamente um dos eventos ocorre: (£ ∩ ¤ª ) ∪ (¤ ∩ £ª ).



5.5. Exercícios
1- [PAGANO e GAUVREAU, 2010] Seja £ representante do evento de que um indivíduo em particular

esteja exposto a altos níveis de monóxido de carbono e ¤ do evento de que ele esteja exposto a altos
a. Qual é o evento £ ∩ ¤?
níveis de dióxido de nitrogênio.
b. Qual é o evento £ ∪ ¤?
c. Qual é o complemento de £?
d. Os evento £ e ¤ são mutuamente exclusivos?
81
a. £ ocorre mas ¤ não ocorre;
2- [BUSSAB e MORETTIN, 2004] Expresse em termos de operações entre eventos:
b. Exatamente um dos eventos £ e ¤ ocorre;

c. Nenhum dos dois eventos £ e ¤ ocorre.
3- [MARTINEZ, 2015] Sejam Ω = › , , , 9, [•, £ = › , , 9•, ¤ = › , 9, [•. Encontre:
a. £ ∪ ¤
b. ¤ª
c. (£ ∩ ¤)ª
d. £ ∩ ¤
e. £ª ∩ ¤
f. £ª ∩ ¤ª
g. (£ ∪ ¤)ª
h. £ ∪ ¤ª
4- [MARTINEZ, 2015] Nos seguintes diagramas de Venn, sombreie:
5- [MARTINEZ, 2015] Sejam Ω = ›1,2,3,4,5,6,7,8,9•, £ = ›1,2,3,4•, ¤ = ›2,4,6,8• e q = ›3,4,5,6•.
a. £ª
Encontre:
82
b. £ ∩ q
c. (£ ∩ q )ª
d. £ ∪ ¤
6- [DEVORE, 2006] Três componentes estão conectados para formar um sistema conforme exibido no
diagrama a seguir (Figura 37). Como os componentes no subsistema 2-3 estão conectados em
paralelo, esse subsistema funcionará se ao menos um dos dois componentes individuais funcionar.
Para que todo o sistema funcione, o componente 1 deve funcionar, bem como o subsistema 2-3. O
experimento consiste em determinar a condição de cada componente [S (sucesso) para um
componente que funciona bem e F (falha) para um componente que não funciona].
Figura 37: Diagrama ilustrativo para resolução do exercício 2.
a. Que resultados estão contidos no evento £ para que exatamente dois dos três componentes
Fonte: Elaborada pela autora com base na figura apresentada em (DEVORE, 2006)
b. Que resultados estão contidos no evento ¤ para que ao menos dois componentes funcionem?
funcionem?
d. Relacione os resultados de q ª , £ ∪ ¤, £ ∩ q, ¤ ∪ q, e ¤ ∩ q.
c. Que resultados estão contidos no evento C para que o sistema funcione?
7- [LARSON e FARBER, 2004] Você está planejando uma viagem de três dias a Seattle, Washington, em
outubro. Use o diagrama da árvore que aparece a seguir para responder às perguntas. (S = sol e C =
chuva).
Figura 38: Diagrama de árvore para auxiliar a resolução do exercício 4.
Fonte: Elaborada pela autora com base no diagrama apresentado em (LARSON e FARBER, 2004)
a. Enumere o espaço amostral.
b. Enumere o(s) resultado(s) do evento "irá chover durante os três dias".
c. Enumere o(s) resultado(s) do evento "irá chover durante exatamente um dia".
83
d. Enumere o(s) resultado(s) do evento "irá chover durante pelo menos um dia".
8- [WALPOLE et al., 2009] Um experimento consiste em lançar um dado e, então, uma moeda uma vez,
a notação 4¬, por exemplo, para denotar o resultado no qual o dado dá 4 e a moeda dá cara (“Head”),
se o número do dado for par. Se o número no dado for ímpar, a moeda é jogada duas vezes. Usando
e 3¬c para denotar o resultado quando o dado dá 3 e a moeda dá uma cara (“Head”) e uma coroa
(“Tail”), construa um diagrama de árvore para mostrar os 18 elementos do espaço amostral -.
a. Liste os elementos correspondentes ao evento £, em que um número menor que 3 seja obtido
9- [WALPOLE et al., 2009] Para o espaço amostral do Exercício 8.
b. Liste os elementos correspondentes ao evento ¤, em que ocorram duas coroas.

no dado.
c. Liste os elementos correspondentes ao evento £ª .

d. Liste os elementos correspondentes ao evento £ª ∩ ¤.
e. Liste os elementos correspondentes ao evento £ ∪ ¤.
5.6. Definições de Probabilidade
Existem algumas definições de probabilidade, e embora elas sejam todas semelhantes, existem algumas
diferenças e vale a pena apresentá-las indicando para qual caso cada uma seria a mais indicada.
5.6.1. Definição Frequentista de Probabilidade
condições iniciais. Vamos definir um evento £ dentro do espaço amostral - relativo a este experimento.
Vamos considerar que determinado experimento foi repetido vezes, sempre respeitando as mesmas
Considere que o evento £ ocorreu ® vezes, dentro das repetições realizadas.
= é a frequência relativa do evento £ nas

Já definimos frequência relativa nas sessões 3.2.1. e 3.2.3. (páginas 14 e 20, respectivamente) desta apostila,
¯
mas relembrando, pode-se dizer que ® repetições, sabemos
que ® tem as seguintes propriedades:
0 ≤ ® ≤ 1;
® = 1 se, e somente se, £ ocorrer em todas as repetições do experimento;

® = 0 se, e somente se, £ nunca ocorrer nas repetições do experimento;


Se £ e ¤ forem eventos mutuamente excludentes, e se ®∪° for a frequência relativa associada ao


evento £ ∪ ¤, então, ®∪° = ® + ° ;


±² , com base em ‘ repetições do experimento em questão, é considerada como uma função de ‘,

que “converge” em certo sentido probabilístico para ³(²), quando ‘ → ∞.

Para entendermos melhor a ideia da definição frequentista de probabilidade, irei simular no software R o
lançamento de um dado viciado (valor 5 com o triplo da probabilidade de sair) e mostrarei os resultados
obtidos para 6, 60, 600 e 6.000 e 60.000 lançamentos na tabela 27 que pode ser observada na página 85:
84
Tabela 27: Tabela contendo os resultados obtidos da simulação do lançamento de um dado viciado.
= 6 = 60 = 600
Resultados Freq. Freq. Resultados Freq. Freq. Resultados Freq. Freq.
possíveis Abs. Rel. possíveis Abs. Rel. possíveis Abs. Rel.
1 1 16,67% 1 10 16,67% 1 55 9,17%
2 2 33,33% 2 9 15,00% 2 66 11,00%
3 0 0,00% 3 11 18,33% 3 79 13,17%
4 1 16,67% 4 4 6,67% 4 79 13,17%
5 2 33,33% 5 17 28,33% 5 243 40,50%
= 6.000 = 60.000 →∞
6 0 0,00% 6 9 15,00% 6 78 13,00%
Resultados Freq. Freq. Resultados Freq. Freq. Resultados Probabilidade

possíveis Abs. Rel. possíveis Abs. Rel. possíveis Teórica
1 748 12,47% 1 7459 12,43% 1 12,50%
2 725 12,08% 2 7630 12,72% 2 12,50%
3 740 12,33% 3 7395 12,33% 3 12,50%
4 803 13,38% 4 7349 12,25% 4 12,50%
5 2243 37,38% 5 22582 37,64% 5 37,50%
6 741 12,35% 6 7585 12,64% 6 12,50%
Os resultados apresentados na tabela 27 ilustram a definição frequentista de probabilidade, podemos ver que
conforme o número de lançamentos simulados aumentam, as frequências relativas chegam mais próximo da
probabilidade real (aquela relativa ao dado criado para esta simulação).
5.6.2. Definição Axiomática de Probabilidade
Vamos conciderar um espaço amostral Ω relativo a determinado experimento. A cada evento £ será associado
um número real, representado por ¶ (£), e denominado probabilidade de ², que satisfaça os seguintes
axiomas:
0 ≤ ¶ (£) ≤ 1;
¶ (·) = 1;

Se £ e ¤ forem eventos mutuamente excludentes, então, ¶ (£ ∪ ¤) = ¶(£) + ¶ (¤);


Se £ , £3 , … , £ forem, dois a dois, eventos mutuamente excludentes, então, ¶ (⋃ " £ ) =


∑ " ¶ (£ ).

5.6.3. Espaço Amostral Finito
Para encontrar a probabilidade de um evento £ definido em um espaço amostral finito Ω devemos,
(£ = › •).
inicialmente considerar o evento formado por um resultado simples – evento simples, ou elementar
A cada evento simples › • será associado um valor ] , denominado probabilidade de › •, que satisfaça as
seguintes condições:
 ] ≥ 0, = 1,2, … , º;
85
] + ]3 + ⋯ + ]» = 1.
Em seguida pode se considerar um evento £! constituído por \ resultados, com 1 ≤ \ ≤ º.

¼£! = ½ !I , !J , … , !¾ ¿À,

consequentemente:
¶¼£! À = ]!I + ]!J + ⋯ + ]!¾
Exemplo: Suponha-se que somente três resultados sejam possíveis em um determinado experimento
aleatório, a saber, , 3 e 4 . Além disso, suponha-se que seja duas vezes mais provável de ocorrer que
3 , e que 3 seja duas vezes mais provável de ocorrer que 4 . Quais as probabilidades de , 3 e 4 , cada,
ocorrerem?
] + ]3 + ]4 = 1, além disso, o enunciado nos diz que ] = 2]3 e que ]3 = 2]4 , logo:
Para resolver esse problema, podemos utilizar os axiomas que definimos acima, sabemos, por exemplo que
] + ]3 + ]4 = 1
2]3 + 2]4 + ]4 = 1
2(2]4 ) + 3]4 = 1
4]4 + 3]4 = 1
7]4 = 1
1 2 4
]4 = ; ]3 = ; ] =
7 7 7
5.6.4. Definição Clássica de Probabilidade
Considere um espaço amostral Ω com º resultados possíveis de determinado experimento, tal que esses º
seja, podemos definir a probabilidade de cada um dos º eventos simples como sendo ] = 1#º.
resultados possíveis tenham a mesma probabilidade de ocorrer (espaço amostral igualmente verossímil), ou
] ≥ 0, = 1,2, … , º;
] = ]! = ] = », para quaisquer e ‹, com, , ‹ = 1,2, … , º

] + ]3 + ⋯ + ]» = º. ] = º. » = 1.


Logo, para qualquer evento £ formado por \ resultados, tem-se:
¶ (£) = \#º
Ou:
número de casos favoráveis a ocorrência do evento £

¶ (£) =
número de resultados possíveis do experimento
Essa definição de probabilidade, embora bastante intuitiva, não pode ser utilizada para todos os experimentos
ou espaços amostrais, mas apenas para experimentos que gerem espaços amostrais igualmente verossímeis.
A ideia de um espaço igualmente verossímil é muito atraente, porém não é aplicável a todas as situações, é
86
necessário justificar a verossimilhança de determinado espaço amostral antes de calcular a probabilidade de
determinado evento ocorrer.
Faz sentido pensar em espaços amostrais igualmente verossímeis em que se consideram experimentos do
tipo:
 Lançamento de um dado honesto;

 Lançamento de uma moeda honesta;
 Retirar ao acaso uma carta de um baralho.
Exemplo: Em uma universidade, 2000 estudantes do curso de medicina, em determinado ano, foram
classificados de acordo com o tipo de esporte que praticam. Futebol é praticado por 260 estudantes, natação
por 185 estudantes e musculação por 210 estudantes, sendo que alguns estudantes praticam mais de um
desses esportes. Assim, tem-se 42 estudantes que praticam natação e musculação, 12 futebol e musculação,
18 futebol e natação e 3 praticam as três modalidades. Se um desses estudantes é sorteado ao acaso, qual é
a probabilidade de:
 Praticar somente musculação?

o Nesse caso, temos um espaço amostral com 2000 resultados possíveis, considerando como
possível o sorteio de cada um dos 2000 estudantes. Para saber a probabilidade de retirar um
aluno que pratique somente musculação, precisamos saber quantos estudantes praticam
apenas musculação, aí termos o número de casos favoráveis ao evento {praticar somente
musculação}, depois de definido esse valor, basta dividi-lo pelo número de resultados
possíveis (2000).
o Para resolver essa probabilidade ou qualquer outra relativa a esse problema, devemos:
 † = ›O estudante pratica futebol•;

 Definir os eventos de interesse:
 Ç = ›O estudante pratica natação•;

 Ê = ›O estudante pratica musculação•.
o Identificar quantos resultados possíveis temos em cada evento. Para isso, usarei o auxílio de
um diagrama de Venn (Figura 39), a fim de utilizar esse apoio visual, deve-se inserir os valores
do enunciado da maior interseção até os eventos de interesse gradualmente:
87
Figura 39: Diagrama de Venn, auxílio ilustrativo para resolução do exemplo.
3 estudantes em † ∩ Ê ∩ Ç
12 estudantes em † ∩ Ê
18 estudantes em † ∩ Ç
42 estudantes em Ê ∩ Ç
260 estudantes em †
185 estudantes em Ç
210 estudantes em Ê
159
¶(somente musculação) = ¶ (Ê ∩ † ª ∩ Ç ª ) = = 0,0795
2000
 Praticar pelo menos um destes esportes:
2000 − 1414 586

¶(pelo menos 1 dos 3 esporte) = ¶ (Ê ∪ † ∪ Ç) = = = 0,293
2000 2000
 Praticar pelo menos dois destes esportes:
39 + 3 + 15 + 9 66
¶(pelo menos 2 dos 3 esporte) = ¶Ë(† ∩ Ê) ∪ († ∩ Ç) ∪ (Ê ∩ Ç)Ì = = =
2000 2000
= 0,033
 Não praticar nenhum destes esportes:
1414
¶(Nenhum dos 3 esporte) = ¶Ë(† ∪ Ê ∪ Ç)ª Ì = = 0,707
2000
5.7. Propriedades
O cálculo de probabilidades depende de interpretação de texto e de situações, compreensão de teoria dos

conjuntos e como aplicá-la na definição e tratamento de espaçoes amostrais e de eventos, além de
maleabilidade e familiaridade com conceitos de probabilidade e propriedades que podem facilitar os cálculos.
Considere os eventos £, ¤ e q relativos a um mesmo espaço amostral Ω. Algumas das propriedades de

probabilidade são dadas abaixo:
¶ (£ ∪ £ª ) = 1;
¶ (£ ∩ £ª ) = 0;

¶ (£) = 1 − ¶(£ª );

¶ (£ ∪ ¤) = ¶(£) + ¶ (¤) − ¶(£ ∩ ¤);


o No caso de dois eventos, £ e ¤, tal que eles sejam mutumente exclusivos, então:

o ¶ (£ ∪ ¤) = ¶(£) + ¶ (¤).
88
 ¶ (£ ∪ ¤ ∪ q ) = ¶(£) + ¶ (¤) + ¶(q ) − ¶ (£ ∩ ¤) − ¶(£ ∩ q ) − ¶(¤ ∩ q ) + ¶ (£ ∩ ¤ ∩ q ).
Exemplo: Sejam £ e ¤ dois eventos em um mesmo espaço amostral, tais que ¶ (£) = 0,2, ¶ (¤) = ],
¶ (£ ∪ ¤) = 0,5 e ¶ (£ ∩ ¤) = 0,1. Determine o valor de ].
¶(£ ∪ ¤) = ¶ (£) + ¶ (¤) − ¶(£ ∩ ¤)
0,5 = 0,2 + ] − 0,1
] = 0,4
5.8. Probabilidade Condicional
Vamos considerar o experimento lançamento de um dado honesto, com espaço amostral Ω = ›1,2,3,4,5,6•.
Dentro desse espaço amostral, vamos definir os eventos £ = ›1• e ¤ = ›sair um número ímpar•. Já vimos
que, no caso de um dado honesto, ¶ (£) = 1/6.
Agora, e se eu souber que o evento ¤ ocorreu, isso influência a probabilidade do evento £ ocorrer?
Sabendo que o evento ¤ = ›sair um número ímpar• ocorreu, temos que o espaço amostral do experimento
foi alterado de 6 resultados possíveis para 3 resultados possíveis e a probabilidade de £ = ›1• ocorrer nesse
caso é: ¶ (£|¤) = 1/3.
Muitas vezes, informações sobre determinado evento ¤ é conhecida, e com conhecimento dessa informação
devemos calcular a probabilidade de um outro evento £. Em outras palavras, é comum, querermos calcular a
probabilidade do evento £ dado que o evento ¤ ocorreu, ou ¶ (£|¤) (se lê probabilidade de £ dado ¤), a
probabilidade de £ condicionada a ¤.
Podemos resolver problemas de probabilidade condicional utilizando o conceito da restrição feita ao espaço
amostral do experimento, ou utilizando a seguinte expressão:
¶(£ ∩ ¤)
¶(¤|£) =
¶ (£)
desde que ¶ (£) > 0;
 Para ¶(£) = 0, temos ¶ (¤|£) = ¶(¤).
Exemplo: Em um estudo feito com 15 pessoas, foram coletadas informações sobre o estilo de vida de cada um
(sedentário ou não) e sobre o peso de cada um (obeso ou não). Foram observadas 5 pessoas obesas e 9
sedentárias; dentre as 5 pessoas obesas, 4 foram classificadas como sedentárias. Qual a probabilidade de:
 Um indivíduo ser obeso e sedentário?
Em exemplos anteriores, resolvi os problemas de maneira direta, ou utilizando o recurso visual do diagrama
de Venn. Nesse caso, o diagrama de Venn não é um recurso muito adequado, e resolver o problema de
maneira direta pode causar dificuldades para aqueles que têm dificuldade nessa matéria. Sendo assim, indico,
para esses tipos de problemas a utilização de uma tabela de dupla entrada para organizar e visualizar as
informações do enunciado.
89
Tabela 28: Tabela de dupla entrada para resolução do exemplo.
Obeso Não obeso Total

Sedentário 4 5 9
Não-Sedentário 1 5 6
Total 5 10 15
Com as informações organizadas na tabela 28 fica mais símples de saber quantos resultados favoráveis a
determinado evento existem, a fim de calcular a probabilidade do evento em questão ocorrer.
Vamos definir os eventos – = ›o indivíduo ser obeso• e - = ›o indivíduo ser sedentário•. Queremos
calcular a probabilidade de um indivíduo ser obeso e sedentário, ou seja: ¶ (– ∩ -) = 4/15. Pela tabela
podemos ver que do total de 15 pessoas amostradas, 4 são obesas e sedentárias.
 Um indivíduo ser obeso ou sedentário?
5 9 4 10
¶ (– ∪ -) = ¶ (–) + ¶(-) − ¶ (– ∩ -) = + − =
15 15 15 15
 Um indivíduo ser obeso dado que ele é sedentário?
¶(– ∩ -) 4#15 4
¶(–|-) = = =
¶(-) 9# 9
15
¶ (– ∩ -) 4#15 4
 Um indivíduo ser sedentário dado que ele é obeso?
¶ (-|–) = = =
¶(–) 5# 5
15
Um resultado importante que sai diretamente da definição de probabilidade condicional é a regra

multiplicativa.
¶(£ ∩ ¤) = ¶ (£|¤)¶ (¤) = ¶(¤ |£)¶(£)
A regra multiplicativa é bastante útil quando estamos interessados em encontrar a probabilidade da

interseção entre dois eventos, e também para auxiliar na identificação de eventos independentes:
 Dois eventos são considerados independentes quando a ocorrência de um não influencia na

ocorrência ou não-ocorrência do outro;
Logo, se dois eventos, £ e ¤, são independentes tem-se que:
¶ (£|¤) = ¶(£) e ¶ (¤|£) = ¶(¤);

Ou seja, ¶ (£ ∩ ¤) = ¶(£)¶ (¤).


OBS: Os termos mutuamente exclusivos e independentes não são sinonimos; basta lembrar que eventos
mutuamente exclusivos não possuem interseção.
Exemplo: Considere as situações dadas abaixo. Identifique se os eventos são mutuamente exclusivos ou
independentes.
90
 Evento A: O primeiro filho de um casal ser menina; Evento B: O segundo filho de um casal ser menina.
o Não temos conhecimento dos valores da probabilidades nesse caso, mas conhecemos o
conceito de independência, que é a ocorrência de um evento não influenciar a ocorrência ou
não do outro. Temos que o o sexo de um filho é determinado por fatores genéticos, e não
pelo sexo do filho anterior, ou seja, a informação de que o primeiro filho é menina, não
influencia a probabilidade do segundo filho ser menina.
o Eventos INDEPENDENTES.
 Evento A: Um indivíduo, de determinada população, ter o tipo sanguíneo A; Evento B: Um indivíduo,
de determinada população, ter o tipo sanguíneo O.
o Nesse caso, também não temos valores de probabilidades para nos basear, apenas o conceito.
Sabemos que um indivíduo tem apenas um tipo sanguíneo, ou seja, não é possível que um
mesmo indivíduo seja do tipo A e do tipo O ao mesmo tempo, sendo assim, existe uma
dependência forte entre os eventos, se o evento A ocorrer eu tenho certeza de que o evento
B não pode ocorrer, e vice versa, ou seja, os eventos A e B são MUTUAMENTE EXCLUSIVOS, e
Considere dois eventos, A e B, dado que ¶(£) = 0,8, ¶ (¤) = 0,5 e ¶(£ ∩ ¤) = 0,45
não independentes.

o Nesse caso não temos como definir conceitualmente, pois os eventos não são descritos,
porém, suas probabilidades são dadas, logo, podemos utilizar a regra multiplicativa para
o ¶ (£)¶ (¤) = 0,8 × 0,5 = 0,4 ≠ ¶(£ ∩ ¤), logo A e B NÂO são eventos NEM
verificar se eles são independentes ou não:
INDEPENDENTES, NEM MUTUAMENTE EXCLUSIVOS.
5.9. Teoremas
Nesta seção estudaremos um dos mais importantes teoremas em probabilidade, o teorema de Bayes. Mas
antes de chegar nele, precisamos entender o que é uma partição do espaço amostral.
Uma partição do espaço amostral é dada por um conjunto de eventos mutuamente exclusivos (¤ , ¤3 , … , ¤ )
que quando unidos formam o espaço amostral, ou seja, o conjunto de eventos deve respeitar as seguintes
condições:
¶(¤ ) > 0, para todo ( = 1,2, … , )

¤ ∩ ¤! = ∅, para todo ( , ‹ ) com ≠ ‹

⋃" ¤ =Ω


5.9.1. Teorema da Probabilidade Total
Dado um evento £ e uma partição do espaço amostral (¤ , ¤3 , … , ¤ ), tem-se:
¶ (£) = ¶ (£ ∩ ¤» ) = ¶(£|¤» )¶(¤» )

»" »"
Exemplo: Suponha que um fabricante de sorvetes recebe 20% de todo o leite que utiliza de uma fazenda † ,
30% de uma outra fazenda †3 e 50% de †4 . Um órgão de fiscalização inspecionou as fazendas de surpresa e
observou que 20% do leite produzido por † estava adulterado por adição de água, enquanto que para †3 e
†4 , essa proporção era de 5% e 2%, respectivamente. Na indústria de sorvetes os galões de leite são
91
armazenados em um refrigerador sem identificação das fazendas. Para um galão escolhido ao acaso, qual a
probabilidade dele estar adulterado?
Nesse caso, temos interesse em calcular a probabilidade do evento £ = ›o leite estar adulterado•, e temos
informações sobre uma partição do espaço amostral (as probabilidade de todo o leite utilizado na fabrica ter
vindo de 3 fazendas distintas, sem interseção entre elas) e as probabilidade de adulteração condicionadas ás
três fazendas de origem. Vamos organizar a informação em um diagrama de Venn (Figura 40):
Figura 40: Diagrama de Venn ilustrando os eventos dados no exemplo.
† †4
†3
Para encontrar a probabilidade do evento £, basta somar as probabilidades das interseções entre o evento £
e os eventos que formam a partição do espaço amostral.
O enunciado nos dá as seguintes informações:
“recebe 20% de todo o leite que utiliza de uma fazenda † ”: ¶ († ) = 0,20;

“30% de uma outra fazenda †3 ”: ¶ (†3 ) = 0,30;

“e 50% de †4 ”: ¶ (†4 ) = 0,50;


“20% do leite produzido por † estava adulterado”: ¶ (£|† ) = 0,20;


“para †3 e †4 , essa proporção era de 5% e 2%, respectivamente”: ¶ (£|†3 ) = 0,05 e ¶(£|†4 ) = 0,02.


O teorema da probabilidade total nos fornece uma maneira de calcular ¶(£):
¶ (£) = ¶ (£ ∩ ¤» ) = ¶ (£|¤» )¶(¤» ) = 0,20 × 0,20 + 0,05 × 0,30 + 0,02 × 0,50

»" »"
¶ (£) = 0,04 + 0,015 + 0,010 = 0,065
O teorema da probabilidade total não é a única maneira de resolver esse tipo de problema, uma outra
maneira, seria utilizando uma árvore de probabilidades, também muito útil quando estamos trabalhando com
partições de espaço amostral:
92
Figura 41: Diagrama de árvore contendo as probabilidades e eventos dados pelo enunciado do exemplo.
Utilizando a árvore de probabilidade pode ser mais fácil de visualizar as relações entre os eventos e como
as probabilidade das interseções contendo £: ¶ (£) = 0,04 + 0,015 + 0,01 = 0,065.

encontrar as interseções. Montando a árvore completa, como mostrada na figura 41, temos apenas que somar
5.9.2. Teorema de Bayes
Dado um evento £, tal que ¶(£) > 0, e uma partição do espaço amostra (¤ , … , ¤ ) tem-se:
¶ (£ ∩ ¤» ) ¶(£|¤» )¶ (¤» )
¶(¤» |£) = =
¶ (£) ∑ " ¶ (£|¤ )¶(¤ )
Com º = 1,2, … , .
Exemplo: Suponha que um fabricante de sorvetes recebe 20% de todo o leite que utiliza de uma fazenda † ,
30% de uma outra fazenda †3 e 50% de †4 . Um órgão de fiscalização inspecionou as fazendas de surpresa e
observou que 20% do leite produzido por † estava adulterado por adição de água, enquanto que para †3 e
†4 , essa proporção era de 5% e 2%, respectivamente. Na indústria de sorvetes os galões de leite são
armazenados em um refrigerador sem identificação das fazendas.
Agora, ao invés de ter interesse na probabilidade de um galão selecionado ao acaso conter leite adulterado,
vamos considerar que temos o interesse em saber qual a probabilidade de um galão de leite adulterado ser
proveniente da fazenda 1.
Já vimos que o enunciado nos dava as seguintes informações:
“20% de todo o leite que utiliza de uma fazenda † ”: ¶ († ) = 0,20;

“30% de uma outra fazenda †3 ”: ¶ (†3 ) = 0,30;

“e 50% de †4 ”: ¶ (†4 ) = 0,50;


“20% do leite produzido por † estava adulterado”: ¶ (£|† ) = 0,20;


“para †3 e †4 , essa proporção era de 5% e 2%, respectivamente”: ¶ (£|†3 ) = 0,05 e ¶(£|†4 ) = 0,02.


93
Apenas com essas informações não é possível calcular a probabiliade desejada ¶ (£|† ) diretamente, já que
não conhecemos ¶ (£ ∩ † ) e ¶(£). Podemos, no entanto, utilizar o teorema de Bayes:
¶(£|† )¶(† )
¶ († |£) =
¶(£|† )¶(† ) + ¶(£|†3 )¶(†3 ) + ¶(£|†3 )¶(†3 )
0,20 × 0,20 0,04

¶(† |£) = = = 0,615
0,20 × 0,20 + 0,30 × 0,05 + 0,50 × 0,02 0,065
Podemos utilizar o diagrama de árvores para resolver esse tipo de problema, fica por conta de cada um
escolher o método com o qual sente mais afinidade e facilidade.
5.10. Exercícios
1- [BLAIR e TAYLOR, 2013] A tabela de dupla entrada dada abaixo representa os resultados de um censo
gênero (Ê = ›Masculino• / † = ›Feminino•) e por suas respostas quanto a terem ou não estado
dirigido que abrange todos os alunos em uma grande universidade. Cada aluno foi categorizado por
(” = ›estiveram embriagados• ”̅ =
›não estiveram embriagados•). Determine as probabilidades:
embriagados nos últimos 30 dias /
” ”̅
Ê
Total
†
0,22 0,32 0,54
0,1 0,36 0,46
Total 0,32 0,68 1
a. A probabilidade de que uma aluna, selecionada aleatoriamente dentre as mulheres, não tenha
estado embriagada nos últimos 30 dias.
b. A probabilidade de que um aluno selecionado aleatóriamente seja do sexo feminino.
c. A probabilidade de que um aluno selecionado aleatoriamente seja do sexo masculino ou
tenha estado embriagado nos últimos 30 dias.
d. A probabilidade de que um aluno selecionado aleatoriamente seja do sexo feminino e tenha
estado embriagado nos últimos 30 dias.
e. A probabilidade de que um aluno selecionado aleatoriamente dentre aqueles que informaram
terem estado embriagados nos últimos 30 dias seja do sexo feminino.
f. A probabilidade de que um aluno selecionado aleatoriamente seja do sexo masculino ou
feminino.
g. O sexo e o estado de embriagues são independentes? Qual é a evidência para a sua conclusão?
2- [BLAIR e TAYLOR, 2013] Suponha que metade dos moradores de uma comunidade seja do sexo
feminino e que 20% dos residentes nessa comunidade admitam um aumento de imposto para que
sejam oferecidos fundos para vacinações gratuitas contra doenças infantis. Considere que 10% dos
moradores da comunidade são do sexo feminino e apoiadores do aumento do imposto.
a. Pode-se dizer que o gênero e o apoio ao aumento do imposto são eventos independentes?
Qual é a evidência que dá suporte à sua resposta?
b. Determine a probabilidade de um indivíduo selecionado aleatoriamente dessa comunidade
apoie o aumento do imposto dado que ele é do sexo masculino.
94
3- [BLAIR e TAYLOR, 2013] Suponha que, para os eventos £, £̅, ¤, ¤ƒ, ¶ (¤ƒ|£) = 0,22, ¶ (£̅) = 0,20 e
¶ (¤) = 0,72. Use essa informação para completar a tabela abaixo:
£ £̅
¤
Total
¤ƒ
Total 1,00
4- [BLAIR e TAYLOR, 2013] Suponha que, em uma determinada comunidade onde 40% da população term
menos de 40 anos, descubramos que a proporção de moradores com menos de 40 anos que apoiam a
vacinação obrigatória de crianças em idade escolar contra certas doenças seja de 0,72. A proporção de
moradores com mais de 40 anos que apoiam a proposição é de 0,52. Use essa informação para calcular
a proporção de possoas nessa comunidade que apoiam a vacinação.
5- [BUSSAB e MORETTIN, 2004] Um restaurante popular apresenta apenas dois tipos de refeições: salada
completa ou um prato à base de carne. Considere que 20% dos fregueses do sexo asculino prefenrem
¬: ›freguês é homem• £: ›freguês prefere salada•

salada, 30% das mulheres escolhem carne, 75% dos fregueses são homens e os seguintes eventos:
Ê: ›freguês é mulher• ¤: ›freguês prefere carne•
a. ¶ (¬), ¶ (£|¬ ), ¶(¤ |Ê);

Calcular:
b. ¶ (£ ∩ ¬), ¶ (£ ∪ ¬);
c. ¶ (Ê|£).
6- [BUSSAB e MORETTIN, 2004] As probabilidade de três motoristas serem capazes de guiar até em casa
com segurança, depois de beber, são de 1/3, 1/4 e 1/5, respectivamente. Se decidirem guiar até em
casa, depois de beber numa festa, qual a probabilidade de todos os três motoristas sofrerem
acidentes? Qual a probabilidade de pelo menos um dos motoristas guiar até em casa a salvo?
7- [DEVORE, 2006] Uma empresa de fundos mútuos oferece a seus cl=ientes diversos fundos: um de
mercado, três de títulos diferentes (curto, médio e longo prazos), dois fundos de ações (moderados e
de alto risco) e um misto. Dentre os usuários que possuem cotas em apenas um fundo, seguem as
porcentagens de clientes nos diferentes fundos: Mercado – 20%; Título curto prazo – 15%; Título
intermediário – 10%; Título longo prazo – 5%; Ações de alto risco – 18%; Ações de risco moderado –
25%; Misto – 7%. Um cliente que possui cotas em apenas um fundo é selecionado aleatoriamente.
a. Qual é a probabilidade de o indivíduo selecionado possuir cotas do fundo misto?
b. Qual é a probabilidade de o indivíduo selecionado possuir cotas em um fundo de títulos?
c. Qual é a probabilidade de o indivíduo selecionado não possuir cotas em um fundo de ações?
projetos. Represente por £ = {projeto i fechado}, para i = 1, 2, 3 e suponha que ¶(£ ) = 0,22,
8- [DEVORE, 2006] Uma empresa de consultoria em informática apresenta suas propostas de três
¶(£3 ) = 0,25, ¶(£4 ) = 0,28, ¶(£ ∩ £3 ) = 0,11, ¶(£ ∩ £4 ) = 0,05, ¶(£3 ∩ £4 ) = 0,07,
¶(£ ∩ £3 ∩ £4 ) = 0,01. Expresse em palavras cada evento a seguir e calcule sua probabilidade:
a. £ ∪ £3
b. £ª ∩ £ª3
c. £ ∪ £3 ∪ £4
d. £ª ∩ £ª3 ∩ £ª4
e. £ª ∩ £ª3 ∩ £4
f. (£ª ∩ £ª3 ) ∪ £4
95
9- [DEVORE, 2006] Represente por £ o evento de que a próxima solicitação de assistência de um consultor
de um software estatístico seja relacionada ao pacote SPSS e por ¤ o evento de a próxima solicitação
de ajuda ser relacionada ao pacote SAS. Suponha que ¶(£) = 0,30 e ¶(¤) = 0,50.
a. Por que não é o caso de ¶(£) + ¶(¤) = 1?
b. Calcule ¶(£ª ).
c. Calcule ¶(£ ∪ ¤).
d. Calcule ¶(£ª ∩ ¤ª ).
10- [DEVORE, 2006] A inspeção visual de juntas de solda em placas de circuitos impressos pode ser
bastante subjetiva. Parte do problema se origina dos diversos tipos de defeitos de soldas (por exemplo,
falta de solda em pontos variados) e até da quantidade de um ou mais desses defeitos.
de uma junta. Em um lote de 10.000 juntas, o inspetor £ encontrou 724 que julgou defeituosas, o
Consequentemente, até mesmo inspetores altamente treinados podem discordar sobre a disposição
inspetor ¤ encontrou 751 e 1159 foram encontradas por ao menos um dos inspetores. Suponha que
uma dessas 10.000 juntas seja selecionada aleatoriamente.
a. Qual é a probabilidade de que a junta selecionada não seja julgada defeituosa por nenhum
b. Qual é a probabilidade de que a junta selecionada seja julgada defeituosa pelo inspetor ¤,
dos dois inspetores?
mas não pelo inspetor £?

11- [DEVORE, 2006] Uma empresa de seguros oferece quatro níveis de dedução – nenhum, baixo, médio
e alto – para os possuidores de apólices de seguros residenciais e três níveis diferentes – baixo, médio
e alto – para os possuidores de apólices de seguros de automóveis. A tabela a seguir fornece as
proporções das diversas categorias de segurados que possuem ambos os tipos de seguros. Por
exemplo: a proporção de indivíduos com baixa dedução de seguro residencial e baixa dedução de
seguro de automóvel é 0,06 (6% de todos os indivíduos).
Automóvel Residencial
N B M A
B 0,04 0,06 0,05 0,03
M 0,07 0,10 0,20 0,10
A 0,02 0,03 0,15 0,15
Suponha que um indivíduo, que possua ambos os tipos de apólices, seja selecionado aleatoriamente.
a. Qual é a probabilidade de que o indivíduo tenha uma dedução média de automóvel e alta de
residência?
b. Qual é a probabilidade de que o indivíduo tenha uma dedução baixa de automóvel? Uma
dedução baixa de residência?
c. Qual é a probabilidade de que um indivíduo esteja na mesma categoria para deduções de
automóvel e residência?
d. Com base na resposta da parte (c), qual é a probabilidade de que as duas categorias sejam
diferentes?
e. Qual é a probabilidade de que o indivíduo tenha ao menos um nível baixo de dedução?
f. Usando a resposta da parte (e), qual é a probabilidade de que nenhum nível de dedução seja
baixo?
automática (£), teto solar (¤) e rádio com CD-player (q). Se 70% de todos os compradores solicitarem
12- [DEVORE, 2006] Os três principais itens opcionais de certo tipo de carro novo são transmissão
£, 80% solicitarem ¤, 75% solicitarem q, 85% solicitarem £ ou ¤, 90% solicitarem £ ou q, 95%
96
solicitarem ¤ ou q e 98% solicitarem £ ou ¤ ou q, calcule as probabilidades dos eventos a seguir.
Desenhe um diagrama de Venn e identifique todas as regiões.
a. O comprador seguinte solicita um dos três opcionais.
b. O comprador seguinte não solicita nenhum opcional.
c. O comprador seguinte solicita apenas transmissão automática e nenhum dos dois outros
opcionais
d. O comprador seguinte solicita exatamente um opcional.
13- [LARSON e FARBER, 2004] A distribuição de frequências abaixo mostra o número de eleitores norte-
americanos (em milhões) de acordo com a idade. (Fonte: U.S. Bureau of the Census). Obtenha a
probabilidade de um eleitor escolhido ao acaso
Idade dos eleitores Frequência (em milhões)

18 a 20 anos de idade 10,8
65 anos de idade ou mais 31,9
a. ter entre 21 e 24 anos
b. não ter entre 18 e 20 anos
14- [LARSON e FARBER, 2004] Uma companhia que fabrica caixas de papelão percebe que:
 a probabilidade de se produzir uma caixa com um furo é de 0,05.
 a probabilidade de uma caixa ter um canto esmagado é de 0,08.
 a probabilidade de uma caixa ter um furo e um canto esmagado é de 0,004.
a. Os eventos "selecionar uma caixa com furo" e "selecionar uma caixa com um canto esmagado"
são mutuamente exclusivos? Explique.
b. Se um inspetor de qualidade escolher ao acaso uma caixa, determine a de a caixa ter um furo
[LARSON e FARBER, 2004] Suponha que ¶ (£|¤) = 0,2, ¶(£|¤ª ) = 0,3 e ¶ (¤) = 0,8. Qual é ¶(£)?
ou um canto esmagado.
15-
16- [LARSON e FARBER, 2004] Suponha que 2% dos rolos de tecido de algodão e 3% dos rolos de tecido de
náilon contenham falhas. Dos rolos usados por um fabricante, 70% são de algodão e 30% são de náilon.
Qual será a probabilidade de que um rolo selecionado aleatoriamente, usado pelo fabricante, contenha
falhas?
17- [LARSON e FARBER, 2004] A aspereza nas bordas de produtos de papel cortado aumenta à medida que
as lâminas de uma faca vão sendo gastas. Somente 1% dos produtos cortados com novas lâminas tem
bordas ásperas, 3% dos produtos cortados com lâminas mediamente afiadas exibem rugosidade e 5%
dos produtos cortados com lâminas gastas exibem rugosidade. Se 25% das lâminas na fabricação forem
novas, 60% forem mediamente afiadas e 15% forem gastas, qual será a proporção dos produtos que
exibem uma aspereza nas bordas?
18- [LARSON e FARBER, 2004] Os dados de 200 peças usinadas estão resumidos a seguir:
Profundidade do orifício
condição da extremidade
Acima do valor desejado abaixo do valor desejado
grosseira 15 10
moderada 25 20
lisa 60 70
97
a. Qual é a probabilidade de que uma peça selecionada tenha uma extremidade em condição
moderada e uma profundidade do orifício abaixo do valor alvo?
b. Qual é a probabilidade de que uma peça selecionada tenha uma extremidade em condição
moderada ou uma profundidade do orifício abaixo do valor alvo?
c. Qual é a probabilidade de que uma peça selecionada não tenha uma extremidade em
condição moderada ou não tenha uma profundidade do orifício abaixo do valor alvo?
d. Construa um diagrama de Venn, com a representação dos eventos no espaço amostral.
19- [LARSON e FARBER, 2004] Em uma operação de enchimento automático, a probabilidade de um
enchimento incorreto quando o processo for operado a baixa velocidade será 0,001. Quando o
processo for operado a alta velocidade, a probabilidade de um enchimento incorreto será 0,01.
Suponha que 30% dos reservatórios sejam cheios quando o processo for operado a alta velocidade e o
restante seja cheio a baixa velocidade.
a. Qual é a probabilidade de um reservatório ser cheio incorretamente?
b. Se um reservatório cheio incorretamente for encontrado, qual é a probabilidade de que ele
tenha sido cheio durante uma operação a alta velocidade?
20- [MONTGOMERY e RUNGER, 2003] Considere os dados sobre contaminação de pastilhas e localização
conjunto. Faça £ denotar o evento em que uma pastilha contenha quatro ou mais partículas e faça ¤
na ferramenta de produzir faísca. Considere que uma pastilha seja selecionada ao acaso, desse
denotar o evento em que uma pastilha seja proveniente do centro da ferramenta de produzir faísca.
a. ¶(£)
Determine
b. ¶ (£|¤)
c. ¶(¤)
d. ¶ (¤|£)
e. ¶(£ ∩ ¤)
f. ¶(£ ∪ ¤)
21- [TRIOLA, 2013] Capacetes e Ferimentos –Use os dados da tabela que segue e responda:
Ferimentos na Cabeça Sem Ferimentos

Usava Capacete 96 656
Sem Capacete 480 2330
a. Se um dos sujeitos é selecionado aleatoriamente, ache a probabilidade de ser selecionado
alguém que teve ferimento na cabeça.
b. Se um dos sujeitos é selecionado aleatoriamente, ache a probabilidade de ser selecionado
alguém que usava capacete.
c. Se um dos sujeitos é selecionado aleatoriamente, ache a probabilidade de ser selecionado
alguém que teve ferimento na cabeça ou que usava capacete.
d. Se um dos sujeitos é selecionado aleatoriamente, ache a probabilidade de ser selecionado
alguém que não usava capacete ou que não sofreu ferimentos.
e. Se um dos sujeitos é selecionado aleatoriamente, ache a probabilidade de ser selecionado
alguém que usava capacete e que sofreu ferimento na cabeça.
f. Se um dos sujeitos é selecionado aleatoriamente, ache a probabilidade de ser selecionado
alguém que não usava capacete e que não sofreu ferimentos.
g. Se dois diferentes sujeitos do estudo são selecionados aleatoriamente, ache a probabilidade
de que ambos estivessem usando capacete.
98
h. Se dois diferentes sujeitos do estudo são selecionados aleatoriamente, ache a probabilidade
de que ambos tenham sofrido ferimentos na cabeça.
i. Se um dos sujeitos é selecionado aleatoriamente, ache a probabilidade de ser selecionado
alguém que não usava capacete, dado que sofreu ferimentos na cabeça.
j. Se um dos sujeitos é selecionado aleatoriamente, ache a probabilidade de ser selecionado
alguém que não sofreu ferimentos, dado que usava capacete.
22- [WALPOLE et al., 2009] Encontre os erros em cada uma das afirmações abaixo:
a. As probabilidades de que um vendedor de carros venda 0, 1, 2 ou 3 carros em qualquer dia
de fevereiro são, respectivamente, 0,19; 0,38; 0,29 e 0,15.
b. A probabilidade de que choverá amanhã é de 0,40, e a probabilidade de que não choverá é
de 0,52.
c. As probabilidades de que uma impressora cometerá 0, 1, 2, 3, 4 ou mais erros ao preparar um
documento são, respectivamente, 0,19; 0,34; -0,25; 0,43 e 0,29.
d. Em uma única retirada de cartas de um baralho, a probabilidade de se tirar uma carta de copas
é de 1/4, a probabilidade de se tirar uma carta preta é de 1/2 e de selecionar uma carta de
copas preta é de 1/8.
23- [WALPOLE et al., 2009] A probabilidade de que uma indústria norte-americana será localizada em
Xangai, na China, é de 0,7; a probabilidade de que será localizada em Pequim, China, é de 0,4; e a
probabilidade de que será localizada em Xangai ou em Pequim, ou em ambos os lugares, é de 0,8. Qual
é a probabilidade de que a empresa seja localizada:
a. em ambas as cidades?
b. em nenhuma das cidades?
24- [WALPOLE et al., 2009] Em uma classe de 100 formandos do ensino médio, 54 estudaram matemática,
69 estudaram história e 35 estudaram ambas as matérias. Se um desses estudantes for selecionado
aleatoriamente, determine a probabilidade de que:
a. o estudante tenha estudado matemática ou história.
b. o estudante não tenha estudado nenhuma dessas matérias.
c. o estudante tenha estudado história, mas não matemática.
25- [WALPOLE et al., 2009] É comum, em muitas áreas industriais, o uso de máquinas envasadoras para
colocar os produtos em caixas. Isso ocorre na indústria alimentícia, bem como em outras áreas nas
£, atender às especificações; ¤, encher as caixas menos do que o necessário; ou q, encher mais do que
quais os produtos têm uso doméstico, como o detergente. Tais máquinas não são perfeitas e podem:
o necessário. Geralmente, o não enchimento das caixas é o que se deseja evitar. Seja ¶(¤) = 0,001
enquanto ¶(£) = 0,990.
a. Forneça ¶(q).
b. Qual é a probabilidade de a máquina não encher as caixas menos do que o necessário?
c. Qual é a probabilidade de a máquina encher as caixas mais do que o necessário ou encher
[WALPOLE et al., 2009] Se R é o evento no qual um condenado cometeu assalto à mão armada e “ é o
menos do que o necessário?
26-
a. ¶(•|“);
evento no qual o condenado vendeu drogas, enuncie em palavras as probabilidades expressas por:
b. ¶(“ª |•);
c. ¶(•ª |“ª ).
27- [WALPOLE et al., 2009] Uma amostra aleatória de 200 adultos é classificada pelo seu sexo e nível de
instrução.
99
Nível de instrução Sexo masculino Sexo feminino
Elementar 38 45
Secundário 28 50
Universitário 22 17
Se uma pessoa desse grupo for escolhida aleatoriamente, determine a probabilidade de que:
a. a pessoa é um homem, e recebeu educação secundária.
b. a pessoa não tem nível universitário, e é do sexo feminino.
28- [WALPOLE et al., 2009] A probabilidade de que um homem casado assista a certo programa de
televisão é de 0,4 e de que uma mulher casada assista é de 0,5. A probabilidade de que um homem
assista ao programa, dado que sua mulher assiste, é de 0,7. Determine a probabilidade de que:
a. um casal assista ao programa.
b. uma esposa assista ao programa, dado que seu marido o faça.
c. pelo menos uma pessoa do casal assista ao programa.
29- [WALPOLE et al., 2009] A probabilidade de que um médico faça o diagnóstico de uma doença
corretamente é de 0,7. Dado que o médico faz um diagnóstico incorreto, a probabilidade de que o
paciente entre com um processo é de 0,9. Qual é a probabilidade de que o médico erre o diagnóstico
e seja processado pelo paciente?
30- [WALPOLE et al., 2009] Uma valise contém dois frascos de aspirinas e três frascos de tabletes para a
tireoide. Uma segunda sacola contém três frascos de aspirinas, dois tabletes para tireoide e um frasco
de laxantes. Se um frasco for retirado aleatoriamente de cada uma das sacolas, determine a
probabilidade de que:
a. ambos contenham tabletes para a tireoide.
b. nenhum dos frascos contenha tabletes para a tireoide.
c. os dois frascos contenham tabletes diferentes.
31- [WALPOLE et al., 2009] Em certa região do país, sabe-se, baseado em experiências anteriores, que a
probabilidade de selecionar um adulto com mais de 40 anos, com câncer, é de 0,05. Se a probabilidade
de o médico diagnosticar corretamente uma pessoa com câncer como portadora da doença é de 0,78
e a probabilidade de diagnosticar incorretamente uma pessoa sem câncer como sendo portadora da
doença é de 0,06, qual é a probabilidade de que a pessoa seja diagnosticada com câncer?
32- [WALPOLE et al., 2009] Referindo-se ao Exercício 31, qual é a probabilidade de que a pessoa
diagnosticada com câncer realmente tenha a doença?
33- [WALPOLE et al., 2009] Suponha que quatro inspetores em uma fábrica de filmes tenham de estampar
a data de validade em cada pacote de filme, ao final da linha de montagem. John, que estampa 20%
dos pacotes, não estampa a data de validade em um de cada 200 pacotes; Tom, que estampa 60% dos
pacotes, erra uma vez a cada 100 pacotes; Jeff, que estampa 15% dos pacotes, erra uma vez a cada 90
pacotes; e Pat, que estampa 5% dos pacotes, erra uma vez a cada 200 pacotes. Se um cliente reclama
que sua embalagem de filme não contém a data de validade, qual é a probabilidade de que ela tenha
sido inspecionada por John?
100
6. Variáveis Aleatórias
Até agora, foi visto como definir e trabalhar com probabilidades utilizando o conhecimento do espaço
amostral e das relações entre os eventos definidos nesse espaço amostral. Com tudo que vimos até agora,
poderíamos resolver praticamente todos os problemas de probabilidade que possam aparecer, no entanto,
ao desenvolver a teoria da probabilidade, pode-se observar que existem alguns padrões que podem aparecer
em diferentes problemas, e que ao reconhecer esses padrões e reescrever os problemas utilizando espaços
equivalentes o trabalho ao resolvê-los torna-se consideravelmente menor.
Considere, por exemplo, o problema abaixo retirado de PINHEIRO et al (2012):
“Humberto deseja aumentar a capacidade de memória RAM do seu

microcomputador. A placa mãe de Humberto permite a instalação de até 4 pentes
de memória e atualmente só possui um pente. Ele vai a um posto de revenda de
computadores e solicita a compra e instalação de mais três pentes de memória,
idênticos ao atual. Na loja há 12 pentes com essa característica. O que Humberto
não sabe, e o técnico também não, é que entre os 12 há quatro pentes defeituosos.
Se os três pentes novos forem escolhidos ao acaso, qual a probabilidade de que:
a) A capacidade de memória do PC realmente aumente?”
De acordo com o enunciado do problema, a capacidade de memória do PC irá aumentar se ao menos um dos
três pentes escolhidos não for defeituoso, e irá continuar com a capacidade de memória original se todos os
3 pentes escolhidos forem defeituosos, dessa forma, podemos criar os seguintes eventos de interesse:
£ = {o primeiro pente selecionado não é defeituoso (é perfeito)};

¤ = {o segundo pente selecionado é perfeito};

q = {o terceiro pente selecionado é perfeito};



amostral (Ω):
Podemos construir o diagrama de árvore (figura 42), identificar os resultados possíveis e definir o espaço
101
Figura 42: Diagrama de árvore para o problema dos pentes de memória.
Utilizando a figura 42, fica fácil ver que o espaço amostral relativo à esse problema é: Ω =
›£¤q, £¤q ª , £¤ª q, £¤ª q ª , £ª ¤q, £ª ¤q ª , £ª ¤ª q, £ª ¤ª q ª •, assim como podemos obter os resultados
possíveis, também podemos obter as suas probabilidades, mas ainda não temos, de maneira direta, a resposta
precisaríamos somar as probabilidades dos resultados: £¤q, £¤q ª , £¤ª q, £¤ª q ª , £ª ¤q, £ª ¤q ª , £ª ¤ª q.
da pergunta: “A probabilidade de que a capacidade de memória do PC realmente aumente?”, para isso,
trabalhar com a variável ` relativa ao número de pentes perfeitos dentre os 3 selecionados, essa variável
Como o interesse é saber quantos pentes perfeitos haverão dentre os selecionados, faz sentido querer
poderia assumir os valores: 0 (resultado possível: £ª ¤ª q ª ); 1 (resultados possíveis: £¤ª q ª , £ª ¤q ª , £ª ¤ª q); 2

(resultados possíveis: £¤q ª , £¤ª q, £ª ¤q); e 3 (resultado possível: £¤q).
Utilizando essa nova variável `, a resposta para a pergunta “A probabilidade de que a capacidade de memória
do PC realmente aumente?” seria: ¶(` ≥ 1) = 1 − ¶(` = 0) = 1 − ∙ ∙ = 1 − 0,018 = 0,982.
Q 4 3
3 T
A variável ` é o que chamamos de variável aleatória discreta, e veremos a partir de agora, como definir,
encontrar e trabalhar com variáveis aleatórias a fim de facilitar o cálculo de probabilidades em diversas
situações.
Uma variável aleatória é uma função que associa a cada ponto do espaço amostral um número real.
102
Algumas variáveis aleatórias irão assumir valores em um conjunto enumerável (como a variável utilizada no
exemplo acima), essas, são chamadas de variáveis aleatórias discretas. Algumas irão assumir valores em um
intervalo da reta real (ex: altura dos alunos de determinada disciplina) e serão denominadas contínuas.
Exemplo 1: Suponha que uma lâmpada tenha sido posta em um soquete à meia noite de determinado dia. O
Experimento será considerado terminado quando a lâmpada queimar. Serão anotados o dia (primeiro,
segundo, terceiro, ...) e a hora em que a lâmpada queimou (24h). Considere que se deseja saber quantas horas
a lâmpada permaneceu acesa até queimar. Defina a variável aleatória que deve ser utilizada.
Resultados do experimento:
Dia, dado por 9 (definido no conjunto dos naturais maiores ou iguais a 1);
Hora, dado por ℎ (definido no conjunto dos reias);

Variável aleatória de interesse, dada por `: ›1|1 = 24(9 − 1) + ℎ•, representa o tempo que a


lâmpada permaneceu acesa antes de queimar.
Exemplo 2: Uma fonte radioativa está emitindo partículas ×. A emissão dessas partículas é observada em um
dispositivo contador durante um período de tempo especificado. Qual variável pode ser utilizada nesse
problema?
Resposta: `: {número de partículas × emitidas durante um determinado período}
6.1. Exercícios
1- [LARSON e FARBER, 2004] O que é uma variável aleatória? Dê um exemplo de variável aleatória discreta
e de uma contínua. Justifique sua resposta.
2- [LARSON e FARBER, 2004] Considere as duas afirmações abaixo, determine se elas são verdadeiras ou
falsas. Se for falsa, reescreva-a em sua forma verdadeira.
a. Na maior parte das aplicações, as variáveis aleatórias contínuas representam dados de
contagem, enquanto as discretas representam dados de medida.
b. A média de uma variável aleatória representa a “média teórica” de um experimento
probabilístico e algumas vezes não é um resultado possível.
3- [LARSON e FARBER, 2004] determine se as variáveis dadas abaixo são discretas ou contínuas. Explique
seu raciocínio.
a. O número anual de mortes nas rodovias do Texas.
b. O volume de sangue retirado para um exame.
c. O número de livros vendidos por trimestre em uma livraria.
d. A quantidade de neve (em polegadas) caída no Alasca no último inverno.
4- [WALPOLE et. Al, 2009] Classifique as seguintes variáveis aleatórias como discretas ou contínuas:
a. Número de acidentes de carro por ano, na Virgínia.
b. O tempo para jogar 18 buracos no golfe.
c. A quantidade de leite produzida anualmente por determinada vaca.
d. O número de ovos postos por uma galinha a cada mês.
e. O número de permissões para construção de prédios em uma cidade a cada mês.
f. A produção, em toneladas, de um grão por acre.
103
6.2. Variáveis Aleatórias Discretas
Como mencionado anteriormente, uma variável aleatória pode ser discreta ou contínua, e assim como na
construção de tabelas de frequências ou gráficos, devemos classificar uma variável aleatória como discreta ou
contínua, a fim de conseguir trabalhar com ela de maneira adequada.
Nos exemplos dados na seção anterior, temos uma variável aleatória discreta (exemplo 2) e uma contínua
(exemplo 1). Iremos estudar, agora, como lidar com variáveis aleatórias discretas.
6.2.1. Distribuição de Probabilidade de Variáveis Aleatórias Discretas
A distribuição de probabilidade de uma variável aleatória discreta `, definida em um espaço amostral Ω, é

uma tabela que associa a cada valor de ` sua probabilidade.
¶ (` = 1 ) = ](1 ) = ] , = 1,2, …
Ou ainda:
Tabela 29: Distribuição de probabilidade da variável aleatória `.
` 1 13 14 …
¶(` = 1 ) ] ]3 ]4 …
Uma distribuição de probabilidade deve satisfazer:
 0 ≤ ] ≤ 1e
 ∑ ] = 1.
Exemplo1: Com dados do último censo, a assistente social de um Centro de Saúde constatou que para as
famílias da região, 20% não têm filhos, 30% têm um filho, 35% têm dois e as restantes se dividem igualmente
número de filhos averiguado. Defina Ç como sendo a variável aleatória “número de filhos”. Descreva a
entre três, quatro ou cinco filhos. Suponha que uma família será escolhida, aleatoriamente, nessa região e o
distribuição de probabilidade de Ç.
Resolução: primeiro, pode ser interessante resumir o enunciado na seguinte tabela:
Tabela 30: Distribuição de probabilidade da variável aleatória Ç.
Ç 0 1 2 3 4 5
¶(Ç = ) 0,20 0,30 0,35 ] ] ]
Devemos, agora, encontrar o valor de ]. Para tal, vamos utilizar as propriedades da distribuição de
probabilidade:
] =1
104
0,2 + 0,3 + 0,35 + 3] = 1
3] = 1 − 0,85
0,15
]= = 0,05
3
Logo, a distribuição de probabilidade de Ç é dada por:
Tabela 31 Distribuição de probabilidade da variável aleatória Ç.
Ç 0 1 2 3 4 5
¶(Ç = ) 0,20 0,30 0,35 0,05 0,05 0,05
Exemplo 2: Na construção de um certo prédio, as fundações devem atingir 15 metros de profundidade e, para
cada 5 metros de estacas colocadas, o operador anota se houve alteração no ritmo de perfuração previamente
estabelecido. Essa alteração é resultado de mudanças para mais ou para menos, na resistência do subsolo.
Nos dois casos, medidas corrigidas serão necessárias, encarecendo o custo da obra. Com base em avaliações
básico inicial é de 100 UPCs (unidade padrão de construção) e será acrescido de 50º, com º representando o
geológicas, admite-se que a probabilidade de ocorrência de alterações é de 0,1 para cada 5 metros. O custo
número de alterações observadas. Como se comporta a variável custo das obras de fundação? (OBS: Considere
que a alteração é detectada no primeiro metro e as correções aplicadas para a perfuração dos próximos 4
metros.)
Resolução: Supõe-se que as alterações ocorrem independentemente entre cada um dos 3 intervalos de 5
metros.
Considere o evento £ = {ocorre uma alteração}
Vamos construir um diagrama de árvore para auxiliar na resolução desse problema:
105
Figura 43: Diagrama de árvore para auxiliar a resolução do exemplo 2.
Vamos definir a variável q como sendo o custo da obra. Utilizando a figura 43 e as informações do enunciado,
podemos montar a tabela 32, dada a seguir:
Tabela 32: Tabela ilustrativa para auxiliar a resolução do exemplo 2.
q (em UPCs)
£∩£∩£ 0,1 × 0,1 × 0,1 = 0,1 100 + 50 × 3 = 250
Evento Probabilidade
4
£ ∩ £ ∩ £ª 0,1 × 0,1 × 0,9 = 0,1 × 0,9 100 + 50 × 2 = 200

3
£ ∩ £ª ∩ £ 0,1 × 0,9 × 0,1 = 0,13 × 0,9 100 + 50 × 2 = 200

£ ∩ £ª ∩ £ª 0,1 × 0,9 × 0,9 = 0,1 × 0,93 100 + 50 × 1 = 150
£ª ∩ £ ∩ £ 0,9 × 0,1 × 0,1 = 0,13 × 0,9 100 + 50 × 2 = 200
£ª ∩ £ ∩ £ª 0,9 × 0,1 × 0,9 = 0,1 × 0,93 100 + 50 × 1 = 150
£ª ∩ £ª ∩ £ 0,9 × 0,9 × 0,1 = 0,1 × 0,93 100 + 50 × 1 = 150
£ª ∩ £ª ∩ £ª 0,9 × 0,9 × 0,9 = 0,14 100 + 50 × 0 = 100
Podemos resumir as informações da tabela acima utilizando a tabela de distribuições de probabilidade de q:
Tabela 33: Distribuição de probabilidade da variável aleatória q.
q
¶(q = q )
100 150 200 250
0,729 0,243 0,029 0,001
6.2.2. Função de Distribuição de Probabilidade
A função de distribuição ou função acumulada de probabilidade de uma variável aleatória discreta ` é

definida, para qualquer número real 1, pela seguinte expressão:
†(1) = ¶(` ≤ 1)
106
Exemplo 1: Suponha que a variável aleatória ` tome os três valores 0, 1 e 2, com probabilidades 1#3 , 1#6 e
1# , respectivamente.
2
Para encontrar a função de distribuição da variável aleatória ` deve-se seguir os seguintes passos:
1. Devemos encontrar o valor mínimo da função de distribuição, para tal, devemos considerar o que
se 1 < 0.
ocorreria se a variável aleatória fosse menor do que seu valor mínimo. No nosso caso, o que ocorreria
a. Nesse caso, †(1) = † ( ) = ¶ (` ≤ ) = 0, em que < 0.

b. Ou seja, para 1 < 0, temos que † (1) = 0.
2. Em seguida, devemos considerar o que ocorreria se 1 estivesse entre os dois menores valores,
incluindo o valor mínimo. No nosso caso, o que ocorreria se 0 ≤ 1 < 1.
a. Para tentar ilustrar melhor, vamos assumir que 1 = , em que ∈ Ë0,1):
b. Em seguida estudar qual a função de distribuição para 1 = : †(1) = † ( ) = ¶ (` ≤ ) =

0 1
¶ (` = 0) = 1#3.
c. Ou seja, para 0 ≤ 1 < 1, temos que † (1) = 1#3.

3. Devemos prosseguir dessa maneira alterando os intervalos em que definimos a variável aleatória `,
o próximo intervalo seria: 1 ≤ 1 < 2.
a. Poderíamos fazer um caso específico, utilizando um valor ∈ Ë1,2), mas vou fazer de maneira
direta, se você tiver dificuldade para enxergar sem esse caso específico, continue o utilizando
b. A função de distribuição para 1 ≤ 1 < 2: † (1) = ¶ (` ≤ 1) = ¶(` = 0) + ¶(` = 1) =

até parar de sentir a necessidade dele.
1# + 1# = 1# .
3 6 2
c. Ou seja, para 1 ≤ 1 < 2, temos que † (1) = 1#2.
4. Por fim, devemos estudar o que ocorreria se 1 ≥ 2.
a. A função de distribuição para 1 ≥ 2: † (`) = ¶ (` < 1) = ¶(` = 0) + ¶(` = 1) + ¶(` =
2) = 1#3 + 1#6 + 1#2 = 1
b. Ou seja, para 1 ≤ 2, temos que † (1) = 1.
0, _[ 1 < 0
⎧1
⎪ #3 , _[ 0 ≤ 1 < 1
Resumindo: † (1) =
⎨1#2 , _[ 1 ≤ 1 < 2
⎪
;
⎩ 1, _[ 1 ≥ 2
ou:
107
Figura 44: Gráfico da função de distribuição.
se eu pedir: Qual a probabilidade de 1 ≤ 1, poderia responder utilizando †(1) = 1#2; ou se quiser saber, qual
A função de distribuição nos dá a probabilidade acumulada até determinado ponto, no exemplo que fizemos,
a probabilidade de 1 = 1, poderia fazer: † (1) − †(0) = 1#2 − 1#3 = 1#6. De uma distribuição de
probabilidades é possível encontrar uma função de distribuição. Assim como de uma função de distribuição
também podemos encontrar a distribuição de probabilidades.
Se ` for uma variável aleatória discreta, com um número finito de valores possíveis, o gráfico da fd será
como ocorre na figura 44. A função † é contínua, exceto nos valores possíveis de `, nesses valores o gráfico
constituído por segmentos horizontais (nesse caso, a função de distribuição se denomina função em degraus),
dará um “salto” de ](1 ) de magnitude.
6.2.3. Medidas de Resumo para Variáveis Aleatórias Discretas
Na seção 3.4. (página 48) estudamos medidas de resumos para variáveis quantitativas discretas e contínuas,
essas medidas de resumo tinham o intuito de fornecer uma visão geral da variável em questão. Demos
bastante destaque para a média, variância, desvio padrão e quantis.
Ao estudar variáveis aleatórias, existe o interesse em obter valores que a resumam, fornecendo informação
sobre sua posição (como a média ou mediana) e sua dispersão (variância, desvio padrão e quantis).
Veremos agora como obter medidas de resumo para variáveis aleatórias discretas, iniciando pela média.
6.2.3.1. O Valor Esperado de uma Variável Aleatória Discreta
Uma das medidas de resumo, ou parâmetros, mais utilizadas tanto na estatística descritiva, quanto para
distribuições de probabilidade é a média, ou esperança, ou valor esperado, dependendo da bibliografia
encontraremos uma ou outra denominação para o mesmo parâmetro.
Definição: Seja ` uma variável aleatória discreta, com valores possíveis 1 , … , 1 , … Seja ](1 ) =
¶ (` = 1 ), = 1, 2, … , , … Então, o valor esperado de ` (ou esperança de `), denotado por ¥(`) é
definido como:
108
Ý
¥(`) = 1 ](1 )
"
Exemplo 2: Os alunos do curso de Estatística têm um time de futebol que não é dos melhores. Admita que a
função de probabilidade dos diversos saldos de gols (diferença entre gols feitos e sofridos) é a seguinte:
Tabela 34: Função de probabilidade da variável saldo de gols.
Saldo de gols -4 -3 -2 -1 0 1 2
] 0,1 0,3 0,3 0,1 0,1 0,05 0,05
Encontre o saldo de gols esperado desse time:
Resolução: Para encontrar a média, ou valor esperado da variável saldo de gols por partida, basta fazer a média
ponderada do saldo de gols pela probabilidade desse saldo ocorrer:
¥(`) = −4 ∙ 0,1 − 3 ∙ 0,3 − 2 ∙ 0,3 − 1 ∙ 0,1 + 0 ∙ 0,1 + 1 ∙ 0,05 + 2 ∙ 0,05 = −1,85 gols/partida
Podemos tentar enxergar essa esperança como a média apresentada na seção 3.4.1. (página 49), se todos
conseguirem fazer essa conexão entre ambas as medidas, fica mais fácil entender o conceito, já que ambas
têm o mesmo significado. Sendo assim, vamos imaginar que foram observados 20 jogos, utilizando as
probabilidades dadas na distribuição de probabilidade do exemplo, podemos montar o a seguinte tabela de
dados observados:
Tabela 35: Frequência absoluta estimada para a variável saldo de gols.
Saldo de gols -4 -3 -2 -1 0 1 2
Número de jogos 2 6 6 2 2 1 1
Olhando por esse lado, se fosse pedida a média aritmética bastaria fazer:
−4 ∙ 2 − 3 ∙ 6 − 2 ∙ 6 − 1 ∙ 2 + 0 ∙ 2 + 1 ∙ 1 + 2 ∙ 1 −37
1̅ = = = −1,85
2+6+6+2+2+1+1 20
Não vou me aprofundar no conceito de esperança nesta seção, já que já isso já foi bastante discutido na parte
relativa à seção 3.4.1. (página 49). A ideia desta seção é apresentar uma maneira de calcular esse parâmetro
para variáveis aleatórias discretas.
Exemplo 2: Um fabricante produz peças tais que 10 por cento delas são defeituosas e 90 por cento são não-
defeituosa lhe dá um lucro de US$ 5. Considere a variável aleatória ` como sendo o lucro líquido por peça.
defeituosas. Se uma peça defeituosa for produzida, o fabricante perde US$1, enquanto uma peça não-
Qual o valor esperado de `?
problema, primeiro, precisamos definir a distribuição de probabilidade de `, para tal, basta relacionar o
Resolução: Essa é uma aplicação muito interessantes da utilização do valor esperado. Para resolvermos esse
prejuízo de US$ 1 (ou lucro negativo (- US$ 1)) com a probabilidade da peça ser defeituosa (10% = 0,10) e o
lucro (positivo) de US$ 5 com a probabilidade da peça ser perfeita (90% = 0,90); dessa forma temos:
109
Tabela 36: Distribuição de probabilidade da variável lucro.
1 -1 5
] 0,1 0,9
Agora é só calcular o valor esperado:
Þ-$4,40
¥(`) = −1 ∙ 0,1 + 5 ∙ 0,9 =
peça
Algumas propriedades do valor esperado são dadas abaixo:
 Seja ` uma variável aleatória e seja à = ¬ (`), tem-se

Ý
¥(à) = ¥Ë¬ (`)Ì = ¬ (1 )](1 ).

"T
 Seja ` = q, em que q é uma constante, então,
¥ (`) = q.
 Suponha-se que q seja uma constante e ` seja uma variável aleatória. Então,
¥ (q`) = q¥ (`).
 Sejam ` e à duas variáveis aleatórias quaisquer. Então,
¥(` + à) = ¥ (`) + ¥(à).
 Sejam variáveis aleatórias ` , … , ` . Então,
¥(` + ⋯ + ` ) = ¥ (` ) + ⋯ + E(` ).
Exemplo3: Seja ` uma variável aleatória que pode receber os valores −1, 0 e 1 com as respectivas
probabilidades:
¶(` = −1) = 0,2 ¶ (` = 0) = 0,5 ¶ (` = 1) = 0,3
Calcule ¥(` 3 ).
Ý
Resolução: Para resolver esse problema basta utilizar a primeira dentre as propriedades dadas acima:
¥(à) = ¥Ë¬ (`)Ì = ¬(1 )](1 )

"T
Nesse caso, temos que ¬ (`) = ` 3 , logo:
¥ (` 3 ) = (−1)3 ∙ 0,2 + 03 ∙ 0,5 + 13 ∙ 0,3 = 0,5
110
6.2.3.2. A Variância de uma Variável Aleatória
Definição: Seja ` uma variável aleatória. Definimos a variância de `, denotada por r(`) ou n„ 3 , da seguinte
maneira:
r(`) = ¥Ë` − ¥(`)Ì3 = ¥ (` 3 ) − Ë¥(`)Ì3
A raiz quadrada positiva de r(`) é denominada o desvio-padrão de `, e é denotado por n„ .
Assim como foi feito para a esperança, irei me ater a como fazer os cálculos da variância e desvio-padrão no
caso de variáveis aleatórias, o conceito e significado dessas estatísticas, ou parâmetros, já foi discutido no
material referente à seção 3.4.5. (página 57).
Exemplo: O serviço de meteorologia classifica o tipo de céu que é visível, em termos de “grau de
nebulosidade”. Uma escala de 11 categorias é empregada: 0, 1, 2, ..., 10, em que 0 representa um céu
perfeitamente claro, 10 representa um céu completamente encoberto, enquanto os outros valores
determinada estação meteorológica, em um determinado dia e hora. Seja ` a variável aleatória que pode
representam as diferentes condições intermediárias. Suponha-se que tal classificação seja feita em uma
tomar um dos 11 valores acima. Admita-se que a distribuição de probabilidade de ` seja:
](0) = ](10) = 0,05; ](1) = ](2) = ](8) = ](9) = 0,15; ](3) = ](4) = ](5) = ](6) = ](7) = 0,06
Calcule a esperança e a variância de `.
Resolução: Primeiro, vamos calcular a esperança de `:
¥(`) = (0 + 10) ∙ 0,05 + (1 + 2 + 8 + 9) ∙ 0,15 + (3 + 4 + 5 + 6 + 7) ∙ 0,06 = 0,05 + 3 + 1,5 = 5
` é perfeitamente simétrica em torno de 5.

Poderíamos ter encontrado esse valor de maneira conceitual, já que podemos verificar que a distribuição de
Para encontrar a variância de ` basta calcular ¥(` 3 ) e em seguida utilizar a fórmula:

r(`) = ¥(` 3 ) − Ë¥(`)Ì3 .
¥(` 3 ) = (03 + 103 ) ∙ 0,05 + (13 + 23 + 83 + 93 ) ∙ 0,15 + (33 + 43 + 53 + 63 + 73 ) ∙ 0,06

= 5 + 22,5 + 8,1 = 35,6
r(`) = 35,6 − 53 = 10,6
Algumas propriedades da variância de uma variável aleatória são dadas abaixo:
 Se q for uma constante,
r(` + q ) = r(`).
 Se q for uma constante,
r(q`) = q 3 r(`).
 Sejam ` , `3 , … , ` , variáveis aleatórias independentes. Então,
r(` + `3 + ⋯ + ` ) = r(` ) + r(`3 ) + ⋯ + r (` ).
111
 Seja ` uma variável aleatória com variância finita. Então, para qualquer número real ×,
r(`) = ¥Ë(` − × )3 Ì − Ë¥(`) − ×Ì3 .
6.2.4. Algumas Distribuições de Probabilidade
Existem diversas distribuições de probabilidade que explicam de maneira bastante satisfatória a distribuição
de probabilidades de variáveis aleatórias discretas de interesse prático. O conhecimento dessas distribuições
facilita a compreensão das variáveis e o processo de previsão e tomada de decisão em problemas reais.
Devido ao caráter introdutório desta apostila iremos nos ater a apenas duas distribuições:
 Distribuição de Bernoulli;
 Distribuição Binomial; e
 Distribuição de Poisson.
6.2.4.1. A Distribuição de Bernoulli
A distribuição de Bernoulli, embora seja extremamente importante, não costuma ser muito utilizada do ponto
de vista prático, porém, a sua compreensão nos permitirá utilizar a distribuição Binomial, uma das
distribuições discretas mais importantes e com ampla aplicação em problemas reais.
Definição: Dizemos que uma variável ` segue uma distribuição de Bernoulli se atribui 0 ou 1 à ocorrência de
fracasso ou sucesso, respectivamente. Com ] representando a probabilidade de sucesso, 0 ≤ ] ≤ 1, sua
distribuição de probabilidade é dada por:
Tabela 37: Distribuição de probabilidade de Bernoulli.
` 0 1
¶(` = 1 ) 1−] ]
Ou, de modo resumido:
¶ (` = 1) = ] k (1 − ]) âk
, 1 = 0,1
6.2.4.2. A Distribuição Binomial
sucesso ]. A variável aleatória ` que conta o número total de sucessos é denominada Binomial com
Definição: Considere a repetição de ensaios de Bernoulli independentes e com a mesma probabilidade de
parâmetros e ].
A distribuição de probabilidade de ` é dada por:
¶ (` = º) = ; = ]» (1 − ]) â»
, º = 0,1, … , .
º
Com ¼» À representando o coeficiente binomial calculado por:
!
; ==
º º! − º)!
(
112
Usaremos a notação `~Bin( , ]) para indicar que a variável aleatória ` segue uma distribuição binomial com
parâmetros e ].
Resultado: Seja ` uma variável aleatória com distribuição Binomial (`~Bin( ; ])). Então,
¥(`) = ];
r(`) = ](1 − ]).
Exemplo 1: Uma certa doença pode ser curada através de procedimento cirúrgico em 80% dos casos. Dentre
os que têm essa doença, sorteamos 15 pacientes que serão submetidos à cirurgia. Fazendo alguma suposição
que julgar necessária, responda qual é a probabilidade de:
 Todos serem curados;

 Pelo menos dois não serem curados;
 Ao menos 10 ficarem livres da doença.
Resolução: Primeiramente, vamos definir a variável aleatória de interesse:
`: ›número de pacientes que se curam da doença, em 15 submetidos à cirurgia•
Faz sentido supor que os pacientes são independentes entre si e que a probabilidade de cura se mantém a
mesma para cada um deles. Dessa forma, podemos supor que a distribuição binomial se ajusta bem a essa
variável aleatória, dessa forma, temos:
`~¤ (15; 0,8)
Após definir a distribuição de probabilidade de ` basta calcular as probabilidades pedidas:
15=
¶ (` = 15) = ; 0,8 V (1 − 0,8) Vâ V = 0,8 V = 0,035
15
15

¶ (` ≤ 13) = 1 − ¶(` > 13) = 1 − Ë¶(` = 14) + ¶ (` = 15)Ì = 1 − ; = 0,8 Q (0,2) Vâ Q

−
14
0,035 = 1 − 15 ∙ 0,8 Q ∙ 0,2 − 0,035 = 1 − 0,132 − 0,035 = 0,833

¶ (` ≥ 10) = ¶(` = 10) + ¶(` = 11) + ¶ (` = 12) + ¶(` = 13) + ¶(` ≥ 14) =
;15= 0,8 T (0,2)V + ;15= 0,8 (0,2)Q + ;15= 0,8 3 (0,2)4 + 0,167 = 0,939

10 11 12
Exemplo 2: Uma máquina impressora tem uma probabilidade constante de 0,05 de entrar em pane, em um
dia qualquer, independentemente de ter tido uma pane ou não no dia (ou dias) anterior. Durante uma
ocorrerem, um lucro de $• será alcançado (• < -); e se 3 ou mais panes ocorrerem, um lucro de $(−è) será
semana de 5 dias úteis, se a máquina não entrar em pane, um lucro de $- será obtido; se 1 ou 2 panes
obtido. (Admita-se que •, - e è sejam maiores do que zero; também se supõe que, se a máquina entrar em
pane em qualquer dia, ela permanecerá parada durante o resto do dia.) Seja ` o lucro obtido por semana de
cinco dias úteis. Qual o lucro médio esperado por semana?
Resolução: Primeiramente, vamos definir as variáveis aleatórias de interesse:
à: ›número de panes em 5 dias•
`: ›lucro obtido por semana de 5 dias úteis•
113
Como o enunciado nos diz:
 “probabilidade constante de 0,05 de entrar em pane, em um dia qualquer” – probabilidade de sucesso

(pane) constante;
 “se a máquina entrar em pane em qualquer dia, ela permanecerá parada durante o resto do dia” – ou
a máquina apresenta 1 pane em dado dia, ou não apresenta pane (não tem a possibilidade de
apresentar mais de uma pane) – únicos resultados possíveis são sucesso (pane) ou fracasso (sem
pane);
 “independentemente de ter tido uma pane ou não no dia (ou dias) anterior” – independência entre
ensaios de Bernoulli;
Dessa forma, podemos assumir:
à~¤ (5; 0,05)
Conhecendo a distribuição de probabilidades de à, podemos encontrar a distribuição de probabilidade de `,

já que o enunciado também nos informa que:
¶ (` = -) = ¶(à = 0)
 “se a máquina não entrar em pane, um lucro de $- será obtido”: ou seja
“se 1 ou 2 panes ocorrerem, um lucro de $• será alcançado (• < -)”: ou seja

¶(` = •) = ¶(1 ≤ à ≤ 2)

¶(` = −è) = ¶(à ≥ 3)

 “se 3 ou mais panes ocorrerem, um lucro de $(−è) será obtido”: ou seja
Tabela 38: Distribuição de probabilidade do lucro.
1 −è • -
] ¶(à ≥ 3) ¶(1 ≤ à ≤ 2) ¶(à = 0)
¥ (`) = −èË¶(à = 3) + ¶(à = 4) + ¶(à = 5)Ì + •Ë¶(à = 1) + ¶(à = 2)Ì + - ∙ ¶(à = 0)
Vou deixar as contas por conta dos leitores, porém, as resolvendo, vocês devem chegar em:
¥(`) = $Ë−0,001è + 0,225• + 0,774-Ì
6.2.4.3. A Distribuição de Poisson
Definição: Uma variável aleatória ` tem distribuição de Poisson com parâmetro é > 0, se sua distribuição
de probabilidade for dada por:
[ âê é»
¶(` = º) = , º = 0,1, … , , …
º!
Em que [ (e Neperiano ou número de Euler) representa uma constante irracional cujos dígitos iniciais são
dados por: 2,7182.
Com o parâmetro é sendo usualmente considerado como a taxa de ocorrência da variável `.
114
Usaremos a notação `~Poisson(é) para indicar que a variável aleatória ` segue uma distribuição de
Poisson com parâmetro é.
Resultado: Seja ` uma variável aleatória com distribuição de Poisson (`~Poisson(é)). Então,
¥(`) = é;
r (`) = é.
Exemplo 1: A emissão de partículas radioativas tem sido modelada através de uma distribuição de Poisson,
com valor do parâmetro dependendo da fonte utilizada. Suponha que o número de partículas alfa,
emitidas por minuto, seja uma variável aleatória seguindo uma distribuição de Poisson com parâmetro 5,
ou seja, a taxa de ocorrência é, em média, de 5 emissões a cada minuto. Calcule a probabilidade de haver
mais de 2 emissões em um minuto e a probabilidade de não haver nenhuma emissão em um minuto.
Resolução: Primeiramente, vamos definir a variável de interesse:
`: ›número de partículas emitidas por determinada fonte em um período de um minuto•
`~¶K __K (5)
 Calculo da probabilidade de haver mais de 2 emissões em um minuto:
¶ (` > 2) = 1 − ¶(` ≤ 2) = 1 − Ë¶(` = 0) + ¶(` = 1) + ¶(` = 2)Ì
[ âV 5T [ âV 5 [ âV 53
¶(` > 2) = 1 − − −
0! 1! 2!
0,0067 × 1 0,0067 × 5 0,0067 × 25
¶ (` > 2) = 1 − − −
1 1 2
¶(` > 2) = 1 − 0,0067 − 0,0337 − 0,08422
¶ (` > 2) = 0,8753
 Cálculo da probabilidade de não haver nenhuma emissão:
¶(` = 0) = 0,0067
o valor do parâmetro ] é pequeno e o valor do parâmetro é grande, nesses casos uma variável `~¤ ( , ])
Observação: A distribuição de Poisson pode ser vista como uma aproximação da distribuição binomial quando
pode ser aproximada por `~¶K __K (é), em que é = ].
Exemplo 2: Vamos reimaginar o enunciado do exemplo anterior: Deseja-se estudar a emissão de partículas de
determinado material, observou-se que uma única partícula é emitida desse material com probabilidade 0,08
em qualquer período de 1 segundo, e que ele não libera partículas em quaisquer períodos de 1 segundo com
probabilidade de 0,92. Deseja-se saber qual a probabilidade deste material emitir mais de 2 partículas em um
período de 1 minuto, ou de 60 segundos.
Resolução:
 Podemos tentar resolver este exercício utilizando a distribuição binomial, e considerar o seguinte:
115
`: ›número de partículas emitidas por determinada fonte em um período de 60 segundos•
`~¤ (60; 0,08)
¶ (` > 2) = 1 − ¶(` ≤ 2) = 1 − ¶(` = 0) − ¶(` = 1) − ¶(` = 2)
60 60 60
¶ (` > 2) = 1 − ì í 0,08T 0,92 T
−ì í 0,08 0,92VS − ì í 0,083 0,92V
0 1 2
¶(` > 2) = 1 − 0,0067 − 0,0351 − 0,0899 = 0,8683
 Vamos resolver agora utilizando a aproximação da Binomial pela Poissom:
`: ›número de partículas emitidas por determinada fonte em um período de 60 segundos•
é = ] = 60 × 0,08 = 4,8
`~¶K __K (4,8)
¶(` > 2) = 1 − ¶ (` ≤ 2) = 1 − ¶ (` = 0) − ¶ (` = 1) − ¶(` = 2)
[ âQ, 4,8T [ âQ, 4,8 [ âQ, 4,83

¶(` > 2) = 1 − − −
0! 1! 2!
0,0082 × 1 0,0082 × 4,8 0,0082 × 23,04
¶ (` > 2) = 1 − − −
1 1 2
¶ (` > 2) = 1 − 0,0082 − 0,0395 − 0,0948 = 0,8575
(0,8575), quanto maior for o tamanho de e quanto menor for o tamanho de ] (parâmetros da
 Podemos perceber que utilizando ambos os métodos chegamos em valores semelhantes (0,8683) e
binomial) melhor será a aproximação.
6.2.5. Exercícios
1- [MONTGOMERY e RUNGER, 2003] O espaço amostral de um experimento aleatório é {a, b, c, d, e, f} e

cada resultado é igualmente provável. Uma variável aleatória é definida como segue:
`
Resultado a b c d e f
Determine a função de probabilidade de `.

0 0 1,5 1,5 2 3
Para os exercícios 2 e 3, verifique as funções de probabilidade e determine as probabilidades requeridas:

2- [MONTGOMERY e RUNGER, 2003] Considere a seguinte distribuição de probabilidades:
x -2 -1 0 1 2
p(x) 1/8 2/8 2/8 2/8 1/8
a. ¶ (` ≤ 2)
b. ¶ (` > −2)
c. ¶ (−1 ≤ ` ≤ 1)
116
d. ¶Ë(` ≤ −1) ∪ (` = 2)Ì
3- [MONTGOMERY e RUNGER, 2003] ¶ (`) = , 1 = 0, 1, 2, 3, 4
3k<
3V
a. ¶ (` = 4)
b. ¶ (` ≤ 1)
c. ¶ (2 ≤ ` < 4)
d. ¶ (` > −10)
4- [MONTGOMERY e RUNGER, 2003] O setor de comercialização estima que um novo instrumento para
análise de amostras de solo terá grande sucesso, moderado sucesso, ou não terá sucesso, com
probabilidades de 0,3; 0,6 e 0,1 respectivamente. A receita anual associada com um produto de grande
respectivamente. Faça a variável aleatória ` denotar a renda anual do produto. Determine a função
sucesso, moderado sucesso ou nenhum sucesso é de R$10 milhões, R$5 milhões e R$1 milhão,
de probabilidade de `.
5- [MONTGOMERY e RUNGER, 2003] Em um processo de fabricação de semicondutores, três pastilhas de
um lote são testadas. Cada pastilha é classificada como passa ou falha. Suponha que a probabilidade
de uma pastilha passar no teste seja de 0,8 e que as pastilhas sejam independentes.
a. Qual é a probabilidade de que todas as três pastilhas passem no teste?
b. Determine a função de probabilidade do número de componentes no arranjo que encontram
as especificações.
6- [MONTGOMERY e RUNGER, 2003] Um arranjo consiste em três componentes mecânicos. Suponha que
as probabilidades do primeiro, do segundo e do terceiro componentes encontrarem as especificações
sejam iguais a 0,95; 0,98 e 0,99. Considere que os componentes sejam independentes.
a. Qual a probabilidade de que todos os componentes em um arranjo encontrem as
especificações?
b. Determine a função de probabilidade do número de componentes no arranjo que encontram
as especificações?
7- [TRIOLA, 2013] No jogo Pick 3 da loteria de Illinois, você paga 50 centavos para selecionar uma
sequência de três dígitos, como 233. Se você seleciona a mesma sequência de três dígitos que é
extraída, você ganha e recebe US$ 250.
a. Quantas seleções são possíveis?
b. Qual é a probabilidade de ganhar?
c. Se você ganha, qual seu lucro líquido?
d. Ache o valor esperado.
e. Se você aposta 50 centavos no jogo Pick 4 de Illinois, o valor esperado é de -25 centavos. Qual
é melhor: uma aposta de 50 centavos no jogo Pick 3 de Illinois ou uma aposta de 50 centavos
no jogo Pick 4 de Illinois? Explique.
8- [TRIOLA, 2013] Há uma probabilidade de 0,9986 de que um homem de 30 anos de idade, selecionado
aleatoriamente, sobreviva este ano. A companhia Fidelity de seguros cobra US$ 161 para segurar que
o homem sobreviva este ano. Se o homem não sobrevive ao ano, a apólice paga US$ 100.000 como
benefício por morte.
a. Da perspectiva de um homem de 30 anos, quais são os valores correspondentes aos dois
eventos de sobreviver e não sobreviver ao ano?
b. Se um homem de 30 anos compra a apólice, qual é o seu valor esperado?
c. A companhia pode esperar lucrar com muitas dessas apólices? Por quê?
9- [TRIOLA, 2013] Em uma pesquisa com 320 graduados em faculdades, 36% relataram que
permaneceram em seu primeiro emprego de tempo integral menos de um ano.
117
a. Se 15 sujeitos pesquisados são selecionados aleatoriamente sem reposição para uma pesquisa
de acompanhamento, ache a probabilidade de que 5 deles tenham permanecido em seu
primeiro emprego menos de um ano.
b. Se parte de a) é alterada, de modo que 20 sujeitos de pesquisa selecionados, explique por que
a fórmula da probabilidade binomial não pode ser usada.
10- [TRIOLA, 2013] Na análise dos locais atingidos por bombas V1 na Segunda Guerra Mundial, Londres foi
subdivida em 576 regiões, cada uma com 0,25 km². Um total de 535 bombas atingiu a área combinada
de 576 regiões.
a. Qual número médio de bombas por região?
b. Se uma região é selecionada aleatoriamente, ache a probabilidade de que ela não tenha sido
atingida.
c. Com base na probabilidade da parte b), quantas das 576 regiões se espera que não tenham
sido atingidas?
d. Na verdade, houve 229 regiões que não foram atingidas. Como esse resultado real se compara
com o resultado da parte c)?
como distribuição de probabilidade da variável aleatória discreta `.

11- [WALPOLE et. at, 2009] Determine o valor c de modo que cada uma das seguintes funções possa servir
a. ](1) = (1 3 + 4), para 1 = 0, 1, 2, 3;

2 3
b. ](1) = ; = ; =, para 1 = 0, 1, 2.
1 3−1
12- [WALPOLE et. at, 2009] A distribuição de probabilidade de `, o número de imperfeições a cada dez
metros de um tecido sintético produzido em rolos contínuos de largura uniforme, é dada por:
1
p(1) 0,41
0 1 2 3 4
Construa a função de distribuição acumulada de `.

0,37 0,16 0,05 0,01
6.2.6. Variáveis Aleatórias Contínuas
Já vimos como trabalhar com variáveis aleatórias discretas, nesta seção veremos como trabalhar com variáveis
aleatórias contínuas.
Quando estudados como montar tabelas de frequências e gráficos para variáveis quantitativas, vimos que
trabalhar com variáveis aleatórias discretas era bastante intuitivo, já que conseguimos ordenar os dados,
estando em um conjunto enumerável, sendo ele finito ou não.
Já ao trabalhar com variáveis quantitativas contínuas, era necessário fazer certas adaptações, já que variáveis
contínuas não são enumeráveis, pertencendo aos conjuntos dos Reais, vimos que para construir tabelas de
frequência não existia a possibilidade de relacionar frequências com valores específicos, era necessário criar
intervalos e relacionar as frequências a esses intervalos (não importando o quão grande ou pequena a
amplitude dos dados).
Ao trabalharmos com variáveis aleatórias contínuas encontraremos dificuldades análogas, para definir a
distribuição de probabilidades, por exemplo, não é possível criar uma tabela que relacione cada valor possível
com sua probabilidade, novamente, será necessário trabalhar com a probabilidade da variável aleatória
pertencer a um determinado intervalo. Como veremos abaixo.
118
6.2.6.1. Distribuição de Probabilidade de Variáveis Aleatórias Contínuas
Definição: Diz-se que ` é uma variável aleatória contínua, se existir uma função , denominada função
densidade de probabilidade ( 9]) de ` que satisfaça às seguintes condições:
(1) ≥ 0 para todo 1;

A área definida por (1) é igual a 1;

Para quaisquer , , com −∞ < < < +∞, teremos ¶ ( ≤ ` ≤ ) = îj (1) 91.
M


Primeiramente, é necessário deixar claro que trabalharemos com conceitos e ferramentas que permitam o
cálculo de probabilidades de variáveis aleatórias contínuas que não exijam a resolução de integrais, limites ou
derivadas, já que esta apostila é livre de pré-requisitos matemáticos de nível superior.
A fim de tentar entender melhor a definição acima, vamos observar a figura 45 abaixo:
Figura 45: Ilustração de uma densidade de probabilidade.
Temos na figura 45 a variável aleatória contínua ` representada pelo eixo horizontal e a função densidade de
probabilidade (1) definida no eixo vertical e a curva que relaciona a variável com sua 9]. Está destacada a
área abaixo da curva delimitada pelos valores e 9, em que ≤ 1 ≤ 9. Dessa forma a área destacada é igual
à probabilidade da variável aleatória ` estar entre os valores e 9.
Observações:
¶ ( < ` < 9) representa a área sob a curva

¶ (` = 1T ) = 0;


¶ ( ≤ ` ≤ 9) = ¶ ( ≤ ` < 9) = ¶ ( < ` ≤ 9) = ¶ ( < ` < 9).
 (1) não representa a probabilidade de coisa alguma!

o Somente quando a função for integrada entre dois limites, ela produzirá uma probabilidade.
6.2.6.2. Medidas de Resumo para Variáveis Aleatórias Contínuas
Assim como para variáveis aleatórias discretas, podemos calcular a esperança e a variância para variáveis
aleatórias contínuas, essas medidas mantêm o mesmo conceito, mudando apenas o método do cálculo da
esperança que será dado abaixo para variáveis aleatórias contínuas:
Definição: Seja ` uma variável aleatória contínua com f.d.p. . O valor esperado de ` é definido como
119
<Ý
¥(`) = ï 1 (1)91,
âÝ
se, e somente se,

<Ý
ï |1| (1)91
âÝ
for finita.
Para encontrar a variância pode-se utilizar a mesma fórmula dada no caso discreto (r(`) = ¥(` 3 ) −
Ë¥(`)Ì3 ), mantendo em mente que as propriedades apresentadas no caso discreto se mantêm para o caso
contínuo.
Exemplo: Existe uma variável aleatória ` com ¥(`) = 3 e ¥(` 3 ) = 8?
uma variável aleatória ` com ¥(`) = 3 e ¥ (` 3 ) = 8, já que r(`) = ¥(` 3 ) − Ë¥(`)Ì3 = 8 − 33 = 8 − 9 =

Resolução: como o cálculo e o conceito de variância se mantém, podemos dizer, com confiança que NÃO existe
−1, e sabemos que não existe variância negativa.
6.2.6.3. Distribuição Normal
A distribuição de probabilidade normal é uma distribuição de extrema importância no cálculo de

probabilidades e na inferência estatística, devida a sua grande importância ela será apresentada e iremos
estudar alguns métodos de obter probabilidades para variáveis que seguem essa distribuição.
6.2.6.4. Definição
Uma variável aleatória ` tem distribuição normal com parâmetros m e n 3 Ë`~Ç(m, n 3 )Ì se sua densidade de
probabilidade é dada por:
1 (kâó)J
(1) = [ 3ôJ
òâ õ
√2ñn
Em que:
−∞ < 1 < ∞;−∞ < m < ∞ e n 3 > 0.

ñ representa uma constante, aproximadamente 3,1415;

[ representa uma outra constante, aproximadamente 2,7182;


m representa a média da distribuição;


n 3 representa a variância da distribuição;



Juntos, os parâmetros m e n 3 definem uma função densidade de probabilidade normal.
Não se assustem pela definição da Normal, a ideia é apenas apresentá-la, o mais importante é vocês
compreenderem suas propriedades e como calcular probabilidades.
120
6.2.6.5. Propriedades
A distribuição normal é unimodal e simétrica em torno de sua média m:
 ¶ (` < m) = ¶(` > m);
O desvio padrão n é uma medida da dispersão dos dados ao redor da média m:
¶ (m − n < ` < m + n) = 0,6826;

¶ (m − 2n < ` < m + 2n) = 0,9546;

¶ (m − 3n < ` < m + 3n) = 0,9974.



Figura 46: Forma da distribuição Normal e algumas propriedades.
Normal, ou seja, se ` , `3 , … , ` formam uma sequência de variáveis aleatórias Ç(m ; n 3 ) independentes e

Tem-se que qualquer combinação linear de variáveis Normais independentes, também terá uma distribuição
, 3 , … , , são constantes quaisquer, então:
ö= `
"
terá distribuição normal com parâmetros:
m÷ = ∑ " m;
nø 3 = ∑ " n .
3 3


121
6.2.6.6. Normal Padrão
Diz-se que uma variável aleatória ù segue uma distribuição normal padrão se ela segue uma distribuição
normal com média 0 e desvio padrão 1 (m = 0 e n 3 = 1).
Exemplo: Suponha que o comprimento de recém-nascidos do sexo feminino não portadores de anomalias
congênitas seja uma variável aleatória com distribuição aproximadamente normal de média 48,54cm e desvio-
padrão 2,5cm.
Se subtrairmos 48,54cm de todas as observações teremos uma distribuição normal com média 0cm e desvio
padrão 2,5cm; se, após subtrairmos 48,54cm, dividirmos todas as observações por 2,5cm teremos uma
distribuição normal com média 0cm e desvio padrão 1cm.
Figura 47: Padronização da distribuição normal, um exemplo.
Uma variável aleatória ` que siga uma distribuição normal com média m ≠ 0 ou desvio padrão n ≠ 1 pode
ser padronizada pela seguinte expressão:
`−m
ù=
n
Conhecendo a relação entre uma variável aleatória ` seguindo uma distribuição normal diferente da padrão
e a variável aleatória ù que segue uma distribuição normal padrão, é possível calcular as probabilidades
relativas à variável ` utilizando a tabela de probabilidades de ù.
Existem diversas tabelas da distribuição normal padrão disponíveis como anexo de diferentes referências
bibliográficas, ou disponíveis na internet. Em anexo, está disponível a tabela que usaremos nesta apostila.
Explicarei o como utilizá-la na resolução do exemplo abaixo.
Continuação do Exemplo: Tomando ` a variável aleatória relativa ao comprimento de recém nascidos (m =

48,54cm e n = 2,5cm).
 Imagine que desejamos saber qual a probabilidade de um recém-nascido ter mais de 48,54 cm
122
Nesse caso, nem seria necessário fazer a relação entre a variável normal `~Ç(48,54; 2,53 ) com a variável
normal padrão ù~Ç(0,1), já que uma das propriedades da distribuição normal é que ela é simétrica em torno
da sua média, ou seja:
¶(` > 48,54) = 0,5
 Imagine que desejamos saber qual a probabilidade de um recém-nascido ter menos de 44,79 cm
Primeiro Passo: Relacionar ` com ù
Para ` = 44,79 ⇒ ù = = = = −1,5

„âó QQ,RSâQ ,VQ â4,RV
ô 3,V 3,V
P(` ≤ 44,79) = P(ù ≤ −1,5)
Para encontrarmos P(ù ≤ −1,5) podemos recorrer à tabela da distribuição normal padrão em anexo, irei
apresentar parte dessa tabela abaixo para entendermos como usá-la:
Figura 48: Representação de parte da tabela da distribuição normal padrão.
Fonte: Anexo (tabela 49 página 218)
A figura 48 me fornece ¶(ù ≥ 1,5) = 0,0668 (valores marcados em azul), mas a probabilidade que estamos
procurando é a probabilidade de ù ≤ −1,5; como obter a probabilidade desejada com a tabela fornecida?
Devemos utilizar, novamente, o conhecimento das propriedades da normal, como a simetria em torno da
média. Sabemos que a média da normal padrão é zero, e sabemos que a distribuição normal é simétrica em
torno da média (zero), ou seja, sabemos que o que acontece à esquerda da média, vai ser espelhado à direita
da média. Sendo assim:
123
P(` ≤ 44,79) = P(ù ≤ −1,5) = ¶ (ù ≥ 1,5) = 0,0668
 Imagine que desejamos saber qual a probabilidade de um recém-nascido ter entre 45,965 cm e
50,465 cm
Primeiro Passo: Relacionar ` com ù
Para ` = 45,965 ⇒ ù = = = −1,03

QV,S VâQ ,VQ â3,VRV
3,V 3,V
Para ` = 50,465 ⟹ ù = = = 0,77

VT,Q VâQ ,VQ ,S3V
3,V 3,V
P(46,04 ≤ ` ≤ 51,04) = P(−1,03 ≤ ù ≤ 0,77)
Vamos voltar na figura 48 e observar os valores marcados em vermelho, temos que ¶(ù ≥ 1,03) =
¶ (ù ≤ −1,03) = 0,1515 e ¶(ù ≥ 0,77) = 0,2206. Para encontrarmos a probabilidade desejada, podemos
utilizar o evento complementar ao evento de interesse:
P(45,965 ≤ ` ≤ 51,465) = P(−1,03 ≤ ù ≤ 0,77) = 1 − ¶ (` ≤ −1,03) − ¶(ù ≥ 0,77)

= 1 − 0,1515 − 0,2206
¶ (45,965 ≤ ` ≤ 51,465) = 0,6279
Mesmo a tabela da distribuição normal padrão sendo limitada, podemos utilizá-la para resolver qualquer tipo
de problema envolvendo a distribuição normal.
6.2.7. Exercícios
1- [DEVORE, 2006] Em cada caso, determine o valor da constante c que torna a declaração de
a. ¶ (0 ≤ ù ≤ ) = 0,291
probabilidade verdadeira.
b. ¶ ( ≤ ù) = 0,121
c. ¶ (− < ù < ) = 0,668
d. ¶ (|ù| > ) = 0,016
2- [DEVORE, 2006] Suponha que a força que age sobre uma coluna que ajuda a suportar um edifício
tenha distribuição normal com a média 15,0kips e desvio padrão 1,25 kips. Qual é a probabilidade de
a força:
a. Estar entre 10 e 12 kips?
b. Desviar de 15,0 kips por no máximo 2 desvios?
3- [MONTGOMERY e RUNGER, 2003] A resistência à tração do papel pode ser modelada por uma
distribuição normal com média de 35 libras por polegada quadrada e um desvio padrão de 2 libras por
polegada quadrada.
a. Qual a probabilidade da resistência de uma amostra ser menor que 40lb/in².
b. Se as especificações requererem que a resistência à tração exceda 30lb/in², que proporção
das amostras será rejeitada.
4- [MONTGOMERY e RUNGER, 2003] O volume de enchimento de uma máquina automática de
enchimento usada para encher latas de bebidas gasosas é distribuída normalmente, com uma média
de 12,4 onças fluídas e um desvio padrão de 0,1 onça fluída.
124
a. Qual é a probabilidade do volume de enchimento ser menor do que 12 fl oz.
b. Se todas as latas menores que 12,1 fl oz ou maiores que 12,6 fl oz forem rejeitadas, que
proporção de latas será rejeitada?
c. Determine as especificações que sejam simétricas em torno da média que incluam 99% de
todas as latas.
5- [MONTGOMERY e RUNGER, 2003] O tempo de reação de um motorista para um estímulo visual é
normalmente distribuído com uma média de 0,4s e um desvio padrão de 0,05s.
a. Qual é a probabilidade de que uma reação requeira mais de 0,5s?
b. Qual é a probabilidade de que uma reação requeira entre 0,4s e 0,5s?
c. Qual é o tempo de reação que é excedido em 90% do tempo?
6- [MONTGOMERY e RUNGER, 2003] No exercício anterior, suponha que o processo fosse centralizado,
de modo, que a média fosse 90mm e o desvio padrão fosse 0,1mm. Considere 10 casos supostos
independentes, fossem medidos.
a. Qual será a probabilidade de todos os 10 casos estarem entre 89,7mm e 90,3mm?
b. Qual é o número esperado dos 10 casos que estão entre 89,7mm e 90,3mm?
7- [MONTGOMERY e RUNGER, 2003] A vida de um semicondutor a laser, a uma potência constate, é
normalmente distribuída com uma média de 7000 horas e desvio padrão de 600 horas.
a. Qual é a probabilidade do laser falhar antes de 5000 horas?
b. Qual é o tempo de vida em horas que 95% dos lasers excedem?
c. Se 3 lasers forem usados em um produto e se eles falharem independentemente, qual será a
probabilidade de todos os 3 estarem ainda operando depois de 7000 horas?
8- [MONTGOMERY e RUNGER, 2003] O peso de um sofisticado sapato de corrida é normalmente
distribuído com uma média de 12 onças e de um desvio padrão de 0,5 onça.
a. Qual a probabilidade do sapato pesar mais de 13 onças?
b. Qual tem de ser o desvio padrão do peso para que a companhia estabeleça que 99,9% de seu
sapato sejam mais leves do que 13 onças?
c. Se o desvio padrão permanecer em 0.5 onça, qual tem de ser o peso médio para que a
companhia estabeleça que 99,9% de seus sapatos sejam mais leves que 13 onças?
Nos exercícios 9 a 11, use as seguintes informações: As alturas de homens são normalmente distribuídas, com
média de 69,0 polegadas e desvio-padrão de 2,8 polegadas; As alturas de mulheres são normalmente
distribuídas, com média de 63,6 polegadas e desvio-padrão de 2,5 polegadas. (TRIOLA, 2013)
9- [TRIOLA, 2013] O monotrilho Mark VI usado na DisneyWorld e o avião comercial Boeing 757-200 ER
têm portas com altura de 72 polegadas.
a. Qual é a porcentagem de homens adultos que podem passar por essas portas sem se curvar?
b. Qual é a porcentagem de mulheres adultas que podem passar por essas portas sem se curvar?
c. O projeto de porta com 72 polegadas de altura parece ser adequado? Explique?
d. Qual altura de porta permitiria que 98% dos homens adultos passassem sem se curvar?
10- [TRIOLA, 2013] O Tall Clubs International é uma organização social para pessoas altas. Ele exige que
os homens tenham, no mínimo, 74 polegadas (187,96 cm) de altura, e as mulheres, no mínimo, 70
polegadas (177,80 cm) de altura.
a. Qual porcentagem de homens satisfaz tal exigência?
b. Qual porcentagem de mulheres satisfaz tal exigência?
c. As exigências para homens e mulheres são razoáveis? Por que sim ou por que não?
125
11- [TRIOLA, 2013] As Forças Armadas Americanas exigem que as mulheres tenham alturas entre 58 e 80
polegadas (147,32 e 203,20 cm).
a. Ache a porcentagem de mulheres que satisfazem essa exigência. Muitas mulheres estão
perdendo a oportunidade de entrar para as forças armadas por serem muito baixas ou muito
altas?
b. Se as Forças Armadas mudam as exigências de altura de modo que todas as mulheres possam
entrar, exceto o 1% das mulheres mais baixas e os 2% das mulheres mais altas, quais seriam
as novas exigências de altura?
12- [TRIOLA, 2013] Na Noruega, os pesos ao nascer são normalmente distribuídos, com uma média de
3570 g e um desvio-padrão de 500 g.
a. Se o Hospital Universitário Ullevar em Oslo exige tratamento especial para bebês com pesos
ao nascer inferiores a 2700 g, qual é a porcentagem de bebês recém-nascidos que exigirão
tratamento especial?
b. Se os diretores do Hospital Universitário Ulleval planejam pedir tratamento especial para os
3% mais leves dos bebês nascidos, qual peso ao nascer separa os que exigem tratamento
especial dos que não exigem?
c. Por que não é prático para o hospital estabelecer que os bebês que exigem tratamento
especial são os dos 3% inferiores dos pesos ao nascer?
13- [TRIOLA, 2013] Com base nos resultados amostrais do Conjunto de Dados 2 do Apêndice B, suponha
que as temperaturas do corpo humano sejam distribuídas normalmente, com média de 92.20 °F e
desvio-padrão de 0.62 °F.
a. O hospital Bellevue, na cidade de Nova York, usa 100.6 °F como a menor temperatura
considerada como febre. Qual é a porcentagem de pessoas normais e saudáveis que seriam
consideradas febris? Tal porcentagem sugere que o corte de 100.6 °F seja apropriado?
b. Os médicos desejam selecionar uma temperatura mínima para a requisição de exames
médicos adicionais. Qual deve ser essa temperatura, se eles desejam que somente 5% das
pessoas saudáveis tenham temperatura superior? (Tal resultado é chamado um falso-positivo,
o que significa que o resultado do teste deu positivo, mas a pessoa não está realmente
doente).
14- [TRIOLA, 2013] Os tempos de gravidez são normalmente distribuídos, com média de 268 dias e desvio-
padrão de 15 dias.
a. Um uso clássico da distribuição normal é inspirado em uma carta para “Dear Abby”, na qual
uma mulher afirmava ter dado a luz 308 dias depois da visita de seu marido, que estava em
serviço na Marinha. Dada essa informação, ache a probabilidade de uma gravidez durar 308
dias ou mais. O que esse resultado sugere?
b. Se um bebê é classificado como prematuro no caso de a duração da gravidez estar dentro dos
4% tempos inferiores, ache o tempo de gravidez que separa os bebês prematuros dos demais.
Bebês prematuros, em geral, requerem tratamentos especiais, e esse resultado pode ser útil
15- [WALPOLE et. Al, 2009] Dada uma distribuição normal padrão, determine o valor de º de modo que:
para os administradores de hospitais no planejamento de tais cuidados.
a. ¶ (ù < º) = 0,0427
b. ¶ (ù > º) = 0,2946
c. ¶ (−0,93 < ù < º) = 0,7235
16- [WALPOLE et. Al, 2009] Dada a variável distribuída normalmente ` com média 18 e desvio-padrão 2,5,
determine:
126
a. ¶ (` < 15)
b. O valor de ºde modo que ¶ (` < º) = 0,2236
c. O valor de ºde modo que ¶ (` > º) = 0,1814
d. ¶ (17 < ` < 21)
17- [WALPOLE et. Al, 2009] Um cientista reporta que camundongos viverão uma média de 40 meses
quando suas dietas forem bastante restritas e portanto, enriquecidas com vitaminas e proteínas.
Assumindo que a vida de tais camundongos é distribuída normalmente, com desvio padrão de 6,3
meses, determine a probabilidade de que certo camundongo viverá:
a. Mais de 32 meses.
b. Menos de 28 meses.
c. Entre 37 e 49 meses.
18- [WALPOLE et. Al, 2009] Uma máquina de refrigerante está regulada de modo a despejar uma média
de 200ml de refrigerante por copo. Se a quantidade da bebida é normalmente distribuída com desvio
padrão de 15ml.
a. Que fração de copos conterá mais de 224 ml?
b. Qual é a probabilidade de que um copo contenha entre 191ml e 209 ml?
c. Quantos copos provavelmente transbordarão se forem utilizados copos de 230ml para as
próximas 1000 bebidas?
d. Abaixo de qual valor temos os 25% menores volumes de bebidas?
19- [WALPOLE et. Al, 2009] Um advogado viaja diariamente de sua casa nos subúrbios até o escritório no
centro da cidade. O tempo médio de viagem de ida é de 24 minutos, com desvio padrão de 3,8
minutos. Assuma que seus tempos de viagem sejam distribuídos normalmente:
a. Qual é a probabilidade de que uma viagem leve pelo menos 30 minutos?
b. Se o escritório abre às 9h e ele sai de sua casa às 8:45h, qual é a porcentagem do tempo em
que ele estará atrasado para o trabalho?
c. Se ele sai de casa às 8:35h e o café será servido no escritório entre 8:50h e 9:00h, qual é a
probabilidade de ele perder o café?
d. Determine o tempo acima do qual encontramos os 15% menores tempos de viagem.
e. Determine a probabilidade de que 2 das próximas 3 viagens levarão pelo menos 30 minutos.
20- [WALPOLE et. Al, 2009] A vida média de certo tipo de pequeno motor é de 10 anos, com desvio padrão
de 2 anos. O fabricante substitui gratuitamente os motores que falharem enquanto estiverem sob
garantia. Se ele deseja substituir somente 3% dos motores que falham, quanto tempo de garantia
deve ser oferecido? Assuma que a vida do motor segue uma distribuição normal.
21- [WALPOLE et. Al, 2009] Uma empresa paga a seus funcionários um salário médio de R$15,90 por hora,
com desvio padrão de R$1,50. Se os salários são distribuídos aproximadamente de maneira normal e
pagos ao centavo mais próximo:
a. Qual porcentagem de funcionários recebe salários entre R$13,75 e R$16,22, inclusive, por
hora?
b. Os 5% mais altos salários por hora são maiores do que qual quantia?
22- [WALPOLE et. Al, 2009] A resistência à tensão de certo componente de metal é normalmente
distribuída com média de 10.000kg/cm². As medições são registradas para os 50kg/cm² mais
próximos.
a. Qual é a proporção desses componentes que excede 10.150kg/cm² na resistência à tensão?
127
b. Se as especificações exigem que todos os componentes tenham resistência à tensão entre
9.800kg/cm² e 10.200kg/cm², inclusive, qual é a proporção de componentes que você espera
serem inutilizados?
23- [WALPOLE et. Al, 2009] Os QIs (quocientes de inteligência) de 600 candidatos de certa faculdade são
aproximadamente distribuídos segundo a distribuição normal, com média de 115 e desvio padrão de
12. Se a faculdade exige um QI de pelo menos 95, quantos desses estudantes serão rejeitados sem ser
24- [WALPOLE et. Al, 2009] O nível de colesterol ` em garotos de 14 anos tem distribuição normal com
consideradas outras qualificações?
media 170 e desvio-padrão de 30.

a. Determine a probabilidade de que o nível de colesterol de um garoto de 14 anos selecionado
aleatoriamente exceda 230.
b. Em uma escola de ensino médio há 300 meninos de 14 anos de idade. Determine a
probabilidade de que pelo menos oito garotos tenham nível de colesterol que exceda 230.
7. Exercícios Avaliativos sobre Probabilidade
1- Uma empresa distribui seus produtos em três cidades por meio de seus vendedores. De seus
vendedores, 20% atuam na cidade A, 40% na cidade B e 40% na cidade C. Cada vendedor atua em
apenas uma cidade. A empresa disponibilizará para os vendedores que desejarem um novo aplicativo
de gestão de vendas. Uma consulta revelou que 60% dos vendedores da cidade A pretendem usar o
a. Dados os eventos: £ = {Um vendedor atender a cidade A} e ¤ = {Um vendedor atender a

aplicativo, bem como 75% dos vendedores da cidade B e 80% dos vendedores da cidade C.
cidade B}. Pode-se dizer que £ e ¤ são independentes? Justifique sua resposta.
b. Qual a proporção de vendedores da empresa que pretendem adotar o aplicativo?
c. Um determinado vendedor usa o aplicativo de gestão de vendas, qual a probabilidade de ele
atuar na cidade A?
2- Em um cassino existem dois tipos de máquina caça-níqueis: uma que paga 10% das vezes e outra que
paga 20% das vezes. Obviamente, você gostaria de jogar na máquina que paga 20% das vezes, mas
não sabe quais das máquinas são as mais generosas. Assim, você adota a seguinte estratégia: você
supõe inicialmente as máquinas são igualmente distribuídas entre generosas e não generosas. Você,
então, seleciona uma máquina aleatoriamente e coloca uma moeda nela. Neste caso.
a. Qual será a probabilidade de que o caça-níquel pague?
b. Considerando que você perdeu a primeira aposta, estime a probabilidade de que a máquina
que você selecionou seja a mais generosa das duas máquinas?
c. Qual é a probabilidade de você ter escolhido uma máquina que pague apenas 10% das vezes,
se você tiver sido pago?
Se você souber que apenas 20% das máquinas do cassino são das mais generosas que pagam
20% das vezes,
d. Qual a probabilidade de que você ganhe alguma coisa em uma jogada?
e. Qual a probabilidade de que você selecione uma máquina que pague apenas 10% das vezes e
que não seja pago?
3- Uma fábrica produz peças para bicicletas que podem ser classificadas ao final do processo de produção
como: aprovada (A), remanufaturada (R) ou defeituosa (D). As primeiras, classificadas como aprovadas
128
(A), serão diretamente comercializadas. As remanufaturadas (R) serão recuperadas dentro dos
padrões de qualidade exigidos e avaliadas novamente e classificadas apenas como aprovadas (A) e,
portanto, comercializadas, ou defeituosas (D). Qualquer peça classificada como defeituosa (D) será
descartada.
Distribuição de probabilidade das peças produzidas no primeiro estágio de produção (Y1)
‚ aprovada remanufaturada defeituosa
¶(à = ‚ ) 0,9 ] 0,03
Distribuição de probabilidade das peças produzidas no segunda estágio de produção (Y2) - apenas
para as peças classificadas como “remanufaturadas” no primeiro estágio de produção.
‚3 aprovada defeituosa
¶(à3 = ‚3 ) 0,8 0,2
Considere que, se a peça foi comercializada ao final de qualquer um dos dois estágios, ela produzirá
uma lucro igual a 10 unidades monetárias (UM) e se foi classificada como defeituosa, um prejuízo de 3
UM
a. Qual o valor de ]?
b. Seja è a variável relativa ao lucro por peça, forneça a distribuição de probabilidade da variável
è.
c. Qual o lucro esperado por peça
4- As preferências de homens e mulheres por cada gênero de filme alugado em uma locadora de vídeos,
estão apresentadas na próxima tabela:
Gênero/Filme Comédia Romance Policial

Homens 136 92 248
Mulheres 102 195 62
Sorteando-se, ao acaso, uma dessas locações de vídeo, pergunta-se a probabilidade de
a. Uma mulher ter alugado um filme policial?

b. O filme alugado ser uma comédia?
c. Um homem ter alugado ou o filme ser um romance?
d. O filme ser policial dado que foi alugado por um homem?
5- Suponha que o diâmetro (em polegadas) do tronco de um certo tipo de árvore tenha distribuição
normal com média 8,8 e desvio padrão 2,8. Qual a probabilidade de que uma arvore escolhida ao
acaso tenha diâmetro entre 8 e 9 polegadas?
6- Para empresas de comércio eletrônico, fazer com que um cliente visite um site da Web não é
suficiente. Os comerciantes devem também persuadir consumidores on-line a gastar dinheiro
realizando uma compra. Especialistas da Andersen Consulting estimam que 88% dos
consumidores da Web abandonam seus carrinhos de compras virtuais antes de completar as
suas transações. Considere uma amostra de 20 consumidores que visitam um site da Web de
129
comércio eletrônico e admita que a probabilidade de que um cliente irá sair do site antes de
completar a transação seja 0,88. Utilize o modelo binomial para responder a seguinte pergunta:
qual é a probabilidade de que exatamente 19 consumidores irão sair do site sem completar uma
transação?
7- O circuito mostrado a seguir opera se houver ao menos um caminho de equipamentos
funcionando entre os pontos a e b, da esquerda para a direita. A probabilidade de que cada
equipamento funcione é mostrada na figura abaixo. Suponha que os equipamentos falhem
independentemente um do outro. Qual será a probabilidade de que o aparelho funcione?
`:
8- Considere a tabela a seguir que apresenta a distribuição de probabilidade da variável aleatória
`
¶(` = 1 )
0 1 2 3 4
0,05 0,25 0,4 0,15
Responda as seguintes questões:
b. Qual o valor esperado da variável `?

a. Qual valor de c é transforma a tabela acima em uma distribuição de probabilidades?
c. Qual a variância da variável `?

9- Sejam £ e ¤ eventos independentes relativos a um mesmo espaço amostral Ω, com ¶(£) e
¶(¤) diferentes de zero. É INCORRETO afirmar.
(a) ¶ (£ ∩ ¤) = ¶(£)¶(¤)
(b) ¶ (£|¤ ) = ¶(£)
(c) ¶(£ ∪ ¤) = ¶(£) + ¶(¤)
(d) £ e ¤ são independentes
(e) ¶ (£ ∩ ¤) = ¶(£|¤)¶(¤)
130
8. Amostragem
A história da amostragem anda junto com a história da estatística. Vimos na Apostila (Seção 2.1., página 2)
que foram encontrados registros de trabalhos estatísticos em civilizações antigas, datando de 5000 a.C. em
diante (POUBEL, 2010), registros esses com o objetivo de obter informações sobre a população de
determinada região, geralmente com intuito de taxação, organização bélica, fins agrícolas ou comerciais. Além
disso, Castro (1970, p. 13-15, apud SILVA JUNIOR, 2015, p. 20) definiu o primeiro período da estatística, como
indo desde o Regime Feudal até meados do século XVII como período de preparação de fatos, organização de
registros com objetivo de: taxação e coleta de impostos ou estratégias de guerras.
Desses registros, podemos observar que a técnica da amostragem vem sendo aplicada (mesmo que de
maneira informal e não probabilística) desde que os seres humanos começaram a conviver em grandes
civilizações, como um método para organizar as cidades, estados, impérios, ...
A formalização da pesquisa por amostragem foi surgir apenas em 1895 no trabalho de Kiar (1895, apud
Vasconcelos, 2006, p.769-771), apresentado na reunião do International Statistical Institute (ISI), trabalho esse
que foi visto com desconfiança, inicialmente, devido à simplicidade da ideia, mas que ganhou força após o
fortalecimento da modelagem e consolidação da ideia em publicações feitas entre 1949 e 1954
(VASCONCELOS, 2006).
8.1. Noções Básicas
A ideia de amostragem é bastante intuitiva, utilizamos o conceito, muitas vezes sem ao menos perceber, por
exemplo, na hora de cozinhar. Ao fazer feijão, por exemplo, é comum pegar uma colher para experimentar e
checar se o feijão está cozido, ou se precisa de mais tempero... sabemos também, que não adianta pegar a
colher e tirar apenas um pouco do líquido que está em cima, pois, nesse caso teríamos apenas o suficiente
para saber se o tempero está bom, mas não para saber se o feijão está cozido, temos que misturar o conteúdo
da panela e pegar uma colher que contenha um pouco dos grão e do caldo, para podermos ter uma ideia mais
completa sobre o sabor e ponto do feijão.
Na amostragem, vamos definir quem é a população de interesse (no caso acima o conteúdo da panela de
feijão) e qual a melhor maneira de remover uma pequena parte dessa população (amostra) de maneira a
poder tirar informações confiáveis sobre a população utilizando o que foi observado na amostra.
Não iremos nos aprofundarmos em como planejar e conduzir uma amostragem da maneira adequada. O
objetivo é entender o conceito de amostragem e saber reconhecer alguns dos tipos de amostras mais comuns
a fim de entender as metodologias utilizadas em artigos e pesquisas de interesse, sendo capaz de ter uma
visão crítica do que foi feito.
8.1.1. Terminologia Básica
Abaixo são dadas as definições de alguns termos fundamentais para a compreensão das técnicas mais
comumente utilizadas em amostragem:
 População-Alvo:
o População que se deseja descrever.
 População de Estudo:
o Subconjunto da população-alvo, do qual as amostras serão selecionadas.
131
 Sistema de referência:
o Lista dos elementos pertencentes à população de estudo.
 Amostra:
o Todo o subconjunto não vazio e com um número menor de elementos do que o conjunto
definido como população.
 Unidade Amostral:
o Cada elemento contido na amostra.
Exemplo: Considere que é de interesse estudar a proporção de alunos do ensino médio de Juiz de Fora que
pretendem fazer vestibular. Suponha, também, que a verba da pesquisa seja suficiente para coletar
informação de uma amostra de 250 alunos.
 População-Alvo: Todos os alunos matriculados no ensino médio na cidade de Juiz de Fora no ano da
pesquisa.
o Vamos assumir que no ano em questão temos aproximadamente 20.000 alunos de ensino
médio matriculados em Juiz de Fora, divididos entre:
 34 escolas estaduais;
 28 escolas privadas;
 2 escolas federais.
 População de Estudo: Nesse caso, temos acesso à informação da matrícula de todos os elementos da
população, sendo assim, a população de estudo é igual à população-alvo.
 Sistema de Referência: Lista contendo o nome de todos os alunos matriculados no ensino médio no
período da pesquisa.
8.2. Maneiras de Selecionar Amostras
Será descrito abaixo, de maneira superficial, os métodos mais comuns de amostragem.
8.2.1. Amostragem Aleatória Simples
O que define uma amostra aleatória simples é o fato de todos os elementos da população terem a mesma
chance de serem selecionados para a amostra e a metodologia para a obtenção da amostra consiste em listar,
ou numerar todos os elementos da população e sortear elementos ao acaso até que a amostra alcance o
tamanho desejado.
Vamos considerar o mesmo exemplo usado anteriormente:
pretendem fazer vestibular. Suponha, também, que a verba da pesquisa é suficiente para coletar informação
de uma amostra de 250 alunos.
A fim de retirar uma amostra aleatória simples, de tamanho 250, nesse caso, basta numerar cada elemento
do sistema de referência de 1 a 20.000 (lista contendo o nome de todos os alunos matriculados no ensino
médio no período da pesquisa) e sortear aleatoriamente 250 números entre 1 e 20.000 sem reposição. Dessa
maneira todos os alunos listados mantêm a mesma probabilidade de serem sorteados e de participarem da
amostra.
132
Os 250 números sorteados aleatoriamente devem ser, então, relacionados aos alunos no sistema de
referência, formando a amostra com 250 alunos selecionados segundo o método de amostragem aleatória
simples.
Figura 49: Metodologia para a seleção de uma amostra aleatória simples.
8.2.2. Amostragem Sistemática
A amostragem sistemática difere da simples, por fazer o sorteio da amostra seguindo um sistema. Esse tipo
de amostragem é indicado em casos de amostras que, se igualmente espalhadas na população, trouxerem
informações mais confiáveis.
A fim de entender melhor essa ideia, vamos imaginar que desejamos saber como está a condição de rodagem
na BR-040 que é uma rodovia federal com 1.179km de extensão, ligando Brasília ao Rio de Janeiro. Digamos
que serão analisados 150 km dessa rodovia, serão verificados a condição do acostamento, se é trecho de pista
única ou dupla, existência ou não de buracos, trecho com ou sem radar, limite de velocidade, pista sinuosa ou
não, entre outros. Aproximadamente 830km da BR-040 estão em Minas Gerais, caso fosse feita a amostragem
dos 150km a serem observados de maneira totalmente aleatória, poderia ocorrer desses 150km serem
selecionados de maneira a cobrirem parte dos 349km da rodovia que se dividem entre os Estados do Rio de
Janeiro e Goiás, ficando de fora a maior parte da rodovia que se encontra em Minas Gerais.
133
Figura 50: Imagem da BR-040.
Fonte: Google Maps (2020)
Uma maneira de amostrar 150 km de estrada de maneira a ter uma ideia melhor das condições em que ela
realmente se encontra, seria impor um sistema de sorteio que fizesse com que esses km se espalhassem
igualmente pela extensão completa da rodovia. Isso pode ser feito se seguirmos o seguinte sistema:
Primeiro, podemos estabelecer que esses 150 km serão divididos em 150 extensões de 1 km da estrada que
serão amostradas. A fim de fazer essa amostragem de forma sistemática, podemos pensar na estrada como
sendo a junção de 1.179 extensões de 1 km, e que serão amostradas 150 dessas 1.179 partes de maneira
sistemática:
 Primeiramente, dividimos a rodovia BR-040 em 1.179 pedaços de 1 km de extensão cada, e os
Em seguida, é necessário encontrar um valor º = 1.179#150 = 7,86 ≅ 8;

numeramos de 1 a 1.179;
A próxima etapa é sortear um valor entre 1 e º (no nosso caso, entre 1 e 8) de maneira completamente


aleatória: utilizando o software R, foi sorteado o valor 2;
amostrados, serão os provenientes da função: 2 + × 8, com 1 ≤ ≤ 147

 Dessa maneira, o primeiro km da amostra é o km anteriormente numerado como 2, os próximos km
 Teremos, então, os seguintes km pertencentes à amostra: 2; 10; 18; 26; ...; 1162; 1170; 1178.
Totalizando uma amostra de 148 km da BR-040.
utilizamos uma aproximação para chegar no valor º, se não fosse necessário fazer a aproximação, chegaríamos
OBS: Foi obtida uma amostra de 148 km, e não uma de 150 km, como tínhamos proposto, isso ocorre pois
134
ao tamanho proposto para a amostra. Se o arredondamento tivesse sido para 7, ao invés de 8, teríamos uma
amostra de 169 km.
Podemos resumir o método de amostra sistemática da seguinte maneira:
Considerando Ç elementos na população, e o objetivo de amostrar elementos.

Utiliza-se o valor º = Ç/ (valor inteiro mais próximo);

+ º, com

pertencente aos naturais e sendo um número sorteado entre 1 e º.

 Faz-se a seleção dos elementos em uma lista selecionando aqueles nas posições
8.2.3. Amostragem Estratificada
A amostragem estratificada, é utilizada quando se acredita que a população não seja homogênea. Se
tomarmos, como exemplo a população de alunos do ensino médio utilizada na seção 8.1.1. (página 131):
pretendem fazer vestibular. Suponha, também, que a verba da pesquisa é suficiente para coletar informação
de uma amostra de 250 alunos.
 População-Alvo: Todos os alunos matriculados no ensino médio na cidade de Juiz de Fora no ano da
pesquisa.
o Vamos assumir que no ano em questão temos aproximadamente 20.000 alunos de ensino
médio matriculados em Juiz de Fora, divididos entre:
 34 escolas estaduais;
 28 escolas privadas;
 2 escolas federais.
Vimos como obter uma amostra aleatória simples dessa população, esse tipo de amostragem, no entanto,
pode não ser o mais indicado nesse caso, já que faz sentido imaginar que alunos matriculados em escolas
estaduais podem não apresentar a mesma propensão a prestar vestibular que os alunos do ensino privado.
Faz sentido pensar que o objetivo de prestar vestibular pode variar dependendo da instituição em que o aluno
está matriculado.
Nesse caso, seria mais indicado dividir a população em 3 estratos: 1- alunos matriculados em escolas estaduais
(10.352 alunos); 2- alunos matriculados em escolas privadas (8.750 alunos); e 3- alunos matriculados em
escolas federais (625 alunos).
A fim de obter uma amostra final que represente esses 3 estratos, devemos retirar amostras aleatórias simples
independentes de cada estrato e, em seguida, unir as 3 amostras obtidas para obter a amostra final da
população alvo.
Abaixo podemos visualizar um esquema de como essa amostra poderia ser retirada da população:
 Inicialmente, criam-se três sistemas de referência, uma para cada estrato:

o 1- alunos matriculados em escolas estaduais.
o 2- alunos matriculados em escolas privadas.
o 3- alunos matriculados em escolas federais.
135
o É importante ressaltar que esses 3 sistemas de referência, quando unidos DEVEM CONTER
TODOS OS 20.000 ALUNOS DA POPULAÇÃO, de maneira que CADA UM DELES APAREÇA UMA
ÚNICA VEZ.
 Em seguida, realizam-se 3 sorteios aleatórios independentes. No nosso exemplo temos:
o Sorteio 1: retiram-se aleatoriamente e sem reposição 125 números entre 1 e 10.625 para
serem relacionados com os números dados aos alunos no sistema de referência 1.
o Sorteio 2: retiram-se aleatoriamente e sem reposição 75 números entre 1 e 8.750 para serem
relacionados com os números dados aos alunos no sistema de referência 2.
o Sorteio 3: retiram-se aleatoriamente e sem reposição 50 números entre 1 e 625 para serem
relacionados com os números dados aos alunos no sistema de referência 3.
estratificada de tamanho 125 + 75 + 50 = 250.

 Finalmente, deve-se unir as 3 amostras aleatórias simples obtidas e formar uma amostra aleatória
Figura 51:Metodologia para a seleção de uma amostra aleatória estratificada.
OBS: O termo estrato simboliza divisões entre elementos, como sexo, classe social, naturalidade, idade,
entre outras.
8.2.4. Amostragem por Conglomerado
A amostragem por conglomerado considera uma amostra de conglomerados (prédios, escolas, hospitais, ...)
dentre todos os existentes na população:
 Estuda todos os elementos dentro de cada conglomerado selecionado (um estágio);

 Ou amostra parte dos elementos dos conglomerados selecionados (dois estágios).
136
Vamos considerar, novamente o exemplo dos 20.000 alunos do ensino médio em Juiz de Fora. Para fazer uma
amostra por conglomerado em um estágio nesse caso, poderíamos seguir a seguinte metodologia:
 Primeiro, teríamos que fazer um sistema de referência para as 64 escolas de ensino médio de Juiz de
Fora (34 Estaduais + 28 Privadas + 2 Federais).
 Depois, sortear aleatoriamente um número entre 1 e 64.
o Usando o software R, foi sorteado o número 41.
 Deve-se, então, relacionar o número 41 com a escola relativa no sistema de referência, e amostrar
todos os alunos matriculados nessa escola.
Figura 52: Esquema de amostragem por conglomerado em um estágio.
Para fazer uma amostragem por conglomerado em dois estágios, poderíamos seguir o seguinte esquema:
 Dividir as 64 escolas de ensino médio de Juiz de Fora em 3 estratos:

o Estrato 1: 34 escolas estaduais;
o Estrato 2: 28 escolas privadas;
o Estrato 3: 2 escolas federais.
 Definir 3 sistemas de referência, um para cada estrato;
 Conduzir 3 sorteios aleatórios independentes:
o Sorteio 1: 2 números entre 1 e 34 sorteados aleatoriamente e sem reposição: 13 e 14 (por
exemplo);
o Sorteio 2: 2 números entre 1 e 28 sorteados aleatoriamente e sem reposição: 17 e 24 (por
exemplo);
o Sorteio 3: 1 número entre 1 e 2 sorteado aleatoriamente: 1 (por exemplo).
 Obter 5 listas de referência contendo os alunos matriculados no ensino médio, uma para cada escola
sorteada;
137
 Conduzir 5 sorteios aleatórios independentes, cada sorteio resultando em uma amostra de 50 alunos
de cada escola.
 Unir as 5 amostras aleatórias independentes (com 50 alunos cada) para obter a amostra aleatória
por conglomerado em 2 estágios de tamanho 250.
Figura 53: Esquema de amostra por conglomerado em dois estágios.
8.2.5. Amostragem Viesada ou Tendenciosa
Os métodos de amostragem apresentados até agora (simples, sistemática, estratificada e conglomerado) são
chamadas de probabilísticas, ou seja, sabe-se qual a probabilidade de inclusão das unidades amostrais.
138
Existem outros métodos de amostragem que não são probabilísticos, métodos que tendem a representar
apenas parte de uma população, e não sua totalidade.
Alguns métodos de amostragem não probabilísticas são: amostras de conveniência ou amostras constituídas
de voluntários.
O fato de uma amostra ser não probabilística não é necessariamente por falta de conhecimento, ou de técnica
do pesquisador, em alguns casos pode não ser possível fazer um sistema de referência e retirar uma amostra
dentro dos moldes apresentados anteriormente.
Um caso em que não é possível observar amostras probabilísticas é quando existe o viés de sobrevivência.
Para aqueles que quiserem ver um pouco sobre viés de sobrevivência, indico acessarem:
 https://hypescience.com/vies-de-sobrevivencia/
 https://medium.com/@renato.cleite/vies-de-sobrevivencia-em-ux-612fc49137a
Duas matérias que sumarizam alguns problemas que foram resolvidos utilizando a boa interpretação de
amostras viesadas.
9. Inferência Estatística
Definimos, anteriormente, a inferência estatística como sendo um conjunto de técnicas e metodologias que
permitem a extrapolação relativa à uma população das informações obtidas de sua amostra.
Nesta seção iremos estudar um pouco mais detalhadamente algumas das técnicas e metodologias utilizadas
na inferência. Novamente, essa apostila visa fornecer um letramento estatístico, não iremos fornecer
explicações teóricas, mas apresentar algumas aplicações e fornecer informações suficientes para a
compreensão do funcionamento da técnica e permitir a interpretação conceitual dos resultados encontrados.
9.1. Terminologia Básica
É preciso conhecer alguns termos para podermos entender os conceitos e metodologias da inferência
estatística, os termos mais importantes para o nosso curso são:
usualmente representadas por letras gregas tais como ü, m e n, entre outras.

 Parâmetro: Quantidades da população, em geral desconhecidas, sobre as quais temos interesse,
 Estimador: Combinação dos elementos da amostra, construída com a finalidade de representar, ou
com o acento circunflexo: üý, m̂ , n, etc.

estimar, um parâmetro de interesse na população. Em geral, denotamos os estimadores por símbolos
 Estimativa: Valores numéricos assumidos pelos estimadores.
Vamos utilizar um exemplo para tentar entender um pouco melhor o que são parâmetros, estimadores e
estimativas.
Exemplo: Vamos considerar o conjunto de dados relativos aos pesos obtido em entrevistas com 898 alunos da
UFJF. Foram feitas diversas perguntas com o intuito de conhecer melhor o perfil dos alunos da UFJF, e saber
como eles se sentem sobre o próprio corpo e se desejam se submeter a cirurgia plástica. Algumas das variáveis
coletadas foram: Área de Estudo; Idade; Peso, Altura; Índice de Massa Corporal (IMC); e Nível de Depressão.
Com o objetivo puramente ilustrativo, considere que esses 898 alunos componham nossa população alvo.
139
Nesse caso conhecemos a média e variância da variável de interesse peso (kg) para toda a população
(parâmetros de interesse).
m = 63,42 kg
n 3 = 156,03 kg²

n = 12,49 kg


Vamos retirar 5 amostras aleatórias de tamanho 30 dessa população utilizando o software R, anotar os
resultados obtidos para a variável peso e obter duas estimativas para a média de peso, utilizando como
estimadores a média amostral e a mediana amostral.
 Amostra 1: (58,8; 61; 78; 55; 55; 61; 91; 67; 56; 70; 52; 45; 56; 53; 60; 86; 95; 53; 50; 66; 60; 50; 63;
o m̂ = 1̅ = 60,73 kg; ou
53; 53; 49; 48; 56; 71; 50)
o m̂ 3 = 89 = 56 kg
 Amostra 2: (67; 72; 72; 47; 78; 62; 48; 78; 58; 93; 51; 54; 76; 60; 52; 66; 58; 55; 70; 80; 81; 75; 58; 69;
o m̂ 4 = 1̅ 3 = 65,53 kg; ou
61; 60; 63; 75; 49; 78)
o m̂ Q = 893 = 64,5 kg
 Amostra 3: (53; 80; 60; 55; 62; 76; 88; 48; 59; 43; 50; 76; 78; 51; 73; 72; 78; 45; 59; 63; 64; 73; 49; 50;
o m̂ V = 1̅ 4 = 64,35 kg; ou
58; 54; 64 58; 57; 72)
o m̂ = 894 = 62,5 kg
 Amostra 4: (59; 57; 51,5; 95; 100; 77; 76; 65; 67; 54; 63; 75; 61; 57; 65; 59; 68; 58; 55; 73; 85; 66; 43;
o m̂ R = 1̅ Q = 63,47 kg; ou
65; 47; 48; 78; 62; 54; 47)
o m̂ = 89Q = 61 kg
 Amostra 5: (87; 70; 51; 60; 56; 52; 52; 71; 93; 74; 80; 63; 59; 64; 53; 45; 67; 85; 50; 73; 60; 61; 56; 57;
o m̂ S = 1̅ V = 63,42 kg; ou
64; 52; 63; 52; 73; 61)
o m̂ T = 89V = 61 kg
Nesse exemplo, conhecemos o parâmetro que estamos tentando estimar (m = 63,42 kg), retiramos 5
mediana) a cada uma das amostras, obtendo 10 estimativas para m apresentadas abaixo:
amostras aleatórias independentes de tamanho 30 da população alvo, aplicamos dois estimadores (média e
Tabela 39: Resumo dos estimadores e estimativas obtidas nas 5 amostras, ordenadas da menor para a maior.
Estimador
mediana amostral média amostral
Amostras 1 5 4 3 2 1 5 4 3 2
Estimativas 56 61 61 62,5 64,5 60,73 63,42 63,47 64,35 65,53
Parâmetro 63,42
Algumas informações interessantes são:
 Pode-se notar que o estimador fornecido pela mediana subestimou o parâmetro em 4 das 5 amostras;
140
 O estimador fornecido pela média amostral superestimou o parâmetro em 3 das 5 amostras,
chegando ao valor exato para a amostra 2 e subestimando o parâmetro na amostra 1.
Se nós continuássemos sorteando amostras aleatórias e obtendo mais estimativas, perceberíamos que elas
girariam em torno do parâmetro de interesse, porém, dificilmente seriam idênticas a ele. O que nos leva à
pergunta: Qual estimador utilizar?
9.2. Propriedades de um Estimador
Quando estamos trabalhando com inferência estatística, temos que lembrar que o interesse é tirar conclusões
confiáveis sobre uma população com base em algum parâmetro desconhecido e que pretendemos estimar.
Sendo assim, a escolha do estimador desse parâmetro é de extrema importância, se escolhemos um bom
estimador teremos mais confiança no nosso resultado, se escolhermos um estimador ruim, teremos pouca
confiança nos resultados.
Uma forma de fazer a escolha de um bom estimador é verificar as propriedades desse estimador, selecionando
aquele que tem as propriedades desejadas.
Algumas das propriedades que devem ser verificadas são:
 Vício: Um estimador üý é não viciado ou não viesado para um parâmetro ü se ¥¼üýÀ = ü. Ou seja, um
Consistência: Um estimador üý é consistente, se, à medida que o tamanho da amostra aumenta, seu
estimador é não viciado se o seu valor esperado coincide com o parâmetro de interesse.

o lim ¥¼üýÀ = ü;
valor esperado converge para o parâmetro de interesse e sua variância converge para zero:
→Ý
lim r \¼üýÀ = 0
→Ý
Eficiência: Dados dois estimadores üý e üý3 , não viciados para um parâmetro ü, dizemos que üý é mais
o
eficiente do que üý3 se r \¼üý À < r \¼üý3 À


Alguns dos parâmetros de interesse mais comuns são a média, a proporção e a variância. Os estimadores mais
utilizados em trabalhos que buscam fazer inferências sobre esses parâmetros são:
Quadro 5: Propriedades de alguns dos estimadores mais comuns.
Parâmetro Estimador Propriedades
` + `3 + ⋯ + `
m ƒ̀ = Não viciado e
\[‡^ê 8K_a\ b K8 \ a[\í_a

consistente
] ]̂ =
Não viciado e
1
consistente
n3 -3 = (` − ƒ̀ )3
−1
Não viciado e
"
consistente
novamente, considerando os 898 alunos como sendo a população de interesse e a média m = 63,42 kg como
Vamos utilizar novamente o exemplo da variável peso no caso do estudo que observou 898 alunos da UFJF,
o parâmetro de interesse.
141
Utilizando o software R foram obtidas 50 amostras independentes de tamanho 50 dessa população, abaixo
serão apresentadas as médias amostrais obtidas para essas 50 amostras independentes:
Tabela 40: Valores das médias estimados para as 50 amostras obtidas, ordenados do menor para o maior.
59.170 59.550 60.760 60.902 61.250 61.460 61.540 61.660 61.860 61.940
62.000 62.306 62.370 62.830 62.866 62.896 62.956 62.990 63.110 63.120
63.130 63.140 63.180 63.190 63.200 63.230 63.316 63.416 63.416 63.508
63.646 63.690 63.836 64.010 64.038 64.080 64.110 64.170 64.390 64.420
64.680 64.740 64.796 64.830 64.860 65.890 66.070 66.490 66.510 66.980
Pelo quadro 5, sabemos que a média é um estimador não viesado e consistente, e podemos ver (pela tabela
40) que os valores das estimativas obtidas pela média amostral variaram de 59,17 kg a 66,98 kg, mas ao fazer
a média das 50 estimativas encontradas por esse estimador chegamos ao valor 63,33 kg que se aproxima
consistência do estimador (_ 3 = 2,67 kg²) o que resulta nas estimativas apresentarem um coeficiente de
bastante do valor do parâmetro (63,42 kg). A variância das estimativas encontradas também demostra a
variação de 2,58% que é um indicativo de que as estimativas obtidas são robustas.
9.3. Distribuição Amostral
Como vimos nas últimas duas seções, estimadores são funções de variáveis aleatórias, ou seja, eles também
são variáveis aleatórias, basta notar que para amostras distintas obtivemos estimativas distintas, utilizando
um mesmo estimador.
Existem diversas distribuições amostrais, uma para cada estimador. Iremos estudar nesta apostila a
distribuição de probabilidade de um dos estimadores mais utilizados: a média amostral.
9.3.1. Distribuição Amostral da Média
UFJF: Considere ` como a variável aleatória que representa o peso (em kg) dos 898 alunos da UFJF que
Para entender melhor a ideia da distribuição da média amostral, vamos voltar ao exemplo dos 898 alunos da
consideramos como nossa população alvo na seção 9.1. (página 139).
Sabemos que ` tem média igual a 63,42 kg e variância igual a 156,03 kg². Vimos, ao retirar 50 amostras dessa
podemos considerar as médias obtidas como uma nova variável aleatória ƒ̀ .

população (tabela 40) que foram obtidas 50 estimativas distintas para a média populacional. Sendo assim,
Temos o interesse em conhecer a distribuição dessa nova variável ƒ̀ a fim de podermos tirar uma informação
confiável sobre a média populacional tendo um valor da média amostral (ƒ̀ ) como base.
Utilizei, mais uma vez, o software R para obter 150 amostras aleatórias retiradas da população de 898 alunos,
de maneira que 50 amostras possuíssem apenas 5 elementos cada, 50 amostras possuíssem 50 elementos
cada e as outras 50 amostras possuíssem 100 elementos cada. Podemos ver as densidades das médias
amostrais obtidas (separadas por tamanho da amostra) na figura abaixo.
142
Figura 54: Densidades sobrepostas das distribuições das médias obtidas para as 50 amostras de tamanho 5 (azul), das 50 amostras
de tamanho 50 (vermelho), e das 50 amostras de tamanho 100 (amarelo).
Observando a figura 54, fica claro que a dispersão entre as médias obtidas para as amostras de tamanho 5 é
bem maior do que a dispersão para as médias obtidas para as amostras de tamanho 50, e a dispersão entre
as médias obtidas para as amostras de tamanho 100 é a menor observada.
9.3.2. Teorema Central do Limite
Suponha uma amostra aleatória simples de tamanho retirada de uma população com média m e variância
n 3 (note que a distribuição de probabilidade da variável aleatória não é especificada). Representando tal
amostra por variáveis aleatórias independentes (` , `3 , … , ` ) e, denotando sua média por ƒ̀ , temos que:
ƒ̀ − m →Ý
n ⎯⎯ ù
#
√
Com ù~Ç(0,1).
O Teorema Central do Limite garante que para suficientemente grande (maior ou igual a 30) a distribuição
da média amostral, devidamente padronizada, segue uma distribuição Normal Padrão, permitindo o estudo
da média amostral probabilisticamente.
população alvo, sabemos que a m = 63,42 kg e n 3 = 156,03 kg². Tiramos 50 amostras independentes de
Vamos, novamente, imaginar que o grupo de 898 estudantes da UFJF entrevistados constituam a nossa
tamanho 50 deve se comportar de acordo com a distribuição normal com média igual a m = 63,42 kg e
tamanho 50 dessa população, segundo o teorema central do limite, a média amostral, para amostras de
143
variância igual à n # = 156,03#50 = 3,1206 kg². Vamos observar se as amostras retiradas anteriormente
3
se encaixam nesse perfil.
Figura 55: Densidade de uma distribuição normal com média 63,24 e variância igual a 3,1206 e a densidade observada para a média
amostral das 50 amostras independentes de tamanho 50 obtidas pelo software R.
A figura 55 nos mostra a densidade teórica (em preto) e a densidade observada (em vermelho) a ideia do
teorema central do limite, é permitir que a densidade real seja aproximada pela densidade teórica, é sabido
que o que é encontrado na realidade não segue perfeitamente os modelos teóricos, porém, temos que os
modelos teóricos, quando utilizados da maneira correta, representam uma aproximação boa o suficiente para
que possamos utilizá-los como base de inferência da realidade. As curvas: preta e vermelha; não são idênticas,
mas são próximas o suficiente para utilizarmos a preta como uma aproximação da realidade, a utilizarmos
para fazer inferência sobre a população tendo uma ideia do erro relacionado a essa inferência.
9.3.3. Distribuição da Proporção Amostral
Suponha que ] represente a proporção de indivíduos com determinada característica em uma população
(valor desconhecido) e ]̂ represente o estimador dessa proporção, considerando uma amostra de tamanho ,
dado por:
ú8[\K 9[ 9 y. 8K_a\ K8 9 9 \ a[\í_a

]̂ =
Vimos no quadro 5 que esse estimador é não viesado e consistente, sabe-se que:
144
](1 − ])
¥(]̂ ) = ] e r \(]̂ ) =
Considerando o Teorema Central do Limite, tem-se que (para ≥ 30):
]̂ − ] →Ý
⎯⎯ Ç(0,1)
](1 − ])
Mais uma vez, vamos tentar entender melhor essa distribuição utilizando o exemplo dos 898 alunos da UFJF
como sendo nossa população de estudo. Vamos considerar o IMC como sendo a variável de interesse nesse
caso, e que queremos saber qual porcentagem da população está com IMC entre 18,5 e 25 (peso normal –
quadro 6).
Quadro 6: Significado dos valores de IMC.
IMC Significado
menor que 17 muito abaixo do peso (queda de cabelo, infertilidade, ausência menstrual)
[17 ; 18,5) abaixo do peso (fadiga, stress, ansiedade)
[18,5 ; 25) peso normal (menor risco de doenças cardíacas e vasculares)
[25 ; 30) acima do peso (fadiga, má circulação, varizes)
[30 ; 35) obesidade grau 1 (diabetes, angina, infarto, aterosclerose)
[35 ; 40) obesidade grau 2 (apneia do sono, falta de ar)
maior que 40 obesidade grau 3 (refluxo, dificuldade para se mover, escaras, diabetes, infarto, avc)
Para tal, vamos sortear aleatoriamente 50 amostras de tamanho 50 da população alvo (898 alunos
pela distribuição normal com média 0,7661 e variância 0,7661 × 0,2339#50 = 0,0036 (valores obtidos da
entrevistados) e verificar (assim como fizemos para a média amostral) se a proporção amostral é bem ajustada
população).
Primeiro, vamos dar uma olhada nas proporções de alunos dentro do peso normal observadas nas 50
amostras:
Tabela 41: Proporções estimadas organizadas da menor para a maior.
0.66 0.68 0.68 0.68 0.68 0.70 0.72 0.72 0.72 0.72
0.72 0.72 0.72 0.74 0.74 0.74 0.74 0.74 0.74 0.74
0.76 0.76 0.76 0.76 0.76 0.76 0.76 0.76 0.78 0.78
0.78 0.78 0.80 0.80 0.80 0.80 0.80 0.80 0.80 0.80
0.82 0.84 0.84 0.84 0.84 0.84 0.86 0.86 0.86 0.88
Observando os dados da tabela 20, podemos ver que a menor proporção observada foi de 66% e a maior foi
de 88%, unindo todas estimativas, temos uma média de 0,7676 e uma variância de 0,0029. Vamos colocar as
densidades da distribuição teórica e da distribuição observada para ver o quanto elas se assemelham:
145
Figura 56: Densidade de uma distribuição normal com média 0,7676 e variância igual a 0,0029 e a densidade observada para a
proporção amostral das 50 amostras independentes de tamanho 50 obtidas pelo software R.
A figura 56 nos mostra que a densidade teórica (em preto) se ajusta muito bem à densidade observada (em
vermelho), fornecendo um bom exemplo do quão útil a distribuição de probabilidade normal é para a
inferência estatística, fornecendo um meio de tirar conclusões sobre um parâmetro populacional, tendo como
base um valor retirado de uma pequena parte dessa população.
9.3.4. Exercícios Resolvidos
Exercício 1- Uma variável ` tem média 5,5 e variância 4. Uma amostra com 40 observações é sorteada. Qual
a probabilidade da média amostral superar o valor 5?
Queremos calcular ¶( ƒ̀ > 5), usando o teorema central do limite, temos que: ƒ̀ ~Ç ;5,5 ; =, já que = 40
Q
QT
probabilidade desejada, podemos reescrever a distribuição de ƒ̀ da seguinte maneira: ƒ̀ ~Ç(5,5 ; 0,323 ).

pode ser considerado como grande o suficiente para a aplicação do teorema. Para facilitar o cálculo da
Conhecendo a média (5,5) e o desvio padrão (0,32) da distribuição de ƒ̀ , podemos relacionar essa variável
com a variável normal padrão e encontrar a probabilidade desejada:
5 − 5,5
¶( ƒ̀ > 5) = ¶ ìù > í = ¶ (ù > −1,56)
0,32
146
Fonte: Anexos (tabela 49, página 218)
Logo, observando a probabilidade marcada em azul na figura 57, temos:
¶ ( ƒ̀ > 5) = ¶ (ù > −1,56) = 1 − ¶ (ù ≤ −1,56) = 1 − ¶ (ù ≥ 1,56) = 1 − 0,0594 = ,, 0+,(
Exercício 2- Suponha que a proporção de peças fora de especificação em um lote é de 40%. Tomada uma
amostra de tamanho 30, qual a probabilidade dessa amostra fornecer uma proporção de peças defeituosas
menor que 0,50?
Queremos encontrar: ¶ (]̂ < 0,5), com as informações passadas pelo enunciado, podemos utilizar o Teorema
Central do Limite para definir a distribuição de ]̂ :
0,4 × (1 − 0,4)
] = 0,4 ; = 30 ⟹ ]̂ ~Ç ì0,4 ; í ⟹ ]̂ ~Ç(0,4 ; 0,0893 )
30
0,5 − 0,4
¶(]̂ < 0,5) = ¶ ìù < í = ¶ (ù < 1,12) = 1 − ¶ (ù ≥ 1,12)
0,089
Voltando na figura 57, e observando a probabilidade marcada em vermelho, temos:
Logo, ¶ ( ƒ̀ < 0,5) = 1 − 0,1314 = 0,8686.
9.3.5. Exercícios
1- [TRIOLA, 2013] Com suas próprias palavras, descreva uma distribuição amostral.
2- [TRIOLA, 2013] O que significa dizermos que a média amostral é um estimador não viesado da média
populacional, ou que a média amostral “tende” para a média populacional?
147
3- [TRIOLA, 2013] Você deseja estimar a proporção de todos os estudantes de faculdades nos Estados
Unidos que têm o profundo bom senso de fazer um curso de estatística. Você obtém uma amostra
aleatória simples na New York University. A proporção amostral resultante é um bom estimador da
4- [TRIOLA, 2013] Amostras de tamanho = 1000 são selecionadas aleatoriamente da população do

proporção populacional? Por que sim ou por que não?
último dígito de números de telefone. Ao se encontrar a média amostral para cada amostra, qual é a
distribuição das médias amostrais?
5- [TRIOLA, 2013] As idades (anos) dos quatro presidentes dos Estados Unidos quando foram
assassinados no exercício do cargo são 56 (Lincoln), 49 (Garfield), 58 (McKinley) e 46 (Kennedy).
a) Supondo que duas das idades sejam selecionadas com reposição, liste as 16 diferentes amostras
possíveis.
b) Ache a média de cada uma das 16 amostras e, então resuma a distribuição amostral das médias
no formato de uma tabela que represente a distribuição de probabilidade.
c) Compare a média populacional com a média das médias amostrais.
d) As médias amostrais tendem para o valor da média populacional? Em geral, as médias amostrais
são bons estimadores das médias populacionais? Por que sim ou por que não?
6- [TRIOLA, 2013] Um experimento genético envolve uma população de moscas de frutas que consiste
em um macho, Mike e três fêmeas, chamadas Ana, Bárbara e Cristina. Suponha que duas moscas de
fruta sejam selecionadas aleatoriamente com reposição.
a) Depois de listar as 16 diferentes amostras possíveis, ache a proporção de fêmeas em cada
amostra e, então, use uma tabela para descrever a distribuição amostral das proporções de
fêmeas.
b) Ache a média da distribuição amostral.
c) A média da distribuição amostral (da parte b.) é igual à proporção populacional de fêmeas? A
média da distribuição amostral de proporções é sempre igual à proporção populacional?
7- [TRIOLA, 2013] Com base em dados de Pesquisa Nacional de Exame de Saúde e Nutrição, suponha que
os pesos de homens normalmente distribuídos, com média de 172 libras e desvio padrão de 29 libras.
a) Ache a probabilidade de que, se um homem individual é selecionado aleatoriamente, seu peso
seja superior a 180 libras.
b) Ache a probabilidade de que 20 homens selecionados aleatoriamente tenham peso médio
superior a 180 libras.
c) Se 20 homens têm peso superior a 180 libras, o peso total excede o limite de carga de segurança
de 3500 libras de um táxi aquático particular. Com base nos resultados anteriores, isso constitui
uma preocupação para a segurança? Por que sim ou por que não?
8- [TRIOLA, 2013] Uma gôndola de esqui, em Vail, Colorado, carrega esquiadores para o topo de uma
montanha. Ela leva um placa na qual se diz que a capacidade máxima é de 12 pessoas ou 2004 libras.
Tal capacidade será excedida se 12 pessoas tiverem pesos com uma média superior a
2004/12=167libras. Como os homens tendem a pesar mais do que as mulheres, a “pior situação”
envolve 12 passageiros que sejam todos homens. Os homens tem pesos que são normalmente
distribuídos, com média 172lb e desvio padrão de 29lb (com base em dados da Pesquisa Nacional de
Saúde).
a) Ache a probabilidade de que um homem individual, selecionado aleatoriamente, tenha peso
superior a 167 libras.
148
b) Ache a probabilidade de que 12 homens, selecionados aleatoriamente tenham um peso médio
superior a 167 libras (de modo que o peso total será maior que a capacidade máxima da gôndola,
de 2004lb).
c) A gôndola parece ter o limite do peso correto? Por que sim ou por que não?
9.4. Estimação por Intervalo
Até agora, falei apenas sobre estimadores pontuais, suas propriedades e distribuições. Já foi visto que
estimadores são variáveis aleatórias e as estimativas variam de amostra para amostra. No caso de estimativa
para proporção, por exemplo, sorteei 50 amostras distintas, as estimativas variaram de 66% a 88% o valor do
parâmetro era de 76,76%.
Levando em consideração a variação observada nas estimativas, a metodologia de sortear uma amostra
aleatória da população, utilizar um estimador e fornecer a estimativa obtida como valor final da inferência
não parece muito razoável. Parece mais razoável utilizar o conhecimento da distribuição do estimador e
associar, à estimativa, informações sobre sua precisão.
Para tal, podemos utilizar intervalos de confiança na estimação de um parâmetro desconhecido, fornecendo
um intervalo contendo valores distintos e a confiança que temos ao afirmar que o intervalo construído contém
o parâmetro desconhecido.
9.4.1. Intervalo de Confiança para a Média
para a média desconhecida m de uma população, da seguinte maneira:

Pode-se utilizar o conhecimento da distribuição da média amostral para construir um intervalo de confiança
Considere uma variável aleatória ` com média m e variância n 3 conhecida, sabemos que:
ƒ̀ − m
ù=n
#
√
Dado que ` siga uma distribuição normal ou que seja suficientemente grande (Teorema Central do Limite).
Agora, a distribuição da variável ù é a normal padrão ¼ù~Ç(0,1)À, conhecida e tabelada, utilizada como
referência para a calcular probabilidades para todas as outras variáveis aleatórias com distribuição normal
diferentes da padrão.
Sabemos, por exemplo que 95% das observações da variável aleatória ù estão entre os valores −1,96 e 1,96.
Basta olhar na tabela da distribuição normal padrão parcialmente representada na figura 58 abaixo:
149
Fonte: Anexo (tabela 49, página 218)

Podemos escrever:
P(−1,96 ≤ ù ≤ 1,96) = 1 − ¶(ù < −1,96) − ¶(ù > 1,96) = 1 − 2 × 0,025
P(−1,96 ≤ ù ≤ 1,96) = 0,95
Como ù = ô
„ƒ âó
#
√
, temos:
ƒ̀ − m
P −1,96 ≤ n ≤ 1,96 = 0,95
#
√
As propriedades da distribuição normal permitem a manipulação da desigualdade, dentro dos parênteses,
padrão da média ìn# í sem perder a veracidade da afirmação feita.

sem alterar a afirmação da probabilidade, ou seja, podemos multiplicar os termos da desigualdade pelo erro
√
n n
−1,96 ≤ ƒ̀ − m ≤ 1,96
√ √
Em seguida, pode-se subtrair a média amostral (ƒ̀) dos três termos da desigualdade:
150
n n
−1,96 − ƒ̀ ≤ −m ≤ 1,96 − ƒ̀
√ √
Por fim pode-se multiplicar os três termos da desigualdade por -1, lembrando de inverter as desigualdades:
n n
1,96 + ƒ̀ ≥ m ≥ −1,96 + ƒ̀
√ √
Ao rearranjarmos os termos da desigualdade tem-se:

n n
ƒ̀ − 1,96 ≤ m ≤ ƒ̀ + 1,96
√ √
Dessa forma, o intervalo de 95% de confiança para a média m é dado por:
n n
ìƒ̀ − 1,96 , ƒ̀ + 1,96 í
√ √
A fim de tentar entender melhor o conceito de um intervalo de confiança, pode-se imaginar que são retiradas
100 amostras independentes de uma população e 100 intervalos de 95% de confiança são construídos, cada
contenham o valor de m e que 5 deles não.

um com base em cada uma das 100 amostras independentes. Espera-se, que 95 desses intervalos de confiança
Vamos tomar como exemplo (mais uma vez) o conjunto dos 898 alunos da UFJF entrevistados como se fossem
a população alvo. Pretendemos estimar a média do peso dos 898 alunos utilizando uma amostra de tamanho
30. Agora, sabemos que o peso médio populacional é de 63,42 kg; retiramos, aleatoriamente, e
independentemente, 100 amostras de tamanho 30 da população (898 alunos) e construímos 100 intervalos
de 95% de confiança. Os resultados podem ser observados na figura 59.
151
Figura 59: Representação de 100 intervalos de 95% de confiança, obtidos para um mesmo parâmetro, a partir de 100 amostras
aleatórias de uma mesma população.
m = 63,42 º
Cada segmento horizontal presente na figura 59, representa um dos 100 intervalos de 95% de confiança, os
segmentos pretos são aqueles que contêm a verdadeira média populacional, podemos perceber que em
alguns a média está próxima ao ponto central, em outras ela está próxima aos limites. Os segmentos que estão
em vermelho não contêm o valor da verdadeira média populacional, podemos observar que são 5 segmentos
vermelhos e 95 pretos, ou seja, dos 100 intervalos estimados 5 não contém o valor que tentam estimar.
Na vida real, não é comum retirar mais de uma amostra de uma mesma população, o comum é buscar retirar
uma amostra aleatória de tamanho suficiente e representativa da população alvo. Com a informação retirada
dessa amostra pode-se construir um intervalo de confiança para a média populacional (com 95% de confiança,
por exemplo). Mas o pesquisador deve ter em mente, e deixar claro em seus resultados que existe a
possibilidade de que o intervalo construído não contenha o valor almejado.
É importante ressaltar que apesar de procurarmos tirar conclusões sobre a média populacional m, essa média
é um valor fixo, embora desconhecido, e não uma variável aleatória.
O intervalo de confiança mais comum é o que considera um nível de confiança de 95%, porém esse não é o
único, pode-se montar intervalos de confiança de qualquer tamanho, dependendo do interesse do
152
um intervalo de confiança de 100(1 − × )% para m é dada por:
pesquisador, no entanto, intervalos de menos de 90% de confiança são de pouca utilidade. A forma geral para
n n
”q (m, (1 − × )%) = ìƒ̀ − #3 . , ƒ̀ + #3 . í
√ √
O tamanho de um intervalo de confiança varia de acordo com o nível de confiança do mesmo ou de acordo
com o tamanho da amostra.
Considerando uma amostra de tamanho fixo, por exemplo, temos:
Quadro 7: Apresentação da amplitude de um intervalo de confiança, mantendo o mesmo tamanho amostral e variando o nível de
significância.
#* Limites de confiança de .,,(. − )% para

n n n
Amplitude do Intervalo
ìƒ̀ − 1,645. , ƒ̀ + 1,645. í 3,29.

√ √ √
n n n
0,1 1,645
ìƒ̀ − 1,96. , ƒ̀ + 1,96. í 3,92.

√ √ √
n n n
0,05 1,96
ìƒ̀ − 2,576. , ƒ̀ + 2,576. í 5,152.

√ √ √
0,01 2,576
Agora, considerando uma amostra com nível de significância × fixo, temos:
Quadro 8: Apresentação da amplitude de um intervalo de confiança, mantendo o mesmo nível de significância e variando o tamanho
da amostra.
‘ Limites de confiança de .,,(. − )% para

n n
Amplitude do Intervalo
ìƒ̀ − 1,96. , ƒ̀ + 1,96. í 1,239n

√10 √10
n n
0,05 10
ìƒ̀ − 1,96. , ƒ̀ + 1,96. í 0,392n

√100 √100
n n
0,05 100
ìƒ̀ − 1,96. , ƒ̀ + 1,96. í 0,124n

√1000 √1000
0,05 1000
9.4.2. Intervalo de Confiança para a Proporção
Como vimos anteriormente (seção 9.3.3., página 144) o Teorema Central do Limite também no diz que a
distribuição de probabilidade do estimador da proporção de determinada característica, quando é grande o
suficiente se aproxima de uma distribuição normal:
]̂ − ] →Ý
⎯⎯ Ç(0,1)
](1 − ])
Logo, analogamente ao que foi feito para a média, pode-se construir um intervalo de confiança para a
proporção em uma população com base na proporção amostral:
153
](1 − ]) ](1 − ])
]̂ − #3 . ,]̂ + #3 .
o parâmetro ] (parâmetro de interesse que queremos estimar). Sendo assim, são propostas as duas soluções
Infelizmente, o intervalo de confiança dado não pode ser utilizado de maneira direta, já que não conhecemos
abaixo:
Substituir ] por ]̂ (intervalo otimista):
]̂ (1 − ]̂ ) ]̂ (1 − ]̂ )
]̂ − #3 . ,]̂ + #3 .
Substituir ](1 − ]) por 1#4, valor máximo que ](1 − ]) pode alcançar (intervalo conservador):
1 1
]̂ − #3 . ,]̂ + #3 .
4 4
Exercício 1- Um provedor de acesso à internet está monitorando a duração do tempo das conexões de seus
probabilidade desse tempo, mas o desvio padrão, por analogia a outros serviços, é considerado igual a √50
clientes, com o objetivo de dimensionar seus equipamentos. São desconhecidas a média e a distribuição de
minutos. Uma amostra de 500 conexões resultou num valor médio observado de 25 minutos. O que dizer da
verdadeira média, com confiança de 92%
`: ›tempo das conexões à internet de clientes• ; m =? ; n 3 = 50 8 âK_ ; = 500
50
ƒ̀ ~Ç ìm ; í ; 1̅ = 25 ; × = 8%
500
#3 = T,T # = T,TQ =
3
Observando a probabilidade marcada em azul na figura 60, pode-se obter o valor
1,75. Sendo assim, temos todas as informações necessárias para calcular o intervalo de 92% de confiança para
a média de tempo das conexões dos clientes do provedor em questão:
50 50
”q (m, 92%) = 25 − 1,751 ; 25 + 1,751 = (24,45 ; 25,55) 8 âK_
500 500
Pode-se dizer que o intervalo encontrado contém o verdadeiro valor da média populacional com
probabilidade de 92%.
154
Exercício 2- A vida média de baterias automotivas de uma certa marca está sendo estudada. Baseado em
estudos similares, com outras marcas, é possível admitir que a vida dessas baterias segue a distribuição normal
com desvio padrão de 4,5 meses. De qual tamanho deverá ser a amostra, para que a amplitude do intervalo
de 90% de confiança para a vida média seja de 3 meses?
4,53
ƒ̀ : ›Vida média de baterias automotivas• ; =? ; ƒ̀ ~Ç m ; ; × = 10%
#3 = T, # = T,TV =
3
Observando a probabilidade marcada em vermelho na figura 60, pode-se obter o valor
1,645; já que 0,05 é o ponto médio entre 0,0505 e 0,0495, podemos calcular o valor de relativo à essa
probabilidade calculando o valor médio entre 1,64 e 1,65.
4,53 4,53
”q (m, 90%) = 1̅ − 1,645 ; 1̅ + 1,645
4,53 4,53
1̅ + 1,645 − 1̅ − 1,645 =3
155
4,53 4,53 3 20,25 20,25
2 × 1,645 =3→ = → = 0,913 → = = 24,5 ≅ 25 baterias
3,29 0,83
A amostra deverá conter 25 baterias.
Exercício 3 - Pretende-se estimar a proporção ] de cura, através do uso de um certo medicamento em doentes
contaminados com cercária, que é uma das formas do verme da esquistossomose. Um experimento consistiu
O que podemos dizer da proporção ] na população em geral, a um nível de 99% de confiança (utilize ambos
em aplicar o medicamento em 200 pacientes, escolhidos ao acaso, e observar que 160 deles foram curados.
os intervalos: otimista e conservador)? Como os dois intervalos calculados se comparam?
160
]: ›proporção de cura• ; = 200 ; ]̂ = = 0,8; × = 1%
200
#3 = T,T # = T,TTV =
3
Observando a probabilidade marcada em verde na figura 60, pode-se obter o valor
2,575;
Intervalo de 99% confiança otimista para a verdadeira proporção de cura
0,8 × 0,2 0,8 × 0,2

0,8 − 2,575 ; 0,8 + 2,575 = (0,73 ; 0,87)
200 200
Intervalo de 99% confiança pessimista para a verdadeira proporção de cura
1 1
0,8 − 2,575 ; 0,8 + 2,575 = (0,71 ; 0,89)
4 × 200 4 × 200
O intervalo de confiança pessimista, por considerar a maior variância possível, possui uma maior amplitude
com relação ao otimista.
9.4.4. Exercícios
a. Qual é o nível de confiança do intervalo ` ± 2,81n/ √ ?

1- [DEVORE, 2006] Considere a distribuição de uma população normal com valor de σ conhecido.
b. Qual é o nível de confiança do intervalo ` ± 1,44n/ √ ?
xarope para tosse seja selecionada e o teor alcoólico de cada garrafa seja determinado. Seja m o teor
2- [DEVORE, 2006] Suponha que uma amostra aleatória de 50 garrafas de uma marca especifica de
médio de álcool da população de todas as garrafas da marca em estudo. Suponha que o intervalo de
confiança de 95% resultante seja (7,8; 9,4).
a. O intervalo de confiança de 90% calculado dessa mesma amostra teria sido mais estreito ou
b. Considere a afirmação a seguir: Existe 95% de chance de m estar entre 7,8 e 9,4. Esta afirmação
mais largo que o intervalo mencionado acima? Explique seu raciocínio.
está correta? Por quê?
156
c. Considere a afirmação a seguir: Podemos estar certos de que 95% de todas as garrafas desse
tipo de xarope tem um conteúdo alcoólico que está entre 7,8 e 9,4. A afirmação está correta?
Por quê?
d. Considere a afirmação a seguir: Se o processo de seleção de uma amostra de tamanho 50 e
resultantes incluirão m. Essa afirmação está correta? Por quê?

de cálculo de intervalo de 95% correspondente for repetido 100 vezes, 95 dos intervalos
3- [DEVORE, 2006] Assuma que a porosidade do hélio (em porcentagem) das amostras de carvão tiradas
de qualquer junta especifica seja normalmente distribuída com desvio padrão real de 0,75.
a. Calcule um IC de 95% da porosidade média real de uma junta, caso a porosidade média de 20
de espécimes seja 4,85.
b. Calcule um IC de 98% de porosidade média real de outra junta com base nos 16 espécimes
com média amostral de porosidade de 4,56.
c. Quão grande o tamanho de uma amostra deve ser se a amplitude do intervalo de 95% for
0,40?
d. Que tamanho de amostra é necessário para estimar a porosidade média real dentro de 0,2
com confiança de 99%?
4- [TRIOLA, 2013] Em uma pesquisa do Pew Research Center com 745 adultos selecionados
aleatoriamente, 589 disseram ser moralmente errado não relatar toda a renda na declaração de
imposto de renda. Construa um intervalo de confiança de 95% para a porcentagem de todos os adultos
que pensam do mesmo modo e, então, escreva uma afirmativa que dê uma interpretação desse
intervalo de confiança.
5- [TRIOLA, 2013] Uma amostra aleatória de 37 pesos de moedas e um centavo feitas depois de 1983
tem média de 2,4991 g e desvio-padrão 0,0165 g. Construa um intervalo de confiança de 99% para o
peso médio de todas essas moedas de um centavo. Especificações do planejamento requerem uma
média populacional de 2,5 g. O que o intervalo de confiança sugere sobre o processo de fabricação.
6- [TRIOLA, 2013] Uma pesquisa Gallup consistiu em 1012 adultos selecionados aleatoriamente, ao quais
se perguntou se “a clonagem de humanos deveria ou não ser permitida”. Os resultados mostraram
que 901 adultos pesquisados apontaram que a clonagem não deveria ser permitida.
a. Ache a melhor estimativa pontual da proporção de adultos que acreditam que a clonagem de
humanos não deve ser permitida.
b. Construa um intervalo de confiança de 95% para a proporção de adultos que acreditam que a
clonagem de humanos não deve ser permitida.
c. Um repórter de um jornal deseja determinar se os resultados da pesquisa constituem uma
forte evidência que a maioria (50%) das pessoas se opõe a tal clonagem. Com base nos
resultados, há evidência forte apoie a afirmativa de que a maioria se opõe a tal clonagem? Por
que sim ou por que não?
7- [TRIOLA, 2013] Quantos adultos devem ser selecionados aleatoriamente para se estimar o escore
médio FICO (classificação de crédito) de adultos trabalhadores nos Estados Unidos? O desvio padrão
populacional é 68 e desejamos 95% de confiança em que a média amostral esteja a até 3 pontos da
média populacional.
8- [TRIOLA, 2013] Quantas quantidades diárias de chuva em Boston devem ser selecionadas para estimar
a quantidade diária média de chuva? O desvio-padrão populacional é 0,212 polegada e desejamos
99% de confiança em que a média amostral esteja a até 0,010 polegada da média populacional.
9- [TRIOLA, 2013] Uma amostra aleatória simples de 125 escores SAT tem média de 1522. Suponha que
os escores SAT tenham um desvio-padrão de 333.
157
a. Construa um intervalo de confiança de 95% para o escore SAT médio.
b. Construa um intervalo de confiança de 99% para o escore SAT médio.
c. Qual dos intervalos anteriores é maior? Por quê?
10- [TRIOLA, 2013] Quando 14 estudantes de segundo ano do curso de medicina, no Hospital Bellevue,
mediram a pressão sanguínea da mesma pessoa, obtiveram os resultados listados a seguir. Supondo
que o desvio-padrão da população seja conhecido e igual a 10 mmHg, construa um intervalo de
confiança de 95% para a média populacional. Idealmente, qual deveria ser o intervalo de confiança
nessa situação?
138 130 135 140 120 125 120
130 130 144 143 140 130 150
11- [TRIOLA, 2013] O teste Weschler de QI é planejado de modo que a média seja 100 e o desvio-padrão
seja 15 para a população de adultos normais. Ache o tamanho de amostra necessário para se estimar
o escore de QI médio de cientistas trabalhando hoje na NASA. Desejamos ter 95% de confiança em
que nossa média amostral esteja a até cinco pontos de QI do verdadeiro valor da média. A média para
essa população é claramente maior do que 100. O desvio-padrão é, provavelmente, menor do que 15,
porque é um grupo com menos variação do que um grupo selecionado aleatoriamente da população
geral; assim, se usarmos σ = 15, seremos conservadores, pois estaremos usando um valor que torna
o tamanho amostral, no mínimo, tão grande quanto necessário. Suponha σ = 15 e determine o
tamanho amostral requerido.
12- [TRIOLA, 2013] Desejamos estimar a perda média de peso de pessoas, um ano após usarem a dieta de
Atkins. Quantas pessoas que fizeram a dieta devem ser entrevistadas, se desejarmos estar 95%
confiantes em que a perda de peso média amostral esteja a até 0,25 libra da verdadeira média
populacional? Suponha que o desvio-padrão populacional seja conhecido e igual a 10,6 libras (com
base em dados de “Comparison of the Atkins, Ornish, Weight Watchers, and the Zone Diets for Weight
Loss and Heart Diseases Risk Reduction”, de Dansinger, et al., Journal of the American Medical
Association, Vol. 293, Nº 1). O tamanho amostral obtido é prático?
13- [TRIOLA, 2013] Uma chamada no jornal USA Today observou que “Os consumidores irão gastar uma
média estimada de 483 dólares em mercadorias” nas despesas de volta às aulas. Foi dito que o valor
se baseava em uma pesquisa com 8453 consumidores, e que a margem de erro era de “± 1 ponto
percentual”. O que há de errado com essa informação?
14- [TRIOLA, 2013] Uma organização nacional de pesquisas de opinião foi contratada para estimar a
quantidade média de dinheiro carregada por adultos nos Estados Unidos. O planejamento amostral
original envolvia chamadas telefônicas para 2500 números diferentes de telefone em todo o país, mas
um gerente decide economizar nas despesas de chamadas interurbanas e usa uma amostra aleatória
simples de 2500 números de telefone, todos no estado da Califórnia. Se essa amostra é usada para a
construção de um intervalo de confiança de 95% para estimar a média populacional, a estimativa será
boa? Por que sim ou por que não?
15- [WALPOLE et al., 2009] Muitos pacientes cardíacos usam marcapassos implantados para controlar os
batimentos do coração. Um módulo conector plástico é montado no topo do marcapasso. Assumindo
um desvio-padrão de 0,0015 e uma distribuição aproximadamente normal, determine um intervalo
de confiança de 95% para a média de todos os módulos conectores fabricados por certa indústria.
Uma amostra aleatória de 75 módulos tem média de 0,310 polegada.
16- [WALPOLE et al., 2009] Uma amostra aleatória de 100 proprietários de automóveis mostra que, no
estado da Virgínia (Estados Unidos), um automóvel é dirigido a uma média de 23.500 quilômetros por
158
ano, com desvio-padrão de 3.900 quilômetros. Assuma a distribuição das medidas como sendo
aproximadamente normal.
a. Construa um intervalo de confiança de 99% para o número médio de quilômetros que um
automóvel percorre anualmente no estado da Virgínia.
b. O que podemos afirmar com 99% de confiança sobre o tamanho possível de nosso erro se
estimarmos o número médio de quilômetros percorridos pelos proprietários de automóveis
como sendo 23.500 quilômetros por ano?
17- [WALPOLE et al., 2009] Qual é o tamanho da amostra necessário no Exercício 22 se desejamos estar
95% confiantes de que nossa média amostrai estará dentro de 0,0005 polegada da média verdadeira?
18- [WALPOLE et al., 2009] Em uma amostra aleatória de 1.000 casas em certa cidade, sabe-se que 228
têm aquecimento a óleo. Determine o intervalo de confiança de 99% para a proporção de casas com
aquecimento a óleo nessa cidade.
19- [WALPOLE et al., 2009] Um novo sistema de lançamento de foguetes está sendo considerado para a
implementação de foguetes pequenos e de certo alcance. O sistema existente tem p = 0,8 como
probabilidade de um lançamento bem-sucedido. Uma amostra de 40 lançamentos experimentais com
o novo sistema é realizada e 34 obtêm sucesso.
a. Construa um intervalo de confiança de 95% para p.
b. Você concluiria que o novo sistema é melhor?
9.5. Testes de Hipóteses
Chegamos, agora, na parte final da apostila. Aqui, iremos estudar sobre testes de hipóteses, uma ferramenta
muito importante na pesquisa científica.
Vamos relembrar rapidamente do método científico, discutido na seção 2.4. (página 6): Uma pesquisa
científica, tem por objetivo responder a uma pergunta. Se não houver informação prévia sobre o problema,
pode-se desejar fazer um estudo exploratório para conhecer algo ainda desconhecido, nesse caso, o que vimos
sobre intervalos de confiança pode ser o suficiente para concluirmos a pesquisa. No entanto, se já existe algum
conhecimento prévio, é comum o pesquisador ter alguma hipótese sobre o resultado que será encontrado,
nesse caso, a pesquisa é feita com o intuito de encontrar evidencias que suportem ou não a hipótese inicial.
Assim como fizemos intervalos de confiança para a média populacional e para a proporção populacional
utilizando os conhecimentos das distribuições amostrais dos estimadores da média amostral e proporção
amostral, também podemos estudar como conduzir testes de hipóteses para a média populacional e para a
proporção populacional.
Primeiro, iremos estudar mais detalhadamente como conduzir um teste de hipóteses para a média
populacional, em seguida, irei mostrar quais adaptações devem ser feitas ao trabalhar com a proporção.
9.5.1. Introdução
Para introduzir o conceito de teste de hipóteses e a nomenclatura básica necessária para o bom entendimento
e aplicação dessa técnica, utilizarei um exemplo puramente ilustrativo:
Considere uma variável aleatória `, tal que:
unidades
` = òconcentração em de determinada vitamina no sangueõ
ml
159
Vamos supor que as distribuições de ` no caso de indivíduos que tenham deficiência, a quantidade adequada
(saudáveis), ou excesso dessa vitamina no sangue sejam conhecidas, e dada por:
` ~Ç(10, 63 ) (indivíduos com deficiência da vitamina);

` ~Ç(14, 63 ) (indivíduos saudáveis);

` ~Ç(18, 63 ) (indivíduos com excesso da vitamina).



Irei descrever três situações que poderiam surgir em pesquisas relacionadas com a variável definida acima:
Situação 1: Suponha que determinada clínica tenha um grupo com 30 pacientes com deficiência da vitamina
no sangue. Todos os pacientes aceitaram tomar um suplemento vitamínico (já se sabe que é seguro) para
verificar se ele é eficaz. Faz sentido imaginar que serão observadas as quantidades de vitamina no sangue, de
cada paciente, após o tratamento com o suplemento, e que a média observada irá fornecer a base para a
conclusão sobre a eficácia do tratamento.
Figura 61: Imagem ilustrativa da situação 1.
Situação 2: Suponha que determinada clínica tenha um grupo com 30 pacientes com excesso da vitamina no
sangue. Todos os pacientes aceitaram tomar um medicamento (já se sabe que é seguro) para verificar se ele
é eficaz. O processo de decisão deve seguir o mesmo esquema da situação acima: observar as quantidades de
vitamina no sangue, de cada paciente, após o tratamento com o medicamento, obter a média observada que
fornecerá a base para a conclusão sobre a eficácia do tratamento.
160
Situação 3: Vamos supor que foi retirada uma amostra de 30 indivíduos de uma cidade, deseja-se inferir se a
população da cidade tem deficiência, excesso, ou se possui a quantidade normal da vitamina no sangue, com
base nessa amostra. Novamente, faz sentido imaginar que essas quantidades serão observadas para cada
indivíduo da amostra e que a média observada sirva como ponto de partida para tomar a decisão sobre a
saúde da população.
161
9.5.2. Hipóteses de Interesse
Ao trabalharmos com testes de hipóteses, faz-se necessário definir as hipóteses de interesse. Todo teste de
hipótese deve possuir duas hipóteses:
 Hipótese Nula (¬T ):

o Hipótese conservadora, aquela que mantém o status quo, não desafia o que já se sabe, ou o
Hipótese Alternativa (¬j ):

que foi especificado;

o Hipótese inovadora, desafia o que se é conhecido, traz uma situação ou conhecimento novo.
Nas situações que foram definidas anteriormente (seção 9.5.1.) temos as seguintes hipóteses de interesse:
o ¬T : m = 10 unidades/ml
 Situação 1:
 Pois o suplemento foi dado a pessoas com deficiência da vitamina, cuja média do
componente no sangue é 10 unidades/ml, ou seja, a hipótese conservadora é o
o ¬j : m > 10 unidades⁄ml
remédio não faz efeito.
m > 10 o suplemento teve o efeito desejado.

 O objetivo do suplemento é aumentar a quantidade de vitamina no sangue, logo, se
o ¬T : m = 18 unidades/ml
 Situação 2:
 Pois o medicamento foi dado a pessoas com excesso da vitamina, cuja média do
o ¬j : m < 18 unidades⁄ml
componente no sangue é 18 unidades/ml.
m < 18 o medicamento teve o efeito desejado

 O objetivo do medicamento é diminuir a quantidade de vitamina no sangue, logo, se
o ¬T : m = 14 unidades/ml.
 Situação 3:
o ¬j : m ≠ 14 unidades⁄ml
 Pois quando não se sabe nada sobre a população, supõe-se o normal.
 Se a população tiver deficiência da vitamina m < 14;

 Se a população tiver excesso da vitamina m > 14.
Dividimos as hipóteses de interesse em dois tipos:
 Unilaterais: Casos em que a hipótese alternativa é dada por uma única desigualdade (como ocorre nas
o ¬T : m = versus ¬j : m < , ou
situações 1 e 2).
o ¬T : m = versus ¬j : m > .
Usualmente, utiliza-se a seguinte notação para hipóteses unilaterais, sem alterar a ideia ou o conceito por trás
da hipótese nula:
¬T : m ≥ versus ¬j : m < , ou
¬T : m ≤ versus ¬j : m > .
o
o
162
 Bilaterais: Casos em que a hipótese alternativa é dada pela diferença ou por duas desigualdades (como
o ¬T : m = versus ¬j : m ≠ .
ocorre na situação 3).
9.5.3. Metodologia
Ao realizar uma pesquisa, devemos primeiro, definir a pergunta que queremos responder, depois definir as
nossas hipóteses de interesse, em seguida prosseguir com a coleta de dados e por fim analisar os dados e
buscar evidências que nos auxiliem na decisão de qual hipótese parece ser a mais compatível com a realidade.
Vamos considerar as situações passadas anteriormente, as hipóteses já estão definidas, vamos considerar que
os dados já foram coletados, vamos ver agora, como analisar esses dados de maneira a obter conclusões
confiáveis.
Vamos relembrar a nossa situação 1: temos 30 pacientes que já foram tratados com o suplemento vitamínico,
pacientes, resultando em um conjunto de 30 dados (` , `3 , … , `4T ), o próximo passo é calcular a média

amostras de sangue foram coletadas e a quantidade de vitamina no sangue foi observada para cada um dos
amostral 1̅ LMN , veremos agora, como tomar uma decisão baseada nessa média observada.
Já vimos, anteriormente, que a média amostral é uma variável aleatória, e que, portanto, seu valor varia de
amostra para amostra, faz sentido utilizar o conhecimento da distribuição amostral da média na nossa tomada
de decisão.
É aqui que vai entrar a importância das hipóteses definidas. Precisamos conhecer a média e o desvio padrão
populacional, a fim de conhecer a distribuição amostral da média. Sabemos que os pacientes tinham
deficiência de vitamina, ou seja, a quantidade de vitamina no sangue desses pacientes seguia uma distribuição
normal com média 10 unidades/ml e desvio padrão de 6 unidades/ml (definido na seção 9.5.1., página 159)
que a quantidade de sangue após o tratamento seguirá essa mesma distribuição, logo ƒ̀ ~Ç ;10 ;
antes do tratamento com o suprimento. Se o tratamento não tiver efeito (hipótese nula) faz sentido pensar
=.
J
4T
163
Figura 65: Distribuição amostral da média, se a hipótese nula for verdadeira.
A figura 65 mostra a distribuição da média amostral (após o tratamento) se o medicamento não for eficaz,
sabemos que a média amostral pode assumir qualquer valor dentro do intervalo delimitado pela curva azul,
com maior probabilidade para os valores centrais e menor probabilidade para os valores mais próximos das
caudas. A ideia é definir um valor crítico (1ª ) que delimite o quão afastado de 10 a média observada deve estar
para que a hipótese de que ele pertença a distribuição ƒ̀ ~Ç ;10 ; = seja rejeitada.
J
4T
9.5.3.1. Erros
O valor crítico (1ª ) deve ser determinado de maneira a minimizar os erros associados às possíveis conclusões.
Faz-se necessário, então, conhecer as possíveis conclusões de um teste de hipóteses:
 Rejeitar a hipótese nula; ou

 Não rejeitar a hipótese nula.
Sempre devemos relacionar as conclusões às hipóteses nulas, pois é com base nessa hipótese que
encontramos a distribuição da média amostral (como ilustrado na figura 65).
Os erros que podem ser cometidos ao se realizar um teste de hipóteses são:
 Erro de tipo I:
o Geralmente representado por ×;

o Consiste em rejeitar a hipótese nula quando ela é verdadeira;
o Em virtude de ¬T especificar um único valor do parâmetro, existe um único valor de ×.

 Erro de tipo II:
o Consiste em não rejeitar a hipótese nula quando ela é falsa;
o Geralmente representado por ;
164
Como ¬j não especifica um único valor para o parâmetro de interesse, existe um valor
diferente de para cada valor do parâmetro consistente com ¬j .
o
A fim de entender melhor a ideia de rejeitar ou não a hipótese nula e os erros relativos a essas decisões, gosto
de utilizar uma analogia com o processo criminal.
Imagine que você é um membro do júri em um julgamento. Você será informado de que o réu deve ser
considerado inocente até que se prove o contrário; ou seja, é assumida a hipótese de inocência como a
hipótese nula, apenas se houverem evidências fortes o suficiente deve-se rejeitar essa hipótese e dar o
veredito de culpado.
Figura 66: Analogia com o processo criminal.
Pode-se ver, na figura 66 que os erros são:
 Rejeitar a inocência (veredito de culpado) quando o réu é inocente; e

 Não rejeitar a inocência (veredito de inocente) quando o réu é culpado.
O consenso, é que é pior prender um inocente do que libertar um culpado, por isso a suposição de inocência
até provada a culpa. Ainda assim, sabemos que o sistema é falho e que erros ocorrem. Quando diminuímos
o erro de prender um inocente, aumentamos a probabilidade de soltar um culpado e vice-versa.
Uma parte fundamental do teste de hipóteses é controlar a probabilidade de cometermos o erro do tipo I:
Quadro 9: Erros e acertos em um teste de hipóteses.
Situação
¬T verdadeira ¬T falsa
Decisão
Rejeitar ¬T Erro Tipo I Sem Erro

Não rejeitar ¬T Sem Erro Erro Tipo II
165
Resumindo, temos:
Erro de tipo I: Rejeitar ¬T quando ¬T é verdadeira;

¶(\[‹[ a \ ¬T |¬T é y[\9 9[ \ ) = ×

Erro de tipo II: Não rejeitar ¬T quando ¬T é falsa;

¶( ãK \[‹[ a \ ¬T |¬T é b_ ) =

Vamos voltar para a situação 1, em que:
¬T : O suplemento não é eficaz, ou ¬T : m ≤ 10

¬j : O suplemento é eficaz, ou ¬j : m > 10


Nesse caso, temos as seguintes probabilidades dos erros de tipo I e de tipo II:
× = ¶(concluir que o suplemento é eficaz quando na verdade ele não é)

= ¶(concluir que o suplemento não é eficaz quando na verdade ele é)


Idealmente, teríamos × e próximos a zero, mas como podemos ver na figura 67 abaixo, conforme
diminuímos ×, aumentamos (para fazer a figura foi utilizado ¬j : m = 14, média da população saudável).
Figura 67: Representação gráfica dos erros de tipo I e II.
Fonte: elaborada pela autora.
área azul, o que significa diminuir o valor do erro de tipo I (× ), porém, ao mesmo tempo que diminuiríamos
O que a figura 67 nos mostra, é que (nesse caso específico) se eu aumentar o valor crítico, iremos diminuir a
a área azul, a área laranja aumentaria, ou seja, o erro de tipo II ( ) aumentaria.
A situação 1 representa um teste de hipóteses unilateral, o que aconteceria se tivéssemos um teste de

hipóteses bilateral?
166
Vamos relembrar da situação 3 (detalhada na seção 9.5.1., página 159) cujas hipóteses foram definidas na
seção 9.5.2., página 162):
¬T : m = 14
¬j : m ≠ 14


Nesse caso, temos as seguintes probabilidades dos erros de tipo I e de tipo II:
 × = ¶(concluir que a população é saudável quando na realidade ela não o é: pode ter tanto excesso
= ¶(concluir que a população não é saudável (pode ter tanto excesso quanto deficiência da
quanto deficiência da vitamina no sangue)

vitamina no sangue) quando na realidade ela é saudável)
Idealmente, teríamos × e próximos a zero, mas como podemos ver na figura abaixo, conforme diminuímos
×, aumentamos (para fazer a figura foi utilizado ¬j : m = 10 ou m = 18, média da população com
deficiência e com excesso da vitamina no sangue, respectivamente).
Figura 68: Representação dos erros de tipo I e II no caso de testes bilaterais.
já que temos interesse em rejeitar ¬T tanto no caso de haver evidências de a média real ser inferior a 10,
Nesse caso, o erro de tipo um (área azul) deve ser dividido nas duas caldas da distribuição amostral da média,
quanto no caso de haver evidências de que a média é superior a 10. Da mesma forma, o erro de tipo II (área
laranja) também estará dividido, mas assim como no caso unilateral, conforme diminuímos a área do erro de
tipo 1, iremos aumentar a área do erro de tipo II.
167
9.5.3.2. Valor Crítico e Região Crítica
O valor crítico (1ª ) deve ser determinado de maneira a respeitar um erro de tipo I (× ) máximo aceito pelo
pesquisador. Esse valor crítico será utilizado para definir a Região Crítica, ou Região de Rejeição (figuras 67 e
68). A ideia é que se o valor da média amostral estiver dentro da região crítica a hipótese nula deverá ser
rejeitada. Agora, se o valor da média amostral não pertencer à região crítica, então a hipótese nula não deverá
ser rejeitada.
Logo, para encontrar 1ª , deve-se fixar o valor de ×, denominado nível de significância do teste, e utilizar o
conhecimento da distribuição de probabilidade da média amostral.
Voltemos para o exemplo dado pela situação 1, temos que ƒ̀ ~Ç ;m, 4T=, pois não sabemos qual o valor real
J
de m após a utilização do suplemento, mas sabemos que foi retirada uma amostra de tamanho 30 da
população de indivíduos com deficiência da vitamina no sangue ¼`~(10, 63 )À.
Se considerarmos ¬T como sendo verdadeira, em outras palavras, se considerarmos que após a utilização do
suplemento m = 10, teremos que ƒ̀ ~Ç ;10, 4T=, logo, × será dado por:
J
63
¶ 1 > 1ª ƒ̀ ~Ç ì10, 30í = ×
de 5% para a rejeição de ¬T .
Um nível de significância muito utilizado, é o de 5%, vamos imaginar, então, que aceitemos um erro máximo
Se voltarmos na figura 60 (página 145) veremos que ¶(ù > 1,645) = 0,05. Para encontrar o valor crítico basta
relacionar esse valor da distribuição normal padrão com a variável ƒ̀ :
1ª − m
= n
#
ª
√
1ª − 10 6
1,645 = ⇒ 1ª = 1,645 + 10 ⇒ Oe = .., -
6# √30
√30
Algumas observações:
Por que calcular ¶ 1 > 1ª ƒ̀ ~Ç ;10, 4T= = 0,05 ao invés de ¶ 1 < 1ª ƒ̀ ~Ç ;10, 4T= ?
J J

o A nossa hipótese nula é que o suplemento não é eficaz, ou seja, a média daqueles que
tomaram o medicamento não difere de 10, que é a média de indivíduos com deficiência.
o Estamos procurando evidências de que o suplemento é eficiente, ou seja, rejeitaremos a
hipótese nula se a média observada for grande o suficiente para concluirmos que não faz
o Dessa forma, faz sentido utilizarmos o sinal definido na ¬j quando formos calcular o valor
sentido dizer que ela vem de uma distribuição com média igual a 10.
crítico (isso sempre será verdade).

 Região de rejeição:
o Nesse caso, a região de rejeição é dada por:
168
•• = ›1̅ ∈ ℝ: 1̅ > 11,8•
 Conclusões possíveis:
o Vamos imaginar que a média amostral observada após o término do experimento seja igual a
11,4 unidade/ml da vitamina no sangue dos participantes. Nesse caso, a média observada não
pertence à Região de rejeição, sendo assim, não existe evidência para rejeitar a hipótese nula.
Ou seja, conclui-se que o suplemento não foi eficaz, a um nível de 5% de significância.
o Agora, vamos imaginar que a média amostral observada após o término do experimento foi
igual a 12,5 unidade/ml da vitamina no sangue dos participantes. Nesse caso, a média
observada pertence à região de rejeição, ou seja, existe evidência para rejeitar a hipótese
nula, ou seja, conclui-se que o suplemento foi eficaz, a um nível de 5% de significância.
Novamente, temos que a situação 1 representa um teste de hipóteses unilateral, o que aconteceria se
tivéssemos um teste de hipóteses bilateral?
Vamos relembrar, mais uma vez da situação 3: temos que ƒ̀ ~Ç ;m, 4T=, pois não sabemos qual o valor real de
J
m da população da cidade em questão, mas sabemos que foi retirada uma amostra de tamanho 30 da
da vitamina no sangue a variância se mantém (n 3 = 63 ).

população e que independentemente de ter deficiência da vitamina no sangue, ser saudável ou ter excesso
Se considerarmos ¬T como sendo verdadeira, em outras palavras, se considerarmos que a população é

saudável m = 14, teremos que ƒ̀ ~Ç ;14, 4T=, logo, × será dado por:
J
63 63
¶ 1 < 1ª ƒ̀ ~Ç ì14, 30í + ¶ 1 > 1ª ƒ̀ ~Ç ì14, 30í = ×
de 5% para a rejeição de ¬T .
Um nível de significância muito utilizado, é o de 5%, vamos imaginar, então, que aceitemos um erro máximo
Se Voltarmos na figura 58 na página 140, vermos que ¶ (ù < −1,96) = ¶ (ù > 1,96) = 0,025, ou seja, os
valores críticos poderão ser encontrados ao relacionar os valores -1,96 e 1,96 da distribuição normal padrão
com os respectivos valores na distribuição da média amostral.
1ªI − 14 6
−1,96 = ⇒ 1ªI = −1,96 + 14 ⇒ Oe. = .., -/
6# √30
√30
1ªJ − 14 6
1,96 = ⇒ 1ªJ = 1,96 + 14 ⇒ Oe* = .(, ./
6# √30
√30
Algumas observações:
 Região de rejeição:
o Nesse caso, a região de rejeição é dada por:
•• = ›1̅ ∈ ℝ: 1̅ < 11,85 ou 1̅ > 16,15•
 Conclusão:
169
o Vamos imaginar que a média amostral observada após o término do experimento foi igual a
13,2 unidade/ml da vitamina no sangue dos participantes. Nesse caso, a média observada não
pertence à Região de rejeição, sendo assim, não existe evidência para rejeitar a hipótese nula.
Ou seja, conclui-se que não existe evidências para afirmar que a população tenha deficiência
ou excesso da vitamina, a um nível de 5% de significância.
9.5.3.3. Estatística do Teste
utilizar, também, a estatística do teste, uma função dos dados da amostra na qual a decisão (rejeitar ¬T ou
Encontrar ao valor crítico e a região crítica não é a única forma de concluir um teste de hipóteses, pode-se
não rejeitar ¬T ) se baseia.
No caso de testes de hipóteses para a média populacional quando conhecemos o desvio padrão da população
(caso discutido até agora) a estatística do teste é a normal, e tudo que temos que fazer é relacionar o valor da
média amostral observada com o valor respectivo da distribuição normal padrão:
1̅ − m
ù=n
#
√
E verificar se a estatística do teste se encontra dentro ou fora da região de rejeição, também definida na
distribuição normal padrão.
A utilização do valor crítico ou da estatística do teste, não traz nenhuma diferença ao resultado do teste, a
decisão de qual utilizar fica a cargo do pesquisador, pode ser que para alguns casos uma das metodologias
seja mais rápida ou envolva menos cálculos, mas ambas DEVEM sempre chegar à mesma conclusão.
Vamos considerar a situação 1, digamos que queremos realizar um teste de hipóteses a um nível de 5% de
significância, teremos:
 Região de Rejeição: •• = › ∈ ℝ: > 1,645• (figura 60, página 145)

 Considerando que a média observada seja igual a 12,5, temos:
12,5 − 10
o Estatística do teste:
ù= = 2,28
6#
√30
rejeitamos ¬T a um nível de 5% de significância. Mesma conclusão que havíamos chegado utilizando

 Conclusão: Como 2,28 > 1,645, temos que a estatística do teste pertence à região de rejeição, ou seja,
o valor crítico.
Vamos considerar a situação 3, a fim de saber como agir no caso de teste bilateral:
 Região de Rejeição: •• = › ∈ ℝ: < −1,96 ou > 1,96• (figura 58, página 140)
 Considerando que a média observada seja igual a 13,2, temos:
13,2 − 14
o Estatística do teste:
ù= = −0,73
6#
√30
170
rejeição, ou seja, não rejeitamos ¬T a um nível de 5% de significância. Mesma conclusão que havíamos
 Conclusão: Como -1,96 < -0,73 < 1,96, temos que a estatística do teste não pertence à região de
chegado utilizando o valor crítico.
9.5.3.4. p-valor
Uma forma de relatar o resultado de um teste de hipóteses é dizer se a hipótese nula foi, ou não, rejeitada a
um nível de significância especificado, como vimos nas seções anteriores. Porém, esse tipo de afirmação nem
sempre é adequado, pois não informa se o valor da estatística estava próximo ou afastado do valor limite da
região de rejeição.
O p-valor é a probabilidade calculada, assumindo-se que ¬T seja verdadeira, de se obter um valor igual ao da
estatística de teste observada, ou tão contraditória à ¬T quanto. Dessa maneira, ele fornece informação sobre
a força da evidência contra ¬T , e permite que o pesquisador tire sua conclusão em qualquer nível de
significância ×.
Quanto menor for o p-valor observado, mais contraditórias a ¬T são as evidências coletadas. Uma vez que o
p-valor tenha sido calculado, a conclusão, em qualquer nível × de significância, resulta da comparação do p-
valor a ×:
] − y bK\ ≤ × ⟹ implica na rejeição de ¬T a um nível ×;

] − y bK\ > × ⟹ implica na não-rejeição de ¬T a um nível ×.


Novamente, vamos considerar a situação 1, definida anteriormente, digamos que o valor da média observada
quão provável seria de encontrar valores superiores (tiro a desigualdade da ¬j ) à média observada se ¬T for
tenha sido 12,5 unidades/ml. A fim de conhecer o p-valor relativo à essa média observada, basta calcular o
verdade, ou seja:
63
¶ 1̅ > 12,5 ƒ̀ ~Ç ì10, 30í = ¶ (ù > 2,28) = 0,0113
existem fortes evidências para rejeitar ¬T , já que o erro real ao rejeitar ¬T , baseado no valor da média
Nesse caso, temos um p-valor de 0,0113 = 1,1% (tabela 49, página 218), dessa forma, podemos concluir que
amostral obtido, é inferior ao erro considerado como aceitável de 5% (nível de significância). Ou seja, pode-se
concluir, ainda com mais certeza, que o suplemento vitamínico é eficiente.
Agora, vamos considerar a situação 3, definida anteriormente, digamos que o valor da média observada tenha
sido 13,2 unidades/ml. Para encontrar o p – valor no caso de teste bilateral, devemos ter um pouco mais de
cuidado, já que devemos considerar a probabilidade de erro dividida nas duas caudas da distribuição amostral.
No caso bilateral, deve-se, primeiramente verificar se o valor da média observada é superior ou inferior ao
valor da média definida pela hipótese nula (no nosso caso 13,2 < 14) nesse caso, vamos considerar que metade
do p – valor é dado por:
] − y bK\ 63
= ¶ 1̅ < 13,2 ƒ̀ ~Ç ì14, 30í
2
171
63
∴ ] − y bK\ = 2 × ¶ 1̅ < 13,2 ƒ̀ ~Ç ì14, 30í
] − y bK\ = 2 × ¶(ù > −0,73) = 2 × 0,2327 = 0,4664
evidências para não rejeitar ¬T , já que o erro real ao rejeitar ¬T , baseado no valor da média amostral obtido,
Nesse caso, temos um p-valor de 0,4664 = 46,64%, dessa forma, podemos concluir que existem fortes
é muito superior ao erro considerado como aceitável de 5% (nível de significância).
OBS: Os valores utilizados acima foram obtidos da seção anterior (seção 9.5.3.3., página 170 e da tabela da
distribuição normal padrão que pode ser encontrada na página 218).
9.5.4. Um Exemplo
¼`~Ç(18 ; 63 )À, todos irão tomar um medicamento cujo objetivo é normalizar a quantidade de vitamina no
Vamos relembrar agora a situação 2: Temos uma amostra de 30 indivíduos com excesso de vitamina no sangue
sangue dos pacientes. Ao final do experimento a quantidade de vitamina no sangue de cada paciente foi
analisada e a média amostral de 16,5 unidades/ml foi encontrada. A empresa reguladora de medicamentos
exige que seja conduzido um teste de hipóteses a um nível de 1% de significância a fim de aprovar ou não o
medicamento. Temos:
o ¬T : m ≥ 18, em outras palavras, o medicamento não é eficaz;

 Hipóteses de interesse:
o ¬j : m < 18, em outras palavras, o medicamento é eficaz
o × = 0,01
 Nível de significância:
o n 3 = 63
 Variância populacional:
= 30
 Tamanho amostral:
o
o 1̅ = 16,5
 Média amostral:
 Conduzindo o teste utilizando o valor crítico:

o Primeiro devemos encontrar o valor relativo ao valor crítico na distribuição normal padrão:
× = 0,01 ⇒ = −2,33 ⇒ •q: › | < −2,33•
1̅ ª = −2,33 × 6# + 18 = −2,55 + 18 = 15,45

√30
••: ›1̅ |1̅ < 15,45•
o
o Como 16,5 > 15,45, temos que a média observada não pertence à região de rejeição, logo,
não existe evidência, a um nível de 1% de significância, para rejeitar a hipótese nula, ou seja,
o remédio não pode ser considerado eficaz.
 Conduzindo o teste utilizando a estatística do teste:
16,5 − 18
= = −1,37
6#
√30
172
••: › | < −2,33•
o Como -1,37 > -2,33, temos que a média observada não pertence à região de rejeição, logo,
não existe evidência, a um nível de 1% de significância, para rejeitar a hipótese nula, ou seja,
o remédio não pode ser considerado eficaz.
 Conduzindo o teste utilizando a o p-valor:
alternativa: ¬j : m < 18. Ou seja, iremos utilizar o sinal de menor (<) no cálculo do p – valor:
o Para calcular o p-valor, primeiro, vamos relembrar qual a afirmação feita pela hipótese
¶ (ù < −1,37) = 0,0853

 Como o p – valor é superior à 0,01, temos que o erro real ao rejeitar ¬T , tendo a média
amostral como base, é superior ao máximo aceito, ou seja, não se deve rejeitar ¬T .
*
9.5.5. Resumindo Testes de Hipóteses para a Média com Conhecido
o ¬T : m ≥ vs ¬j : m <
 Testes Unilaterais:
1̅ LMN −
 Estatística do Teste:
LMN = n
#
√
 Nível de significância: ×;
¶ ( ƒ̀ < 1ª ) = ×
 Valor Crítico:
 Região de Rejeição:
••: ›1̅ ∈ ℝ|1̅ < 1ª •
¶( ƒ̀ < 1̅ LMN ) = ¶(ù < LMN )

 p-valor:
o ¬T : m ≤ vs ¬j : m >
1̅ LMN −
= n
#
LMN
√
¶ ( ƒ̀ > 1ª ) = ×
 Valor Crítico:
••: ›1̅ ∈ ℝ|1̅ > 1ª •
¶( ƒ̀ > 1̅ LMN ) = ¶(ù > LMN )

 p-valor:
o ¬T : m = vs ¬j : m ≠
 Teste Bilateral:
1̅ LMN −
= n
#
LMN
√
173
¶¼ƒ̀ < 1ªI À = ×#2 e ¶¼ƒ̀ > 1ªJ À = ×#2
 Valor Crítico:
••: ½1̅ ∈ ℝ 1̅ < 1ªI ou 1̅ > 1ªJ ¿
 p-valor:
2 × ¶ (ù ≤ LMN ) = 2 × ¶( ƒ̀ ≤ 1̅LMN ) se 1̅ LMN ≤ ou
2 × ¶ (ù ≥ LMN ) = 2 × ¶ ( ƒ̀ ≥ 1̅ LMN ) se 1̅ LMN ≥
9.5.6. Testes de Hipóteses para a Proporção
Iremos estudar como conduzir um teste de hipóteses para a proporção utilizando exemplos, assim como foi
feito para a média.
 Teste de hipótese unilateral
Situação 1: Vamos considerar os mesmos 30 pacientes com deficiência de determinada vitamina no sangue,
esses pacientes aceitaram participar de um experimento com um suplemento vitamínico cuja taxa de
eficiência é de 85% (segundo a farmacêutica). O objetivo do pesquisador é verificar se o suplemento atinge a
taxa de eficiência prometida.
o ¬T : ] ≥ 0,85, hipótese nula (conservadora), a afirmação da farmacêutica está correta.

o ¬j : ] < 0,85, hipótese alternativa (inovadora), o suplemento não tem a eficácia prometida.
Com as hipóteses definidas, podemos dar prosseguimento ao experimento. Ao final do mesmo, serão obtidas
amostras de sangue de cada um dos pacientes e observado quantos deles tiveram a quantidade de vitamina
no sangue compatível com a de indivíduos saudáveis.
A variável aleatória de interesse nesse caso é a proporção amostral (]̂ ): proporção de indivíduos na amostra
suficientemente grande ( ≥ 30) tem-se que a variável aleatória ]̂ segue uma distribuição normal:
com concentração adequada da vitamina no sangue. Sabemos que para amostras de tamanho
](1 − ])
]̂ ~Ç ì], í
Sendo assim, na situação 1, temos (ao considerar a hipótese nula verdadeira):
0,85(0,15)
]̂ ~Ç 0,85 ; ou ]̂ ~Ç(0,85 ; 0,0653 )
30
Com o conhecimento da distribuição amostral da proporção, podemos conduzir o teste de hipóteses da

mesma forma como foi feito para a média:
 Utilizando o Valor Crítico e Região de Rejeição:
174
Novamente, devemos encontrar o valor crítico com base em um nível de significância pré-estabelecido.
Vamos considerar um nível de 5% de significância nesse exemplo.
¶(]̂ < ]ª ) = 0,05 = ¶(ù < −1,645)
distribuição de ]̂ :
Tendo o valor crítico na distribuição normal padrão, basta relacioná-lo com o valor da região crítica na
]ª − 0,85
−1,645 = ⇒ ]ª = −0,11 + 0,85 ⇒ te = ,, )+
0,065
ou seja ]̂ = 24#30 = 0,8 = 80%. Como 0,8 > 0,74, temos que a proporção observada não pertence à região
Vamos supor que 24 dos 30 pacientes tenham chegado a níveis considerados saudáveis da vitamina no sangue,
de rejeição, ou seja, não foram encontradas evidências fortes o suficiente para contradizer as especificações
dadas pela empresa farmacêutica, a um nível de 5% de significância.
 Utilizando a Estatística do teste:
Nesse caso, assim como para a média, a estatística do teste é a normal:
]̂ − ] 0,8 − 0,85
= = = −0,77
LMN
](1 − ]) 0,065
Como -0,77 > -1,645, chegamos à conclusão de que não podemos rejeitar a hipótese nula a um nível de 5% de
significância.
 Utilizando o p – valor:
¶( LMN < −0,77) = 0,2206
Logo, O erro real ao rejeitar ¬T (] − y bK\ = 22,06%), baseado no valor da proporção amostral obtido, é
superior ao erro considerado como aceitável de 5% (nível de significância), ou seja, não encontramos
evidências para rejeitar a hipótese nula.
 Teste de hipótese bilateral
Situação 2: Vamos considerar uma amostra aleatória de 30 indivíduos de uma cidade pequena. Não se sabe
qual a prevalência de indivíduos com a quantidade adequada de vitamina no sangue para essa cidade, mas
sabe-se que no estado, a prevalência é de 75% de indivíduos saudáveis na população. O objetivo do
pesquisador é saber se a prevalência de indivíduos com a quantidade adequada da vitamina no sangue, nessa
cidade, difere da prevalência no estado. Mais uma vez, vamos usar um nível de 5% de significância.
o ¬T : ] = 0,75, hipótese nula (conservadora), a taxa do estado se mantém na cidade em

o ¬j : ] ≠ 0,75, hipótese alternativa (inovadora), a taxa na cidade difere da encontrada no

questão.
estado.
175
Com as hipóteses definidas, podemos dar prosseguimento ao experimento. Ao final do mesmo, serão obtidas
amostras de sangue de cada um dos pacientes e observado quantos deles tiveram a quantidade de vitamina
no sangue compatível com a de indivíduos saudáveis.
Para a situação 2, temos:
0,75(0,25)
]̂ ~Ç 0,75 ; ou ]̂ ~Ç(0,75 ; 0,0793 )
30
¶(]̂ < −]ª ) + ¶(]̂ > ]ª ) = 0,05 = ¶(ù < −1,96) + ¶(ù > 1,96)
 Utilizando o Valor Crítico e Região de Rejeição:
]ªI − 0,75
−1,96 = ⇒ ]ªI = −0,15 + 0,75 ⇒ te. = ,, (,
0,079
]ªJ − 0,75
1,96 = ⇒ ]ªJ = 0,15 + 0,75 ⇒ te* = ,, 0,
0,079
ou seja ]̂ = 24#30 = 0,8 = 80%. Como 0,60 < 0,80 < 0,90, temos que a proporção observada não pertence
Vamos supor que 24 dos 30 pacientes tenham chegado a níveis considerados saudáveis da vitamina no sangue,
à região de rejeição, ou seja, não foram encontradas evidências fortes o suficiente para concluir que a taxa de
prevalência na cidade seja diferente daquela observada no estado.
]̂ − ] 0,8 − 0,75
 Utilizando a Estatística do teste:
= = = 0,63
LMN
](1 − ]) 0,079
Como -1,96 < 0,633 < 1,96, chegamos à conclusão de que não podemos rejeitar a hipótese nula a um nível de
5% de significância.
 Utilizando o p – valor:
¶(ù < 0,63) = 0,2643
] − y bK\ = 2 × 0,2643 = 0,5286
Logo, O erro real ao rejeitar ¬T (] − y bK\ = 52,86%), baseado no valor da proporção amostral obtido, é
muito superior ao erro considerado como aceitável de 5% (nível de significância), ou seja, encontramos
evidências fortes para não rejeitar a hipótese nula.
9.5.7. Resumindo Testes de Hipóteses para a Proporção
o ¬T : ] ≥ vs ¬j : ] <
]̂ LMN −
LMN =
(1 − )
 Valor Crítico:
176
¶ (]̂ < ]ª ) = ×
••: ›] ∈ ℝ|] < ]ª •
¶(]̂ < ]̂ LMN ) = ¶(ù < LMN )

 p-valor:
o ¬T : ] ≤ vs ¬j : ] >
]̂ LMN −
=
(1 − )
LMN
¶ (]̂ > ]ª ) = ×
 Valor Crítico:
••: ›] ∈ ℝ|] > ]ª •
¶(]̂ > ]̂ LMN ) = ¶(ù > LMN )

 p-valor:
o ¬T : ] = vs ¬j : ] ≠
]̂ LMN −
=
(1 − )
LMN
¶¼]̂ < ]̂ ªI À = ×#2 e ¶¼]̂ > ]̂ ªJ À = ×#2

 Valor Crítico:
••: ½] ∈ ℝ ] < ]ªI ou ] > ]ªJ ¿
 p-valor:
2 × ¶ (ù ≤ LMN ) = 2 × ¶(]̂ ≤ ]̂ LMN ) se ]̂ LMN ≤ ou
2 × ¶ (ù ≥ LMN ) = 2 × ¶(]̂ ≥ ]̂ LMN ) se ]̂ LMN ≥

*
9.5.8. Testes de Hipóteses para a Média com Desconhecido
Algo que acontece com bastante frequência em problemas de inferência estatística é o fato de não ser
conhecida a variância populacional relacionada com a variável que temos interesse em estudar. Vamos ver
como lidar com situações em que desejamos fazer inferência sobre a média, porém, não temos conhecimento
sobre a variância populacional.
177
Situação 1: Suponha que determinada clínica tenha um grupo com 30 pacientes com deficiência de
determinada vitamina no sangue. Todos os pacientes aceitaram tomar um suplemento vitamínico (já se sabe
que é seguro) para verificar se ele é eficaz. Faz sentido imaginar que serão observadas as quantidades de
vitamina no sangue, de cada paciente, após o tratamento com o suplemento, e que a média observada irá
fornecer a base para a conclusão sobre a eficácia do tratamento. Sabe-se que indivíduos saudáveis apresentam
uma média de 14 unidades/ml e que indivíduos com deficiência da vitamina apresentam uma média de 10
unidades/ml, porém não se conhece a variância dessas distribuições.
o ¬T : m ≤ 10, hipótese nula (conservadora), o suplemento não é eficaz.

 Hipóteses de Interesse:
o ¬T : m > 10, hipótese alternativa (inovadora), o suplemento é eficaz.
Vamos supor que observamos uma média de 1̅ = 13,91 unidades/ml e um desvio-padrão de _ = 5,82
unidades/ml, com os resultados obtidos da amostra ao final do experimento. E que o pesquisador deseje
conduzir um teste de hipóteses a um nível de 1% de significância.
Como não conhecemos a variância populacional não podemos utilizar a distribuição normal como foi feito
nos testes de hipóteses conduzidos até agora, temos, no entanto, o desvio padrão amostral, isso nos
permite utilizar uma outra estatística do teste para conduzir o teste de hipóteses.
Estatística do Teste: nos casos em que não conhecemos o desvio-padrão (ou variância)
populacional, podemos utilizar uma aproximação da distribuição Normal, a distribuição t de

Student:
ƒ̀ − m
a= _
#
√
o Em que c segue uma distribuição t de Student com − 1 graus de liberdade.
No nosso caso, temos o seguinte valor observado para a estatística do teste:
13,91 − 10 3,91
aLMN = = = 3,678
5,82 1,063
"
√30
178
significância de 1% e pela distribuição t de Student com 29 graus de liberdade, isso pode ser feito utilizando a
Podemos agora, seguir com o teste comparando esse valor com o valor crítico definido para um nível de
tabela da t de Student que pode ser encontrada em anexo (tabela 50, página 219).
Figura 69: Representação de parte da tabela da distribuição t de Student.
Fonte: Anexo (tabela 50, página 219).
••: ›a|aLMN > 2,462•
Como o valor observado para a estatística do teste 3,678 é superior ao valor tabelado 2,462 (valor destacado
em azul na figura 69) para a distribuição t de Student com 29 graus de liberdade, temos evidências o suficiente
para rejeitar a hipótese nula a um nível de 1% de significância.
 P – valor:
Como o maior valor de t tabelado para 29 graus de liberdade é 2,7564 e ¶(a > 2,7564) = 0,005 (valor
circulado em vermelho na figura 69), temos que:
] − y bK\ = ¶ (a > 3,678) < 0,005
A maior diferença entre o caso de trabalhar com a distribuição normal ou a distribuição t de Student, é que
quando utilizamos a distribuição normal podemos concluir o teste de 3 maneiras:
 Valor e região crítica;

 Estatística do teste;
 P – valor.
Quando utilizamos a distribuição t de student, podemos utilizar apenas 2 dessas técnicas:
179
 Estatística do teste; ou
 P – valor.
*
9.5.9. Resumindo Testes de Hipóteses para a Média com Desconhecido
o ¬T : m ≥ vs ¬j : m <
1̅ LMN −
aLMN = _
#
√
¶(a < aLMN )

 p-valor:
o ¬T : m ≤ vs ¬j : m >
1̅ LMN −
aLMN = _
#
√
¶(a > aLMN )

 p-valor:
o ¬T : m = vs ¬j : m ≠
1̅ LMN −
aLMN = a
#
√
 p-valor:
2 × ¶ (a ≤ aLMN ) se 1̅ LMN ≤ ou
2 × ¶(a ≥ aLMN ) se 1̅ LMN ≥
1 - Suponha, por exemplo, que 10% de todas as placas de circuito produzidas por um certo fabricante durante
acreditando que resultará em um índice reduzido de defeito. Seja ] a proporção real de placas com defeito
um período recente estivessem com defeito. Um engenheiro sugeriu uma mudança no processo de produção,
resultante do processo alterado. Quais as hipóteses nula e alternativa que devem ser consideradas nesse caso?
¬T : ] ≥ 0,1 y[\_^_ ¬j : ] < 0,1

Resposta:
2- Identifique as hipóteses que estão sendo testadas em cada caso:
a. A companhia de transporte afirma que, em média, o intervalo entre sucessivos ônibus é de 15

minutos. Uma associação de usuários de transportes coletivos acha que a pontualidade é muito importante e
pretende testar a afirmação da companhia.
180
Resposta: ¬T : m = 15 8 âK_ versus ¬j : m ≠ 15 8 âK_
b. Os amortecedores, de automóveis que circulam entre cidades, duram em média 30 mil quilômetros,
segundo informações de algumas oficinas especializadas. Um proprietário de automóvel deseja testar essa
informação.
Resposta: ¬T : m = 30.000 º8 versus ¬j : m ≠ 30.000 º8
c. Um veterinário conseguiu ganho médio diário de 3 litros de leite por vaca com uma nova composição
de ração. Um pecuarista acredita que o ganho não é tão grande assim.
Resposta: ¬T : m ≥ 3 b versus ¬j : m < 3 b
3 - Um estudo foi desenvolvido para avaliar o salário de empregadas domésticas na cidade de São Paulo. Foram
sorteadas e entrevistadas 200 trabalhadoras. Admita que o desvio-padrão dessa variável na cidade é de 0,8
salários-mínimos. Deseja-se testar se a média é igual a 3 salários-mínimos ou é menor.
a. Formule as hipóteses adequadas.
Resposta: ¬T : m ≥ 3 _ bá\ K_ 8í 8K_ y[\_^_ ¬j : m < 3 _ bá\ K_ 8í 8K_
b. Para um nível de significância de 3%, construa a região crítica.
Resposta:
n 0,8
# = # = 0,057
√ √200

¶(ù < ª) = 0,03 ⇒ ª = −1,88
1ª − 3
−1,88 = ⇒ 1ª = 2,893
0,057
 ••: ›1 ∈ ℝ|1 < 2,893•
c. Se a amostra forneceu média de 2,5 salários-mínimos, qual seria a conclusão?
Resposta: Como 2,5 < 2,89, teríamos evidências fortes o suficiente para rejeitar ¬T a um nível de 3% de
significância. Ou seja, concluiríamos que o salário médio de empregadas domésticas na cidade de São Paulo é
inferior à 3 salários-mínimos.
4 - Um pesquisador deseja estudar o efeito de certa substância no tempo de reação de seres vivos a um certo
tipo de estímulo. Um experimento é desenvolvido em cobaias, que são inoculadas com a substância e
submetidas a um estímulo elétrico, com seus tempos de reação (em segundos) anotados. Os seguintes valores
foram obtidos:
9,1 9,3 7,2 7,5 13,3 10,9 7,2 9,9 8,0 8,6
Admite-se que o tempo de reação segue, em geral, uma distribuição normal com média 8 e que o desvio
padrão seja de 2 segundos. O pesquisador desconfia, entretanto, que o tempo médio sofre alteração por
influência da substância. Conduza um teste de hipóteses a um nível de 4% de significância.
181
23
`: ›tempo de reação• ; `~Ç(8 ; 23 ) , logo ƒ̀ ~Ç 8 ;
10
¬T : m = 8 _[ ^ 9K_ versus ¬j : m ≠ 8 _[ ^ 9K_
¶(ù < − ª ) = ¶(ù > ª) = 0,02 ⇒ ª = 2,05
1ªI − 8
−2,05 = ⇒ 1ªI = 6,703
0,63
1ªJ − 8
2,05 = ⇒ 1ªJ = 9,297
0,63
••: ›1̅LMN < 6,703 _[ ^ 9K_ ou 1̅ LMN > 9,297 _[ ^ 9K_•
9,1 + 9,3 + 7,2 + 7,5 + 13,3 + 10,9 + 7,2 + 9,9 + 8 + 8,6

1̅ LMN = = 9,1 _[ ^ 9K_
10
Como 1̅ LMN não pertence à região de rejeição, não se rejeita ¬T . Ou seja, conclui-se que o tempo de reação
não sofreu alteração devido ao efeito da substância estudada.
5 - Um relatório de uma companhia afirma que 40% de toda a água obtida, através de poços artesianos no
Nordeste é salobra. Há muitas controvérsias sobre essa informação, alguns dizem que a proporção é maior,
outros que é menor. Para eliminar a dúvida, 400 poços foram sorteados e observou-se, em 120 deles, água
salobra. Qual seria a conclusão, ao nível de 3% de significância?
]: ›proporção de poços artesianos, no Nordeste, com água salobra•
¬T : m = 0,4 versus ¬j : m ≠ 0,4
120
= 400 ; ]̂ = = 0,3
400
¶(ù < − ª ) = ¶ (ù > ª) = 0,015 ⇒ ª = 2,17
]ªI − 0,4
−2,17 = ⇒ ]ªI = 0,347
0,4(0,6)
ì 400 í
]ªI − 0,4
2,17 = ⇒ ]ªJ = 0,453
0,4(0,6)
ì 400 í
••: ›]̂ < 0,347 _[ ^ 9K_ ou ]̂ > 0,453 _[ ^ 9K_•
Como 0,3 pertence à região de rejeição, conclui-se que existe evidência para rejeitar a hipótese nula a um
nível de 3% de significância, ou seja, no Nordeste, a proporção de poços artesianos com água salobra é
diferente de 40%.
182
6 - Suponha que um laboratório alegue que uma determinada droga que ele comercialize é eficiente em pelo
menos 80% dos casos em que é utilizada. Suponha que, para comprovar a alegação do laboratório, um
organismo de controle testou 180 pacientes, verificando a eficiência da droga em 147 casos. Teste a eficiência
alegada pelo laboratório a um nível de 1% de significância.
]: ›proporção de casos em que a droga é eficiente•
¬T : m ≥ 0,8 versus ¬j : m < 0,8
147
= 180 ; ]̂ = = 0,82
180
0,82 − 0,8
= ⇒ = 0,67
0,8(0,2)
ª ª
ì 180 í
] − y bK\ = ¶(ù < 0,67) = 1 − 0,2514 = 0,7486
Como o erro ao rejeitar ¬T baseado nas evidências encontradas é superior ao erro máximo aceito de 1%
(] − y bK\ = 0,7486), não se rejeita ¬T , ou seja, conclui-se que a eficiência alegada pelo laboratório está de
acordo com a realidade.
7 - Uma amostra com 10 observações de uma variável aleatória normal forneceu média amostral de 5,5 e
variância amostral 4. Deseja-se testar, ao nível de significância de 5%, se a média na população é igual ou é
menor que 6. Qual é a conclusão?
¬T : m ≥ 6 versus ¬j : m < 6
= 10 ; 1̅ LMN = 5,5 ; _ = 2 ; × = 0,05
5,5 − 6
aLMN = = −0,791
2#
√10
¶(a < aª ) = 0,05 ⇒ aª = 1,8331
Como o valor da distribuição -0,791 > -1,8331, temos que não existe evidência o suficiente para rejeitar a
hipótese nula a um nível de 5% de significância.
9.5.11. Exercícios
1- [DEVORE, 2006] Antes de concordar em fazer um grande pedido de revestimentos de polietileno para
um tipo específico de cabo de força submarino preenchido com óleo de alta pressão, uma empresa
deseja ter evidências conclusivas de que o desvio padrão da real espessura do revestimento é menor
que 0,05mm. Quais hipóteses devem ser testadas e por quê? Neste contexto, quais são os erros tipo
I e tipo II.
2- [DEVORE, 2006] Amostras de água são coletadas da água usada para resfriamento quando está sendo
despejada de uma usina de energia em um rio. Determinou-se que, desde que a temperatura média
da água despejada seja de no máximo 150°F, não haverá efeitos negativos sobre o ecossistema do rio.
Para investigar se a usina está em conformidade com as regulamentações que proíbem uma
temperatura média de água de descarga acima de 150°, 50 amostras de água serão tiradas em tempos
183
serão usados para testas as hipóteses: ¬T : µ ≤ 150°† y[_^_ ¬j : µ > 150°. No contexto dessa
selecionados aleatoriamente e a temperatura de cada amostra será registrada. Os dados resultantes
situação, descreva os erros tipo I e tipo II. Que tipo de erro você consideraria mais sério? Explique.
em uma determinada região. Seja ] a proporção de todos os assinantes em potencial que favorecem
3- [DEVORE, 2006] Duas empresas diferentes concentraram-se em oferecer serviços de televisão a cabo
a primeira empresa com relação à segunda. Considere o teste de ¬T : ] = 0,5 y[\_^_ ¬j : ] ≠ 0,5 com
base em uma amostra aleatória de 25 indivíduos. Seja ` o número na amostra que favorece a primeira
empresa e x o valor observado de `.
•1 = ›1: 1 ≤ 7 K^ 1 ≥ 18•, •2 = ›1: 1 ≤ 8•, •3 = ›1: 1 ≥ 17•

a. Qual das regiões de rejeição a seguir é mais apropriada e por quê?
c. Qual é a distribuição de probabilidades da estatística do teste ` quando H0 for verdadeira?

b. No contexto da situação deste problema, descreva quais são os erros do tipo I e tipo II.
Use-a para calcular a probabilidade de um erro tipo I.

d. Usando a região selecionada, a que conclusão você chegaria se 6 dos 25 questionados
4- [DEVORE, 2006] Seja ` , . . . , ` uma amostra aleatória de uma distribuição de uma população normal
favorecessem a empresa 1?
com um valor conhecido de n.

a. Para testar as hipóteses: ¬T : µ = µT y[_^_ ¬j : µ = µT (onde µT é um número fixo), mostre
que o teste com estatística de teste ƒ̀ e região de rejeição 1̅ ≥ m0 + 2,33σ/√ possui nível de
b. Suponha que o procedimento do item (a) seja usado para testar a hipótese ¬T : µ ≤
significância de 0,01.
µT y[_^_ ¬j : µ > µT . Se µT = 100, = 25, [ n = 5, qual é a probabilidade de se cometer

um erro tipo I quando µ = 99? E quando µ = 98? Em geral, o que se pode dizer sobre a
probabilidade de um erro tipo I quando o valor real de µ for menor que µ0? Prove sua
afirmação.
5- [MONTGOMERY e RUNGER, 2003] A resistência à quebra de um fio usado na fabricação de material
moldável necessita ser no mínimo 100 psi. Experiência passada indicou que o desvio padrão da
resistência à quebra foi 2 psi. Uma amostra aleatória de 9 espécimes é testada e a resistência média
à quebra é 98 psi.
a. A fibra deve ser julgada como aceitável com α= 0,05?
b. Qual é o valor p para esse teste?
c. Encontre um intervalo bilateral de confiança de 95% para a resistência média verdadeira à
quebra.
6- [MONTGOMERY e RUNGER, 2003] O diâmetro dos orifícios para arreios de cabo tem um desvio padrão
de 0,01in. Uma amostra aleatória de tamanho 10 resulta em um diâmetro médio de 1,5045in. Use
α=0,01.
a. Teste a hipótese de que o diâmetro médio verdadeiro do orifício seja igual a 1,50in?
b. Qual é o valor p para esse teste?
c. Qual seria o tamanho necessário da amostra para detectar um diâmetro médio verdadeiro do
orifício igual a 1,505in, com uma probabilidade de no mínimo 0,90? (poder do teste)
d. Encontre um intervalo bilateral de confiança de 99% para o diâmetro médio do orifício.
é distribuída de forma aproximadamente normal, com desvio padrão n = 25ℎK\ _. Uma amostra
7- [MONTGOMERY e RUNGER, 2003] Sabe-se que a vida em horas de um bulbo de uma lâmpada de 75W
aleatória de 20 bulbos tem uma vida média de 1014horas.
184
a. Há alguma evidencia que suporte a alegação de que a vida do bulbo excede 1000horas? Use
α= 0,05.
b. Qual é o valor para o teste do item A?
c. Construa um intervalo de confiança de 95% para a vida média.
8- [TRIOLA, 2013] Relatando Rendas Em uma pesquisa de opinião de Pew Reserch Center com 745
adultos selecionados aleatoriamente, 589 disseram ser moralmente errado não se relatar toda a renda
na declaração de ajuste de imposto de renda. Use o nível de significância de 0,01 para testar a
afirmativa de que 75% dos adultos dizem ser moralmente errado não se relatar toda a renda na
declaração de ajuste do importo de renda.
9- [TRIOLA, 2013] Replay Instantâneo no Tênis O sistema eletrônico Hawk-Eye (Olho de Facão) é usado
no tênis para mostrar repetições instantâneas de jogadas para se ter certeza se uma bola foi fora ou
não. No primeiro U.S. Open que usou o sistema Hawk-Eye, era, então, usado para confirmar ou
derrubar a marcação do juiz. Os jogadores fizeram 839 desafios, e 327 deles foram bem-sucedidos,
com a marcação do juiz retirada. Use o nível de significância de 0,01 para testar a afirmativa de que a
proporção de desafios que são bem-sucedidos é maior que 1/3. O que os resultados sugerem sobre a
qualidade de marcações feitas pelos juízes?
10- [TRIOLA, 2013] Teste Clínico do Tamiflu Testes clínicos envolveram o tratamento de pacientes de
gripe com Tamiflu, que é um medicamento que se destina a atacar os vírus da influenza e impedi-lo
de causar os sintomas de gripe. Entre 724 pacientes tratados com Tamiflu, 72 tiveram náuseas como
reação adversa. Use o nível de significância de 0,05 para testar a afirmativa de que a taxa de náuseas
é maior do que a taxa de 6% exibida pelos pacientes com gripe que receberam um placebo. A náusea
parece ser uma preocupação para os que receberam o tratamento com Tamiflu?
11- [TRIOLA, 2013] Telefones Celulares e Câncer Em um estudo com 420095 usuários de telefone celular
na Dinamarca, 135 pessoas desenvolveram câncer de cérebro ou do sistema nervoso. Teste a
afirmativa de uma crença que tais cânceres são afetados pelo uso do telefone celular. Isto é, teste a
afirmativa de que os usuários de telefone celular desenvolvem câncer de cérebro ou do sistema
nervosa a uma taxa que é diferente da taxa de 0,0340% entre as pessoas que não usam telefone
celular. Como essa questão é de grande importância, use o nível de significância 0,005. Os usuários de
telefone celular devem se preocupar sobre o câncer de cérebro ou de sistema nervoso?
12- [TRIOLA, 2013] Trapaceando em Bombas de Gasolina Ao testar bombas de gasolina em Michigan em
relação a precisão, especialistas em cumprimento da lei de qualidade do combustível testaram
bombas e encontraram que 1299 delas não estavam bombeando adequadamente (dentro de 3,3
onças quando 5 galões eram bombeados), e 5686 bombas eram precisas. Use o nível de significância
de 0,01 para testar a afirmativa de uma representante da indústria de que menos de 20% das bombas
de gasolina de Michigan eram imprecisas. Da perspectiva do consumidor, essa taxa parece ser baixa o
bastante?
13- [TRIOLA, 2013] Detectores de Mentira Testes em um experimento com polígrafo incluem 98
resultados, com 24 casos de resultados errados e 74 casos de corretos. Use o nível de significância de
0,05 para testar a afirmativa de que tais resultados de polígrafo são corretos em menos de 80% das
vezes. Com base nos resultados, os resultados de testes de poligrafo deveriam ser proibidos como
evidência em julgamentos?
14- [TRIOLA, 2013] A cota de Nielsen Uma apresentação recente de show de televisão 60 minutes teve
uma cota de 15, o que significa que, entre 5000 aparelhos domésticos de televisão ligados, 15% deles
estavam ligados no 60 Minutes. Use o nível de significância de 0,01 para testar a afirmativa de um
185
anunciante de que, entre as residências com televisões ligados, menos de 20% estavam sintonizados
no 60 Minutes.
15- [TRIOLA, 2013] Erros em Entrevistas para Emprego Em uma pesquisa de Accountemps com 150
executivos seniores, 47,3% disseram que o erro mais comum em uma entrevista para emprego é ter-
se pouco, ou nenhum, conhecimento da companhia. Teste a afirmativa de que, na população de todos
os executivos seniores, 50% digam que o erro mais comum em uma entrevista para emprego é ter-se
pouco, ou nenhum, conhecimento da companhia. Qual importante lição se tira dessa pesquisa?
16- [TRIOLA, 2013] Uso da Internet Quando 3011 adultos foram entrevistados em uma pesquisa de
opinião do Pew Research Center, 73% disseram usar a Internet. É razoável que um repórter de jornal
escreva que “3/4 de todos os adultos usam a Internet”? Por que sim ou por que não?
17- [TRIOLA, 2013] Grito Uma sondagem com 61.647 pessoas incluiu várias questões sobre relações de
trabalho. Dos respondentes, 26% relataram que os patrões gritavam com os empregados. Use o nível
de significância de 0,05 para testar a afirmativa de que mais de ¼ das pessoas diz que os patrões gritam
com os empregados. Como essa conclusão é afetada, depois de se saber que essa sondagem está
postada em uma pesquisa de Elle/MSNBC.COM, na qual os usuários da Internet escolhem se
respondem, ou não?
18- [TRIOLA, 2013] Encontrando Emprego através de uma Rede de Amigos Em uma pesquisa com 703
trabalhadores selecionados aleatoriamente, 61% haviam obtido seus empregos através de uma rede
de amigos. Use os dados amostrais, com o nível de significância de 0,05, para testar a afirmativa de
que a maioria (mais que 50%) dos trabalhadores obteve seus empregos através de rede de amigos. O
que esse resultado sugere sobre a estratégia para se encontrar um emprego depois de formado?
19- [TRIOLA, 2013] Escrevendo uma Canção de Sucesso Num manual “How to Have a Number One the
easy Way”, afirma-se que uma canção “não deve durar mais que 3 minutos e 30 segundos” (ou 210s).
Uma amostra aleatória simples de 40 canções atuais de sucesso resulta em uma duração média de
252,5s. Suponha que o desvio padrão da duração das canções seja 54,5s. Use o nível de significância
de 0,05 para testar a afirmativa de que a amostra é proveniente de uma população de canções com
duração média superior a 210s. O que esses resultados sugerem sobre o conselho dado no manual?
20- [TRIOLA, 2013] Pesos de M&M Uma amostra aleatória simples de 19 balas verdes M&M tem média
de 0,8635g. Suponha que o desvio padrão seja conhecido e igual a 0,0565g. Use o nível de significância
de 0,05 para testar a afirmativa de que o peso médio de todas as balas verdes M&M é igual a 0,8535g,
que é o peso médio necessário para que as balas M&M tenham o peso impresso no rótulo da
embalagem. As balas verdes M&M parecem ter pesos consistentes com o rótulo da embalagem?
21- [TRIOLA, 2013] A dieta é prática? Quando 40 pessoas usam Weight Watchers (Vigilantes do Peso) por
de peso seja n = 4,9 libras e use o nível de significância de 0,01 para testar a afirmativa de que a perda
um ano, a perda média de peso foi de 3,0 libras. Suponha que o desvio padrão de todas tais mudanças
média de peso e superior a 0. Com base nesses resultados, parece que a dieta é eficaz? A dieta parece
ter significância pratica?
22- [TRIOLA, 2013] Altura sentada Uma aluna do autor mediu a altura sentada de 36 colegas homens, e
obteve a média de 92,8cm. A população de homens tem altura sentada média de 91,4cm e desvio
padrão de 3,6cm. Use o nível de significância de 0,05 para testar a afirmativa de que os homens na
escola dessa aluna tenham altura sentada média diferente de 91,4cm. Há alguma coisa sobre os dados
amostrais que sugira que os métodos apresentados aqui não devam ser usados?
23- [TRIOLA, 2013] Salários de Técnicos de futebol da NCAA Uma amostra aleatória simples de 40 salários
de técnicos da NCAA tem média de 415.953 dólares. O desvio padrão de todos os salários de técnicos
186
de futebol da NCAA é 464.364 dólares. Use o nível de significância de 0,05 para testar a afirmativa de
que o salário de um técnico de futebol da NCAA é inferior a 500.000dólares.
24- [TRIOLA, 2013] Bolas de Beisebol Testes com bolas antigas de beisebol mostraram que, quando
jogadas de uma altura de 24 pés sobre uma superfície de concreto, elas quicavam a uma altura média
de 235,8cm. Em um teste de 40 novas bolas de beisebol, as alturas dos quiques teve média de
235,4cm. Suponha que o desvio padrão das alturas dos quiques seja 4,5cm. Use o nível de significância
de 0,05 para testar a afirmativa de que as novas bolas de beisebol têm alturas de quiques com media
diferente de 235,8cm. As novas bolas de beisebol são diferentes?
25- [TRIOLA, 2013] Escores de Credito FICO Obtém-se uma amostra aleatória simples de escores de
classificação de credito FICO, que estão listados a seguir. Até o momento da escrita deste livro o escore
FICO médio era relatado como de 678. Suponha que o desvio padrão de todos os escores FICO seja
conhecido e igual a 58,3, use o nível de significância de 0,05 para testar a afirmativa de que esses
escores FICO amostrais são provenientes de uma população com média de 678.
714 751 664 789 818 779 698 836 753 834 693 802
26- [TRIOLA, 2013] Escrevendo uma Canção de Sucesso – No manual da KLF Publications “How to Have a
Number One the Easy Way”, afirma-se que uma canção deve durar “não mais do que três minutos e
trinta segundos” (ou 210 segundos). Uma amostra aleatória simples de 40 canções de sucesso atuais
resulta em uma duração média de 252,2 segundos e desvio-padrão de 54,5 segundos. (As canções são
de Timberlake, Furtado, Daughtry, Stefani, Fergie, Akon, Ludacris, etc.). Use o nível de significância de
0,05 e para testar a afirmativa de que a amostra é proveniente de uma população de canções com
média superior a 210 segundos.
27- [TRIOLA, 2013] Alcatrão em Cigarros – Obteve-se uma amostra aleatória simples de 25 cigarros de
100mm com filtro, e mediu-se o conteúdo de alcatrão em cada um deles. A amostra tem média de
13,2mg e desvio-padrão de 3,7mg. Use o nível de significância de 0,05 para testar a afirmativa de que
o conteúdo médio do alcatrão de cigarros de 100mm com filtro é inferior a 21,1mg, que é a média
para cigarros tamanho king sem filtro. O que os resultados sugerem sobre a eficácia dos filtros?
28- [TRIOLA, 2013] Pesos de Centavos – A Casa da Moeda americana tem uma especificação de que as
moedas de 1 centavo tenham peso médio de 2,5g. Uma amostra de 37 centavos tem peso médio de
2,49910g e desvio-padrão de 0,01648g. Use o nível de significância de 0,05 para testar a afirmativa de
que essa amostra provém de uma população com peso médio de 2,5g. As moedas de centavo parecem
estar de acordo com as especificações da Casa da Moeda?
29- [TRIOLA, 2013] Tempo Necessário para se Obter o Grau de Bacharel – Pesquisadores coletaram uma
amostra aleatória simples dos tempos que 81 estudantes universitários levaram para obter o grau de
bacharel. A amostra tem média de 4,8 anos e desvio-padrão de 2,2 anos (com base em dados do
National Center for Education Statistics). Use o nível de significância de 0,05 para testar a afirmativa
de que o tempo médio para todos os estudantes universitários é superior a 4,5 anos.
30- [TRIOLA, 2013] Análise de Centavos – Em uma análise que investigava a utilidade das moedas de 1
centavo, foram registradas as porções em centavos de 100 cheques selecionados aleatoriamente. A
amostra tem média de 23,8 centavos e desvio padrão de 32 centavos. Se as quantidades de 0 centavos
a 99 centavos são todas igualmente prováveis, a média esperada é 49,5 centavos. Use o nível de
significância de 0,01 para testar a afirmativa de que a amostra provém de uma população com média
menor que 49,5 centavos. O que o resultado sugere sobre as quantias em centavos dos cheques?
31- [TRIOLA, 2013] Testes de assentos de crianças em carros – A National Highway Traffic Safety
Administration realizou testes de batidas para assentos de crianças em carros. A seguir, estão listados
os resultados desses testes, com as medidas dadas em Hic – unidade padrão de danos à cabeça. O
187
requisito de segurança é de que a medida em Hic seja inferior a 1000 Hic. Use o nível de significância
de 0,01 para testar a afirmativa de que a amostra provém de uma população com média menor do
que 1000 Hic.
32- [TRIOLA, 2013] Custos de Batidas de Carro – O instituto de seguros para segurança nas estradas
realizou testes com batidas de carros novos que viajavam a 6 mi/h e encontrou-se o custo total dos
danos. Os resultados estão listados a seguir, para uma amostra aleatória simples de carros testados.
Use o nível de significância de 0,05 para testar a afirmativa de que, quando testado sobre as mesmas
condições padrão, o custo dos danos para a população de carros tem média de U$5000,00.
7448 4911 9051 6374 4277
33- [WALPOLE et al., 2009] Uma indústria elétrica fabrica lâmpadas cuja vida útil tem distribuição
que m = 800 horas contra a alternativa m ≠ 800 horas, se uma amostra aleatória de 30 lâmpadas tem
aproximadamente normal com média de 800 horas e desvio-padrão de 40 horas. Teste a hipótese de
média de vida de 788 horas. Use um valor P em suas respostas.

34- [WALPOLE et al., 2009] Em uma pesquisa feita por Richard H. Weindruch, da Escola de Medicina da
Universidade da Califórnia, afirmou-se que os ratos com média de vida de 32 meses viveriam por mais
proteínas. Há alguma razão para acreditarmos que m < 40 se 64 ratos colocados sob essa dieta têm
ou menos 40 meses se 40% das calorias de suas refeições fossem substituídas por vitaminas e
uma média de vida de 38 meses com desvio-padrão de 5,8 meses? Use um valor P em sua conclusão.
35- [WALPOLE et al., 2009] Afirma-se que um automóvel é dirigido, em mé-dia, mais de 20.000
quilômetros por ano. Para testar essa afirmação, uma amostra aleatória de cem proprietários de
automóveis registra os quilômetros viajados. Você concordaria com essa afirmação, se esta amostra
mostrasse uma média de 23.500 quilômetros e desvio-padrão de 3.900 quilômetros? Use um valor P
em sua conclusão.
36- [WALPOLE et al., 2009] Teste a hipótese de que o conteúdo médio de recipientes de certo lubrificante
é dez litros, se os conteúdos de uma amostra aleatória de dez recipientes são 10,2; 9,7; 10,1; 10,3;
10,1; 9,8; 9,9; 10,4; 10,3 e 9,8 litros. Use o nível de significância 0,01 e suponha que a distribuição dos
conteúdos dos recipientes é normal.
37- [WALPOLE et al., 2009] Experiências passadas indicam que o tempo para que alunos veteranos do
ensino médio completem um teste padronizado é uma variável aleatória normal, com média de 35
minutos. Se uma amostra aleatória de 20 alunos levou uma média de 33,1 minutos para completar o
m = 35 minutos contra a alternativa de que m < 35 minutos.

teste, com um desvio-padrão de 4,3 minutos, teste a hipótese, no nível de significância 0,05, de que
9.6. Teste de Qui-Quadrado
Um outro teste que pode ser muito útil é o teste de qui-quadrado que pode ser utilizado para verificar se duas
variáveis distintas são independentes ou não.
Assim como foi feito para os outros testes, vamos utilizar um exemplo para explicar o objetivo, metodologia
e como interpretar resultados do teste.
São apresentados, na tabela 32, os resultados de um estudo sobre a efetividade dos capacetes de bicicleta na
prevenção de lesões na cabeça. Os dados foram obtidos de uma amostra aleatória de 793 ciclistas envolvidos
em acidentes em um período especificado de um ano.
188
Tabela 42: Tabela contendo os dados da amostra de 793 ciclistas.
Uso de Capacete
Lesão na Cabeça Total
Sim Não
Sim 17 218 235
Não 130 428 558
Total 147 646 793
Fonte: Pagano e Gauvreau (2004).
O objetivo do pesquisador ao coletar os dados apresentados na tabela 42, era de verificar se os capacetes para
ciclistas realmente evitavam lesões na cabeça. Foram observadas duas variáveis: Se houve uma lesão séria na
cabeça (lesão que precisou de tratamento médico), ou não; e se estava utilizando capacete ao se acidentar,
ou não.
Se o capacete não for eficiente na prevenção das lesões na cabeça, faz sentido pensar que sofrer lesão ou não
na cabeça independe de estar utilizando capacete, ou não, na hora do acidente. A fim de verificar a
independência das duas variáveis vamos utilizar o teste de qui-quadrado.
o ¬T : hipótese nula (conservadora), as variáveis são independentes, ou seja, a proporção de

ciclistas que sofrem lesões na cabeça na população de usuários de capacetes no momento

do acidente é igual à proporção de ciclistas que sofrem lesões na cabeça na população de
não usuários desses equipamentos de segurança.
o ¬T : m > 10, hipótese alternativa (inovadora), as variáveis são dependentes entre si, ou
seja, as proporções de ciclistas que sofrem lesões na cabeça diferem nas duas populações.
A metodologia do teste de qui-quadrado consiste em usar parte das informações coletadas para criar uma
tabela de maneira que os dados confirmem a independência entre as variáveis, ou seja, criar uma tabela
de dupla entrada na qual a hipótese nula é verdade. Em seguida é utilizada uma estatística para verificar
se a tabela observada é equivalente ou não à tabela criada respeitando à hipótese nula.
Essa tabela criada para respeitar a hipótese nula é chamada de tabela de valores esperados (valores que
seriam esperaríamos observar se as variáveis fossem independentes entre si), e deve ser encontrada da
seguinte maneira:
Vamos considerar a tabela 43, dada abaixo, como uma representação hipotética de uma tabela
observada em um problema real, na qual as letras representam os valores observados:

Tabela 43: Tabela hipotética de dados observados.
Variável 2
Variável 1 Total
+
Sim Não
9 + 9
Sim
+ + 9
Não

Total
 Para obter a tabela de dados esperados, deve-se fazer os cálculos apresentados na tabela 44:
189
Tabela 44: Tabela hipotética de dados esperados.
Variável 2
Variável 1 Total
Sim Não
( + ) × ( + ) ( + ) × ( + 9)
Sim +
( + 9) × ( + ) ( + 9) × ( + 9)
Não + 9
+ + 9
Total
Voltando ao nosso exemplo do estudo sobre a eficiência dos capacetes para ciclistas, vejamos como ficaria
a tabela de dados esperados:
 Relembrando a tabela de dados observados:
Tabela 45: Tabela de dados observados.
Lesão na Uso de Capacete

Total
17 218 235
Cabeça Sim Não
130 428 558

Sim
147 646 793

Não
Fonte: Pagano e Gauvreau (2004).

Total
 Obtendo a tabela de dados esperados:
Tabela 46: Cálculo dos valores esperados.
Uso de Capacete
Lesão na Cabeça Total
Sim Não
(235) × (147) (235) × (646)
= 43,6 = 191,4 235
793 793
Sim
(558) × (147) (558) × (646)

= 103,4 = 454,6 558
793 793
Não
147 646 793

Total
Temos agora a tabela contendo as observações retiradas da amostra (tabela 45) e a tabela contendo
valores representando aqueles que seriam esperados se as variáveis fossem independentes (tabela 46).
A ideia do teste de qui-quadrado é comparar essas duas tabelas e verificar se existem evidências que
indiquem que a diferença entre elas é pequena o suficiente para indicar que a tabela observada é
compatível com a tabela de valores esperados; ou se essa variação é grande o suficiente para indicar que
a tabela observada não é compatível com a hipótese de independência, indicando que as variáveis
dependem entre si.
Para saber se a diferenças entre a tabela é pequena o suficiente, ou grande o suficiente, devemos calcular
a estatística do teste:
190
(– − ¥ )3
(ª
'LMN =
3
¥
"
Em que:
b representa o número de linhas na tabela;

representa o número de colunas na tabela;

b representa o número de caselas na tabela;


– representa cada uma das frequências observadas;


¥ representa cada uma das frequências esperadas.



A estatística do teste, dada acima, segue uma distribuição qui-quadrado ('3 ) com ( − 1)(b − 1) graus de
liberdade, isso, se a hipótese nula for verdadeira.
Com as informações dadas até agora, podemos calcular a estatística do teste para o exemplo sobre a
eficiência dos capacetes de ciclismo na prevenção de lesões na cabeça de ciclistas:
Figura 70: Exemplo do cálculo da estatística do teste qui-quadrado.
(17 − 43,6)3 (130 − 103,4)3 (218 − 191,4)3 (428 − 454,6)3

'LMN 3 = + + +
43,6 103,4 191,4 454,6
707,56 707,56 707,56 707,56

'LMN 3 = + + +
43,6 103,4 191,4 454,6
'LMN 3 = 16,23 + 6,84 + 3,70 + 1,56 = *-, $$
Assim como foi feito para os outros testes, podemos decidir se a estatística do teste fornece evidências
para rejeitar ou não a hipótese nula ao compará-la com um valor crítico (definido com base em um nível
de significância previamente especificado) ou encontrando o p-valor relativo à estatística do teste.
Diferentemente do que vimos nos outros testes, a hipótese nula no teste de qui-quadrado, sempre será a
independência entre as duas variáveis estudadas, e a hipótese alternativa sempre será a dependência
entre as variáveis. Sendo assim, sempre definiremos o nível de significância, ou o p-valor, como sendo a
área acima do valor crítico, ou acima da estatística do teste, respectivamente.
191
Conclusões possíveis:
Se 'LMN 3 > '€jM 3, rejeita-se a hipótese de independência entre as variáveis;

Se 'LMN 3 ≤ '€jM 3, não se rejeita a hipótese de independência entre as variáveis;

Se ] − y bK\ > ×, rejeita-se a hipótese de independência entre as variáveis;


Se ] − y bK\ ≤ ×, não se rejeita a hipótese de independência entre as variáveis.



Figura 71: Representação de parte da tabela da distribuição Qui-Quadrado.
Fonte: Anexo (tabela 51, página 220).
Ao compararmos o valor da estatística do teste 28,33 com o valor crítico 3,841 obtido a um nível de 5% de
significância (valor destacado em azul na figura 71 acima), podemos perceber que o valor da estatística do
teste é superior ao valor crítico, nesse caso, temos evidências de que as variáveis uso do capacete e lesões na
cabeça não independem uma da outra.
Podemos buscar pelo p-valor utilizando a tabela, porém, como ela possui apenas algumas probabilidades,
muitas vezes teremos um p-valor aproximado, e não exato (se quisermos um valor exato podemos utilizar
calculadoras on-line, softwares estatísticos ou planilhas eletrônicas.
Destacado em vermelho na figura (71) acima temos o valor 15,137, o que nos informa que ¶ (à > 15,137) =
0,0001, como o valor observado (28,33) é superior à 15,137, sabemos que ] − y bK\ = ¶ (à > 28,33) <
0,0001, o que é muito menor do que os 5% de erro que aceitamos correr ao rejeitar a hipótese de nulidade.
Dessa forma, podemos concluir com um erro menor que 0,01%, que o estudo traz evidências de que o uso do
capacete tem influência na ocorrência de lesões na cabeça em quedas de bicicleta.
Para poder interpretar qual seria essa influência no uso do capacete, temos que observar as tabelas de dados
observados e esperados novamente:
Voltando a observar a figura 70 podemos perceber que dos 147 indivíduos que sofreram acidente e estavam
com capacete apenas 17 sofreram lesão na cabeça e não os 43,6 que seriam esperados se houvesse
independência, além disso foram 130 acidentados que não apresentaram lesões, ao invés dos 103,4
esperados. Sendo assim, parece razoável concluir que o ciclista que utiliza capacetes tem uma menor
probabilidade de sofrer lesões na cabeça em um acidente do que o ciclista que não utiliza esse equipamento
192
de proteção. Podemos chegar à mesma conclusão observando que dentre os ciclistas que não estavam de
capacete ao se acidentarem, o número observado de lesões na cabeça foi superior ao número esperado.
9.6.1. Exercício Resolvido
Uma pesquisa sobre a qualidade de certo produto foi realizada enviando-se questionários a donas-de-casa
pelo correio. Aventando-se a possibilidade de que os respondentes voluntários tenham um particular viés de
respostas, fizeram-se mais duas tentativas com os não respondentes. Os resultados estão indicados abaixo.
Você acha que existe relação entre a resposta e o número de tentativas? (exercício retirado de BUSSAB e
MORETTIN (2004), página 401)
Tabela 47: Tabela auxiliar para a resolução do exercício 8.
Opinião sobre o Nº de donas-de-casa

produto 1ª tentativa 2ª tentativa 3ª tentativa
Excelente 62 36 12
Satisfatório 84 42 14
Insatisfatório 24 22 24
Fonte: Bussab e Morettin (2004).
Nesse caso, estamos interessados em conduzir um teste qui-quadrado, o primeiro passo deve ser a construção
da tabela dos dados esperados sob a hipótese de independência entre as variáveis (hipótese nula).
Tabela 48: Tabela de auxílio para calcular os valores esperados.
Opinião sobre o Nº de donas-de-casa

Total
110 × 170 110 × 100 110 × 50
produto 1ª tentativa 2ª tentativa 3ª tentativa
= 58,44 = 34,38 = 17,19
320 320 320
140 × 170 140 × 100 140 × 50
Excelente 110
= 74,38 = 43,75 = 21,88

320 320 320
70 × 170 70 × 100 70 × 50
Satisfatório 140
= 37,19 = 21,88 = 10,94

320 320 320
Insatisfatório 70
Total 170 100 50 320
Com as tabelas de dados observados (tabela 47) e de dados esperados (tabela 48), podemos calcular a
estatística do teste:
(62 − 58,44)3 (36 − 34,38)3 (12 − 17,19)3 (84 − 74,375)3 (42 − 43,75)3
'LMN 3 = + + + +
58,44 34,38 17,19 74,375 43,75
(14 − 21,88)3 (24 − 37,19)3 (22 − 21,88)3 (24 − 10,94)3
+ + + +
21,88 37,19 21,88 10,94
(3,56)3 (1,63)3 (−5,19)3 (9,63)3 (−1,75)3 (−7,88)3 (−13,19)3 (0,13)3

'LMN 3 = + + + + + + +
58,44 34,38 17,19 74,375 43,75 21,88 37,19 21,88
(13,07) 3
+
10,94
12,69 2,64 26,91 92,64 3,06 62,02 173,91 0,02 170,63

'LMN 3 = + + + + + + + +
58,44 34,38 17,19 74,375 43,75 21,88 37,19 21,88 10,94
193
'LMN 3 = 0,22 + 0,08 + 1,57 + 1,25 + 0,07 + 2,84 + 4,68 + 0,001 + 15,6 = *(, *0
Falta sabermos o valor crítico do teste, ou o p-valor para podermos tomar a decisão de rejeitar ou não a
hipótese nula.
Figura 72: Representação de parte da tabela da distribuição Qui-Quadrado.
Utilizando o valor crítico já temos evidências o suficiente para rejeitar a hipótese de independência entre as
variáveis, já que a estatística do teste (26,29) é superior ao valor crítico (9,488 – destacado em azul na figura
66))
Pode-se dizer, que o erro ao rejeitar a hipótese de independência, com base nas observações coletadas, é
inferior à 0,0001, ou 0,01% (já que 26,29 > 23,513 – figura 66). Que é um erro muito menor do que o erro
assumido como aceitável de 5%. Sendo assim, concluímos que existe um viés dos respondentes voluntários
(aqueles que responderam de primeira) e ao observar as tabelas de dados observados e esperados, podemos
perceber que o número de opinião insatisfatória dentre as respostas voluntárias foi menor do que a que seria
esperada, ou seja, parece que aqueles que aprovam o produto tem uma maior probabilidade de responder,
de maneira voluntária do que aqueles de desaprovam o produto, o que pode ser observado, também, dentre
os que responderam na terceira tentativa, já que a quantidade de indivíduos que estavam insatisfeitos com o
produto foi maior do que o que seria esperado se as variáveis fossem independentes.
9.6.2. Exercícios
1- [BLAIR e TAYLOR, 2013] Considere um estudo feito para estudar se a sobrevivência de pacientes
sofrendo de uma enfermidade terminal, em um período de 5 anos, depende de três tratamentos
distintos. A tabela com as observações coletadas é dada abaixo:
Condição do paciente
ao final dos 5 anos Tratamento 1 Tratamento 2 Tratamento 3
vivo 52 54 26
morto 17 29 11
Conduza o teste adequado, conclua e interprete.
194
a. Que proporção da área sob a curva se encontra à direita de '3 = 9,21?
2- [PAGANO e GAUVREAU, 2010] Considere a distribuição qui-quadrado com 2 graus de liberdade.
b. Que proporção da área se encontra à direita de '3 = 7,38?

c. Que valor de '3 limita os 10% superiores da distribuição?
a. Que proporção da área sob a curva se encontra à direita de '3 = 33,41?

3- [PAGANO e GAUVREAU, 2010] Considere a distribuição qui-quadrado com 17 graus de liberdade.
b. Que proporção da área se encontra à esquerda de '3 = 27,59?

c. Que valor de '3 limita os 10% superiores da distribuição?
4- [PAGANO e GAUVREAU, 2010] Os dados seguintes vêm de um estudo concebido para investigar
problemas de bebida entre os estudantes universitários. Em 1983, foi perguntado a um grupo se já
dirigira um automóvel depois de beber. Em 1987, depois de atingida idade legal para o consumo de
bebidas alcoólicas, foi feita a mesma questão a outro grupo universitário.
Ano
Dirigia enquanto bebia Total
1983 1987
Sim 1250 991 2241
Não 1387 1666 3053
Total 2637 2657 5294
a. Use um teste de hipóteses para avaliar a hipótese nula de que as proporções de estudantes
da população que dirigia enquanto bebia são as mesmas nos dois anos.
b. O que você conclui sobre o comportamento desses estudantes?
5- [PAGANO e GAUVREAU, 2010] Um estudo foi conduzido para se avaliar a eficácia relativa de
suplementação com cálcio versus o calcitrol no tratamento da osteoporose pós-menopausa. O
calcitros é um agente que aumenta a absorção gastrointestinal de cálcio. Várias pacientes retiraram-
se prematuramente desse estudo, devido aos efeitos adversos do tratamento, tais como sede,
problemas de pele e sintomas neurológicos. Os dados relevantes aparecem abaixo.
Retirada
Tratamento Total
Sim Não
Calcitrol 27 287 314
Cálcio 20 288 308
Total 47 575 622
a. Calcule a proporção da amostra de pacientes que se retiraram do estudo em cada grupo de

tratamento.
b. Teste a hipótese nula de que não há associação entre o grupo de tratamento e sua retirada
do estudo ao nível de significância de 0,05. O que você conclui?
195
10. Exercícios Avaliativos sobre Inferência
1- Em um esforço para estimar a quantia média gasta por cliente para jantar em um grande restaurante,
foram coletados os dados de uma amostra aleatória de 49 clientes em um período de três semanas.
Considere um desvio padrão populacional de $2,50.
a. Qual seria a amplitude de um intervalo com nível de confiança de 99% para a média
populacional?
b. Se a média amostral é $22,60, qual o intervalo de confiança de 95% para a média da
população?
2- Um levantamento do USA Today/CNN Gallup com 369 pais que trabalham revelou que 200 deles
disseram passar muito pouco tempo com os filhos por causa dos compromissos de trabalho.
a. Qual deveria ser o tamanho mínimo da amostra para garantir um intervalo de 95% de
confiança (conservador) com amplitude máxima de 0,08?
b. Qual a estimativa por intervalo de confiança de 95% (otimista) da proporção da população de
pais que trabalham que sentem que passam muito pouco tempo com os filhos por causa dos
compromissos de trabalho?
3- Solicitou-se ao pessoal de vendas de uma grande distribuidora que apresentem relatórios semanais
listando os contatos com clientes feitos durante a semana. Uma amostra de 61 relatórios mostrou
uma média semanal de 22,4 contatos com clientes para o pessoal de vendas. O desvio padrão amostral
foi de 5 contatos.
a. Qual a estimativa pontual para o número médio de contatos semanais com clientes para a
população do pessoal de vendas?
b. Qual o intervalo de confiança de 99% para o número médio de contatos semanais com clientes
para a população do pessoal de vendas?
4- O cadastro do MEC indica que a nota média do ENEM em 2015 é de 500 pontos, com um desvio padrão
de 100 pontos. Para saber se os ingressantes à UFJF obtiveram pontuações equivalentes ou não,
retirou-se uma amostra aleatória de 49 ingressantes obtendo uma média de 475 pontos nesta
amostra. Considerando um nível de significância de 5% e que se deseja testar se os ingressantes à UFJF
apresentam um rendimento diferente nas provas do ENEM que os mostrados pelo MEC.
a. Realize o teste de hipótese para a investigação da problemática acima. Indicando as hipóteses,
a estatística do teste, a região de rejeição, e a conclusão.
b. A partir de qual nível de significância se rejeitaria a hipótese nula?
5- De um lote de chips produzidos por uma fábrica foi selecionada uma amostra de 240 chips e observou-
se que 6 destes apresentavam defeito. As normas de qualidade da fábrica consideram que o lote deve
apresentar menos de 3% de chips com defeito para ser validado. Use um nível de significância de 8%.
a estatística do teste, o p-valor, e a conclusão.
b. Interprete a conclusão obtida acima.
6- O tempo médio de fabricação de uma peça é de 30 minutos. Uma companhia ofereceu a 36 filiais um
curso de aperfeiçoamento do processo produtivo com a intenção de melhorar a produção industrial
delas, entretanto elas estão reclamando que os seus tempos de produção aumentaram após
concluírem o curso. O tempo médio de fabricação da peça pelas filiais após o curso foi de 35 minutos
com variância de 144 minutos². Supondo normalidade dos tempos de produção, desejamos testar se
estes resultados trazem evidências estatísticas do aumento do tempo de fabricação. Use um nível de
significância de 1% para os cálculos seguintes.
196
a estatística do teste, a região de rejeição, e a conclusão.
b. Qual é o p-valor do teste, e qual o seu significado?
7- Para realizar uma pesquisa a respeito da qualidade do ensino de matemática nas escolas públicas de
um estado, selecionaram aleatoriamente uma escola de cada um dos municípios desse estado e
aplicaram uma mesma prova de matemática a todos os estudantes do nono ano do ensino
fundamental de cada uma dessas escolas. Nesse caso, foi utilizada a amostragem.
8- Suponha que uma recente pesquisa indique que o brasileiro tenha estatura média de 1,70 m com
desvio padrão de 0,5. Selecionando uma amostra de 40 pessoas, qual a probabilidade da média
amostral ser superior a 1,72 m?
9- Suponha que 10% de todos os chips produzidos por um certo fabricante durante um período recente
estivessem com defeito. Um engenheiro sugeriu uma mudança no processo de produção, acreditando
que resultará em uma redução na proporção de chips defeituosos. Cem chips são testados e são
observados 8 defeituosos.
a. Defina as hipóteses adequadas para este estudo.
b. No contexto dessa situação, qual o significado do erro de tipo I.
10- Amostras são coletadas da água que está sendo usada para resfriamento de uma usina de energia
em um rio. Desde que a temperatura média da água despejada seja de, no máximo, 40°C, não
haverá efeitos negativos sobre o ecossistema do rio. Para investigar se a usina está em
conformidade com as regulamentações, 50 amostras de água foram retiradas em tempos
selecionados aleatoriamente e a temperatura de cada amostra foi registrada. A média amostral
obtida foi de 44°C, com desvio padrão 5°C.
a. Defina as hipóteses adequadas para este estudo.
b. No contexto dessa situação, qual o significado do erro de tipo II.
11- Muitos sorteios virtuais são realizados em uma plataforma que gera números de maneira
aleatória, sendo cada número sorteado apenas uma vez com a mesma probabilidade. Essa
técnica é denominada?
12- Uma empresa encomenda uma pesquisa de mercado que utilize o método de amostragem
aleatória simples. Esse é um caso de amostra probabilística em que cada entrevistado:
(a) define o seu grau de satisfação com os serviços prestados pela companhia.
(b) é conhecido dos entrevistadores e dos diretores da organização.
(c) está presente numa lista segmentada por renda, faixa etária e sexo.
(d) indica outro entrevistado e assim sucessivamente até o preenchimento da amostra.
(e) tem a mesma chance, entre o universo da pesquisa, de ser abordado.
13- Assinale a ÚNICA alternativa verdadeira.
(a) Uma amostragem estratificada utiliza um sistema de seleção de elementos que irão compor a
amostra que é imposto pelo pesquisador.
(b) A inferência estatística consiste em organizar, resumir e descrever os dados.
(c) O Teorema Central do Limite garante que, para uma amostra de tamanho n pequeno, a
distribuição da média amostral, quando padronizada, segue uma distribuição normal padrão.
(d) Os estimadores, por serem funções de variáveis aleatórias, são, também, variáveis aleatórias.
(e) Os estimadores não estão em função de variáveis aleatórias.
197
11. Respostas dos Exercícios Propostos
11.1. Respostas dos Exercícios da Seção 2.8.
1- a. Não. Supondo que a população é formada pelos alunos que cursaram um grande curso de
estatística, deveriam ser amostrados alunos que participaram do SI assim como alunos que não
participaram do SI.
b. A aleatoriedade protege contra viés e ajuda a garantir que os alunos do grupo SI tenham pouca
possibilidade de terem vantagens além do SI, isso, com relação aos alunos do grupo de controle (aqueles
que não participarão do SI).
c. Não haveria bases sólidas para o cálculo efetivo do SI (não haveria uma base de comparação, para
saber se alunos que não recebem esse reforço tendem a ter desempenho igual, superior ou inferior ao
desempenho dos alunos recebendo esse reforço).
2- Possivelmente erro de medida, erro de registro, diferenças nas condições ambientais, diferenças nos
tempos de medida, diferenças de observadores, diferenças de aparelhos de medição, etc...
3- Não se pode afirmar que a amostra esteja adequada, já que não se pode ter certeza de que todas as
séries tem entrada ao mesmo horário, talvez alguma das séries tenha um horário adiantado para fazer
uma atividade específica.
4- (d)
5- (c)
1- a.
Não Conformidade Freq. Abs. Freq. Rel. (%)
0 7 11,67
1 12 20
2 13 21,67
3 14 23,33
4 6 10
5 3 5
6 3 5
7 1 1,67
8 1 1,67
S R R 44
Total 60 100,01
b. TTT ; TTT ; TTT
c. O histograma está centrado em algum lugar entre 2 e 3 a distribuição se concentra principalmente
entre os valores 0 e 4, sendo bastante esparsa entre 4 e 8, o que indica que um número de não conformidades
superior à 4 ocorre, porém com menor frequência.
198
2- a. Os limites inferiores e superiores das classes são fechados, sendo assim, os valores limites
pertencem a mais de uma classe.
b.
Classe Freq. Abs. Freq. Rel. (%)

[0;50) 9 18
[50;100) 19 38
[100;150) 11 22
[150;200) 4 8
[200;250) 2 4
[250;300) 2 4
[300;350) 1 2
[350;400) 1 2
[400;500) 0 0
[500;550) 1 2
Total 50 100
O valor 100 parece estar próximo do valor central. Há grande variação na vida útil, sendo que os dados estão
V Q
mais concentrados nos valores inferiores à 200 e bastante dispersos até o valor máximo.
c. TT ; TT
3-
Reclamação Freq. Abs. Freq. Rel. (%)
Dor nas Costas (B) 7 11,67
Fadiga (F) 9 15
Fadiga Muscular (M) 4 6,67
Inflamação de Articulações (J) 10 16,67
Irritação Nasal/Coriza (N) 6 10
Tosse (C) 3 5
Outros (O) 21 35
Total 60 100,01
199
4- Ao organizar os dados em uma distribuição de frequências, pode-se ter uma visão geral dos dados de
maneira resumida e simples e pode-se observar padrões de comportamento dos dados.
5- Quantitativo: histogramas e gráficos de dispersão / Qualitativo: diagrama de pizza e gráficos de barras.
6-
200
Não há uma tendência clara, mas parece que pessoas que trabalham poucas horas por semana (menos de 30)
e pessoas que trabalham muitas horas (mais de 40) recebem pouco por hora trabalhada; já pessoas que
trabalham entre 30 e 40 horas tem salários variados, provavelmente diferenciados pelo cargo exercido.
7- Com um conjunto de dados tão pequeno, a verdadeira natureza da distribuição não pode ser vista com um
histograma.
8- Apenas o gráfico A é adequado, já que o gráfico B tem o eixo vertical iniciando em 38% o que faz a diferença
entre os resultados das duas dietas parecer maior do que ela é na realidade.
9- a. O gráfico foi feito utilizando a frequência absoluta, o que não permite a comparação entre as
distribuições das frequências de indivíduos dentro de cada tipo sanguíneo de acordo com o sexo.
b.
10- Aparentemente, existe uma tendência crescente entre as duas variáveis, aumentando a quantidade de
monóxido de carbono ao aumentar a quantidade de alcatrão, essa relação, no entanto não parece ser muito
forte.
201
11- a. dados discretos
b. dados contínuos
c. dados discretos (se for considerado dias, meses ou anos completos) ou contínuos (se for
considerado tempo corrido em horas, por exemplo)
d. dados discretos
12- A taxa de pulsação masculina parece ser, num geral, mais baixa do que a das mulheres, sendo que mais
de 50% dos homens tem taxa de pulsação inferior a 70, e apenas 30% das mulheres tem taxa abaixo de 70.
Não foram observados homens com taxa superior a 100, isso já foi observado para as mulheres, embora em
pouca quantidade.
11.3. Respostas dos Exercícios da Seção 3.4.3.
1- a. 1̅ = 1,03; 89 = 1,01. A mediana se encontra à esquerda da média, o que pode indicar uma
assimetria à direita na distribuição dos dados.
b. 0,383
2- Falso. A média é a medida de tendência central com a maior probabilidade de ser afetada por um valor
atípico.
a. 1̅ = 4,57, 89 = 4,8, 8K = 4,8

3- Falso. Todo conjunto de dados quantitativos tem uma mediana.
4-
a. 1̅ = 170,63, 89 = 169,3, 8K = 8K9 b

b. Mediana, uma vez que há uma possível assimetria
5-
b. Média, uma vez que a média e a mediana são semelhantes (possível simetria).
6- Elas usam abordagens diferentes para fornecer um valor (ou valores) central de conjunto de dados.
8- 1̅ = 53,3; 89 = 52; 8K = amodal. Usando a média de 53,3 palavras por página, a estimativa do número
7- Não. O preço exatamente entre o maior e o menor é o ponto médio, não a mediana.
total de palavras é 77.765; já utilizando a mediana esse valor é de 75.920. Como as medidas estimadas se
baseia em uma pequena amostra e os números de palavras definidas nas páginas parecem variar bastante, as
estimativas não podem ser consideradas precisas, basta ver o quanto elas se diferenciam entre si.
9- 85,5 kg
202
a. _ 3 = 1264,77; _ = 35,56 (minutos)

b. _ 3 = 0,35; _ = 0,59 (horas)
1-
2- a. ‚ƒ = 1̅ + ; _* 3 = 3 _k 3
b. 189,14; 1,87
3- Variância é uma medida numérica de dispersão, variação está relacionado a um termo utilizado para se
referir a algo que varia de alguma forma.
4- as rendas de uma amostra aleatória simples de 1.000 adultos selecionados da população geral, já que
dentro dessa população teremos a possibilidade de amostrar indivíduos sem renda, ou com renda muito
baixa e indivíduos com rendas exorbitantes; já em uma amostra de 1000 professores de estatística os
5- _ 3 = 245,12; _ = 15,66. Considerando que o desvio padrão é igual a 15,66 e a média é de 53,3, podemos
salários devem ser bem mais compatíveis entre si.
dizer que existe uma variação grande dos dados, o que afeta consideravelmente a confiança nas estimativas
calculadas anteriormente.
6- 30 dias antes: 8,5%; 1 dia antes: 33,8%. Os custos das passagens compradas com 30 dias de antecedência
têm menos variação do que os custos de passagens compradas com 1 dia de antecedência. Há uma economia
substancial na compra de passagens com 30 dias de antecedência.
1- a. Sim
b. Além da presença de outliers, a distribuição em torno da mediana é assimétrica, havendo uma maior
concentração de observações entre o primeiro quartil e a mediana, também, os dados estão mais
concentrados entre o primeiro e o terceiro quartis do que nas extremidades.
2- a.
Resumo dos 5 números ED Não-ED
Mínimo 0 0
Primeiro Quartil 0,1 0,3
Mediana 0,4 1,6
Terceiro Quartil 2,8 7,9
Máximo 21 17,8
b. Sim
ED Não-ED
DIQ 2,7 7,6
ROT (-3,95 ; 6,85) (-11,1 ; 19,3)
203
Outliers 8,9 ; 9,2 ; 11,7 ; 21
c. Existem outliers apenas no conjunto de dados ED. Ambas as amostras são assimétricas à direita,
tendo uma maior concentração nos valores mais baixos, os valores no conjunto Não-ED tendem a ser um
pouco maiores do que a do conjunto ED. A dispersão no conjunto Não-ED é maior.
3- 8í = 664; • = 706; •3 = 766; •4 = 810; 8á1 = 836; “”• = 104; •–c = (550 ; 966). Esse
conjunto de dados não possui valores atípicos.
8í = 27 cm; • = 37,75 cm; •3 = 39,05 cm; •4 = 41 cm; 8á1 = 48,6 cm; “”• = 3,25 cm;
•–c = (32,875 ; 45,875) cm. Esse conjunto de dados possui 4 valores atípicos.
4-
204
1̅ = 19,3 onças; 89 = 19,5 onças; 8K = 20 onças; Amplitude = 4 onças; _ = 1,3 onça; _ 3 = 1,8
onça²; • = 18 onças; •4 = 20 onças.
5-
11.6. Reposta dos Exercícios da Seção 4.
1- a. 1̅ +… = 5,83 e qr+… = 69,64% ; 1̅, = 5,79 e qr+… = 106,56%

b.
c. Ambas as distribuições são assimétricas à esquerda, como pode ser observado no gráfico, e
suportado pelo fato da ambas as médias calculadas no item (a) serem inferiores às medianas apresentadas
no gráfico. Além disso, fica claro, tanto pelos coeficientes de variação como pelos box plots que os dados
de montreal são mais heterogêneos que os dados de Nova York.
2- a.
205
Classe Freq. Abs. Freq. Rel. (%) Freq. Rel. Ac. (%)
501 ⊢ 526 4 16,67 16,67
526 ⊢ 551 3 12,50 29,17
551 ⊢ 576 3 12,50 41,67
576 ⊢ 601 2 8,33 50,00
601 ⊢ 626 6 25,00 75,00
626 ⊢⊣ 651 6 25,00 100,00
Total 24 100
b.
c. Não, já que o histograma não pode ser considerado como espelhado em torno de 585,29, além disso
a média se encontra à esquerda da mediana (599), o que indica que essa variável apresenta uma assimetria
à esquerda.
3. a. Estatística: média = 61,25 ; mediana = 61 ; moda = 50 / matemática: média = 62,25 ; mediana = 60 ;
amodal
b. Para estatística, a média e a mediana são semelhantes, sendo assim, pode-se dizer que sua
distribuição deve ser aproximadamente simétrica, já para matemática, a média e a mediana são mais
afastadas, o que pode indicar uma assimetria na distribuição das notas.
c. Estatística: CV = 13,75% / matemática: CV = 18,70%. Olhando pelo coeficiente de variação, pode-se
dizer que as notas de estatística são mais homogêneas que as notas de matemática.
d.
206
Resumo dos Cinco Números Estatística Matemática
Mínimo 50 45
Primeiro Quartil 55,5 54,5
Mediana 61 60
Terceiro Quartil 65,5 68
Máximo 80 90
e. Estatística: DIQ = 10 e ROT = (40,5 ; 80,5) não existem valores atípicos / Matemática: DIQ = 13,5 e
ROT = (34,25 ; 88,25) existe um valor atípico, o 90.
f.
4- a. 6
b. 4
c. • = 3 ; •3 = 4 ; •4 = 6
d. DIQ = 3 e ROT =(-1,5 ; 10,5) não existem valores atípicos
207
5. item (a)
6. item (b)
7. item (a)
8. item (c)
9. item (d)
10. item (b)
11. item (d)
12. item (e)
13. item (d)
14. item (d)
1- a. Um indivíduo em particular que esteja exposto a altos níveis de monóxido de carbono e de dióxido
de nitrogênio
b. Um indivíduo em particular que esteja exposto a altos níveis de monóxido de carbono ou altos níveis
de dióxido de nitrogênio
c. Um indivíduo em particular que não esteja exposto a altos níveis de monóxido de carbono
a. £ ∩ ¤ª
d. Não
b. (£ ∩ ¤ª ) ∪ (£ª ∩ ¤)
2-
c. £ª ∩ ¤ª
a. £ ∪ ¤ = › , , 9, [•
b. ¤ª = › , •
3-
c. (£ ∩ ¤)ª = › , , [•
d. £ ∩ ¤ = › , 9•
e. £ª ∩ ¤ = ›[•
f. £ª ∩ ¤ª = › •
208
g. (£ ∪ ¤)ª = › •
h. £ ∪ ¤ª = › , , , 9•
4.
a. £ª = ›5,6,7,8,9•
b. £ ∩ q = ›3,4•
5-
c. (£ ∩ q )ª = ›1,2,5,6,7,8,9•
d. £ ∪ ¤ = ›1,2,3,4,6,8•
a. £ = {SSF, SFS, FSS}
b. ¤ = {SSF, SFS, FSS, SSS}
6-
c. q = {SFS, SSF, SSS}

d. q ª = {FFF, FSF, FFS, FSS, SFF}
£ ∪ q = {SSF, SFS, FSS, SSS}
£ ∩ q = {SSF, SFS}
¤ ∪ q= {SSF, SFS, FSS, SSS} = B
¤ ∩ q = {SSF, SFS, SSS} = C
7- a. {(SSS), (SSC), (SCC), (SCS), (CSS), (CSC), (CCS), (CCC)}
b. {(CCC)}
c. {(SSC), (SCS), (CSS)}
d. {(SSC), (SCS), (SCC), (CSS), (CSC), (CCS), (CCC)}
8- {1HH, 1HT, 1TH, 1TT, 2H, 2T, 3HH, 3HT, 3TH, 3TT, 4H, 4T, 5HH, 5HT, 5TH, 5TT, 6H, 6T}
9- a. {1HH, 1HT, 1 TH, 1TT, 2H, 2T}
209
b. {1TT ,3TT , 5TT}
c. {3HH, 3HT, 3TH, 3TT , 4H, 4T, 5HH, 5HT, 5TH, 5TT , 6H ,6T}
d. {3TT , 5TT}
e. {1HH, 1HT, 1TH, 1TT, 2H, 2T, 3TT ,5TT}
1- a. 0,7826 b. 0,46 c. 0,64 d. 0,1 e. 0,3125 f. 1

g. Não, pois a probabilidade da interseção entre os eventos difere da multiplicação das probabilidades
individuais.
2- a. Sim, já que a multiplicação das probabilidades individuais é igual probabilidade da interseção entre
os eventos.
b. 0,2 ; 0,1
£ £̅
3-
¤
Total
¤ƒ
0,624 0,096 0,72
0,176 0,104 0,28
Total 0,80 0,20 1,00
4- 0,6
5- a. 0,75 ; 0,20 ; 0,30 b. 0,15 c. 0,538
6- 0,0167 ; 0,9833
7- a. 0,07 b. 0,30 c. 0,57
8- a. Projetos 1 ou 2 fechados; 0,07
b. Projetos 1 e 2 abertos; 0,64
c. Projetos 1, 2 ou 3 fechados 0,57
d. Projetos 1, 2 e 3 abertos; 0,47
e. Projetos 1 e 2 abertos e projeto 3 fechado; 0,17
f. Projetos 1 e 2 abertos, ou projeto 3 fechado; 0,75
9- a. Há pacotes de software estatísticos além do SPSS e do SAS.
b. 0,70 c. 0,80 d. 0,20
10- a. 0,8841 b. 0,0435
11- a. 0,10 b. 0,18;0,19 c. 0,41 d. 0,59 e. 0,31 f. 0,69
12- a. 0,98 b. 0,02 c. 0,03 d. 0,24
13- a. 0,072 b. 0,944
14- a. Não são eventos mutuamente exclusivos, já que pode haver uma caixa com furo e com o canto
amassado.
b. 0,126
15- 0.22
16- 0.023
17- 0.028
18- a. 0.10 b. 5/8 c. 0.9
19- a. 0.0037 b. 0.1892
20- a. 0.7 b. 0.4 c. 0.1 d. 0.2 e. 0.6 f. 0.8
21- a. 0,162 b. 0,211 c. 0,346 d. 0,9743 e. 0,0270 f. 0,654
g. 0,045 h. 0,0261 i. 0,833 j. 0,872
22- a. A soma das probabilidades excede 1.
b. A soma das probabilidades é menor que 1.
c. Uma probabilidade negativa.
d. A probabilidade de uma carta de copas de cor preta é zero.
210
23- a. 0,3; b. 0,2
24- a. 22/25; b. 3/25; c. 17/50
25- a. 0,009; b. 0,999; c. 0,01
26- a. A probabilidade de que um condenado que tenha feito tráfico de drogas também tenha cometido
assalto à mão armada.
b. A probabilidade de que um condenado que tenha feito assalto à mão armada não tenha sido
condenado por tráfico de drogas.
c. A probabilidade de que um condenado que não cometeu tráfico de drogas também náo tenha
cometido assalto à mão armada.
27- a. 14/39; b. 95/112
28- a. 0,35; b. 0,875; c. 0,55
29- 0,27
30- a. 1/5; b. 4/15; c. 3/5
31- 0,0960
32- 0,40625
33- 0,1124
1- Uma variável aleatória representa um valor numérico atribuído a um resultado de um experimento

probabilístico.
2- a. Falso. Na maioria das aplicações, variáveis aleatórias discretas representam dados que podem ser
contados, enquanto as variáveis aleatórias contínuas representam dados que podem ser medidos.
b. Verdadeiro
3- a. Discreta, pois a variável aleatória é contável
b. Contínua, pois a variável aleatória não pode ser contada.
c. Discreta, pois a variável aleatória é contável.
d. Contínua, pois a variável aleatória não pode ser contada.
4- a. Discreta b. contínua c. contínua d. discreta e. discreta f. contínua
11.10. Resposta dos Exercícios da Seção 6.2.5.
1- f(0) = 1/3, f(1,5) = 1/3, f(2) = 1/6, f(3) = 1/6

2- Todas as probabilidades são maiores que 0 e menores do que 1 e totalizam um.
a.1 b. 0 c. 3/4 d. ½
3- Todas as probabilidades são maiores que 0 e menores do que 1 e totalizam um.
a. 9/25 b. 4/25 c. 12/25 d. 1
4- P(X = 10 milhões) = 0,3. P(X = 5 milhões) = 0,6. P(X = 1 milhão) = 0,1
5- a. 0,512 b. P(X = 0) = 0,008 ; P(X = 1) = 0,096 ; P(X = 2) = 0,384 ; P(X = 3) = 0,512.
6- a. 0,92169 b. P(X = 0) = 0,00001 ; P(X = 1) = 0,00167 ; P(X = 2) = 0,07663 ; P(X = 3) = 0,92169
7- a. 1000 b. 0,001 c. 249,50 dólares d. -25 centavos
e. Como ambos os jogos têm o mesmo valor esperado, nenhuma aposta é melhor que a outra.
8- a. -161 dólares e 99.839 dólares b. -21 dólares
c. Sim, pois o valor esperado para a companhia de seguros é 21 dólares, que indica que a companhia
pode esperar obter uma média de 21 dólares por cada uma das apólices.
9- a. 0,209
b. Diferentemente de a), os 20 sujeitos selecionados são mais do que 5% dos 320 sujeitos disponíveis,
de modo que a independência não pode ser admitida pela diretriz dos 5%. O requisito de independência para
a probabilidade binomial não é satisfeito.
10- a. 0,929 b. 0,395 c. 227,5 regiões
d. O resultado real de 229 está muito próximo do resultado calculado.
11- a. 1/30 b. 1/10
211
0, 1 < 0
⎧0,41, 0 ≤ 1 < 1
⎪
0,78, 1 ≤ 1 < 2
† (1 ) =
⎨0,94, 2 ≤ 1 < 3
⎪0,99, 3 ≤ 1 < 4
12-
⎩ 1, 1 ≥ 4
1- a. 0,81 b. 1,17 c. 0,97 d. 2,41

2- a. 0,0082 b.0,9544
3- a. 0,99379 b. 0,00621
4- a. 0 b. 0,0241 c. (12.142, 12.658)
5- a. 0,02275 b. 0,47725 c. 0,336
6- a. 0,9733 b. 9,973
7- a. 0,00043 b. 6016 c. 1/8
8- a. 0,02275 b. 0,324 c. 11,455
9- a.85,77% (Tecnologia: 85,80%) b. 99,96%
c. A altura não é adequada porque 14% dos homens adultos precisarão se abaixar, de modo que seria
melhor ter-se uma altura maior de porta, mas outras considerações de design provavelmente tornam
isso não prático.
d. 74,7 polegadas (Tecnologia: 74,8 polegadas]0
10- a. 3,67% (Tecnologia: 3,71%) b. 0,52%
c. Não. A porcentagem de homens elegíveis é maior do que a porcentagem de mulheres elegíveis.
11- a. 98,74% (Tecnologia: 98,75%). Não, apenas cerca de 1% das mulheres não é elegível.
b. Mínimo: 57,8 polegadas; máximo: 68,7 polegadas
12- a. 4.09% b. 2630 g
c. Sem um peso ao nascer especifico de corte, não haveria como saber se um bebê estará nos 3%
inferiores até que todos os bebês tivessem nascido, mas a espera poderia negar tratamento para
aqueles bebes que precisassem de tratamento especial.
13- a. 0.01% Sim b. 99.22°
14- a. 0.0038; ou ocorreu um evento muito raro, ou o marido não é o pai.
b. 242 dias
16- a. 0.1151 b. 16.1 c. 20.275 d. 0.5403
17- a. 0,8980 b. 0,0287 c. 0,6080
18- a. 0,0548 b. 0,4514 c. 23 d. 189.95ml
19- a. 0,0571 b. 99,11% c. 0,3974 d. 27,952 minutos e. 0,0092
20- 6,24 anos
21- a. 51% b. 18,37%
22- a. 0,0401 b.0,0244
23- 26
24- a. 0,0228 b. 0,3974
11.12. Respostas dos Exercícios da Seção 7.
1- a. Os eventos A e B não são independentes, já que são definidos como mutuamente exclusivos.
b. 0,74 c. 0,16
2- a. 0,15 b. 0,47 c. 0,33 d. 0,12 e. 0,72
3- a. 0,07
b.
212
b
¶(b = b )
-3 1
0,044 0,956
c. 0,824 UM
4- a. 0,074 b. 0,285 c. 0,804 d. 0,521
5- 0,142
6- 0,21
7- 0,995
8- a. 0,15 b. 2,1 c. 1,19
9- (c)
1- Uma distribuição amostral de uma estatística é a distribuição de todos os valores daquela estatística
quando são extraídas todas as amostras possíveis, de mesmo tamanho, da mesma população.
2- A média de todas as médias amostrais é igual à média populacional.
3- A amostra não é uma amostra aleatória simples da população de todos os estudantes universitários
dos Estados Unidos. É provável que os estudantes da New York University não reflitam com precisão o
comportamento de todos os universitários dos Estados Unidos.
4- Normal (aproximadamente).
5- a. (56, 56), (56, 49), (56, 58), (56, 46), (49, 56), (49, 49), (49, 58), (49, 46), (58, 56), (58, 49), (58, 58),
(58, 46) (46,56), (46, 49), (46, 58), (46, 46).
1̅
b.
46 47,5 49 51 52 52,5 53,5 56 57 58
Probabilidade 1/16 1/8 1/16 1/8 1/8 1/8 1/8 1/16 1/8 1/16
c. A média da população é 52,25 e a média das médias amostrais também é 52,25.
d. As médias amostrais tendem para a média populacional. As médias amostrais são bons estimadores
das médias populacionais porque tendem ao valor da média populacional, em vez de, sistematicamente,
subestimar ou sobrestimar esse valor.
6- a. (M, M), (M, A), (M, B), (M, C), (A, M), (A, A), (A, B), (A, C), (B, M), (B, A), (B, B), (B, C), (C, M), (C, A),
(C, B), (C, C).
Proporção Probabilidade
0 1/16
0,5 6/16
1 9/16
b. 0,75.
c. Sim; sim.
7- a.0,3897 b. 0,1093
c. Sim. A probabilidade de exceder a capacidade de segurança de 3500 libras é de 0,1093, que é muito
alta.
8- a.0,5675 b. 0,7257
c. A gôndola é, provavelmente, projetada para carregar uma carga total algo maior do que 2004 libras,
mais os operadores seriam sábios ao evitarem uma carga de 12 homens, especialmente se eles parecem ter
peso alto.
1- a. 99,5% b. 85%
2- a. mais estreito b. não c. não d. não
3- a. (4,52 ; 5,18) b. (4,12 ; 5,00) c. 0,55 d. 94
213
4- 76,1% < p < 82,0%. Há 95% de confiança em que os limites de 76,1% e 82,0% contenham o valor
verdadeiro da porcentagem de todos os adultos que acreditam ser moralmente errado não declarar toda a
2,492 < m < 2,506g. O intervalo de confiança contém o valor médio requerido de 2,5g, de modo que o
renda.
5-
processo de manufatura parece estar bom.
6- a. 0,890 b. 0,871 < p < 0,910
c. Sim, como há 95% de confiança em que os limites 0,871 e 0,910 contenham o verdadeiro valor da
proporção populacional, parece que há forte evidência de que a proporção populacional é maior que 0,5.
7- 1974
8- 2981 (Tecnologia: 2982)
9- a. 1464 < µ < 1580 b. 1445 < µ < 1599
c. O intervalo de confiança de 99% é mais amplo. Precisamos de uma amplitude maior de valores para
termos mais confiança em que o intervalo contenha a média populacional.
10- 128,7 < µ < 139,2; idealmente, todas as medidas deveriam ser as mesmas, de modo que não haveria
uma estimativa intervalar
11- 35
12- 6907. O tamanho amostral é muito grande para ser prático.
13- A quantia se refere a uma média, que pode ser a média ou a mediana, mas a margem de erro é
apropriada para uma proporção, não para média ou mediana. A margem de erro deve ser uma quantia em
dólares, não pontos percentuais.
14- Não. A amostra aleatória simples é obtida dos californianos, de modo que não necessariamente
resultará em uma boa estimativa para a população de adultos dos Estados Unidos. É bem possível que os
californianos não sejam representativos dos Estados Unidos. É necessária uma amostra aleatória simples da
0,3097 < m < 0,3103

população.
a. 22.496; < m < 24.504;

15-
16- b. erro < 1004
17- 35
18- 0,194 <p < 0,262
19- a. 0,739 < p < 0,961; b. não
1- H0:σ=0,05 versus Ha:σ<0,05. I: conclui que a variabilidade na espessura é satisfatória quando de fato
não é. II: conclui que a variabilidade na espessura não é satisfatória quando de fato é.
2- I: concluindo que a usina não está em conformidade quando está; II: concluindo que a usina está em
a. •
conformidade quando não está.
3- c. 0,044 d. Rejeitar H0
b. I: julgando que uma das duas companhias é favorecida em relação à outra quando este não é o
caso; II: julgando que nenhuma companhia é favorecida em relação à outra quando na realidade uma das
duas é realmente preferida.
Não rejeitar ¬T
4- b. 0,0004; 0; menor do que 0,01.
Não rejeitar ¬T
5- b. 0,99865 c. 96,7≤µ≤99,31
Rejeitar ¬T
6- b. 0,15562 c. 60 d. 1,496≤µ≤1,513
7- b. 0,00539 c. 1003≤µ≤1025
8- H0: p = 0,75. H1: p ≠0,75. Estatística de teste: z = 2,56. Valores críticos de z = ±2,575. Valor P: 0,0104.
Deixe de rejeitar H0. Não há evidencia suficiente para garantir a rejeição da afirmativa de que 75% dos adultos
dizem ser moralmente errado não relatar toda a renda na declaração de imposto.
9- H0: p = 1/3. H1: p > 1/3. Estatística de teste: z = 3,47. Valor crítico de z = 2,33. Valor P: 0,0003. Rejeite
H0. Há evidencia suficiente para apoiar a afirmativa de que a proporção de desafios bem-sucedidos é maior
do que 1/3. Ao avaliar a qualidade das decisões do juiz, deve ser notado que apenas decisões próximas têm
chance de ser desafiadas, e 327 desafios bem-sucedidos entre milhares de decisões é uma proporção muito
pequena de decisões erradas, de modo que a qualidade das decisões do juiz é muito boa, mas não perfeita.
214
10- H0: p = 0,06. H1: P > 0,06. Estatística de teste: z = 4,47. Valor crítico de z = 1,645. Valor P: 0,0001. Rejeite
H0. Há evidencias suficiente para apoiar a afirmativa de que a taxa de náusea é a maior do que a taxa de 6%,
experimentada pelos pacientes de resfriado que receberam um placebo. A taxa de náusea com o tratamento
com o Tamiflu parece maior que a taxa entre aqueles que receberam um placebo, e a proporção amostral de
0,0994 sugere que cerca de 10% dos que foram tratados tiveram náuseas, de modo que essa reação é uma
preocupação para os que fazem o tratamento
11- H0: p = 0,000340. H1: p ≠ 0,000340. Estatística de teste: z = -0,66. Valores críticos de z = ±2,81. Valor P:
0,5092. Deixe rejeitar H0.Não há evidencias suficiente para apoiar a afirmativa de que a taxa é diferente de
0,0340% o usuário de telefones celulares não deve se preocupar com câncer no cérebro ou do sistema
nervoso.
12- H0: p = 0,20. H1: p < 0,20. Estatística de teste: z = -2,93. Valor crítico de z = -2,33. Valor P: 0,0017. Rejeite
H0. Há evidencias suficiente para apoiar a afirmativa de que menos de 20% das bombas de gasolina de
Michigan são imprecisas. A porcentagem de bombas imprecisas deveria ser muito baixa, mas esse teste de
hipótese mostra apenas que ela parece inferior a 20%. A proporção amostral de 0,186 sugere que muitas
bombas são precisas.
13- H0: p = 0,80. H1: p< 0,80. Estatística de teste: z = -1,11. Valor crítico de z = -1,645. Valor P: 0,1335. Deixe
de rejeitar H0. Não há evidencias suficiente para apoiar a afirmativa de que os resultados do poligrafo são
corretos menos de 80% das vezes. Com base na proporção amostral de resultados corretos em 75,5% dos 98
casos, os resultados do poligrafo não parecem ter o alto grau de confiabilidade que justifique o uso de
resultados de testes em julgamentos, de modo que os resultados deveriam ser proibidos como evidencia em
julgamentos.
14- H0: p = 0,20. H1: p < 0,20. Estatística de teste: z = -8,84. Valor crítico de z = -2,83. Valor P: 0,0001.
Rejeite H0. Há evidencias suficiente para apoiar a afirmativa de que menos de 20% dos aparelhos de TV em
uso estavam ligados no 60 Minutes.
15- H0: p = 0,50. H1: p≠0,50. Estatística de teste: z = -0,66 ou z=-0,65. Valor crítico de z = ±1,96 (Supondo o
nível de significância de 0,05). Valor P=0,5092 ou P=0,5156. Deixe de rejeitar H0. Não há evidência suficiente
para garantir a rejeição da afirmativa de que, entre executivos seniores, 50% dizem que o erro mais comum
na entrevista para emprego é ter-se pouco, ou nenhum, conhecimento da empresa. A lição importante é
sempre se preparar para uma entrevista para emprego aprendendo sobre a empresa.
16- H0: p = 3/4. H1: p≠3/4. Estatística de teste: z =-2,53 ou z=-2,54. Valor crítico de z = ±1,96 (Supondo o
nível de significância de 0,05). Valor P=0,0114 ou P=0,0110. Rejeite H0. Há evidência suficiente para garantir a
rejeição da afirmativa de que 3/4 de todos os adultos usam internet. A proporção parece ser diferente de 3/4
ou 0,75. O repórter não deveria escrever que 3/4 dos adultos usam a internet.
17- H0: p = 1/4. H1: p>1/4. Estatística de teste: z =5,73. Valor crítico de z = +1,645. Valor P=0,0001. Rejeite
H0. Há evidência suficiente para apoiar a afirmativa de que mais de 1/4 das pessoas dizem que os patrões
gritam com os empregados. Se a amostra é de resposta voluntária, a conclusão sobre a população pode não
ser válida.
18- H0: p = 0,5. H1: p>0,5. Estatística de teste: z =5,83 ou z=5,85. Valor crítico de z = 1,645. Valor P=0,0001.
Rejeite H0. Há evidência suficiente para apoiar a afirmativa de que a maioria dos trabalhadores obtém seus
empregos através de redes.
19- H0:µ=210s. H1:µ>210s. Estatísticas de testes: z = 4,93. Valor crítico z=1,645. Valor P: 0,0001. Rejeite H0.
Há evidencia suficiente para apoiar a afirmativa de que a amostra é proveniente de uma população de canções
com duração média maior do que 210s. Esses resultados sugerem que o conselho de escrever uma canção
que não dure mais do que 210s não é solido.
20- H0:µ=0,8535g. H1:µ≠0,8535g. Estatísticas de testes: z = 0,77. Valor crítico z=±1,96. Valor P: 0,4412.
Deixe de rejeitar H0.Não há evidencia suficiente para garantir a rejeição da afirmativa de que as M&M verdes
tem peso médio de 0,8535g. As M&M verdes parecem ter pesos consistentes com os rótulos das embalagens.
21- H0:µ=0 libras. H1:µ>0 libras. Estatísticas de testes: z = 3,87. Valor crítico z=2,33. Valor P: 0,0001. Rejeite
H0. Há evidencia suficiente para apoiar a afirmativa de que a perda média de peso é maior do que 0. Embora
a dieta pareça ter significância estatística, não parece ter significância prática, porque a perda média de peso
de apenas 3 libras não parece valer a pena o esforço e custo.
215
22- H0:µ=91,4cm. H1:µ≠91,4cm. Estatísticas de testes: z = 2,33. Valor crítico z=±1,96. Valor P: 0,0198.
Rejeite H0. Há evidencia suficiente para apoiar a afirmativa de que os homens na faculdade têm altura quando
sentados diferente de 91,4cm. Como a estudante selecionou amigos homens, ela usou uma amostra de
conveniência, que pode ter características diferentes das características da população de homens de sua
escola. Como o requisito de uma amostra aleatória simples não é satisfeito, o método de testes de hipótese
dado nessa sessão não se aplica, de modo que os resultados não são necessariamente válidos.
23- H0:µ=500.000 dólares. H1:µ<500.000 dólares. Estatísticas de testes: z = -1,15. Valor crítico z=-1,645.
Valor P: 0,1251. Deixe de rejeitar H0. Não há evidencia suficiente para garantir a rejeição da afirmativa de que
o salário médio de um técnico de futebol da NCAA é inferior a 500.000 dólares.
24- H0:µ=235,8cm. H1:µ≠235,8cm. Estatísticas de testes: z = -0,56. Valor crítico z=±1,96. Valor P: 0,5754.
Deixe de rejeitar H0. Não há evidencia suficiente para garantir a rejeição da afirmativa de que as novas bolas
de beisebol têm altura média de quique de 235,8cm. As novas bolas de beisebol não parecem diferentes.
25- H0:µ=678. H1:µ≠678. Estatísticas de testes: z = 4,93. Valor crítico z=±1,96. Valor P: 0,0002. Rejeite H0.
Há evidencia suficiente para apoiar a afirmativa de que a amostra de escores FICO é proveniente de uma
população com escores FICO médio de 678.
26- H0: µ= 210s. H1: µ>210s. Estatística de teste t=4,93. Valor P: 0,000. Rejeite H0. Há evidência suficiente
para apoiar a afirmativa de que a amostra é proveniente de uma população de canções com duração média
maior que 210s. Esses resultados sugerem que o conselho de se escrever uma canção não mais longa do que
210s não tem fundamento.
27- H0: µ= 21,1mg. H1: µ<21,1mg. Estatística de teste t=-10,676. Valor crítico: t=-1,711.Valor P<0,005.
Rejeite H0. Há evidência suficiente para apoiar a afirmativa de que os cigarros de 100mm com filtro tem uma
quantidade média de alcatrão menor do que 21,1mg. Os resultados sugerem que os filtros são eficazes na
redução de alcatrão.
28- H0: µ= 2,5g. H1: µ≠2,5g. Estatística de teste t=-0,332. Valores críticos: t=±2,028. Valor P>0,20. Deixe de
rejeitar H0. Não há evidência suficiente para garantir a rejeição da afirmativa de que os centavos tem peso
médio igual a 2,5g. Os centavos parecem de acordo com as especificações de cunhagem dos Estados Unidos.
29- H0: µ= 4,5 anos. H1: µ>4,5 anos. Estatística de teste t=1,227. Valor crítico: t=1,664.Valor P>0,10. Deixe
de rejeitar H0. Não há evidência suficiente para apoiar a afirmativa de que o tempo médio é maior do que 4,5
anos.
30- H0: µ= 49,5 centavos. H1: µ<49,5 centavos. Estatística de teste t=-8,031. Valor crítico t=-2,364. Valor
P<0,01. Rejeite H0. Há evidência suficiente para apoiar a afirmativa de que a média é menor do que 49,5
centavos. Os resultados sugerem que as porções de centavos de quantias de cheques são tais que os valores
de 0 centavos a 99 centavos não são equiprováveis.
31- H0: µ= 1000 Hic. H1: µ<1000 Hic. Estatística de teste t=-2,661. Valor crítico t=-3,365. Valor P está entre
0,01 e 0,025. Deixe de rejeitar H0. Não há evidência suficiente para apoiar a afirmativa de que a média
populacional é menor do que 1000 Hic. Não há forte evidência de que a média é menor do que 1000 Hic, e um
dos assentos para crianças tem uma medida de 1210 Hic, o que não satisfaz a especificação de ser menor do
que 1000 Hic.
32- H0: µ=U$5000. H1: µ≠U$5000. Estatística de teste t=1,679. Valor crítico t=±2,776. Valor P está entre
0,10 e 0,20. Deixe de rejeitar H0. Não há evidência suficiente para rejeição da afirmativa de que o custo médio
de danos é de U$5000.
z = -2,76; sim, m < 40 meses; Valor P = 0,0029

33- z = -1,64; Valor P = 0,10
z = 8,97; sim, m > 20.000 quilômetros; Valor P < 0,001

34-
35-
36- t = 0,77; não rejeitar H0.
37- t = -1,98; Rejeitar H0 Valor P = 0,0312
1- 3
'LMN = 1,9025; 0,3 < p-valor < 0,4. Logo, pode-se concluir que o tratamento utilizado não tem
influência no tempo de sobrevivência dos pacientes sofrendo dessa enfermidade terminal específica, sendo
216
indicado, portanto, aquele tratamento que fornecer uma melhor qualidade de vida e conforto ao paciente, se
houver algum.
2- a. 0,01 b. 0,025 c. 4,605
a. 'LMN = 55,36; p-valor < 0,0001. Logo, temos evidências suficientes para rejeitar a hipótese nula.
3
3- a. 0,01 b. 0,95 c. 24,769
4-
b. Podemos dizer que dirigir embriagado depende da idade, e que após atingir a idade legal menos
estudantes dirigiram embriagados.
5- a. 8,60% dos pacientes do grupo Calcitrol e 6,49% dos pacientes do grupo Cálcio se retiraram
3
b. 'LMN = 0,9865 e '€jM
3
= 3,841. Logo, não se rejeita a hipótese nula, ou seja, não foi possível
(respectivamente)
verificar associação entre o tratamento e a retirada do paciente.
11.17. Respostas dos Exercícios da Seção 10.
1- a. 1,8393 b. (21,9 ; 23,3)

2- a. 601 b. (0,491 ; 0,593)
a. ¬T : m = 500 y_. ¬j : m ≠ 500 ; ù = −1,75 ; ••: › | < −1,96 K^ > 1,96• ; Como ù ∉ ••,
3- a. 22,4 b. (20,697 ; 24,173)
não se rejeita ¬T
4-
a. ¬T : ] = 0,03 y_. ¬j : m < 0,03 ; ù = − − 0,454 ; ] − y bK\ = 0,3264 ; Como ] − y bK\ >
b. 9%
0,08, não se rejeita ¬T

5-
b. Não é possível afirmar que a fábrica esteja dentro das normas já que a evidência obtida indica que
a. ¬T : m = 30 y_. ¬j : m > 30 ;a = 2,5 ; ••: ›a|a > 2,4377• ; Como a ∈ ••, rejeita-se ¬T
a proporção de peças defeituosas não difere de três.
b. 0,005 < ] − y bK\ < 0,01, ou seja o erro real ao rejeitar a hipótese nula baseado na evidência
6-
coletada está entre 0,5% e 1%.

7- Conglomerado
a. ¬T : ] = 0,01 y_. ¬j : m < 0,01

8- 0,4013
9-
b. Rejeitar uma proporção de peças defeituosas igual a 10%, quando na realidade essa proporção
a. ¬T : m ≤ 40 y_. ¬j : m > 40 ;
não difere de 10%.
10-
b. Não rejeitar uma temperatura média de no máximo 40°C, quando na verdade a temperatura
média da água despejada no rio é superior a 40°C.
11- Amostragem aleatória simples
12- (e)
13- (d)
217
12. Anexos
Tabela 49: Distribuição Normal Padrão (Z~N(0,1)). Corpo da tabela dá a probabilidade p, tal que p=P(Z≥z_c ).
³(. ≥ e)
Segunda decimal de e
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
e
1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
Parte inteira e primeira decimal de
1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
³(. ≥ e)
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
Segunda decimal de e
218
Tabela 50: Distribuição t de Student. Corpo da tabela dá os valores dY•x, tais que ³(d > dY•x ) = . Para valores maiores que
120, utilizar a aproximação normal.
Probabilidades da cauda direita ( )

³(d > dY•x ) =
0,4 0,3 0,2 0,1 0,05 0,04 0,03 0,025 0,02 0,01 0,005
1 0,3249 0,7265 1,3764 3,0777 6,3138 7,9158 10,579 12,706 15,895 31,821 63,657
2 0,2887 0,6172 1,0607 1,8856 2,92 3,3198 3,8964 4,3027 4,8487 6,9646 9,9248
3 0,2767 0,5844 0,9785 1,6377 2,3534 2,6054 2,9505 3,1824 3,4819 4,5407 5,8409
4 0,2707 0,5686 0,941 1,5332 2,1318 2,3329 2,6008 2,7764 2,9985 3,7469 4,6041
5 0,2672 0,5594 0,9195 1,4759 2,015 2,191 2,4216 2,5706 2,7565 3,3649 4,0321
6 0,2648 0,5534 0,9057 1,4398 1,9432 2,1043 2,3133 2,4469 2,6122 3,1427 3,7074
7 0,2632 0,5491 0,896 1,4149 1,8946 2,046 2,2409 2,3646 2,5168 2,998 3,4995
8 0,2619 0,5459 0,8889 1,3968 1,8595 2,0042 2,1892 2,306 2,449 2,8965 3,3554
9 0,261 0,5435 0,8834 1,383 1,8331 1,9727 2,1504 2,2622 2,3984 2,8214 3,2498
10 0,2602 0,5415 0,8791 1,3722 1,8125 1,9481 2,1202 2,2281 2,3593 2,7638 3,1693
11 0,2596 0,5399 0,8755 1,3634 1,7959 1,9284 2,0961 2,201 2,3281 2,7181 3,1058
12 0,259 0,5386 0,8726 1,3562 1,7823 1,9123 2,0764 2,1788 2,3027 2,681 3,0545
13 0,2586 0,5375 0,8702 1,3502 1,7709 1,8989 2,06 2,1604 2,2816 2,6503 3,0123
14 0,2582 0,5366 0,8681 1,345 1,7613 1,8875 2,0462 2,1448 2,2638 2,6245 2,9768
15 0,2579 0,5357 0,8662 1,3406 1,7531 1,8777 2,0343 2,1314 2,2485 2,6025 2,9467
Graus de Liberdade ‘ − .)
16 0,2576 0,535 0,8647 1,3368 1,7459 1,8693 2,024 2,1199 2,2354 2,5835 2,9208
(
17 0,2573 0,5344 0,8633 1,3334 1,7396 1,8619 2,015 2,1098 2,2238 2,5669 2,8982
18 0,2571 0,5338 0,862 1,3304 1,7341 1,8553 2,0071 2,1009 2,2137 2,5524 2,8784
19 0,2569 0,5333 0,861 1,3277 1,7291 1,8495 2 2,093 2,2047 2,5395 2,8609
20 0,2567 0,5329 0,86 1,3253 1,7247 1,8443 1,9937 2,086 2,1967 2,528 2,8453
21 0,2566 0,5325 0,8591 1,3232 1,7207 1,8397 1,988 2,0796 2,1894 2,5176 2,8314
22 0,2564 0,5321 0,8583 1,3212 1,7171 1,8354 1,9829 2,0739 2,1829 2,5083 2,8188
23 0,2563 0,5317 0,8575 1,3195 1,7139 1,8316 1,9782 2,0687 2,177 2,4999 2,8073
24 0,2562 0,5314 0,8569 1,3178 1,7109 1,8281 1,974 2,0639 2,1715 2,4922 2,7969
25 0,2561 0,5312 0,8562 1,3163 1,7081 1,8248 1,9701 2,0595 2,1666 2,4851 2,7874
26 0,256 0,5309 0,8557 1,315 1,7056 1,8219 1,9665 2,0555 2,162 2,4786 2,7787
27 0,2559 0,5306 0,8551 1,3137 1,7033 1,8191 1,9632 2,0518 2,1578 2,4727 2,7707
28 0,2558 0,5304 0,8546 1,3125 1,7011 1,8166 1,9601 2,0484 2,1539 2,4671 2,7633
29 0,2557 0,5302 0,8542 1,3114 1,6991 1,8142 1,9573 2,0452 2,1503 2,462 2,7564
30 0,2556 0,53 0,8538 1,3104 1,6973 1,812 1,9546 2,0423 2,147 2,4573 2,75
35 0,2553 0,5292 0,852 1,3062 1,6896 1,803 1,9438 2,0301 2,1332 2,4377 2,7238
40 0,255 0,5286 0,8507 1,3031 1,6839 1,7963 1,9357 2,0211 2,1229 2,4233 2,7045
50 0,2547 0,5278 0,8489 1,2987 1,6759 1,787 1,9244 2,0086 2,1087 2,4033 2,6778
60 0,2545 0,5272 0,8477 1,2958 1,6706 1,7808 1,917 2,0003 2,0994 2,3901 2,6603
∞
120 0,2539 0,5258 0,8446 1,2886 1,6577 1,7656 1,8987 1,9799 2,0763 2,3578 2,6174
0,2534 0,5246 0,842 1,2824 1,6464 1,7525 1,8829 1,9623 2,0564 2,3301 2,5808
³(d > dY•x ) =

0,4 0,3 0,2 0,1 0,05 0,04 0,03 0,025 0,02 0,01 0,005
Probabilidades da cauda direita
219
Tabela 51: Distribuição Qui-quadrado. Corpo da tabela dá os valores ‚ª , tais que ¶(à > ‚ª ) = ×. Para valores de graus de liberdade
maiores que 30, utilizar a aproximação normal.

¶(à > ‚ª ) = ×
0,4 0,3 0,2 0,1 0,05 0,04 0,025 0,02 0,01 0,005 0,0001
1 0,708 1,074 1,642 2,706 3,841 4,218 5,024 5,412 6,635 7,879 15,137
2 1,833 2,408 3,219 4,605 5,991 6,438 7,378 7,824 9,210 10,597 18,421
3 2,946 3,665 4,642 6,251 7,815 8,311 9,348 9,837 11,345 12,838 21,108
4 4,045 4,878 5,989 7,779 9,488 10,026 11,143 11,668 13,277 14,860 23,513
5 5,132 6,064 7,289 9,236 11,070 11,644 12,833 13,388 15,086 16,750 25,745
6 6,211 7,231 8,558 10,645 12,592 13,198 14,449 15,033 16,812 18,548 27,856
7 7,283 8,383 9,803 12,017 14,067 14,703 16,013 16,622 18,475 20,278 29,878
8 8,351 9,524 11,030 13,362 15,507 16,171 17,535 18,168 20,090 21,955 31,828
9 9,414 10,656 12,242 14,684 16,919 17,608 19,023 19,679 21,666 23,589 33,720
10 10,473 11,781 13,442 15,987 18,307 19,021 20,483 21,161 23,209 25,188 35,564
11 11,530 12,899 14,631 17,275 19,675 20,412 21,920 22,618 24,725 26,757 37,367
12 12,584 14,011 15,812 18,549 21,026 21,785 23,337 24,054 26,217 28,300 39,134
13 13,636 15,119 16,985 19,812 22,362 23,142 24,736 25,472 27,688 29,819 40,871
Graus de Liberdade
14 14,685 16,222 18,151 21,064 23,685 24,485 26,119 26,873 29,141 31,319 42,579
15 15,733 17,322 19,311 22,307 24,996 25,816 27,488 28,259 30,578 32,801 44,263
16 16,780 18,418 20,465 23,542 26,296 27,136 28,845 29,633 32,000 34,267 45,925
17 17,824 19,511 21,615 24,769 27,587 28,445 30,191 30,995 33,409 35,718 47,566
18 18,868 20,601 22,760 25,989 28,869 29,745 31,526 32,346 34,805 37,156 49,189
19 19,910 21,689 23,900 27,204 30,144 31,037 32,852 33,687 36,191 38,582 50,795
20 20,951 22,775 25,038 28,412 31,410 32,321 34,170 35,020 37,566 39,997 52,386
21 21,991 23,858 26,171 29,615 32,671 33,597 35,479 36,343 38,932 41,401 53,962
22 23,031 24,939 27,301 30,813 33,924 34,867 36,781 37,659 40,289 42,796 55,525
23 24,069 26,018 28,429 32,007 35,172 36,131 38,076 38,968 41,638 44,181 57,075
24 25,106 27,096 29,553 33,196 36,415 37,389 39,364 40,270 42,980 45,559 58,613
25 26,143 28,172 30,675 34,382 37,652 38,642 40,646 41,566 44,314 46,928 60,140
26 27,179 29,246 31,795 35,563 38,885 39,889 41,923 42,856 45,642 48,290 61,657
27 28,214 30,319 32,912 36,741 40,113 41,132 43,195 44,140 46,963 49,645 63,164
28 29,249 31,391 34,027 37,916 41,337 42,370 44,461 45,419 48,278 50,993 64,662
29 30,283 32,461 35,139 39,087 42,557 43,604 45,722 46,693 49,588 52,336 66,152
30 31,316 33,530 36,250 40,256 43,773 44,834 46,979 47,962 50,892 53,672 67,633
¶(à > ‚ª ) = ×
0,4 0,3 0,2 0,1 0,05 0,04 0,025 0,02 0,01 0,005 0,0001
220
13. Referências
BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 5ª ed. São Paulo: Saraiva. 2004. 526p.
BLAIR, R. C.; TAYLOR, R. A. Bioestatística para ciências da saúde. São Paulo: Pearson Education do Brasil,
2013.
BONFARINE, H.; BUSSAB, W. O. Elementos de Amostragem. São Paulo: Edgar Blücher. 2005. 274p.
CarrerCast. The best jobs of 2021. CarrerCast.com, 2022. Disponível em: <https://www.careercast.com/jobs-
rated/best-jobs-2021>. Acessado em 14/03/2021
CONFE. Código de ética profissional do estatístico. CONFE – CONSELHO FEDERAL DE ESTATÍSTICA. 1976.
Disponível em: < http://www.confe.org.br/resolucao_58.pdf>. Acessado em 09/06/2020
CONRE-3. Onde o estatístico pode ser essencial?, CONRE 3 – Conselho Regional de Estatística 3ª Região,
[sem ano]. Disponível em: <http://www.conre3.org.br/portal/onde-o-estatistico-pode-ser-essencial/>.
Acessado em 05/06/2020
DANCEY, C. P.; REIDY, J. G.; ROWE, R. Estatística sem Matemática para as Ciências da Saúde. Porto Alegre:
Penso, 2017.
DEVORE, J. L. Probabilidade e Estatística: para Engenharia e Ciências. 6ª ed., São Paulo: Pioneira Thompson
Learning. 2006.
DORIA FILHO, U. Introdução à Bioestatística – Para Simples Mortais. São Paulo: Elsevier, 1999.
IBGE. Normas de apresentação tabular. Fundação Instituto Brasileiro de Geografia e Estatística, Centro de
Documentação e Disseminação de Informações. 3ª ed. Rio de Janeiro: IBGE, 1993.
JACOBSEN, P. Como funciona o método científico. Blog Biblioteca Central UFRGS, 2016. Disponível em: <
https://www.ufrgs.br/blogdabc/como-funciona-o-metodo-cientifico/>. Acessado em 08/06/2020
LARSON, R.; FARBER, B. Estatística Aplicada. São Paulo: Pearson Prentice Hall, 2004.
LEITE, R. Viés de sobrevivência e UX. Renato Leite, 2019. Disponível em:

<https://medium.com/@renato.cleite/vies-de-sobrevivencia-em-ux-612fc49137a>. Acessado em 01/03/2021
MAES, J. Viés de sobrevivência: a falha de raciocínio que a feta a sociedade. Hypescience, 2019. Disponível
em: <https://hypescience.com/vies-de-sobrevivencia/>. Acessado em 01/03/2021
MAGALHÃES, M. M.; LIMA, A. C. P. Noções de Probabilidade e Estatística. 6ª ed. São Paulo: EDUSP. 2005.
416p.
MARTINEZ, E. Z. Bioestatística para os cursos de Graduação da Área de Saúde. São Paulo: Blucher, 2015.
MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidade para Engenheiros. 2ª ed., Rio de
Janeiro: LTC, 2003.
PAGANO, M.; GAUVREAU, K. Princípios de Bioestatística. São Paulo: Cengage Learning, 2010.
221
PINHEIRO, J. I. D.; CARVAJAL, S. S. R.; CUNHA, S. B. da; GOMES, G. C. Probabilidade e Estatística:
quantificando a incerteza. Rio de Janeiro: Elsevier, 2012.
POUBEL, M. W. Um estudo da história da estatística: o 1º censo demográfico. Anais do IX Seminário Nacional

de História da Matemática, n. 12, Novembro 2010.
Presidência da República. Lei nº 4.739, de 15 de julho de 1965. Disponível em: <

http://www.planalto.gov.br/ccivil_03/leis/1950-1969/L4739.htm>. Acessado em 09/06/2020
R Core Team (2020). R: A language and environment for statistical computing. R Foundation for Statistical
Computing, Vienna, Austria. URL https://www.R-project.org/.
RATCLIFFE, S. Oxford Essential Quotations. 6ª ed. Edição Online: Editora da Universidade de Oxford. 2018. eI
SBN: 9780191866692
SENRA, N. Uma breve história das estatísticas brasileiras (1822-2002). Rio de Janeiro: Centro de
Documentação e Disseminação de Informação. 2009. 474p.
SILVA, D. N. Astecas. História do Mundo, [2019]. Disponível em:

<https://www.historiadomundo.com.br/asteca>. Acessado em 03/05/2020
SILVA, D. N. Civilização Maia. História do Mundo. [2020]. Disponível em: <

https://www.historiadomundo.com.br/maia>. Acessado em 03/05/2020
SILVA JUNIOR, J. M. da. Estatística: história e práticas didáticas no ensino contextualizado. 2015. 71p.
Dissertação (Mestrado em Matemática) – Universidade Estadual do Norte Fluminense, Campos dos
Goytacazes, 2015.
SOUZA, R. G. Civilização Inca – história da civilização Inca. História do Mundo. [2019]. Disponível em: <
https://www.historiadomundo.com.br/inca/civilizacao-inca.htm>. Acessado em 03/05/2020
SOUZA, R. G. Organização política romana – história da organização política romana. História do Mundo.
[2020]. Disponível em: < https://www.historiadomundo.com.br/romana/organizacao-politica-romana.htm>.
Acessado em 03/05/2020
TRIOLA, M. F. Introdução à Estatística: Atualização da Tecnologia. 11ª ed., Rio de Janeiro: LTC, 2013.
VASCONCELLOS, M. T. L. de. Comentário: Eunice Pinho de Castro Silva, o despontar da pesquisa por
amostragem brasileira. Ver Saúde Pública, 40(5): 769-71, 2006.
WALPOLE, R. E.; MYERS, R. H.; MYERS, S. L.; YE, K. Probabilidade & Estatística para Engenharia e Ciências. 8ª
ed., São Paulo: Prentice Hall Brasil, 2009.
222

Apostila - Introdução À Estatística Ufjf

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apostila - Introdução À Estatística Ufjf

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE FEDERAL DE JUIZ DE FORA

INSTITUTO DE CIÊNCIAS EXATAS

Professora Ângela Mello Coelho

2.1. Origens da Estatística e da Probabilidade

 5000 a.C. – registros egípcios de presos de guerra;

2.2. História da Estatística no Brasil

 1800 – Carta régia pedindo informações censitárias ao vice-rei do Estado do Brasil;

 1889 – Proclamação da República;

2.3. Profissão de Estatístico

Para entender o papel e a importância da Estatística na pesquisa científica é necessário, primeiramente,

Figura 1: Representação do Método Científico

Fonte: BLOG da Biblioteca Central da UFRGS, (JACOBSEN, 2016).

2.5. A Ética na Estatística

Mas afinal, o que vem a ser “Estatística”?

2.7. Terminologia Básica

Figura 2: Esquema visual relacionando população e amostra.

Fonte: Magalhães e Lima, 2010

1- [DEVORE, 2006] Diversas universidades e faculdades instituíram programas de Instrução Suplementar

Para as questões 4 e 5, escolha a alternativa correta:

3.1. Variáveis e Dados

Vejamos, por exemplo, a tabela 1 abaixo:

Tabela 1: Informações de 1999 sobre 30 veículos novos em 1999.

 Veículo: marca do carro;

Quadro 1: Exemplos de variáveis quantitativas discretas.

o Dados contínuos: Pertencem a um intervalo de números reais. Resultam, geralmente, de

Quadro 3: Exemplos de variáveis qualitativas nominais.

Quadro 4: Exemplos de variáveis qualitativas ordinais.

 Variáveis qualitativas nominais: Veículo e Nacionalidade;

3.2. Distribuição de Frequência – Tabelas e Gráficos

Em uma tabela de frequência para variáveis qualitativas temos a seguinte configuração:

 A tabela é formada por 3 colunas;

Tabela 2: Tabela de frequência da variável qualitativa nominal Nacionalidade.

Nacionalidade Freq. Abs. Freq. Rel. (%)

Tabela 3: Tabela de frequência da variável qualitativa ordinal Geração.

Geração Freq. Abs. Freq. Rel. (%)

3.2.1.2. Formatação de Tabelas (normas ABNT)

3.2.2. Gráficos para Variáveis Qualitativas

Figura 3: Gráfico de Barras para a variável qualitativa Nacionalidade.

Fonte: Elaborada pela autora.

Fonte: Elaborada pela autora.

Fonte: Elaborada pela autora.

Figura 6:Gráfico de pizza para a variável Geração.

Fonte: Elaborada pela autora.

3.2.3. Tabelas de Frequência para Variáveis Quantitativas

como: ⊢ (intervalo fechado em e aberto em );

Tabela 4: Tabela de frequência da variável quantitativa discreta Anos.

Tabela 5: Tabela de frequência da variável quantitativa discreta Motor.

6 ⊢ 11 fechado em 6 e aberto em 11);

Tabela 6: Tabela de frequência da variável quantitativa contínua Preço.

3.2.4. Gráficos para Variáveis Quantitativas

Fonte: Elaborada pela autora.

Fonte: Elaborada pela autora.

Fonte: Elaborada pela autora.

Fonte: Elaborada pela autora.

Fonte: Elaborada pela autora

Fonte: Elaborada pela autora.

Fonte: Elaborada pela autora.

Fonte: Elaborada pela autora.

3.2.5. Frequência Acumulada

5.255 ⊢ 8.615 9# = $,%

3.2.6. Polígonos de Frequência

Fonte: Elaborada pela autora.

Fonte: Elaborada pela autora.