Você está na página 1de 80

ANA PAULA LIMA MARQUES FERNANDES

ANTONIO CARLOS MARQUES DA SILVA

INTRODUÇÃO À ESTATÍSTICA

Maceió-Alagoas
2011
UNIVERSIDADE FEDERAL DE ALAGOAS

Reitora
Ana Dayse Rezende Dorea

Vice-reitor
Eurico de Barros Lôbo Filho

Diretora da Edufal
Sheila Diab Maluf

Conselho Editorial Edufal


Sheila Diab Maluf (Presidente)
Cícero Péricles de Oliveira Carvalho
Elton Casado Fireman
Roberto Sarmento Lima
Iracilda Maria de Moura Lima
Lindemberg Medeiros de Araújo
Leonardo Bittencourt
Eurico Eduardo Pinto de Lemos
Antonio de Pádua Cavalcante
Cristiane Cyrino Estevão Oliveira

Editoração eletrônica, capa e programação visual


ANTONIO CARLOS MARQUES DA SILVA

Catalogação na fonte
Universidade Federal de Alagoas
Biblioteca Central – Divisão de Tratamento Técnico
Bibliotecária Responsável: Betânia Almeida dos Santos
S586i Fernandes, Ana Paula Lima Marques.
Introdução à Estatística / Ana Paula Lima Marques Fernandes, Antonio
Carlos Marques da Silva. – Maceió: EDUFAL, 2011.

CD-ROM: il.; 4 ¾ pol.

ISBN: 978-85-7177-556-5

1. Estatística descritiva. 2. Variáveis estatísticas. 3. Medidas de posição


e de dispersão. 4. Probabilidade, distribuições discretas e contínuas.
I. Silva, Antonio Carlos Marques da. II. Título.

Direitos desta edição reservados à Editora afiliada:


Edufal - Editora da Universidade Federal de Alagoas
Campus A. C. Simões, BR 104, Km, 97,6 - Fone/Fax: (82) 3214.1111
Tabuleiro do Martins - CEP: 57.072-970 - Maceió - Alagoas
E-mail:edufal@edufal.ufal.br - Site: www.edufal.ufal.br ASSOCIAÇÃO BRASILEIRA
DE EDITORAS UNIVERSITÁRIAS
UFAL – IM

Universidade Federal de Alagoas

Instituto de Matemática

Anamelea de Campos Pinto


Coordenadora Institucional de Educação à Distância
(CIED - UFAL)

Amauri da Silva Barros


Diretor do Instituto de Matemática
José Carlos Almeida de Lima
Vice-Diretor do IM
Ediel Azevedo Guerra
Coordenador Acadêmico
José Fábio Boia Porto
Coordenador de Tutoria

Juliene Barros
Revisora EAD
Introdução à Estatística

SUMÁRIO

• Apresentação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

• Capítulo 1  Variáveis Estatísticas e Escalas de Mensuração . . . . . . 7

I Respostas das Atividades-propostas . . . . . . . . . . . . . . . . . . . . . . 15

• Capítulo 2  Distribuições de Frequências . . . . . . . . . . . . . . . . . 17

I Respostas das Atividades-propostas . . . . . . . . . . . . . . . . . . . . . . 25

• Capítulo 3  Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . 27

I Respostas das Atividades-propostas . . . . . . . . . . . . . . . . . . . . . . 37

• Capítulo 4  Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . 38

I Respostas das Atividades-propostas . . . . . . . . . . . . . . . . . . . . . . 45

• Capítulo 5  Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . 46

I Respostas das Atividades-propostas . . . . . . . . . . . . . . . . . . . . . . 61

• Capítulo 6  Funções de Distribuição . . . . . . . . . . . . . . . . . . . . 64

I Respostas das Atividades-propostas . . . . . . . . . . . . . . . . . . . . . . 78

• Referências Bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . 79

iv
APRESENTAÇÃO

A inclusão da Estatística como ferramenta básica presente em vários cursos de graduação vem promo-
vendo uma visão uniforme e multidisciplinar, abundantemente exemplicada no núcleo especíco das DCN
de Estatística (cf. MEC, junho de 1999), interagindo com a grande maioria das diversas áreas acadêmicas.
Os temas e os conteúdos assinalados devem, é claro, enfatizar as respectivas especicidades.

Para uso imediato dos cursos de EAD, notadamente das Licenciaturas, o presente texto, de caráter
introdutório, pretende ilustrar as variadas aplicações que decorrem de uma metodologia estatística adequada.
Descreveremos os procedimentos de Estatística Descritiva, os conceitos iniciais de Probabildade e das Fun-
ções de Distribuição (de probabilidade). Numa futura segunda parte do curso, ampliaremos o estudos das
distribuições de probabilidade discreta e contínua, e sua aplicação à Inferência Estatística, com ênfase nos
intervalos de conança e testes de hipótese.

A tônica da apresentação dos conteúdos procura preservar a formulação técnica adequada e o enfoque
matemático que leva em conta a experiência cognitiva do alunado.

Nesse sentido, procuramos descartar a apresentação vertical, de sabor dogmático e pouco eciente,
a nosso ver, para uma primeira abordagem dos conteúdos. Optamos por um enfoque mais informativo,
sem descuidar das condições de validade da teoria subjacente. Também procuramos explicitar os métodos
numéricos efetivos, eventualmente com o auxílio de algoritmos computacionais, ferramenta indispensável nas
atuais aplicações.

Cada capítulo é precedido de um resumo dos objetivos e de uma visão sistêmica dos conteúdos corres-
pondentes, quando pretendemos aguçar a curiosidade do público-alvo.

Os exercícios propostos ao longo do texto objetivam treinar os conceitos apresentados de modo direto
e amigável. Eventualmente, solicitamos a participação explícita do aluno; nesse caso, as armações do tipo
é fácil ver que... são absolutamente sinceras: não há armadilhas intencionais nem resultados de algibeira,
que poderiam exigir conhecimentos outros que não os apresentados nas notas.

O autor sênior, com uma prática docente que ultrapassou mais de 40 anos de experiência universitária,
vem acompanhando os trabalhos da jovem professora Ana Paula, cuja atração pelas diciplinas de Métodos
Quantitativos, aí incluída a Estatística, permitiu a redação a quatro mãos dessas notas.

Gostaríamos de receber de vocês, prezados alunos, o retorno sobre a ecácia e adequação das notas
para realizar os objetivos propostos, os exercícios e o detalhamento das soluções. São informações funda-
mentais para a correção de rumos e de conteúdos.

Bom trabalho!

Ana Paula Lima Marques Fernandes Antonio Carlos Marques da Silva

v
1. Variáveis estatísticas e escalas de mensuração 7

CAPÍTULO 1
VARIÁVEIS ESTATÍSTICAS
E ESCALAS DE MENSURAÇÃO

Objetivos do Capítulo 1

(a) Descrever os fundamentos da metodologia da Estatística;

(b) Conceituar população e amostra;

(c) Estabelecer os objetivos da Estatística Descritiva e da Inferência Estatística;

(d) Caracterizar as variáveis qualitativas e quantitativas;

(e) Estudar as principais escalas de mensuração.

1.1 INTRODUÇÃO

Atualmente, nos mais diversos campos de atividades, informações especícas sobre variados eventos

permitem indicar ou prever sua validade ou sugerir correções em seus possíveis desdobramentos.

Por exemplo, consideremos os enunciados:

• O número de carros vendidos no Nordeste, no ano passado, aumentou de 25%;

• A taxa de desemprego na grande Recife ainda é muito alta;

• Ações da Eletrobrás subiram, em média, $ 2,00, na última quinzena;

• No feriadão de Corpus Christi, o trânsito provocou 25 mortos e 450 feridos nas estradas federais

de Minas;

• A qualicação docente das IFES em alguns setores acadêmicos é mais lenta do que em outros;

• Pesquisa recente do IBOPE aponta elevados índices de popularidade da Presidenta Dilma.

Parte das informações exemplicadas lança mão de resultados (e unidades) numéricas, outras usam

comparações entre atributos categóricos. Na realidade, nesses casos e em outros, análogos, diremos que

estamos identicando variáveis ou dados estatísticos: são informações provenientes de observações,

contagens, medidas ou respostas.

Na mesma ordem de idéias, tomaremos como ponto de partida a seguinte denição.

A Estatística é a ciência de coletar, organizar, apresentar, analisar e interpretar dados,


adequadamente codicados, com o objetivo de tomar melhores decisões.
8 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

1.2 POPULAÇÃO E AMOSTRA

Muitas vezes, apesar do progresso tecnológico (como a eciência dos recursos computacionais), não é

possível estudar a totalidade de um certo conjunto de dados.

Fatores como o alto custo de uma análise individualizada, ausência de recursos humanos e procedi-

mentos destrutivos podem comprometer a apreciação global do conjunto de dados.

Por exemplo, a observação da durabilidade de uma classe de lâmpadas, testando cada uma até que

queime, evidentemente inviabiliza o processo de vendas dessas lâmpadas. Contudo, se o teste for

usado para calcular a vida média de um lote de lâmpadas, esse resultado servirá de referência para

toda a produção.

Um outro exemplo: deve ser evitada a exposição prolongada de um pesquisador-médico a um ambiente

saturado de organismos virais, cujas formas de contágio são objeto de estudo.

Para contornar essas diculdades, consideraremos dois tipos de conjuntos de dados:

População  coleção de todos os possíveis elementos, objetos ou medidas que são de interesse para

o estudo de um determinado evento. (Observemos que o termo população está sendo usado em um
sentido mais amplo do que o signicado, mais comum, de conjunto de pessoas.)

Amostra  subconjunto da população, sucientemente representativo das características ou propri-

edades do objeto de estudo. A coleta desses elementos é a chamada amostragem.


Por exemplo,

• Um levantamento sobre toda uma população é denominado censo. No Brasil, o IBGE é encar-

regado de organizar censos periódicos.

Em 2010, o IBGE realizou o XII Censo Demográco, o grande retrato em extensão e pro-
fundidade da população brasileira e das suas características sócio-econômicas e a base sobre
a qual deverá se assentar todo o planejamento público e privado da próxima década. Ver
[www.ibge.gov.br].

• Antes de uma eleição, diversos órgãos de pesquisa e imprensa consultam um conjunto selecionado

de eleitores para avaliar o desempenho dos candidatos na futura eleição;

• Uma indústria de laminados seleciona uma amostra do produto fabricado em intervalos de

tempo especicados, para vericar se o processo está sob controle e evitar a fabricação de peças

defeituosas;

• Redes de tv e rádio usam constantemente os índices de popularidade de uma certa programação

para xar valores de propaganda ou então modicar ou eliminar programas com baixa audiência;

• Biólogos marcam peixes, pássaros, etc. para monitorar a espécie e tentar prever e estudar seus

hábitos e garantir, se for o caso, sua sobrevivência.

1.3 Estatística Descritiva e Inferencial

A organização e a representação dos dados estatísticos obtidos integram a Estatística Descritiva


(ou Análise Exploratória dos Dados). Por exemplo, são usadas as distribuições de frequências e tipos

adequados de grácos e diagramas para resumir as propriedades consideradas. Quando o enfoque

inicial é o de uma amostra, os critérios que permitem validar as conclusões e sua generalização para

uma população, bem como a adequação da amostra ao estudo em questão, constituem métodos

da Estatística Indutiva ou Inferencial. Também aqui comparecem aplicações da Teoria das


Probabilidades, que permitem minimizar os erros gerados pela variabilidade inerente à ampliação

amostra/população, bem como as situações relacionadas ao acaso.


1. Variáveis estatísticas e escalas de mensuração 9

Em resumo, a estatística descritica e as probabilidades são ferramentas para a inferência estatística,

que avalia de dois modos os resultados obtidos de uma amostra:

• estima uma característica da população cujo valor não se conhece, ou

• realiza um teste probabilístico sobre essa característica da qual se supõe ter um certo valor.

Para facilitar a linguagem usada nos métodos de inferência, as características da população e da

amostra serão referidas como parâmetros e estatísticas, isto é, um parâmetro é uma medida de

uma característica da população, enquanto uma estatística é uma característica da amostra.

Por exemplo, consideremos as armações:

(a) Em uma vericação rotineira e aleatória das barracas de peixe das balanças, a Vigilância Sanitária

constatou que 10% delas não armazenavam o peixe a uma temperatura conveniente. Como a medida

numérica de 10% é relativa a uma parte (balanças) de todos os estabelecimentos que vendem peixe,

trata-se de uma estatística amostral.

(b) Para estabelecer a longevidade média dos atuais Governadores dos estados brasileiros, sua idade

foi anotada. Nesse caso, cada idade é um parâmetro populacional.

Exemplo 1.4

1. Uma administradora de planos de saúde realizou um levantamento com 1.020 homens e mulheres,

indicando que 76% das mulheres e 60% dos homens haviam feito um exame de condicionamento físico

no ano anterior.

Uma primeira inferência do resultado sugere que, dentre todos os usuários dos planos de saúde con-

siderados que fazem o exame, o número de mulheres é maior do que o número de homens.

2. Um certo instituto entrevistou uma amostra de 9.500 pessoas para vericar qual a primeira marca

de produto que vem à cabeça do consumidor. Dessa amostra, 1.140 disseram ser a do sabão Limpa-

melhor.

A informação veículada poderia ser mais objetiva, uma vez que (1.140/9.500) × 100 ' 12%, resultado

que explicita melhor a proporção dos que usam o sabão apontado, na amostra.

Atividade-proposta 1.5

1. Após um levantamento, há uma crítica inicial das observações para vericar a exatidão de cada

resposta. O objetivo é, se necessário, repetir alguma entrevista, reticar valores duvidosos, e preparar

relatório para ser colocado em uma escala numérica. Justicar a necessidade desse procedimento

inicial.

2. Um ex-ministro brasileiro armou que, nos Estados Unidos, os censos demográcos me pergunta-

vam se eu era caucasiano, mexicano, ariano, asiático, mongólico e outras classicações, cujo signicado

[eu] não conhecia. Discuta a precisão das informações obtidas em um censo demográco e indique

as possíveis consequências do fato de um entrevistado não conhecer o signicado de alguns termos

contidos nas perguntas que lhe são feitas.

3. Uma amostra de analistas nanceiros da BOVESPA apontou para 44% de prognósticos incorretos

sobre os lucros de empresas de alta tecnologia, em 2009. Apresente uma inferência plausível desse

resultado.

4. Quando Lula foi eleito presidente em 2006, ele recebeu 60,83% dos votos válidos do segundo turno.

Esse dado percentual é um parâmetro populacional ou uma estatística amostral?


10 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

1.6 Variáveis estatísticas

Tendo em conta a natureza dos valores assumidos por uma variável estatística, temos dois grandes

grupos de classicação:

(a) variáveis qualitativas (não métricas ou categóricas), cujos valores são atributos associados a

categorias;

(b) variáveis quantitativas (métricas), cujos valores pertencem a conjuntos numéricos, em geral

associados a métodos de contagens ou de medidas.

(α) Exemplos de variáveis qualitativas

Variável Categoria

sexo masculino, feminino

religião católica, protestante, judaica

naturalidade Alagoas, Pernambuco, Minas Gerais, Rio de Janeiro

escolaridade fundamental, média, superior

faixa etária até 20 anos, de 21 a 49 anos, acima de 50 anos

(β ) Exemplos de variáveis quantitativas

número de lhos de uma amostra de casais altura dos alunos matriculados na UFAL

número de alunos matriculados na UFAL pressão arterial de uma amostra populacional

apostas na Megasena nos últimos dez concursos precipitação pluviométrica em 2009 no Agreste

total de ações negociadas em SP(06/2010) produção de café no Brasil na última década

As variáveis quantitativas ainda são classicadas em variáveis discretas e variáveis contínuas.


As variáveis discretas são aquelas cujo conjunto de valores possíveis é nito ou innito enume-

rável e resultam de uma contagem (enumeração). As variáveis contínuas tomam valores em (produtos

de) intervalos de números reais e estão associadas a processos de medidas. Por exemplo, na tabela (β)
acima, a primeira coluna é formada de variáveis discretas e a segunda coluna, de variáveis contínuas.

Observação 1 Quando uma variável numérica contínua X toma valores, por exemplo, em um intervalo

I ⊂ R, esse resultado signica, tão somente, que o conjunto S dos valores de X (S é o conjunto-universo
de X ) é um subconjunto de I , isto é, o intervalo I possui amplitude conveniente para permitir a in-

clusão S ⊂ I ; na realidade, em muitas aplicações, o conjunto S é discreto.

Exemplo Na medida das alturas h de uma amostra de 500 alunos da UFAL, podemos supor que

h1 < h < h2 , onde h1 = 0, 50m e h2 = 3m. Dependendo da precisão do instrumento de medida, uma

altura h pode ser, a priori, qualquer ponto do intervalo considerado. Feitas as medições, encontrare-

mos, é claro, 500 resultados (não necessariamente distintos) da amostra em estudo.

Exemplo As posições de entrada de aviões no controle aéreo de um aeroporto são indicadas por

radares/monitores, cujas telas são munidas de referencial cartesiano com escalas de grande preci-

são. A priori, a posição de um avião é qualquer ponto X = (a, b) de um círculo de referência

{(x, y) ∈ R2 ; x2 + y2 ≤ r2 }; assim, X é uma variável contínua. Num determinado período de

trabalho, é nito o número de aviões controlados.

Observação 2 Pode ser conveniente codicar numericamente uma variável qualitativa. É o caso, por

exemplo, do registro da variável sexo (masculino, feminino), cujos atributos podem ser designados por

1-masculino e 2-feminino; alternativamente, via um código literal, M-masculino e F-feminino.

Também é claro que o simples uso de um código numérico não altera a qualicação da variável;

assim, não são considerados quantitativos os valores das variáveis CPF 012.345.678-90, ou telefone

(000)1234.5678, ou, ainda, Camisa 10 da Seleção Brasileira!


1. Variáveis estatísticas e escalas de mensuração 11

1.7 Escalas de mensuração

O processo de selecionar o modelo estatístico adequado a um procedimento operacional costuma ser

precedido pela mensuração do fenômeno envolvido.

Existem quatro tipos ou níveis de medidas ou escalas de mensuração: nominal, ordinal, intervalar
e proporcional.
(1) A escala nominal classica os dados em categorias ou grupos.

Números podem ser usados para rotular (categorizar) os dados em diferentes grupos e permitem a

contagem (frequência) de quantos há em cada categoria. [Como veremos no próximo capítulo, as

estatísticas para escalas nominais são moda e distribuição de frequências].


Não existe uma ordem particular entre as categorias. Além disso, as categorias são exaustivas e duas

categorias quaisquer são mutuamente excludentes.

Exemplo A Receita Federal usa a seguinte Tabela de Códigos da Declaração de Bens e Direitos.

Código Bens Moveis

21 Veículo automotor terrestre: caminhão, automóvel, moto etc.

22 Aeronave

23 Embarcação

24 Bem relacionado com o exercício da atividade autônoma

25 Jóia, quadro, objeto de arte, de coleção, antigüidade etc.

26 Linha telefônica

29 Outros

Exemplo Observe a tabela abaixo, de uma amostra de 700 pessoas, relativa à variável nominal

Estado civil.
Estado civil Número de pessoas

casado 340

solteiro 250

viúvo 40

divorciado 50

Total 700

Como vemos acima, as classes ou categorias podem ser rotuladas com números, o que não signica

que as operações aritméticas usuais com esses números tenham algum signicado em particular.

(2) A escala ordinal corresponde ao tipo nominal em que se podem ordenar as categorias, mas as

diferenças entre os registros de dados não são signicativas. Os números associados ao nível ordinal

têm apenas um signicado de classicação. [As estatísticas são moda, mediana e distribuição de
frequências].
Exemplos de dados ordinais incluem opinião, escalas de preferência e avaliação de conceitos.

Exemplo A tabela abaixo ilustra a variável ordinal Conceito para uma amostra de 30 alunos.
Conceito Número de alunos

A 4

B 6

C 15

D 3

E 2

Total 30
12 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Exemplo Foram divulgados no dia 1º de julho de 2010 os primeiros resultados do IDEB (Índice

de Desenvolvimento da Educação Básica), baseados em dados de 2009. A primeira etapa do ensino

fundamental (1
a à 4a série) cou com nota média de 4,6. A segunda etapa (5
a a 8a série), cou com

4,0; o ensino médio, por sua vez, teve média 3,6. As médias, apesar de "vermelhas", estão acima das

metas traçadas pelo governo para o ano de 2009, que eram de 4,2, 3,7 e 3,5, respectivamente. A nota

é medida numa escala que vai de 0 a 10. Cf. [www.mec.gov.br].

(3) A escala intervalar permite armar que uma medida é igual ou diferente, maior e quanto maior

do que outra. Em particular, podemos quanticar a diferença entre as categorias ordinais, via uma

unidade de medida e a escolha de uma origem arbitrária. (Essa origem, às vezes, é chamada de zero,
embora não signique ausência da característica em estudo). Por construção, escalas intervalares são
preservadas por aplicações (bijetivas) do tipo y = ax + b, com a > 0, onde as constantes a e b são

relativas à escala de medida e à origem, respectivamente. [Estatísticas usadas: todas as medidas

paramétricas, salvo as escalas de razão, como o coeciente de variação].

Exemplo As escalas termométricas Celsius (o C) e Fahrenheit (o F ) são escalas intervalares. Se

considerarmos dois corpos A 0 0


e B , às temperaturas de 40 C e 10 C , é claro que o corpo
A é mais quente
que o corpo B , mas não podemos armar que A é quatro vezes mais quente do que B . Na realidade,
0 0 0 0
como 0 C =32 F (ponto de gelo) e 100 C =212 F (ponto de vapor), sabemos que F = (9/5)C + 32;
0 0
assim, na escala F , temos que a temperatura do corpo A é 104 F e a de B , 50 F . Ainda é verdade que

A é mais quente que B , mas 104/50 = 2, 08 6= 4, pois os zeros das duas escalas não se correspondem.
0 0
Consideremos, em seguida, o corpo intermediário D , cuja temperatura vale 20 C =68 F , e observemos

que a tabela de variações ilustra a permanência da relação (dobro) das variações em cada escala:
0 0
C ∆C F ∆F
A 40 104
D 20 40-20=20 68 104-68=36
B 10 20-10=10 50 68-50=18

Exemplo Há vários calendários para indicar uma linha de tempo em anos. Observemos as seguintes

codicações numéricas: atualmente, o ano 2010 usa o formato do calendário gregoriano; este ano

será 5770 no calendário judaico, 1430 no calendário muçulmano, 2554 segundo os budistas e 5129 no

calendário maia. Dos exemplos mencionados, apenas o calendário gregoriano usa como origem a data

do nascimento de Cristo (4a.C.); os demais consideram outros eventos religiosos e ou políticos.

(4) A escala proporcional ou de razão possui todas as propriedades da escala intervalar: permite

comparar duas medidas ordinais quaisquer, estabelecer se uma é diferente, maior, quanto maior e,

ainda, quantas vezes a outra. Essa última comparação decorre da existência de um zero absoluto,
ponto da escala em que não existe a propriedade em questão. Assim, todas as operações aritméticas

são permitidas e duas escalas podem ser transformadas por aplicações lineares da forma y = ax, com

a > 0, o que preserva a origem. Por exemplo, y = x/100 transforma cm em m. [Estatísticas usadas:

todas as medidas paramétricas].

Exemplo As medidas dos comprimentos de uma amostra de 50 parafusos de alta precisão constituem

uma escala proporcional. Idem para os pesos de uma amostra de pacotes de café ensacados à vácuo.

Idem para as alturas de uma amostra de alunos.

Exemplo No item (3) acima, há escalas de temperatura proporcionais: a escala Kelvin possui um

zero absoluto (0K=−273


0 C ), em que é nula a temperatura; aqui, tem sentido comparar a maior

temperatura da superfície da Terra (331K) com a menor (184K), da ordem de 1,8 vezes.
1. Variáveis estatísticas e escalas de mensuração 13

1.8 Resumo

O quadro abaixo resume a classicação das variáveis estatísticas.


(
Escala Nominal
Variáveis Qualitativas
Escala Ordinal
(
Escala Intervalar
Variáveis Quantitativas
Escala Proporcional

Exemplo 1.9

1. Dependendo da característica em estudo, o conjunto-universo de uma variável pode ser redenido, o

que implica alterar a escala de mensuração da variável. Se considerarmos uma delegação de lutadores

de boxe e a variável peso (ou massa) X de cada atleta, cujos valores (kg) são anotados de uma balança

adequada, então X é quantitativa contínua. Agora, se o peso X classicar a categoria do boxe, então
X é qualitativa ordinal:

Federação Internacional de Boxe Amador  Categorias de peso do Boxe Amador


Peso (kg) Categoria Peso (kg) Categoria
+91 Super-Pesado 64 Médio-Ligeiro
91 Peso-Pesado 60 Peso-Leve
81 Meio-Pesado 57 Peso-Pena
75 Peso-Médio 54 Peso-Galo
69 Meio-Médio 51 Peso-Mosca
2. Numa rodada de um campeonato regional de futebol, em que jogarão os times F e V (sem perda

de generalidade...), serão considerados os eventos A = {o time F venceu o jogo}, B = {o jogo


terminou com vitória};C = {o time V venceu por 4 × 1}; D = {foram marcados, pelo menos, 3

gols}. Usando os números x e y de gols marcados, respectivamente, pelos times F e V, e supondo

(x, y) ∈ U = N × N, onde N = {0, 1, 2, ...} denota o conjunto dos números naturais, os eventos

destacados serão representados por

A = {(x, y) ∈ U ; x > y}; B = {(x, y) ∈ U ; x 6= y}; C = {(x, y) ∈ U ; x = 1, y = 4} = {1, 4};


D = {(x, y) ∈ U ; x + y ≥ 3}.
3. Um treino de tiro de competição usa um alvo retangular, munido de um referencial plano (x, y),
com −2 ≤ x ≤ 2 e −1 ≤ y ≤ 1; a posição do tiro é assinalada pelo ponto (x, y) (e todo tiro acerta o

alvo). Para efeito de classicação, são usadas as seguintes regiões do alvo:

A = {a abscissa do ponto de impacto não é menor do que a ordenada} = {(x, y); x ≥ y};
B = {o produto das coordenadas do ponto não é negativo} = {(x, y); xy ≥ 0};
C = {a soma dos valores absolutos das coordenadas é maior do que a unidade} = {(x, y); |x|+|y| ≥ 1}
Pratique um pouco Faça um esboço gráco dos quatro conjuntos considerados (o alvo inclusive).

1 1 1

U A @
@ C
−2 −1 0 s 1 2 −2 −1 0 s 1 2 −2 −1 0 s @1 2
@
@
@
−1 −1 −1
14 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Atividade-proposta 1.10

1. Considere a seguinte cha cadastral solicitada por uma instituição nanceira para a liberação de

um nanciamento imobiliário a longo prazo:

a) tipo de imóvel (casa, apart., terreno) b) idade (anos)

c) comprometimento(%) da renda familiar d) renda familiar ($) anual

e) estado civil f ) número de dependentes

g) tempo máximo de nanciamento h) outros encargos ($) nanceiros

Classicar cada resposta por tipo de dado e nível de medição.

2. Sobre o segmento [a, b] ⊂ R escolhemos um ponto qualquer x; a seguir, sobre o segmento [a, x],
escolhemos o ponto y ; os pares (x, y) formam o conjunto-universo U . Represente, no plano cartesiano,

o conjunto U e as seguintes ocorrências, indicando, inicialmente, a respectiva denição analítica:

A = {y está mais próximo de b do que de a},


B = {a distância entre x e y é menor do que a metade de (b − a)};
C = {x está mais próximo de a do que de b}; D = {x está mais próximo de y do que de b }.
3. Considere um diâmetro AB de uma circunferência S de raio R, e a coleção das cordas de S que

são perpendiculares a AB , identicadas pelo ponto M de interseção com o diâmetro considerado.

Descreva as posições do ponto M em AB para que a corda correspondente tenha comprimento maior

ou igual ao raio R.
Sugestão. Examine, cuidadosamente, a gura abaixo. Conclua que os pontos M procurados descrevem

o segmento (P, Q).


1. Variáveis estatísticas e escalas de mensuração 15

RESPOSTAS DAS ATIVIDADES PROPOSTAS

As atividades propostas reetem a inuência dos excelentes textos citados na Bibliograa. Destacamos os
livros de Crespo (2002), Morgado (2006) e Morettin & Bussab (2010), que abordam tópicos mais avançados do
que os que apresentamos nessas notas. O sítio português www.alea.pt, voltado para o ensino de Estatística,
também é muito bem organizado.

1.5

1. Se for o caso, é necessário estudar e eliminar eventuais dados da amostra que podem não ser repre-

sentativos da população.

2. As informações obtidas não são completamente precisas porque dependem da veracidade das res-

postas do entrevistado. Além disso, responder de forma errada pode favorecer a propagação de êrro

na inferência sobre a população.

3. Não é fácil fazer previsões para um mercado de ações, tanto mais quanto o nível de especicidade

(empresas de alta tecnologia) exige conhecimento adequado dos prossionais envolvidos.

4. Como foram apurados todos os votos válidos, trata-se de um parâmetro populacional.

1.10

1.
(a) qualitativa nominal; (b) quantitativa discreta proporcional;

(c) quantitativa contínua proporcional; (d) quantitativa contínua proporcional;

(e) qualitativa nominal; (f ) quantitativa discreta proporcional;

(g) quantitativa contínua proporcional; (h) quantitativa contínua proporcional.

2. O conjunto-universo se escreve U = {(x, y) ∈ [a, b] × [a, b] ; y ≤ x}.


Em relação ao subconjunto A, temos: d(y, b) < d(y, a), ou |y − b| < |y − a|, donde b − y < y − a, ou
a+b b−a b−a b−a
y> . Para B , vale d(x, y) < , ou x − y < , isto é, y > x − . Relativamente a
2 2 2 2
a+b
C , temos d(x, a) < d(x, b), donde x − a < b − x, ou x < . Enm, para D , d(x, y) < d(x, b), ou
2
x − y < b − x e y > 2x − b.
y y

bs bs

A
a+b
U 2
C
a s a s

s s x s s x
a b a a+b b

y y 2
bs bs





B D 

a s a s 

s s x s s x
a a+b b a a+b b

2 2
16 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

3. Retorne ao enunciado e à gura dada. Considere as cordas perpendiculares ao diâmetro AB nos

pontos P Q, de modo que os raios correspondentes às extemidades das cordas formam ângulos iguais
e

a 30 com AB . Então, é fácil ver que os pontos M procurados descrevem o segmento (P, Q).

s
b b
b
b
b
b
b
b
b
A P b
bs Q B
2. Distribuição de Frequência 17

CAPÍTULO 2
DISTRIBUIÇÃO DE FREQUÊNCIA

Objetivos do Capítulo 2

(a) Interpretar as distribuições de frequência;

(b) Identicar os tipos de frequências;

(c) Especicar os casos categórico e discreto nito e de variação pequena;

(d) Descrever os elementos de uma distribuição agrupada por classes;

(e) Estudar a representação gráca de uma distribuição.

2.1 INTRODUÇÃO

Iniciando nosso estudo da Estatística Descritiva, abordaremos, nesse capítulo, a análise das chamadas

distribuições de frequências, ferramentas extremamente úteis para melhor caracterizar um conjunto

de dados (de uma amostra).

Consideremos um conjunto numérico X de n dados, não necessariamente distintos, eventualmente


rótulos de uma variável qualitativa. Usaremos, quase sempre, a seguinte disposição tabular:

i xi fi
1 x1 f1
2 x2 f2
. .
. .
. .

m xm fm
m
X
fi = n
i=1

Nessa tabela, fi , 1 ≤ i ≤ m, indica a frequência simples ou absoluta dos valores que representam
o número de dados de cada classe xi .
Exemplo 2.2 Observe a tabela abaixo, já considerada no Capítulo 1, de uma amostra de n = 700
pessoas, classicadas pela variável nominal Estado civil.

Estado civil fi
casado 360

solteiro 250

viúvo 40

divorciado 50

Total 700
Há quatro classes de frequências simples (f1 = 360, f2 = 250, f3 = 40, f4 = 50), uma para cada

categoria da variável Estado civil; temos f1 + f2 + f3 + f4 = 700.


18 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Exemplo 2.3 Uma amostra de 60 alunos da Licenciatura de Matemática na UFAL, revelou a

seguinte distribuição de frequência da variável discreta número de irmãos:

Núm. irmãos fi
0 6

1 9

2 20

3 16

4 5

5 3

6 1

Total 60
O Exemplo revela sete classes de frequências simples.

2.4 TIPOS DE FREQUÊNCIAS


Além da frequência simples, estamos, também, interessados na proporção, ou percentagem, das ob-

servações em cada classe. Assim, para um conjunto com n observações, temos:

Frequências Relativas e Percentuais


frequência da classe fi
(a) frequência relativa de uma classe: fri = = ;
n n
(b) frequência percentual de uma classe = frequência relativa percentual (multiplicada por 100);

(c) frequência acumulada de uma classe: é a soma das frequências simples anteriores à ordem da

classe considerada, isto é, Fi = f1 + f2 + · · · + fi ;


Fi
(d) frequência acumulada relativa de uma classe vale Fri = .
n

Exemplo 2.3 - Continuação

Retomando a distribuição de frequência acima, temos:

Núm. irmãos fi f ri Fi Fri


0 6 0,100 6 0,100

1 9 0,150 15 0,250

2 20 0,333 35 0,583

3 16 0,267 51 0,850

4 5 0,083 56 0,933

5 3 0,050 59 0,983

6 1 0,017 60 1,000

Total 60 1,000

Pratique um pouco! Na tabela acima (Exemplo 2.3), complete a distribuição de frequência acres-

centando uma coluna para a frequência relativa percentual.

Exemplo 2.5 A leitura de dados pode ser implementada mais facilmente se as respectivas tabelas

possuirem um certa organização. Assim, por exemplo, chamaremos de tabela primitiva aquela em
que os dados (brutos) são apresentados tal qual como foram obtidos. Organizando os valores numa

certa ordenação (crescente ou decrescente) chamaremos a nova tabela de rol. Uma observação: cui-

dado para não trocar seis por meia-dúzia... Os algorítmos de ordenação não são muito amigáveis para

grandes volumes de dados!


2. Distribuição de Frequência 19

Atividade Proposta 2.6


xi 2 4 6 8 10
1. Dada a distribuição de frequência , determine:
fi 3 5 6 4 2
X
(a) a soma das frequências fi ;
(b) as frequências relativas e percentuais;
(c) as frequências acumuladas; (d) as frequências relativas acumuladas.

2. A distribuição indica, ao longo de um semestre, o número de horas extras trabalhadas por 60


empregados de uma administradora :

n.
◦ horas 0 1 2 3 4 5
. Determine:

n. funcionários 20 10 16 9 3 2
(a) o número de empregados que não trabalharam nenhuma hora extra;
(b) o número de empregados que trabalharam pelo menos 4 horas;
(c) o número de empregados que trabalharam menos de 2 horas;
(d) o número de empregados que trabalharam no mínimo 3 e no máximo 5 horas;
(e) a percentagem dos empregados que trabalharam no máximo 2 horas.

3. Complete os dados que faltam na distribuição de frequência:

xi fi f ri Fi
0 1 0,05 ?
1 ? 0,15 4
2 4 ? ?
3 ? 0,25 13
4 3 0,15 ?
5 2 ? 18
6 ? ? 19
7 ? ? ?
20 1,00
X

2.7 Frequências de dados agrupados por intervalos


Há um procedimento padrão para organizar e resumir dados, por faixas de valores, principalmente os

associados a variáveis contínuas. As variáveis são agrupadas em classes ou intervalos, por exemplo, do

tipo [a, b) (fechados à esquerda e abertos à direita), procurando preservar a qualidade da informação.

Normalmente são usadas de 5 a 15 classes com a mesma amplitude. Lembremo-nos que um pequeno

número de classes pode comprometer sua validade e um grande número, por outro lado, prejudica o

objetivo de resumir os dados.

Vamos usar um exemplo concreto para explicitar os elementos da distribuição de frequência.

Exemplo motivador 2.8


Uma amostra de n=40 índices de rentabilidade nanceira apontou uma variabilidade entre 0, 90 e

8, 96. Como achar o número k de classes, a amplitude h de cada intervalo (suposta constante) e os

limites dos intervalos?

Ordenando a amostra, temos:

0,90 0,90 1,28 1,82 1,88 2,00 2,01 2,12 2,43 2,78

2,82 2,88 2,93 3,63 3,67 3,73 3,96 4,00 4,07 4,10

4,15 4,17 4,26 4,30 4,65 5,09 5,28 5,36 5,41 5,54

5,84 6,00 6,54 6,67 7,35 7,77 8,14 8,45 8,67 8,96
20 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

É possível vericar que, em geral, vale k = 1 + 3, 3 log n = 1 + log2 n (usando uma aproximação
normal de uma distribuição binomial conveniente  Regra de Sturges). Para uma rápida ordem

de grandeza, também usaremos k = n. Há vários outros procedimentos, que serão descritos

oportunamente.

Em nosso caso, como n = 40, vem k = 1 + 3, 3 log 40 = 6, 28 ' 6. Por outro lado, considerando
a amplitude amostral AA = x(max) − x(min) (diferença entre o valor máximo e o valor mínimo
AA 8, 06
da amostra), com AA = 8, 96 − 0, 90 = 8, 06, vemos que h = = ' 1, 343 teria um valor
k 6
numérico inconveniente. Optamos, então, por escolher k = 5 classes, e a amplitude de cada uma
8, 06
h= = 1, 612 ' 2; essa escolha considera, também, AA ' 10.
5
A partir desses resultados, podemos descrever os agrupamentos da distribuição, usando a seguinte

tabela:

i Índices fi
1 0 `2 5

2 2 ` 4 12

3 4 ` 6 14

4 6 ` 8 5

5 8 ` 10 4
P
fi = 40

Em resumo, valem as seguintes características:


k
X
a) n= fi é o total de dados, k o total de intervalos ou classes e fi a frequência simples das
i=1
observações correspondentes à classe (intervalo) de ordem i;
b) Ii , 1 ≤ i ≤ k , é o intervalo de ordem i. Assim, I1 = [0, 2), I5 = [8, 10);

c) Para cada intervalo Ii , denotaremos por li o extremo inferior e Li o extremo superior de Ii .

Em particular, a amplitude de Ii vale hi = Li − li . Na realidade, estamos supondo os hi = h = 2

constantes. Assim l2 = 2, L2 = 4; L4 = 8; l5 = 8; h2 = h4 = h5 = 2;
li + Li
d) O ponto médio xi de uma classe é o ponto médio do intervalo Ii : xi = ;
2
e) Amplitude total AT = L(max) − l(min), é a diferença entre o limite superior da última

classe e o limite inferior da primeira. No exemplo em tela, AT = 10 − 0 = 10.

f ) Amplitude amostral AA = x(máx) − x(mín). Como vimos, AA = 8, 96 − 0, 9 = 8, 06;

g) Partindo das frequências fi , podemos determinar, como anteriormente, as frequências

relativas e acumuladas f ri , Fi e F ri . A tabela abaixo completa os valores numéricos considerados.

i Índice fi xi f ri Fi F ri
1 0 `2 5 1 0,125 5 0,125

2 2 ` 4 12 3 0,300 17 0,425

3 4 ` 6 14 5 0,350 31 0,775

4 6 ` 8 5 7 0,125 36 0,900

5 8 ` 10 4 9 0,100 40 1,000
P P
= 40 = 1, 000

Pratique um pouco!
Completar a distribuição acima, acrescentando duas colunas percentuais, uma para cada frquência

relativa, fr (%) e Fr (%).


2. Distribuição de Frequência 21

Atividade-proposta 2.9
1. Os dados seguintes referem-se ao tempo de espera (em minutos) de 30 clientes em uma la de

banco, em um dia de grande movimento:

23 - 19 - 07 - 21 - 16 - 13 - 11 - 16 - 33 - 22- 17 - 15 - 12 - 18 - 25 - 20 - 14 - 16 - 12 - 10- 08 - 20 - 16

14 - 19 - 23 - 36 - 30 - 28 - 35
Construa uma tabela de freqüência (fi ), agrupando as informações em classes de amplitude igual
a 5, a partir do menor tempo encontrado. Indique, também, as frequências relativas e acumuladas
(f ri , Fi , F ri ).

2. Considere a seguinte distribuição de frequência das faixas salariais (em salários mínimos) dos 120
funcionários de uma rede de locadoras:

faixas (s.m.) 1 ` 3 ` 5 ` 7 ` 9 ` 11

fi 30 48 24 10 8

Determine:
a) a amplitude total;
b) o limite superior da terceira classe;
c) o limite inferior da segunda classe;
d) o ponto médio da quarta classe;
e) a frequência da quarta classe;
f ) a frequência relativa da segunda classe;
g) a frequência acumulada da terceira classe;
h) a classe do 72◦ empregado.

3. Complete os dados que faltam na distribuição abaixo.

i classes xi fi Fi f ri
1 0 `2 1 4 ? 0,04
2 2 `4 ? 8 ? ?
3 4 `6 5 ? 30 0,18
4 ? 7 27 ? 0,27
5 8 ` 10 ? 15 72 ?
6 10 ` 12 ? ? 83 ?
7 ? 13 10 93 0,10
8 14 ` 16 ? ? ? 0,07
P P
= ··· = ···

2.10 Grácos associados a distribuições de frequência


A representação gráca das distribuições de frequência permitem, quase sempre, uma melhor compa-

ração da ordem de grandeza das variáveis em estudo.

(1) Variáveis qualitativas. Tipos de grácos adequados:

(a) Grácos em barras; (b) Grácos em setores.


No gráco em barras, usamos as frequências simples para indicar as alturas dos retângulos (barras

verticais) representativos da série. Podemos, também, dispor as barras horizontalmente.

No gráco em setores (circulares), o total é representado pelo círculo, subdividido no mesmo número

de setores que a série de dados; as áreas dos setores são respectivamente proporcionais aos dados. É

fácil calcular cada área por meio de uma regra de três simples e direta, lembrando que o total da série

corresponde a 360 .
0

Exemplo 2.2  Continuação


22 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

No caso dos setores circulares, os ângulos centrais podem ser determinados (em graus), multiplicando

cada frequência percentual p por 3,6, como decorre da regra de três



n 360 f

, donde x◦ = 360 = 3, 6 p. Assim, por exemplo, o setor dos casados (51%) corres-
f x n
ponde a 183,6 .

(2) Variáveis quantitativas. Agora, as escalas numéricas são mais adequadas a inúmeras repre-

sentações grácas.

(a) Grácos em barras, inclusive os grácos em bastão;


(b) Polígono de frequência (simples), em que os pontos (xi , fi ) são ligados por segmentos de retas.

Essa aparência algo grosseira pode ser suavisada por um traçado de linhas convenientes. No caso de

dados agrupados em intervalos, o valor xi corresponde ao ponto médio da classe Ii . Ainda nesse caso,

para fazer o gráco começar e terminar sobre o eixo horizontal, é usual estender o lado esquerdo em

uma amplitude de classe antes do ponto médio da primeira classe e o lado direito em uma amplitude

após o último ponto médio;

(c) Polígono de frequência acumulada (ou ogiva), no caso de dados agrupados em intervalos, é for-

mado por segmentos de retas que unem os pontos (Li , Fi ), marcados sobre cada limite superior Li ,
com a escala vertical sendo as frequências acumuladas. O gráco começa no limite inferior da primeira

classe (com frequência cumulativa nula) e termina no limite superior da última classe (cuja frequência

cumulativa é o tamanho n da amostra).

(d) Histograma. Semelhante a um gráco de barras, é formado por retângulos justapostos, com bases

no eixo horizontal e pontos médios coincidentes com os pontos médios dos intervalos de classe; as lar-

guras dos retângulos são iguais às respectivas amplitudes dos intervalos e as alturas numericamente

iguais às frequências.

Exemplo 2.11
1. Observemos o gráco em bastão da seguinte distribuição.

xi fi Fi fi
2 4 4
6
3 7 11
4 5 16 4
5 2 18
6 1 19 2

7 1 20
P
= 20 1 2 3 4 xi5 6 7

Pratique um pouco! Superpor ao gráco de bastões acima, as correspondentes frequências acumuladas (Fi ),
já indicadas na distribuição dada. Não deixe de indicar as descontinuidades nitas do gráco!
2. Distribuição de Frequência 23

2. Para a distribuição do Exemplo 2.3, apresentamos os dois tipos de polígonos de frequência.

Núm. irmãos fi f ri Fi Fri


0 6 0,100 6 0,100
1 9 0,150 15 0,250
2 20 0,333 35 0,583
3 16 0,267 51 0,850
4 5 0,083 56 0,933
5 3 0,050 59 0,983
6 1 0,017 60 1,000
P P
= 60 = 1, 000

3. O exemplo ilustra um histograma e os polígonos de frequências com intervalos de classe (cf. 2.8).

Índice fi xi f ri Fi
0`2 5 1 0,125 5
2`4 12 3 0,300 17
4`6 14 5 0,350 31
6`8 5 7 0,125 36
8 ` 10 4 9 0,100 40
P P
= 40 = 1, 000
24 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

4. Problema-brinde
Verique que a área total dos retângulos de um histograma é igual à área limitada pelo polígono de

frequências correspondente e o eixo horizontal do histograma.

Atividade-proposta 2.12
1. Os dados de uma amostra de 50 refrigerantes indicaram a tabela abaixo.

Marca fi f ri f ri (%) Fi
Coca Light 8
Coca-cola 18
Guaraná 13
Pepsi 5
Sprite 6
50
P

(a) Complete a tabela com as frequências relativas (f ri ), percentuais e acumuladas (Fi );

(b) Construa um gráco em barras horizontais, exibindo as frequência simples (fi );

(c) Construa um gráco em setores circulares, destacando as medidas angulares e as frequências

percentuais.

2. Um diagrama de Pareto é um gráxo de barras (verticais) usado para variáveis qualitativas:

as respostas categorizadas são representadas em ordem decrescente das respectivas frequências. Esse

tipo de ordenação, é claro, permite focalizar as respostas mais importantes, minimizando aquelas de

menor signicado.

Use os dados do problema anterior para construir um diagrama de Pareto.

3. Sempre com a preocupação de explicitar as categorias de maior importância, é comum superpor a

um diagrama de Pareto, um polígono de frequências acumuladas. Faça, então, o que foi assinalado:

justaponha ao diagrama de Pareto as frequências acumuladas da distribuição dada.


2. Distribuição de Frequência 25

RESPOSTAS DAS ATIVIDADES PROPOSTAS

2.6
1. Vale a distribuição:

xi fi f ri f ri (%) Fi Fri
2 3 0,15 15 3 0,15
4 5 0,25 25 8 0,40
6 6 0,30 30 14 0,70
8 4 0,20 20 18 0,90
10 2 0,10 10 20 1,00
20 1,00 100%
P

2. (a) 20; (b) 5; (c) 30; (d) 14; (e) 76,67%

3. Temos fi : 3,5,1,1; f ri : 0,3;0,1;0,05;0,05; Fi : 1,8,16,20.

2.9
1. Verique a validade dos resultados.

Tempo(min) xi fi f ri Fi F ri
7 ` 12 9,5 4 0,133 4 0,133
12 ` 17 14,5 10 0,333 14 0,466
17 ` 22 19,5 7 0,233 21 0,700
22 ` 27 24,5 4 0,133 25 0,833
27 ` 32 29,5 2 0,066 27 0,900
32 ` 37 34,5 3 0,100 30 1,000
30 1,000
P

2. (a) AT = 11 − 1 = 10; (b)L3 = 7; (c) l2 = 3; (d) x4 = 8; (e) f4 = 10;


48
(f ) f r2 = = 0, 40; (g) F3 = 102; (h) I2 .
120
P
3. classes: 6 ` 8; 12 ` 14; xi : 3,9,11,15; fi : 18,11,7 ( = 100);
P
Fi : 4,12,57,100; f ri : 0,08; 0,15; 0,11 ( = 1, 00).
2.12
1. (a) f ri : 0,16; 0,36; 0,26; 0,10; 0,12; Fi : 8,26,39,44,50.

Grácos (b), (c) abaixo; setores angulares (graus): coca-light 57,6; coca 129,6; pepsi 36; guaraná

93,6; sprite 43,2.


26 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Para o diagrama de Pareto, indicamos, abaixo, duas congurações, cada qual com seu polígono de

frequências acumuladas.
3. Medidas de Posição 27

CAPÍTULO 3
MEDIDAS DE POSIÇÃO

Objetivos do Capítulo 3

(a) Descrever as medidas de posição de uma distribuição de frequência;

(b) Explicitar as medidas de tendência central e as de tendência não central;

(c) Estabelecer as limitações numéricas nas interpretações decorrentes das medidas;

(d) Interpretar gracamente as questões de simetria das distribuções;

3.1 INTRODUÇÃO

O comportamento numérico das variáveis estatísticas está bem fundamentado em vários critérios

denominados de medidas características. Tais critérios fornecem as pistas tanto de um melhor

entendimento como de um aprofundamento das propriedades das variáveis em estudo.

As medidas estão agrupadas em dois grandes blocos, como abaixo indicado.

Medidas de tendência central: média, moda e mediana


(
Medidas de posição
Medidas separatrizes: quantis, decis e percentis


 amplitude


desvio padrão
Medidas de dispersão ou de variabilidade


 variância


coeciente de variação

Neste capítulo, estudaremos as medidas de posição, deixando as medidas de dispersão para o

Capítulo 4. Iniciaremos com as medidas de tendência central.

3.2 MÉDIA

(a) Dados não agrupados


A média aritmética (ou, mais simplesmente, média) de uma variável quantitativa X = {x1 , x2 , . . . xn },
n
X
xi
i=1
notada X, é a soma dos valores de X dividida pelo número total n das observações: X= .
n
x1 = 28, x2 = 32, x3 = 42, x4 = 46, x5 = 52, então
Por exemplo, se

28 + 32 + 42 + 46 + 52 180
X= = = 36; observe que a média pode não ser um dos valores de X.
5 5
28 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Do mesmo modo, se X = {2, 5, 6, 8} é uma amostra de números inteiros, então X = 5, 25,


isto é, a média não inteira revela que não ocorre, necessariamente, a mesma natureza dos dados de

partida.

3.2.1 Propriedades da média


As seguintes relações são de vericação rotineira.

di = xi − X (desvio de xi em relação à média X ), então ni=1 di = 0.


P
(a) Se
Xn Xn Xn Xn
De fato, temos di = (xi − X) = xi − X = nX − nX = 0.
i=1 i=1 i=1 i=1
(b) Somando-se uma constante c a cada valor de uma variável numérica X = {x1 , x2 , . . . xn }, obtemos
a variável Y = X + c = {x1 + c, x2 + c, . . . xn + c}, tal que Y = X + c.
Por exemplo, a variável Y =X −X possui média nula: Y = 0.
(c) Multiplicando-se cada valor de uma variável numérica X = {x1 , x2 , . . . xn } por uma constante

c 6= 0, a variável Z = cX é tal que Z = c X.


(d) Para cada desvio δi = xi − δ do valor xi em relação a um número arbitrário δ, vale a condição
Pn 2
Pn 2
mínima i=1 di ≤ i=1 δi , onde di é o desvio em relação à média.

(b) Dados agrupados sem intervalos de classe


Como cada valor X = {x1 , x2 , . . . xn } está afetado de uma frequência simples fi , o somatório
xi de
P P P
xi permite uma condensação: xi = x1 f1 + x2 f2 + · · ·X + xm fm = xi fi . Por outro lado,
X temos

P x i xi fi
fi = n. Desse modo, a expressão usual da média X = é escrita sob a forma X = X
n fi
de uma média aritmética ponderada.
xi fi xi fi
x1 f1 x1 f1
x2 f2 x2 f2
. .
. .
. .

xm fm xm fm
m
X m
X
fi xi fi
i=1 i=1

Por exemplo, da tabela do Número de irmãos (cf. 2.4), segue

xi fi xi fi
0 6 0

1 9 9

2 20 40

3 16 48

4 5 20

5 3 15

6 1 6

Total 60 138
138
Vemos, então, que X= = 2, 3.
60
3. Medidas de Posição 29

(c) Dados agrupados com intervalos de classe


Nesse caso, adotaremos a convenção de que, em cada intervalo, o respectivo ponto médio xi , junta-

mente com a frequência simples fi da classe, representa todos os pontos do intervalo. (Na realidade,

a validade analítica desse procedimento depende de que os valores se distribuam uniformemente em

cada classe, o que exige conhecimentos de análise real mais adequados para um segundo curso).
X
xi fi
Admitindo esse resultado, vale a mesma expressão anterior X= X .
fi
Por exemplo, seja a distribuição do tempo de espera do prob. 2.9.1.

Tempo(min) xi fi fi xi
7 ` 12 9,5 4 38,00
12 ` 17 14,5 10 145,00
17 ` 22 19,5 7 136,50
22 ` 27 24,5 4 98,00
27 ` 32 29,5 2 59,00
32 ` 37 34,5 3 103,50
P
30 580,00

580
Vemos, então, que X= = 19, 33 min.
30
(d) Processo simplicado para o cálculo da média
Dependendo da ordem de grandeza dos dados X, o cálculo direto da média X̄ pode ser algo
X − X0
fastidioso. É possível usar uma mudança de variável conveniente, da forma Y = , que torna
h
mais simples todo o processo. De fato, tendo em conta as propriedades
X 3.2.1 da média, vemos que
X̄ − X0 h yi fi
Ȳ = , donde X̄ = X0 + hȲ , isto é X̄ = X0 + X . Em geral, a simplicação decorre
h fi
da escolha da origem X0 dentre os pontos médios da distribuição, de maior frequência. O parâmetro

h, como de hábito, é a amplitude comum dos intervalos de classe.

Por exemplo, para a distribuição já considerada do tempo de espera, temos h = 5 e indicamos os

valores de Y tomados em relação ao ponto X0 = 14, 5.


xi fi yi fi yi
9,5 4 -1 -4

14,5 10 0 0

19,5 7 1 7

24,5 4 2 8

29,5 2 3 6

34,5 3 4 12
P P
fi = 30 fi yi = 29
 
29
Enm, X̄ = 14, 5 + 5 = 19, 33 min.
30

Exemplo 3.3
1. Verique que a seguinte série numérica {4, −3, 2, −7, 5} não pode ser formada de desvios em relação
à (alguma) média aritmética.

Com efeito, a soma 4 + (−3) + 2 + (−7) + 5 = 1 não é nula, o que viola a propriedade 3.2.1.(a).
30 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

2. Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma média de

70 pontos em uma certa prova. Dada a média geral dos candidatos (masc. e fem.) de 64 pontos, qual

foi a média dos candidatos do sexo feminino?

Seja x a média do sexo feminino; temos (justique!) 70 × 0, 6 + x × 0, 4 = 64, donde x = 55.


3. Em 1990, a Seleção Brasileira Feminina de Vôlei foi recordista de vitórias. Também, com aquelas

atletas, era brincadeira:

N
◦ Nome Idade Altura

1 Kelly 20 1,87

2 Ana Moser 22 1,84

3 Denise 22 1,82

4 Ida 25 1,78

5 Ana Richa 23 1,76

6 Tina 24 1,85

7 Ana Volponi 23 1,80

8 Cilene 23 1,83

9 Fátima 21 1,87

10 Márcia Fu 21 1,85

11 Ana Flávia 20 1,85

12 Fernanda Venturini 19 1,81

263
A idade média da seleção era I= ' 22anos.
12

Atividade-proposta 3.4
1. Sejam os conjuntos X = {1, 3, 7, 9, 10}, Y = {20, 60, 140, 180, 200} e Z = {10, 50, 130, 170, 190}.
Calcule a média X; usando as propriedades (3.2.1) da média, conclua Y e Z.
2. Calcule a média das seguintes distribuições:

xi 2 4 6 8 10
(a)
fi 3 5 6 4 2

faixas (s.m.) 1 ` 3 ` 5 ` 7 ` 9 ` 11
(b)
fi 30 48 24 10 8

3. Encontre a altura média da Seleção Brasileira de Vôlei (ver o Prob.3.3.3).

4. Sejam as distribuições X e Y, que reetem os comportamentos (tamanhos de família) em duas

comunidades, uma de base cultural alemã, outra, italiana. Indique qual das duas comunidades tem

famílias maiores, explicitando o critério usado.

xi 2 3 4 5 6 7
(a)
fi 25 30 48 111 98 88

yi 3 4 5 6 7 8 9
(b)
fi 48 51 48 41 32 14 6

5. Verique a validade da propriedade da média estabelecida em 3.2.1(d), sobre a soma dos desvios

quadrados atingir um mínimo para os desvios em relação à média.

Sugestão. Podemos proceder analiticamente, usando o anulamento da derivada em um ponto crítico,

ou desenvolver convenientemente a soma dos desvios quadrados.


3. Medidas de Posição 31

3.5 MODA

A moda Mo é o valor mais frequente do conjunto de observações de determinada variável.

Tal como anteriormente, consideraremos os três casos mais comuns de distribuições.

(a) Dados não agrupados


A moda é facilmente reconhecida: basta procurar o valor que mais se repete. Por exemplo, se

X = {3, 4, 5, 7, 7, 7, 9, 11, 15}, então a moda vale 7. Podem ocorrer dois ou mais valores modais,

quando diremos que a distribuição é bimodal. É o caso de Y = {2, 3, 5, 5, 5, 7, 8, 9, 11, 11, 11), que

possui os valores modais 5 e 11. Enm, pode não ocorrer nenhum valor modal (caso amodal), como
em Z = {3, 6, 9, 13, 17, 19}.
(b) Dados agrupados sem intervalos de classe
A determinação da moda é imediata, bastando xar a variável de maior frequência. Esse é um

procedimento bastante comum para variáveis qualitativas.

Por exemplo, abaixo, assinalamos a moda de cada distribuição. Na primeira, a moda corresponde à

categoria casado; na segunda, a moda é a família com dois irmãos.

Estado civil fi Núm. irmãos fi


casado 360 0 6

solteiro 240 1 9

viúvo 40 2 20

divorciado 50 3 15

outra situação 10 4 5

Total 700 Total 55


(c) Dados agrupados com intervalos de classe
Nesse caso, começamos por identicar a classe que possui a maior frequência (a classe modal). Dentre
l∗ + L∗
os pontos dessa classe, escolhemos o ponto médio como representante da moda: Mo = , onde
2
l∗ é o limite inferior e L∗ o limite superior da classe modal.
Por exemplo, dada a distribuição,

Altura(cm) fi
150 ` 154 7

154 ` 158 11

158 ` 162 12

162 ` 166 10
P
fi = 40

158 + 162 320


vemos que a classe modal é o intervalo 158 ` 162, donde a moda Mo = = = 160cm
2 2
é o ponto médio do intervalo considerado.

Observação. Para dados agrupados em intervalos, o ponto médio de cada classe foi escolhido para

representar todos os pontos do intervalo considerado (afetado, é claro, da frequência correspondente à

classe). Por essa razão, os processos relativos a distribuições pontuais valem, com poucas adaptações,

para os intervalos de classe.


32 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

3.6 MEDIANA

A mediana (M d) é um valor que ocupa a posição central de uma série de observações ordenadas

(de forma crescente), em que 50% dos elementos devem estar abaixo de Md e 50% acima. É fácil

estabelecer uma rotina de cálculos da mediana.

a) Dados não agrupados


Dado um conjunto numérico nito X = {x1 , x2 , . . . , xn }, com x1 ≤ x2 ≤ · · · ≤ xn , a paridade de n
indicará como proceder para o cálculo da mediana:

(i) n ímpar: M d = x(n+1)/2 é o elemento central;

(ii) n par: há dois elementos centrais xn/2 e x(n/2)+1 ; a mediana é a média aritmética desses dois

valores.

Por exemplo, se X = {2, 4, 5, 7, 8, 10, 13}, com n = 7, temos M d(X) = x4 = 7.


Em Y = {4, 6, 7, 8, 12, 15}, com n = 6, ocorrem dois elementos centrais, x3 = 7 e x4 = 8; donde a
7+8
média aritmética M d(Y ) = = 7, 5. Observemos que M d(Y ) não é valor de Y .
2
(b) Dados agrupados sem intervalos de classe
P
Comparando a semi-soma das frequências simples ( fi )/2 com as frequência acumuladas Fi , encon-

tramos a menor frequência acumulada que supera a semi-soma simples; o correspondente


P xi + xi+1
valor xi é o valor mediano. Caso ocorra a igualdade Fi = ( fi )/2, então Md = .
2
Observemos os seguintes exemplos.

Núm. irmãos fi Fi Núm. irmãos fi Fi


0 2 2 0 2 2

1 6 8 1 5 7

2 10 18 2 7 14

3 11 29 3 8 22

4 5 34 4 6 28

Total 34 Total 28
P
Na primeira distribuição, temos ( fi )/2 = 34/2 = 17; ora, a menor frequência acumulada maior do

que 17 vale 18 que, por sua vez, corresponde ao valor 2 da varíável. Logo, M d = 2.
P
No segundo exemplo, vemos que ( fi )/2 = 28/2 = 14. Agora, há uma frequência acumulada, a

saber, F3 tal que F3 = 14, que corresponde ao valor 2 da variável. Então, tomamos a mediana como

a média entre 2 e 3, isto é, M d = 2, 5.

(c) Dados agrupados com intervalos de classe


P
Tal como no caso anterior, iniciamos com a frequência acumulada igual à soma ( fi )/2, ou com

classe mediana,
P
a menor frequência acumulada maior do que ( fi )/2, que nos dará a onde se

enconta a mediana M d. O posicionamento da mediana em sua classe decorre de uma semelhança de

triângulos, melhor visualizados no polígono de frequências acumuladas, como mostramos no diagrama

abaixo. Obtemos, então:


X
( fi /2) − F (ant)
M d = l∗ + h∗ ,
f∗
onde l∗ é o limite inferior da classe mediana; F (ant) é a frequência acumulada da classe anterior à

classe mediana; f é a frequência simples da classe mediana e h∗ a amplitude do intervalo da classe

mediana. Na realidade, a operação acima revela uma interpolação linear.


3. Medidas de Posição 33

Por exemplo, considere a distribuição dos pesos (kg) de 40 alunos da UFAL.

Pesos (kg) fi Fi
59 ` 64 2 2

64 ` 69 6 8

69 ` 74 9 17

74 ` 79 12 29

79 ` 84 8 37

84 ` 89 3 40
P
fi = 40
P
Com as notações acima temos: ( fi )/2 = 40/2 = 20, o que identica a classe mediana 74 ` 79;
(20 − 17) · 5
assim, F (ant) = 17, l∗ = 74, f ∗ = 12, h∗ = 5, donde M d = 74 + = 75, 25.
12

F 29

 
P  
( fi )/2  

 f∗ 20

 12
 
 
 
F(ant)  17 

l∗ Md l∗ + h∗ 74 Md 79

Atividade-proposta 3.7
1. Calcule a moda e a mediana das distribuições:

xi 2 4 6 8 10
(a)
fi 3 5 6 4 2

faixas (s.m.) 1 ` 3 ` 5 ` 7 ` 9 ` 11
(b)
fi 30 48 24 10 8

2. Um livro com 50 páginas apresentou um número de erros de impressão por página conforme indi-

cado abaixo.

Erros Núm. pág.


Ação Taxa(%)
0 25
1 2,59
1 20
2 2,64
2 3
3 2,60
3 1
4 2,62
4 1
5 2,57
Total 50

Calcule o número médio de erros por página, o número mediano de erros por página e o número modal

de erros por página.

3. Durante um certo período de tempo, o rendimento de cinco ações na Bovespa está tabelado acima.

Determine o rendimento médio, o rendimento mediano e o rendimento modal.

4. No processo para achar a mediana dos intervalos de classes, mostre que, se existir uma frequência
P
acumulada exatamente igual a ( fi )/2, então a mediana será o limite superior da classe correspon-

dente. Vale o resultado para outras medidas?


34 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

5. O departamento de pessoal de uma rma fez um levantamento dos salários dos 120 funcionários

do setor administrativo, resumidos na tabela abaixo.

Faixa salarial(s.m.) % de funcionários

1`3 0,25

3 ` 5 0,40

5 ` 7 0,20

7 ` 10 0,15

Total 1,00
a) Encontre o salário médio dos funcionários, o salário mediano e o salário moda;

b) Se for dado um aumento de 20% para todos os funcionários, qual será o novo salário médio?

3.8 MEDIDAS SEPARATRIZES


As separatrizes generalizam a mediana: enquanto esta divide a amostra em dois grupos com o mesmo

número de valores, isto é, 50% do total n de valores, podemos considerar outras partições. Assim,

(a) os quartis dividem uma série em quatro partes iguais. Há três quartis, notados Q1 , Q2 = M d e

Q3 . O primeiro quartil é a posição Q1 tal que uma quarta parte 25% = 1/4 dos dados é menor do
que Q175% = 3/4 dos dados são superiores a Q1 . O segundo
e quartil Q2 = M d é a nossa mediana.

O terceiro quartil Q3 indica que 75% = 3/4 dos dados são menores do que ele e uma quarta parte

25% = 1/4 é maior.


(b) os decis são nove valores que particionam os dados em 10 partes iguais; serão indicados por

d1 , d2 , . . . , d9 . Temos d5 = M d = Q2 .
(c) os percentis são 99 valores que separam os valores em 100 partes iguais, notados p1 , p2 , . . . , p99 .
Observemos que p25 = Q1 , p50 = M d = Q2 = d5 , p75 = Q3 .

3.8.1 Ordem de elementos e percentis


Consideremos n números reais, crescentemente ordenados, cujas posições 1, 2, . . . , n serão represen-

tadas pelos percentis 0%, 1%, 2%,. . . , 100%. Desse modo, qualquer dado da amostra estará sempre

entre 0% e 100%.

percentil
100%
##
#
p #
#
#
#
#
#
0 #
1 2 x n ordem

n−1 x−1
Como vemos na gura, vale a proporção = , donde as relações
100% − 0% p − 0%
x−1 p
p= × 100% e x = (n − 1) × +1
n−1 100
Tais relações são fundamentais para passar de ordem a percentil e vice-versa!
3. Medidas de Posição 35

Por exemplo, examinemos os seguintes dados, onde aparecem 11 resultados ordenados e os respectivos

percentis.

amostra 15 18 19 24 27 31 32 38 39 42 43

percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

x−1
Nesse caso, como n=11, temos × 100% = (x − 1) × 10%, o que permite vericar, dada a
p=
10
ordem, qual é o percentil correspondente: x=1 ⇒ p=0%; x=2 ⇒ p=10%; x=6 ⇒ p=50%. Recipro-
p p
camente, agora usando x = (11 − 1) × +1 = + 1, vemos que, se p = 80%, então a ordem
100 10
x = 9, que se refere ao valor 39.
Observação Há diversos processos de relacionar a ordem de dados ordenados com cada percentil.
Optamos pela forma acima construída, que é usada por dois importantes pacotes computacionais, a

saber, EXCEL e R. No programa R, inclusive, podem ser usados várias rotinas de cálculo.

3.9 Cálculo dos quartis

(a) Dados não agrupados


n+3 3n + 1
Basta usar as posições de ordem x1 = (pois p = 1/4), e x3 = (pois p = 3/4).
4 4
Se o resultado não for um número inteiro, realizaremos uma interpolação linear para xar o valor

correto.

Por exemplo, se X = {185, 196, 207, 305, 574, 597, 612}, então x1 = 10/4 = 2, 5 indica que o 1◦
quartil está entre 196 e 207; como 207-196=11, segue que 196 + 0, 5 × 11 = 196 + 5.5 = 201, 5, isto é,
Q1 = 201, 5.
Pratique um pouco! No exemplo acima, verique que Q3 = 585, 5.
(b) Dados com intervalos de classe. O procedimento é o mesmo usado para a mediana, agora
P
a comparação com as frequências acumuladas sendo feitas com o valor k fi /4, onde k=1 para o

quartil Q1 , e k=3 para Q3 . A expressão nal será:


X
k( fi /4) − F (ant)
Qk = l∗ + h∗
f∗
Por exemplo, na distribuição de salários abaixo, temos
P
(1) x1 = fi /4 = 56/4 = 14
A frequência acumulada 22 indica a classe 500 ` 550 como a classe de Q1 , donde

(14 − 12)50
Q1 = 500 + = 500 + 10 = 510.
10
Dividendos fi Fi
400 ` 450 4 4
450 ` 500 8 12

500 ` 550 10 22
550 ` 600 14 36

600 ` 650 12 48
650 ` 700 8 56
P
fi = 56

P 3 × 56
(2) x3 = 3 fi /4 = = 42
4
A frequência acumulada 48 indica a classe 600 ` 650 para o quartil Q3 , isto é,
(42 − 36)50
Q3 = 600 + = 600 + 25 = 625.
12
36 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

3.10 Cálculo dos percentis

Basta considerar o caso com intervalos de classe. Novamente, o processo é adaptado do cálculo da
P
mediana, onde a expressão k fi /100, k = 1, 2, . . . , 99, é usada na comparação com as frequências

acumuladas.
X
k( fi /100) − F (ant)
pk = l ∗ + h∗ ,
f∗
Por exemplo, calculemos o percentil p55 na tabela Dividendos anteriormente considerada. Temos:
55 P
x55 = fi = 0, 55×56 = 30, 8, o que seleciona a frequência acumulada 36 e o intervalo 550 ` 600;
100
(30, 8 − 22)50
assim, p55 = 550 + = 550 + 31, 43 = 581, 43.
14

Atividade-proposta 3.11

1. Usando as seguintes distribuições, determine, em cada caso:

Faixas sal.min. fi Notas fi


1 `3 30 0 `2 3

3 ` 5 48 2 ` 4 5

5 ` 7 24 4 ` 6 6

7 ` 9 10 6 ` 8 4

9 ` 11 8 8 ` 10 2
P P
=120 =20

(a) o primeiro e o terceiro quartis; (b) o quinto e o sétimo decis;

(c) o 20
◦ percentil e o 90◦ percentil.
3. Medidas de Posição 37

RESPOSTAS DAS ATIVIDADES PROPOSTAS

3.4

1. Temos X̄ = 30/5 = 6. Como Y = 20X e Z = Y − 10, segue que Ȳ = 20X̄ = 120 e

Z̄ = Ȳ − 10 = 110.
P P
2. Basta usar a média ponderada ( fi xi )/ fi : (a) 5,70; (b)4,63.

3. h̄ = 1, 8274 ' 1, 83m


4. Temos X̄ = 5, 23 e Ȳ = 5, 10; assim, em média, são maiores as famílias de base alemã.

5. Pondo δi = xi − δ e di = xi − d (com d = X̄ ), temos δi = di + (d − δ). Elevando ao quadrado,


2 2 2
P 2 P 2
segue δi = di + 2di (d − δ) + (d − δ) . Somando, obtemos δ = di + n(d − δ)2 , pois é nula a
P
soma di , donde a conclusão.
Alternativa: usando o Cálculo, a solução também é interessante. Verique!

3.7
1. (a) M o = 6, M d = 6; (b) M o = 4, M d = 4, 25
2. 0,66; 0,50; 0.

3. 2,60; 2,59; 2,64.

4. Reler o cálculo da mediana em função da paridade do número de observações. Examine com

cuidado o caso geral para concuir a validade do resultado para qualquer medida.

5. (a) 4,575; 4,25; 4; (b) 1,20 vezes maior, isto é, 5,49.

3.11
1.(a) para os salários: Q1 = 3, Q3 = 6; para as notas: Q1 = 2, 8, Q3 = 6, 5.
(b) para os salários: D5 = 4, 25, D7 = 5, 5; para as notas: D5 = 2, 67, D7 = 6.
(c) para os salários: P20 = 2, 6, P90 = 8, 2; para as notas P20 = 2, 4, P90 = 8.
38 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

CAPÍTULO 4
MEDIDAS DE DISPERSÃO

Objetivos do Capítulo 4

(a) Explicitar as características de homogeneidade e de diversicação de uma variável;


(b) Descrever as medidas de dispersão de uma distribuição de frequência;
(c) Comparar as medidas de uma população e de suas amostras;
(d) Estabelecer as limitações numéricas nas interpretações decorrentes das medidas;
(e) Complementar o emprego de medidas mais especícas.

4.1 INTRODUÇÃO

Quando descrevemos o comportamento numérico de um conjunto de valores X , vimos que, por exem-
plo, podemos usar a média de X como um valor típico ou representativo dos valores em estudo.
Entretanto, quando for necessário aferir o grau de homogeneidade daquela variável X , em torno de
uma medida de tendência central, recorremos às chamadas medidas de dispersão.
Por exemplo, sejam
X1 = {4, 5, 5, 6, 6, 7, 7, 8}, X2 = {1, 2, 4, 6, 6, 9, 10, 10} e X3 = {0, 6, 6, 7, 7, 7, 7.5, 7.5} as notas de
oito alunos em três avaliações nais de um dado curso. Observe que as médias são as mesmas:
m1 = m2 = m3 = 6, o que não signica que o desempenho dos alunos tenha sido o mesmo nas três
avaliações realizadas.
Na primeira avaliação, as notas estão, realmente, regularmente distribuídas em torno da média. Já na
segunda, vemos uma distorção maior: embora a maioria das notas sejam altas, algumas notas baixas
puxam a média para um valor menor. Na terceira prova, há apenas uma nota baixa, mas seu valor é
tal que de fato consegue diminuir a média do conjunto.
As medidas de dispersão de que trataremos nesse capítulo são: amplitude total, variância,
desvio padrão e coeciente de variação.

4.2 AMPLITUDE TOTAL

(a) Dados não agrupados


A amplitude total é a diferença entre os valores observados máximo e mínimo: AT = x(max)−x(min)
4. Medidas de Dispersão 39

Por exemplo, se X = {4, 5, 5, 6, 6, 7, 7, 8}, então ATX = 8 − 4 = 4. Por outro lado, com Y =
{4; 4; 4; 2; 4, 3; 4, 5; 5; 5; 8}, então ATY = 8 − 4 = 4, a mesma amplitude. Observemos, contudo, que
a variável X apresenta uma dispersão bem mais uniforme que Y . Assim, apenas a informação da
amplitude não permite ter idéia de como os dados estão distribuídoss entre os extremos.
(b) Dados agrupados sem intervalos de classe
Vale, ainda, a mesma relação do item anterior: AT = x(max) − x(min)
xi 2 4 6 8 10
Por exemplo, a amplitude total da distribuição vale AT = 10 − 2 = 8.
fi 3 5 6 4 2
(c) Dados agrupados com intervalos de classe
Nesse caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior
da primeira classe: AT = L(max) − l(min).
Por exemplo, na distribuição abaixo, AT = 11 − 1.
faixas (s.m.) 1 ` 3 ` 5 ` 7 ` 9 ` 11
fi 30 48 24 10 8

4.3 VARIÂNCIA E DESVIO PADRÃO

A idéia é vericar, para uma variável numérica X , a tendência dos desvios em relação à média. Ora,
já vimos que é nula a soma dos desvios: (xi − X̄) = 0. o que nos conduz a considerar a média dos
P

quadrados dos desvios. Essa expressão é a variância de X . Tal como construída, a variância é
expressa em unidades ao quadrado. Para preservar as unidades originais, é usual considerar o desvio
padrão σ, raiz quadrada da variância.
Mais precisamente, numa população com n elementos, de média µ = ( xi )/n, a variância populaci-
P

onal vale σ 2 = [ (xi − µ)2 ]/n e o desvio padrão σ = [ (xi − µ)2 ]/n.
P pP

Numa amostra de n elementos, notaremos a variância amostral s2 = [ (xi − X̄)/(n − 1) e o desvio


P

padrão amostral s = s2 . A diferença nos denominadores envolvidos (entre o dado populacional e o
amostral) garante uma certa estabilidade no caso amostral (diremos, então, que s2 é uma estimativa
não viesada). Observemos, enm, para conservar a mesma denição, que podemos sempre usar o
n n
divisor n, multiplicando o resultado por para obter o caso não viesado: s2 = σ 2 .
n−1 n−1
Propriedades
(a) Somando-se uma constante c a cada valor de uma variável numérica X = {x1 , x2 , . . . xn }, obtemos
a variável Y = X + c = {x1 + c, x2 + c, . . . xn + c}, tal que σY = σX .
(b) Multiplicando-se cada valor de uma variável numérica X = {x1 , x2 , . . . xn } por uma constante
c 6= 0, a variável Z = c X é tal que σZ = c σX .
X
Por exemplo, se X possui um desvio padrão não nulo σ , então a variável Z = possui desvio padrão
σ
σX
unitario: σZ = = 1.
σ
X X 2 X
x2i xi x2i
(c) Vale a fórmula alternativa σ2 = −  = − µ2
n n n

Com efeito, desevolvendo


(xi − µ)2 = (x2i − 2µ xi + µ2 ) = x2i − 2nµ2 + nµ2 =
P 2
xi − nµ2
P P P

segue que σ 2 = [ (xi − µ)2 ]/n = ( x2i )/n − µ2 .


P P

Passemos a explicitar os cálculos nos três casos de distribuições que vimos considerando.
40 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

(a) Dados não agrupados


Por exemplo, dado X = {15, 18, 19, 24, 27, 31, 32, 38, 39, 42, 43}, com n = 11, calculemos a variância
σ 2 e o desvio padrão σ . Organizando os dados:
xi x2i
15 225
18 324
19 361
24 576
27 729
31 961
32 1024
38 1444
39 1521
42 1764
43 1849
P P
= 328 = 10778
2


10778 328
Logo, σ2 = − = 90, 69, donde σ = 90, 69 = 9, 52. Com esses resultados populacio-
11 11
nais, poderíamos obter as correspondentes medidas amostrais:
n 11 √
s2 = σ2 = 90, 69 = 99, 76, ou s = 99, 76 = 9, 99
n−1 10
(b) Dados agrupados sem intervalos de classe
Nesse caso, levando em consideração as frequências de cada dado (xi , fi ), a expressão alternativa
anterior se generaliza sem maiores diculdades. Para a variância, temos:
X X 2
fi x2i fi xi
σ2 = − 
n n

Por exemplo, consideremos a distribuição:


xi fi fi xi fi x2i
2 3 6 12
4 5 20 80
6 6 36 216
8 4 32 256
10 2 20 200
P P P
= 20 = 114 = 764
 2
764 114
Temos σ2 = − = 38, 2 − 32, 49 = 5, 71, donde σ = 2, 39
20 20
(c) Dados agrupados com intervalos de classe
Continuamos com a fórmula anterior, observando que, agora, no par (xi , fi ), o valor xi corresponde
ao ponto médio da classe associada à frequência fi .
Por exemplo, retomemos o levantamento dos salários dos 120 funcionários do setor administrativo de
uma rma, resumidos na tabela a seguir.
Temos: σ 2 = 25, 4375 − (4, 575)2 = 4, 506875, ou σ = 2, 12
Pratique um pouco! (a) Se for dado um abono de 0,5 s.m. a todos os funcionários, como ca o
desvio padrão dos salários? (b) E se for aplicado um aumento de 20% para todos os funcionários?
[Resp. (a)Não se altera. (b) Passa para 2,55. Justique cada caso!]
4. Medidas de Dispersão 41

Faixa salarial(s.m.) fi (% funcionários) xi fi xi fi x2i


1`3 0,25 2 0,5 1
3`5 0,40 4 1,6 6,4
5`7 0,20 6 1,2 7,2
7 ` 10 0,15 8,5 1,275 10,8375
1,00 4,575 25,4375
X

4.3.1 Processo breve

Tal como zemos para a média, podemos reduzir o trabalho numérico do cálculo do desvio padrão σ
X − X0
com o auxílio de uma mudança de variável conveniente. De fato, se Y := , vimos em 4.3 que
h
σX
σY = ; a escolha de Y pode simplicar os cálculos!
h
Por exemplo, seja X = {136, 138, 141, 143, 157}.
Escolhendo Y = X − 140, temos Y = {−4, −2, 1, 3, 17}, cuja ordem de grandeza parece ser mais
319
sugestiva. Usando yi = 15 e yi2 = 319, segue σY2 = − (15/5)2 = 54, 8, donde σY = 7, 40.
P P
5
Enm, σX = σY = 7, 40.
O processo para o caso de dados agrupados em intervalos de classe pode ser assim sistematizado.
X − X0
Escolhemos a variável Y = , onde X0 é o ponto médio de maior frequência e h a amplitude
h
(comum) dos intervalos; temos σX = h σY .
Por exemplo, consideremos a distribuição, já complementada com as colunas relativas à variável Y .
custos (R$) 450 ` 550 ` 650 ` 750 ` 850 ` 950 ` 1050 ` 1150
fi 8 10 11 16 13 5 1
X − 800
Variável auxiliar Y = . Temos
100
xi fi yi fi yi fi yi2
500 8 −3 −24 72
600 10 −2 −20 40
700 11 −1 −11 11
800 16 0 0 0
900 13 1 13 13
1000 5 2 10 20
1100 1 3 3 9
P P P
h = 100 = 64 = −29 = 165
"  2 #
165 −29
Temos: σY2 = − = 2, 3728 ; σY = 1.54 ; σX = 100σY = 154.
64 64

Atividade-proposta 4.4

1. Em cada caso, calcule a variância e o desvio padrão, considerando (i) dados populacionais; (ii)
dados amostrais.
(a) {1, 3, 5, 6, 8, 13};
xi 0 1 2 3 4
(b)
fi 600 310 75 13 2
42 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

2. Calcule o desvio padrão por cálculo direto com os dados originais. Comprove o resultado, usando
o processo breve.
peso(kg) fi xi fi xi fi x2i yi fi yi fi yi2
59 ` 63 3 61
63 ` 67 5 65
67 ` 71 9 69
71 ` 75 12 73
75 ` 79 6 77
79 ` 83 5 81
P P P P P
h=4 = 40
3. Os operários de um setor industrial têm, em uma época 1, um salário médio de 5 salários mínimos
(s.m.) e desvio padrão de 2 s.m. Um acordo coletivo prevê, para uma época 2, um aumento linear de
60%, mais uma parte xa correspondente a 70% de um salário mínimo. Calcule a média e o desvio
padrão dos salários na época 2.

4.5 COEFICIENTE DE VARIAÇÃO

O coeciente de variação percentual é uma medida de dispersão relativa, permitindo comparar o


agrupamento de diferentes distribuições (com diferentes média se desvios padrões).
σX
CV= × 100

Por exemplo, em um exame nal de Matemática, o grau médio de um grupo de 150 alunos foi 7,8
e o desvio padrão, 0,80. Em Estatística, entretanto, o grau médio foi 7,3 e o desvio padrão, 0,76.
Calculando cada coeciente de variação, encontramos:
0, 80 0, 76
CV1 = = 10, 26% e CV2 = = 10, 41%
7, 8 7, 3
O maior coeciente de variação em Estatística indica maior dispersão em relação à Matemática.
Pratique um pouco!
Os retornos mensais de dois investimentos (A e B), durante os últimos seis meses, apresentaram os
resultados tabelados abaixo:
Estatísticas A B
Média 9,33% 7,17%
Desvio padrão 3,72% 1,17%
CV amostra
Verique que o CV de A é maior do que o de B, isto é, o investimento A apresentou mais risco do
que o investimento B.

4.6 ASSIMETRIA

1. Posições relativas da média, mediana e moda


Intuitivamente, quando há coincidência das três medidas, a distribuição de frequência possui uma
representação gráca simétrica em relação à média(=mediana=moda). Na realidade, a curva lembra
o perl de um sino, pois que, como veremos, é muito próxima a uma distribuição normal (de Gauss!).
Veja a curva (a) na próxima página, simétrica, em que X̄ = 12, M d = 12, M o = 12 e σ = 5, 85.
Quando X̄ < M d < M o, diremos que a distribuição possui assimetria negativa ou à esquerda; é
o caso da curva (b), em que X̄ = 13, M d = 13, 6, M o = 16 e σ = 8, 82.
Enm, se M o < M d < X̄ , então ocorre assimetria positiva ou à direita; veja a curva (c), onde
M o = 8, M d = 10, 4 e X̄ = 11, e σ = 8, 82.
4. Medidas de Dispersão 43

Resumindo a discussão anterior, temos os três casos analisados:


(a) X̄ − M o = 0 =⇒ assimetria nula ou distribuição simétrica;
(b) X̄ − M o < 0 =⇒ assimetria negativa ou à esquerda;
(c) X̄ − M o > 0 =⇒ assimetria positiva ou à direita.
2. Coeciente de assimetria
Para permitir comparações entre medidas de duas distribuições, é usual lançar mão do chamado
coeciente de assimetria de Pearson, dado por
3(X̄ − M d)
As =
σ
A assimetria é ainda classicada como moderada, se for 0, 15 < |As| < 1, ou forte, quando
|As| > 1.
Pratique um pouco! Comprove os seguintes valores do coeciente de Pearson para as distribuições
anteriormente cosideradas (a),(b) e (c): AsA = 0, AsB = −0, 2041, AsC = 0, 2041.

(a) (b)

(c)

Cada distribuição está tabelada a seguir.


(a) faixa fi (b) faixa fi (c) faixa fi
2`6 4 2`6 4 2`6 4
6 ` 10 10 6 ` 10 10 6 ` 10 26
10 ` 14 20 10 ` 14 20 10 ` 14 20
14 ` 18 10 14 ` 18 26 14 ` 18 10
18 ` 22 4 18 ` 22 4 18 ` 22 4
P P P
= 48 = 64 = 64
44 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Atividade-proposta 4.7

1. [Variáveis reduzidas] Dado um conjunto X , seja X a média de X e σX o respectivo desvio


X −X
padrão. Verique que a variável Z = possui média nula e desvio padrão unitário. Diremos,
σX
então, que Z é uma variável reduzida ou que apresenta um escore reduzido. Observemos que Z mede
o desvio de X em relação a X̄ , em termos de σ .
Aplicação Um estudante recebeu o grau 84 em um exame de Matemática, para o qual o grau médio
foi 76 e desvio padrão 10. No exame correspondente de Física, para o qual o grau médio foi 82 e o
desvio padrão 16, recebeu o grau 90. Em que matéria sua posição relativa foi mais elevada?
2. Uma indústria de cinescópios tem dois tipos de monitores, A e B ; os cinescópios tem durações
médias de X̄A = 1495h e X̄B = 1875h, e desvios-padrões σA = 280h e σB = 310h. Que tipo apresenta
maior (a)dispersão absoluta; (b) dispersão relativa.
3. O intervalo interquartil, denido por IQ = Q3 − Q1 , é outra medida de dispersão dos dados,
Q3 − Q1
enquanto Q1 + Q3 é outra medida de tendência central. Por isso, denimos VQ = como o
Q3 + Q1
coeciente quartílico de variação relativa, uma outra medida de dispersão relativa.
Dada a distribuição da Atividade (3.11), calcule CV , IQ e VQ .
Notas fi
0`2 3
2`4 5
4`6 6
6`8 4
8 ` 10 2
=20
P
4. Medidas de Dispersão 45

RESPOSTAS DAS ATIVIDADES PROPOSTAS

4.4
n
1. (a) pop. σ 2 = 14, 67, σ = 3, 83; amostr. s2 = 17, 60, s = 4, 20. Lembrar que s2 = σ 2 . No
n−1
caso, vale s2 = (6/5) 14, 67 = 17, 60.
(b) pop. σ 2 = 0, 4706, σ = 0, 6860.
2.
peso(kg) fi xi fi xi fi x2i yi fi yi fi yi2
59 ` 63 4 244 61 14884 −3 −12 36
63 ` 67 6 390 65 25350 −2 −12 24
67 ` 71 7 483 69 33327 −1 −7 7
71 ` 75 12 876 73 63948 0 0 0
75 ` 79 6 462 77 35574 1 6 6
79 ` 83 5 405 81 32805 2 10 20
2860 205888 93
P
h=4 = 40 −15
√ √
Temos σX = 34, 95 = 5, 92 cm. Alternativamente, pelo processo breve, achamos σY = 2, 184375 =
1, 48 , donde σX = 4σY = 5, 92.
3. Seja Y = 1, 6X + 0, 7 o novo salário. Temos Y = 1, 6X + 0, 70, donde Y = 1, 6 × 5 + 0, 70, ou
Y = 8, 70. Por outro lado, σY = 1, 6σX = 3, 20.
4.7

84 − 76 90 − 82
1. Os escores reduzidos são: zmat = = 0, 8; zf is = = 0, 5. Assim, ocorre uma posição
10 16
relativa mais alta em Matemática.
2. Como σB > σA , vemos que o tipo B tem maior dispersão absoluta. Por outro lado, os coecientes
280 310
de variação são CVA = = 18, 7% e CVB = = 16, 5%, indicando o tipo A como o de maior
1495 1875
variação ou dispersão relativa.
3. Temos X = 4, 70, σ = 2, 39, Q1 = 2, 8 e Q3 = 6, 5. Segue, então:
σ 2, 39
CV = = = 50, 84%;
X 4, 70
IQ = Q3 − Q1 = 6, 5 − 2, 8 = 3, 7
Q3 − Q1 3, 7
VQ = = = 39, 78%
Q3 + Q1 9, 3
46 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

CAPÍTULO 5
PROBABILIDADE

Objetivos do Capítulo 5

(a) Explicitar as hipóteses de probabilidade uniforme em espaços amostrais nitos;

(b) Descrever as principais propriedades operacionais;

(c) Estudar o conceito de probabilidade condicional a as aplicações de Bayes;

(d) Ampliar para o caso de espaços enumeráveis os axiomas de Kolgomorov (casos elementares).

5.1 EXPERIMENTOS DETERMINÍSTICOS E ALEATÓRIOS


Os experimentos ou fenômenos determinísticos são aqueles que, realizados em condições seme-

lhantes, apontam para resultados essencialmente idênticos. Por outro lado, os experimentos que,

realizados sob as mesmas condições, produzem resultados geralmente diferentes e não previsíveis, são

os chamados experimentos aleatórios.


No primeiro caso, encontramos os enunciados cientícos que moldaram a Teoria do Conhecimento

desde o sec. XVI, em suas diversas vertentes. O formalismo da mecânica newtoniana, por exemplo,

só veio a ser questionado pelas correções relativistas de Einstein, em 1905.

Exemplo 5.2

São aleatórios os seguintes eventos:

(a) Lançamento de uma moeda perfeita;

(b) Lançamento de um dado equilibrado;

(c) Lançamento de duas moedas;

(d) Retirada de uma carta de um baralho de 52 cartas;

(e) Determinação da vida util de um semicondutor.

O conjunto dos possíveis resultados de um espaço aleatório é o espaço amostral E; inicialmente,

conjunto nito. Os elementos (pontos) de E são os chamados


suporemos que o espaço amostral é um

eventos elementares. Os subconjuntos de E são os eventos de E .


5. Probabilidade 47

Exemplo 5.3

Os espaços amostrais associados aos eventos considerados em 5.2 são:

(a) E = {c, k}, onde os eventos elementares são cara (c) e coroa (k);

(b) E = {1, 2, 3, 4, 5, 6}, indicando a ocorrência de uma das faces 1,2,3,4,5 ou 6;

(c) E = {(c, k), (c, c), (k, c), (k, k)};


(d) E = {A0 , . . . , K0 , Ap , . . . , Kp , Ae , . . . , Ke , Ac , . . . , Kc }, onde A, 1, 2, . . . , 10, J, D, K são as

13 guras, cada uma ocorrendo em 4 naipes (ouros, paus, espadas, copas);

(e) E = {t ∈ R ; t ≥ 0}.
Exemplo 5.4

No lançamento de dois dados, o espaço amostral E corresponde ao produto cartesiano

E = {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6}, com 36 pontos.

1 2 3 4 5 6
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Consideremos a descrição dos seguintes eventos:

E1 : saída de faces iguais = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}
E2 : saída de faces de soma 11 = {(5, 6), (6, 5)
E3 : saída de faces de soma 1 = φ (evento impossível)

E4 : saída de faces de soma menor do que 20 = E (evento certo)

E5 : saída de faces onde um número é o triplo do outro = {(1, 3), (3, 1), (2, 6), (6, 2)}.

Exemplo 5.5

Os oito resultados dos 3 lançamentos de uma moeda podem ser indicados em um diagrama de árvore.
c (c, c, c)

c 
H k
HH (c, c, k)
c
@ c (c, k, c)
 @ 
 @ 
 kHH
H
 k (c, k, k)

A c (k, c, c)
A c 
A 
HH
A H
A k (k, c, k)
k@
A

@ c (k, k, c)
@
kHH
H
k (k, k, k)
48 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

5.6 O CONCEITO DE PROBABILIDADE


Em vários casos de experiências aleatórias, é comum admitir uma certa regularidade estatística,
isto é, quando da realização repetitiva do experimento um grande número de vezes, a frequência
relativa dos resultados obtidos parece apontar para uma proporção xa.

Por exemplo, relativamente ao lançamento de uma moeda equilibrada, a regularidade a longo termo
signica que a proporção de vezes que saiu cara tende a se estabilizar perto do valor 1/2. Observe a
simulação representada no quadro abaixo, em que a frequência relativa se aproxima do valor f = 0, 5.
# lançamentos # caras metade lançamentos(y) |y − x| freq.relativa

100 49 50 1 0,49

500 253 250 3 0,51

1000 495 500 5 0,50

2000 943 1000 7 0,50

3000 1510 1500 10 0,50

Diremos, então, que a probabilidade da saída de cara em qualquer lançamento da moeda vale p = 0, 5.

Um outro exemplo, para ilustrar a tendência numérica da frequência relativa, está resumido no
quadro abaixo, com os resultados do lançamento de um dado 1000 vezes e anotada a face virada para
cima.
face freq. abs. freq. rel.

1 159 15,9%

2 163 16,3%

3 160 16,0%

4 161 16,1%

5 86 8,6%

6 271 27,1%

A construção de Laplace

Seja A ⊂ E um evento de um espaço amostral. Considerando que os elementos de A (os eventos


elementares que compõem A) indicam os casos favoráveis à ocorrência de A, dentre o total de casos
possíveis de E, indicaremos a probabilidade da ocorrência de A pela razão:

número de casos favoráveis #A


P (A) = =
número de casos possíveis #E
Essa formulação, na realidade, repousa nas seguintes características:

(a) Há um número nito n ≥ 1 de eventos elementares (casos possíveis ) cuja união é o espaço E ;
(b) Os eventos elementares são igualmente prováveis;
(c) Todo evento A ⊂ E é união de m eventos elementares (casos favoráveis), com m ≤ n.
#A m
Nessas condições, P (A) = = .
#E n
5. Probabilidade 49

5.7 Propriedades
As seguintes propriedades decorrem diretamente da denição anterior.

(a) Para todo evento A, vale 0 ≤ P (A) ≤ 1;


(b) P (E) = 1 (evento certo);

(c) P (φ) = 0 (evento impossível);

(d) Se A∩B =φ (eventos mutuamente exclusivos), então P (A ∪ B) = P (A) + P (B).

Exemplos 5.8
1. No lançamento de um dado, ache a probabilidade dos eventos: (i) o resultado é o número 1; (ii) o

resultado é o número 2; (iii) o resultado é 1 ou 2; (iv) o resultado é 3,4,5 ou 6.

Se A = {1}, então P (A) = 1/6. Mesmo valor para B = {2}: p(B) = 1/6. No terceiro caso, temos
C = A ∪ B , donde P (C) = P (A) + P (B) = (1/6) + (1/6) = 1/3, pois A e B são mutuamente
exclusivos. Enm, com D = {3, 4, 5, 6}, temos C ∪ D = E , logo P (C) + P (D) = P (E) = 1, donde

P (D) = 1 − (1/3) = 2/3.


2. No lançamento de dois dados (ver 5.4), indicar a probabilidade de que seja igual a 11 a soma dos

números mostrados nas faces.

Temos #E = 6 × 6 = 36 e pondo A = {(x, y) ; x + y = 11} = {(5, 6), (6, 5)}, vem #A = 2, donde
2 1
P (A) = = .
36 18
3. Retomando o espaço amostral E do lançamento de uma moeda três vezes (cf. 5.5), indicar a

probablidade de obter 2 caras (e uma coroa).

Sendo A = {(c, c, k), (c, k, c), (k, c, c)}, temos #A = 3. Como #E = 8, vemos que P (A) = 3/8.
4. Numa urna, existem 5 bolas, das quais 3 são vermelhas e 2 são pretas. Duas bolas são retiradas

da urna; indicar a probabilidade de que as bolas sejam de cores diferentes.

Para facilitar a identicação dos resultados, suponhamos as bolas vermelhas numeradas 1,2,3; as

bolas pretas serão 4 e 5. O evento A = extrair duas bolas de cores diferentes é formado pelos 12

resultados (1, 4), (1, 5), )(2, 4), (2, 5), (3, 4), (3, 5), (4, 1), (4, 2), (4, 3), (5, 1), (5, 2), (5, 3).
Para caracterizar o total dos casos possíveis, temos de decidir se a amostragem será feita com
reposição ou sem reposição. Ora, no caso com reposição, quando se retira uma bola, verica-se

sua cor e a bola é devolvida à urna, para, só então, prosseguir com a segunda extração. Desse

modo, teremos 5
2 = 25 possibilidades para o espaço amostral. Por outro lado, no caso sem

reposição, obtemos 20 pontos para o espaço amostral, a saber, os 25 resultados menos os 5 pares

(1, 1, ), (2, 2, ), (3, 3), (4, 4), (5, 5) que correspondem à mesma bola. Em denitivo, com reposição:

P (A) = 12/25; sem reposição: P (A) = 12/20.


5. Um casal possui 4 lhos. Qual a probabilidade de que, dentre os lhos, ocorra exatamente uma

menina? Supor que a probabilidade de nascimento de sl menino vale 1/2 e que o mesmo valor ocorre

para menina.
O espaço amostral envolve 16 eventos (use um diagrama de árvore para acompanhar a listagem):

{(M M M M ), (M M M F ), (M M F M ), (M M F F ), (M F M M ), (M F M F ), (M F F M ), (M F F F ),
(F M M M ), (F M M F ), (F M F M ), (F M F F ), (F F M M ), (F F M F ), (F F F M ), (F F F F )}. Agora,

para descrever o evento A o casal de 4 lhos só tem uma lha, basta considerar

A = {(M M M F ), (M M F M ), (M F M M ), (F M M M )}. Enm, P (A) = 4/16 = 1/4 = 0, 25.


50 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Atividade-proposta 5.9
1. No lançamento de um dado, calcule a probabilidade da face de cima exibir (a) um número primo;

(b) um número não inferior a 5.

2. Na extração de uma carta de um baralho de 52 cartas, indique a probabilidade de sair (a) carta

de copas; (b) carta de copas ou de espadas.

3. Uma moeda é lançada 3 vezes. Indique a probabilidade de obter (a) pelo menos uma cara; (b)

nenhuma cara.

4. Um casal decidiu que vai ter 4 lhos. O que é mais provável: que tenha dois casais, ou três lhos

de um sexo e um do outro?

5. Considere o lançamento de 3 dados, anote cada número exibido na face de cima, e descreva as

possibilidades para que a soma dos pontos seja igual a (a) 9; (b) 10. 0 quadro abaixo resume algumas

das congurações válidas e respectivas possibilidades. Complete o que está faltando.

soma 9 total pos. soma 10 total pos.

(1,2,6) 6 (1,4,5) 6

(1,3,5) 6 (1,3,6) 6

(1,4,4) 3 (2,2,6) 3

6 (2,3,5) 6

(2,2,5) 3 (2,4,4) 3

(3,3,3)

total 25 total

Conclua que a soma 10 é mais frequente que a soma 9.

5.10 Espaços de Probabilidade


A conceituação de probabilidade introduzida por Laplace restringe sua aplicabilidade aos espaços
uniformes. Desse modo, somos conduzidos a ampliar as considerações de 5.6, inclusive para permitir

espaços amostrais mais gerais.

Dado um espaço amostral E , uma função P denida para todos os subconjuntos de E (chamados
eventos) é uma probabilidade se
(a) 0 ≤ P (A) ≤ 1, para todo evento A ⊂ E;
(b) P (φ) = 0, P (E) = 1;
(c) Se A e B são disjuntos (mutuamente exclusivos), então P (A ∪ B) = P (A) + P (B).
Observação 1 É fácil ver que, efetivamente, a reformulação acima generaliza o método de Laplace.
Com efeito, dado qualquer conjunto nito Z = {z1 , . . . , zn }, seja P (zi ) = pi , onde os pi ≥ 0 são
números tais que p1 + · · · + pn = 1. Para cada A ⊂ Z , pondo P (A) a soma dos pi com zi ∈ A, obtemos

uma probabilidade sobre Z , em geral distinta da probabilidade de Laplace. Se p1 = · · · = pn = 1/n,

obtemos a probabilidade (uniforme) de Laplace, como caso particular.

Propriedades
(1) P (A) = 1 − P (A)
De fato, temos 1 = P (E) = P (A ∪ A) = P (A) + P (A), donde o resultado.

(2) Se A ⊂ B, então P (A) = P (B) − P (B − A).


Usando B = A ∪ (B − A), vem P (B) = P (A) + P (B − A), logo valendo o enunciado.
5. Probabilidade 51

(3) Se A ⊂ B, então P (A) ≤ P (B)


Por (2), temos P (B) − P (A) = P (B − A) ≥ 0.
(4) P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P (A) = P (A − B) + P (A ∩ B) e P (B) = P (B − A) + P (A ∩ B), logo P (A) + P (B) =
De fato, temos

P (A−B)+P (B −A)+P (A∩B)+P (A∩B), donde a relação pois P (A−B)+P (B −A)+P (A∩B) =
P (A ∪ B).
(5) P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C).
Pratique um pouco. Verique a validade dessa relação, uma ampliação evidente de (4).
Observação 2 Se considerarmos uma coleção nita {A1 , . . . An } de subconjuntos de E, dois a

dois disjuntos (ou mutuamente exclusivos), então, por indução sobre n, podemos vericar que
n n
!
X X
P Ai = P (Ai ), sempre que Ai ∩ Aj = φ (i 6= j ), o que generaliza a relação 5.10(c).
i=1 i=1
Tal igualdade exprime a aditividade nita de P .

Exemplos 5.11

1. O diagrama mostra um espaço amostral E, com 34 pontos e os eventos A, B, C, D.

Calcular as probabilidades P (A), P (B), P (C), P (D), P (A ∩ B), P (A ∩ C), P (A ∩ D), P (B ∩ C),
P (B ∩ D), P (A ∩ B ∩ C), P (A ∪ B), P (A ∪ D), P (A ∪ B ∪ C), P (A), P (A ∪ B).
Temos P (A) = 10/34, P (B) = 10/34, P (C) = 7/34, P (D) = 8/34, P (A ∩ B) = 3/34, P (A ∩ C) =
2/34, P (A ∩ D) = 0, P (B ∩ C) = 2/34, P (B ∩ D) = 0, P (A ∩ B ∩ C) = 1/34, P (A ∪ B) = 17/34,
P (A ∪ D) = 18/34, P (A ∪ B ∪ C) = 21/34, P (A) = 24/34 = 1 − P (A), P (A ∪ B) = 31/34 =
1 − P (A ∩ B).
2. Uma moeda foi cunhada de tal forma que é 4 vezes mais provável dar cara (c) do que coroa (k).

Calcular as probabilidades de cara e coroa.

Se P (k) = p, então P (c) = 4p; também p + 4p = 1, donde p = 1/5, ou seja P (k) = 1/5 e P (c) = 4/5.
3. Um número entre 1 e 200 é escolhido aleatoriamente. Calcular a probalidade de que seja divisível

por 5 ou por 7.

Sejam A e B os eventos o número é divisível por 5 e o número é divisível por 7; o evento A∩B
signica o número é divisível por 35 (observe que 5 e 7 são primos relativos!).

Há [200/5] = 40 inteiros entre 1 e 200 divisíveis por 5, [200/7] = 28 divisíveis por 7 e [200/35] = 5
divisíveis por 35 (justique o uso da função [ ] maior inteiro!).

Logo, P (A) = 40/200 = 1/5, P (B) = 28/200 = 7/50 e P (A ∩ B) = 5/200.


Enm, P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 63/200.
52 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

4. Uma cidade possui três jornais A, B e C. Uma amostragem de 1000 pessoas revelou o seguinte

perl de assinaturas: A:470, B:420, C:315, A e B:110, A e C:220, B e C: 140, A,B e C: 75. Escolhendo

ao acaso uma pessoa da amostra, calcular a probabilidade de que essa pessoa: (a) não assine nenhum

dos 3 jornais; (b) assine apenas um; (c) assine pelo menos dois jornais.

O diagrama de Venn indica todos os valores que nos interessam. Temos: (a)190 pessoas não assinam

nenhum dos jornais, logo a probabilidade procurada vale 190/1000 = 0, 190. (b) Assinam apenas
1 jornal o total de 215 + 245 + 30 = 490 pessoas, donde a probabilidade 490/1000 = 0, 490. (c)

Assinam dois ou mais jornais o total de assinantes 1000 − 190 = 810 menos os que só lêem 1 jornal:

810 − 490 = 320, seja 320/1000 = 0, 320.


5. Sejam A e B eventos tais que P (A) = 1/2, P (B) = 1/4, P (A ∩ B) = 1/5. Calcular:

(a) P (A ∪ B); (b) P (A); (c) P (B);


(d) P (A ∩ B); (e) P (A ∩ B ; (f ) P (A ∩ B); (g) P (A ∪ B).
Temos, sucessivamente:

1 1 1 11
(a) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = + − = ;
2 4 5 20
1 1
(b) P (A) = 1 − P (A) = 1 − = ;
2 2
3
(c) P (B) = ; (verique!)
4
1 1 3
(d) P (A ∩ B) = P (A − B) = P (A) − P (A ∩ B) = − = ;
2 5 10
1
(e) P (A ∩ B = ; (verique!)
20
11 9
(f ) P (A ∩ B) = P (A ∪ B) = 1 − P (A ∪ B) = 1 − = ;
20 20
1 4
(g) P (A ∪ B) = P (A ∩ B) = 1 − P (A ∩ B) = 1 − = .
5 5
6. Dos 148 pacientes internados em um hospital, 18 estão com a gripe AS (8 são mulheres). Dos

internados, 60 são homens. Selecionando-se um dos internados, aleatoriamente, qual a probabilidade

dessa pessoa:

(a) ser mulher;

(b) ser um internado não gripado;

(c) ser uma mulher não gripada;

(d) ser um homem gripado.

A solução ca facilitada pelo seguinte quadro-resumo dos dados fornecidos.


5. Probabilidade 53

H M Total gripe

Gripe 10 8 18

Não gripe 50 80 130

Total sexo 60 88 148

(a) Há 88 mulheres dentre 148 pacientes, donde a probabilidade 88/148 = 0, 595;


(b) Há 130 pacientes não gripados, logo 130/148 = 0, 878 é a probabilidade procurada;

(c) Como há 80 mulheres não gripadas, vemos que 80/148 = 0, 541 é a probabilidade solicitada;

(d) Dos 10 homens gripados, segue a probabilidade 10/148 = 0, 068.

Atividade-proposta 5.12
1. Os metereologistas armam que há uma chance em 5 de chover no próximo domingo. Qual é a

chance de não chover?

2. A probabilidade de uma criança ter sarampo é 0, 25 e a de ter catapora é 0, 50. Se a probabilidade

de contrair ambas as doenças é 0, 125, ache a probabilidade da criança ter uma das duas doenças.

3. Um aluno (que não estudou...) deve responder a um teste de três questões do tipo certo/errado.

Represente as alternativas possíveis em um diagrama de árvore; em seguida, calcule a probabilidade

desse aluno:

(a) acertar as três questões; (b) errar as três questões; (c) acertar pelo menos duas questões.

4. Dois dados perfeitos (faces de 1 a 6) são lançados simultaneamente. Calcular a probabilidade de

que sejam sorteados dois números consecutivos, cuja soma seja um número primo.

5. Um grupo de 850 pessoas foi submetido a um teste para vericar o efeito de um antidepressivo em

relação ao enjôo que ele pode provocar nas pessoas. A tabela abaixo resume o resultado da pesquisa.

Antidepres. Placebo Total

Com enjôo 120 280 400

Sem enjôo 300 150 450

Total 420 430 850

Selecionando-se, aleatoriamente, uma pessoa do grupo, achar a probabilidade da mesma:

(a) Ter tomado o antidepressivo; (b) Ter sofrido de enjôo;

(c) Não ter enjôo ou ter ingerido placebo;

(d) Ter tomado o antidepressivo e ter cado com enjôo;

(e) Ter tomado o placebo e ter cado com enjôo.

6. Considere a experiência aleatória que consiste em lançar 2 tetraedros regulares, com as faces

numeradas de 1 a 4, e em anotar a soma dos números das faces voltadas para baixo. O quadro

abaixo indica o espaço amostral e o modelo de probabilidade associado.

Resultado 2 3 4 5 6 7 8

(1,1) (1,2) (1,3) (1,4) (2,4) (3,4) (4,4)

(2,1) (2,2) (2,3) (3,3) (4.3)

(3,1) (3,2) (4,2)

(4,2)

Probabilidade 1/16 2/16 3/16 ? ? ? ?


54 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Considere os seguintes eventos, que envolvem a soma das faces-resultados:

A: a soma é superior a 5; B: a soma é inferior ou igual a 7; C: a soma é par.

Calcule as probabilidades P (A), P (B), P (C), P (A ∩ B); P (A ∪ B).


7. Considere todos os números de 4 algarismos distintos que podem ser formados com os dígitos

1,2,3,4,5 e 6. Escolhido ao acaso um desses números, achar a probabilidade dele conter o algarismo 3

e não conter o algarismo 5.

8. A tabela indica as apostas feitas por cinco amigos em relação ao resultado decorrente do lançamento

de um dado, cuja planicação também está indicada.

Ana face branca ou número par

Bruna face branca ou número 5

Carlos face preta ou número menor que 2

Ronaldo face preta ou número maior que 2

Maria face branca ou número menor que 4

Para tornar o jogo mais ágil (?!), alguém sugeriu trocar o conectivo ou pelo conectivo e, em cada

aposta. Verique que essa alteração provoca maior redução nas chances de acertar o resultado para

certo jogador. Identique de quem se trata, justicando sua resposta.

5.13 Probabilidade Condicional


Exemplo motivador
Um treinamento de línguas estrangeiras envolve 250 estagiários (100 homens e 150 mulheres)

divididos em dois módulos, o de Francês (110 alunos) e o de Inglês (140 alunos), assim distribuídos:

F I Total

H 40 60 100

M 70 80 150

Total 110 140 250

Um estagiário é sorteado ao acaso.

(a) Qual a probabilidade de ser do módulo I (Inglês)? É claro que P (I) = 140/250 = 0, 56
(probabilidade a priori );
(b) Qual a probabilidade de ser do módulo I, dado que é mulher? Essa probabilidade a posteriori,
na realidade, usa a ocorrência do evento I em relação ao espaço amostral reduzido M, ao invés de

manter o espaço amostral original E.


Usaremos a notação P (I|M ) para representar essa probabilidade de I condicionada a M , ou a
probabilidade de I dado M . Como #M = 150, e ocorrem 80 casos de I em M , isto é, #I ∩ M = 80,
#I ∩ M 80
vem P (I|M ) = = = 0, 32. Essa última razão pode ser reescrita assim:
#M 150
(80/250) P (I ∩ M )
P (I|M ) = =
(150/250) P (M )
voltando a referência ao espaço amostral original.
5. Probabilidade 55

Denição
Sejam os eventos A
B num espaço amostral E , com P (A) > 0. A probabilidade condicional
e de B
dado A é o número P (B|A) denido por

P (A ∩ B) (∗) .
P (B|A) = , condição também escrita P (A ∩ B) = P (A) P (B|A)
P (A)
Se P (B) > 0, de modo análogo, temos também P (A ∩ B) = P (B) P (A|B) (∗∗) .
Cada relação assinalada acima é conhecida como Teorema da Multiplicação.
Observação 3 Nos casos de três ou mais eventos, o Teorema da Multiplicação possui a seguinte

generalização.

Se P (A1 ∩ A2 ∩ · · · ∩ An ) 6= 0, então

P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 )P (A2 |A1 )P (A3 |(A1 ∩ A2 )) · · · P (An |(A1 ∩ A2 ∩ · · · ∩ An−1 ).


A notação, embora adequada, pode parecer algo intimidativa. Veja como a arrumação algébrica, para

3 eventos, tem um ritmo bem mais amigável:

P (A1 ∩ A2 ∩ A3 ) = P (A3 |(A1 ∩ A2 ))P (A1 ∩ A2 ) = P (A3 |(A1 ∩ A2 ))P (A2 |A1 )P (A1 ).
Observação 4 Pode acontecer, supondo P (A) > 0 ou P (B) > 0, que as probabilidades condicionais
coincidam com as probabilidades calculadas no espaço original, isto é, P (B|A) = P (B) ou P (A|B) =
P (A); nesses casos , vale a relação P (A ∩ B) = P (A) P (B) . Diremos, então, que A e B são eventos

independentes.
Para 3 eventos, a condição de independência supõe que: (a) P (A ∩ B) = P (A)P (B);
(b) P (B ∩ C) = P (B)P (C); (c) P (A ∩ C) = P (A)P (C); (d) P (A ∩ B ∩ C) = P (A)P (B)P (C).

Exemplos 5.14
1. No lançamento de uma moeda 2 vezes, o espaço amostral é E = {cc, ck, kc, kk}. Sejam os eventos
A(o segundo lançamento dá cara)={cc, kc}, B(ambos os lançamentos dão cara)={cc} e C(o primeiro

lançamento dá cara)={cc, ck}.

Temos as probabilidades P (A) = 2/4 = 1/2, P (B) = 1/4, P (C) = 2/4 = 1/2. Calculemos as

probabilidades condicionais:

P (A ∩ C) 1/4
P (A|C) = = = 1/2 =⇒ A e C independentes, pois P (A|C) = P (A);
P (C) 1/2
P (B ∩ C) 1/4
P (B|C) = = = 1/2 =⇒ B e C dependentes, pois P (B|C) 6= P (B).
P (C) 1/2
Alternativamente, vale P (A ∩ C) = P (A)P (C) = (1/2)(1/2) = (1/4), mas P (B ∩ C) 6= P (B)P (C).

2. Consideremos os eventos A e B tais que P (A) = 3/8, P (B) = 5/8 e P (A ∪ B) = 3/4. Calcular as

probabilidades condicionais P (A|B) e P (B|A).


Inicialmente, calculemos P (A∩B) pela probabilidade da soma: P (A∪B) = P (A)+P (B)−P (A∩B);
substituindo os valores dados, segue P (A ∩ B) = 1/4. Logo, obtemos

P (A ∩ B) P (A ∩ B)
P (A|B) = = 2/5 e P (B|A) = = 2/3
P (B) P (A)
3. Sejam A e B eventos tais que P (A) = 0, 2, P (A ∪ B) = 0, 6 e P (B) = x. Calcular x sabendo que

A e B são: (a) mutuamente exclusivos; (b) independentes.


(a) Se A e B são mutuamente exclusivos, então P (A ∩ B) = 0, donde P (A ∪ B) = P (A) + P (B) ou
0, 6 = 0, 2 + x, logo x = 0, 4. (b) Agora, A e B são independentes: P (A ∩ B) = P (A)P (B) = 0, 2x.
Também, P (A ∪ B) = P (A) + P (B) − P (A ∪ B), donde vem 0, 6 = 0, 2 + x − 0, 2x, ou x = 0, 5.
56 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

4. A pontuação de dois jogadores, após 120 partidas de xadrez, mostrou que A ganhou 60 partidas,

B ganhou 40 e 20 terminaram empatadas. Num campeonato posterior, A e B jogarão 3 partidas.

Determinar a probabilidade de:

(a) A ganhar todas as três; (b) duas partidas terminarem empatadas;

(c) A e B ganharem alternadamente.

Pondo P (A) = 60/120 = 1/2, P (B) = 40/120 = 1/3, P (EP ) = 20/120 = 1/6 (ocorrência de em-

pate), temos:

(a) P (A ∩ A ∩ A) = (1/2)(1/2)(1/2) = 1/8;


(b) P (Dois EP ) = 3P (EP ∩ EP ∩ EP ) = 3(1/6)(1/6)(5/6) = 5/72
Observe o fator 3 acima, indicando que há 3 congurações possíveis:

(EP, EP, EP ), (EP, EP , EP ), (EP , EP, EP ).


(c) P (A e B alternad.) = P (A ∩ B ∩ A) + P (B ∩ A ∩ B) = (1/2)(1/3)(1/2) + (1/3)(1/2)(1/3) = 5/36
5. Sacam-se, sucessivamente e sem reposição, duas cartas de uma baralho de 52 cartas. Achar a
a
probabilidade da 1 carta ser uma dama e a 2a ser de copas.
Na realidade, há dois casos: (i) se a primeira carta é a dama de copas, então a probabilidade vale

p1 = (1/52)(12/51);
(ii) se a primeira carta é uma dama que não é de copas, então a probabilidade é igual a p2 =
1 12 3 13 1
(3/52)(13/51). Desse modo, o resultado nal é p1 + p2 = + = .
52 51 52 51 52
6. Num curso de nivelamento, 25% dos candidatos não foram aprovados em Matemática, 15% perde-

ram o módulo de Física e 10% perderam os dois módulos. Calcular a probabilidade:

(a) de que um aluno seja reprovado em Matemática, dado que foi reprovado em Física;

(b) de que um aluno seja reprovado em Física, dado que foi reprovado em Matemática;

(c) de que um aluno seja reprovado em Matemática ou em Física.

As percentagens de reprovação em (M), (F) e em ambos os módulos (MF) são, respectivamete,

P (M ) = 0, 25, P (F ) = 0, 15 e P (M F ) = 0, 10. Assim:


P (M ∩ F ) 0, 10
(a) P (M |F ) = = = 2/3;
P (F ) 0, 15
P (F ∩ M ) 0, 10
(b) P (F |M ) = = = 2/5;
P (M ) 0, 25
(c) P (M ∪ F ) = P (M ) + P (F ) − P (M ∩ F ) = 0, 25 + 0, 15 − 0, 10 = 0, 30 = 3/10.

7. Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se simultaneamente 3 bolas.

Achar a probabilidade de que:

(a) nenhuma seja vermelha; (b) exatamente uma seja vermelha; (c) todas sejam da mesma cor.

Simplicando um pouco a notação teremos:


8 7 6 14
(a) P (V ∩ V ∩ V ) = = ;
12 11 10 55
4 8 7 28
(b) 3P (V ∩ V ∩ V ) = 3 = ; (Atenção: 3 possibilidades)
12 11 10 55
5 4 3 4 3 2 3 2 1 3
(c) P (B ∩ B ∩ B) + P (V ∩ V ∩ V ) + P (A ∩ A ∩ A) = + + = .
12 11 10 12 11 10 12 11 10 44
Pratique um pouco!
A identicação da independência facilita a aplicabilidade do teorema da muliplicação. Assim, se

A e B são independentes, verique que os pares de eventos A e B, A e B, e A e B são também

independentes.
5. Probabilidade 57

Atividade-proposta 5.15
1. Sejam P (A) = 0, 50, P (B) = 0, 40 e P (A ∪ B) = 0, 70.
(a) A e B são eventos mutuamente exclusivos? Por que?

(b) Encontre P (A ∩ B);


(c) A e B são eventos independentes? Por que?

(d) Calcule as probabilidades condicionais P (A|B) e P (B|A).


2. Considere o lançamento de uma moeda 2 vezes, cujo espaço amostral é E = {cc, ck, kc, kk}. Sejam
os eventos A(o primeiro lançamento dá cara)={cc, ck}, B(o segundo lançamento dá cara)={cc, kc} e

C(cara aparece em um só dos dois lançamentos)={ck, kc}.

(a)Verique as probabilidades P (A) = P (B) = P (C) = 2/4 = 1/2, P (A ∩ B) = P (A ∩ C) =


P (B ∩ C) = 1/4. Conclua que A,B e C são dois a dois independentes.
(b) Entretanto, o resultado P (A ∩ B ∩ C) 6= P (A)P (B)P (C) indica que os três eventos A, B e C não

são independentes. Explique.

3. Uma caixa contém 4 válvulas defeituosas e 6 perfeitas. Duas válvulas são extraidas, juntas. Uma

delas é ensaiada e se verica ser perfeita. Qual a probabilidade da outra bola ser perfeita?

4. Um míssil atinge um alvo com a probabilidade de 0, 3. Ache quantos mísseis deverão ser disparados

para atingir o alvo com probabilidade maior que 80%.

5. A probabilidade de um aluno A resolver uma questão de prova é 0,80, enquanto que a do aluno B

é 0,60. Calcular a probabilidade de que a questão seja resolvida se os dois alunos tentarem resolvê-la

independentemente.

6. São retiradas duas bolas de uma urna contendo 3 bolas pretas e 5 bolas vermelhas. Determine todos

os resultados possíveis e suas respectivas probabilidades, supondo, para a primeira bola extraída:

(a) extração sem reposição; (b) extração com reposição .

7. A preferência de consumo de uma amostra de 1000 indivíduos é indicada abaixo:

Homem Mulher Total por produto

Produto A 200 270 470

Produto B 200 100 400

Produto C 60 70 130

Total por sexo 560 440 1000

Calcular a probabilidade de selecionar uma consumidora do produto B e a probabilidade de uma

mulher selecionada aleatoriamente ser consumidora do produto B.

8. Estudantes de três universidades diferentes X, Y e Z, fazem um exame onde os resultados são

medidos pelos conceitos A, B e C. A tabela abaixo mostra as distribuições de frequências relativas

das combinações de universidades e conceitos.

Universidades A B C

X 0,20 0,10 0,00

Y 0,25 0,10 0,05

Z 0,15 0,10 0,05

A tabela mostra, por exemplo, que 20% do total dos alunos que zeram o exame eram da universidade

X e tiveram conceito A; 5% eram da universidade Y e tiveram conceito C, e assim por diante. Sabendo-

se que um estudante arbitrariamente selecionado teve conceito A, calcular a probabilidade de que ele

tenha estudado na universidade X.


58 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

5.16 Probabilidade Total e Bayes


1. A decomposição do espaço amostral com o auxílio de partições (subconjuntos não vazios, dois

a dois disjuntos e cuja união é o espaço dado) é uma ferramenta poderosa para tratar com a

probabilidade condicional. Examine o seguinte exemplo.

Exemplo motivador Sabe-se que 80% dos pênaltis marcados a favor do Brasil são cobrados por

jogadores do Flamengo. A probabilidade de um pênalti ser convertido é de 40% se o cobrador for do

Flamengo e de 70%, em caso contrário. Um pênalti a favor do Brasil acaba de ser marcado.

(a) Qual a probabilidade do pênalti ser cobrado por um jogador do Flamengo e ser convertido?

(b) Qual a probabilidade do pênalti ser convertido?

Sejam os eventos F (cobrador é do Flamengo) e C (o pênalti é convertido).

Em (a) é solicitada a probabilidade P (F ∩ C). Temos

P (F ∩ C) = P (F )P (C/F ) = 0, 8 × 0, 4 = 0, 32
Para resolver (b), observemos que apenas foram dadas as probabilidades condicionais do pênalti

ser convertido, dado que o batedor seja do Flamengo ou não. Somos levados, então, a decompor o

evento C na união de dois eventos disjuntos: o cobrador é do Flamengo e o pênalti é convertido e

o cobrador não é do Flamengo e o pênalti é convertido, isto é:

C = (F ∩ C) ∪ (F ∩ C) ,

logo

P (C) = P (F ∩ C) + P (F ∩ C) .

Cada probabilidade do segundo membro decorre, então, do teorema do produto

P (F ∩ C) = P (F )P (C|F ) = 0, 8 × 0, 4 = 0, 32;
P (F ∩ C) = P (F )P (C|F ) = 0, 2 × 0, 7 = 0, 14, logo

P (C) = 0, 32 + 0, 14 = 0, 46.

0,4 C F ∩C

F
HH
0,8 F ∩C
0,6H C
H

@ C F ∩C
@ 0,7
0,2 @ 
@
H
F HH
0,3H
C F ∩C

O diagrama de árvore ilustra o cálculo do produto, uma vez que representa as probabilidades

condicionais do evento associado ao nal de cada ramo.

Caso geral Suponhamos a reunião disjuntaE = A1 ∪A2 ∪· · ·∪An , onde {A1 , A2 , . . . An } é uma par-
tição do espaço amostral E . Para cada evento B ⊂ E , vale B = (B∩A1 )∪(B∩A2 )∪· · ·∪(B∩An ), reu-

nião de eventos mutuamente exclusivos. Então, temos P (B) = P (B∩A1 )+P (B∩A2 )+· · ·+P (B∩An );

enm, com o teorema da multiplicação nas parcelas do segundo membro, obtemos:

P (B) = P (A1 )P (B|A1 ) + P (A2 )P (B|A2 ) + · · · + P (An )P (B|An )


Essa igualdade traduz o Teorema da Probabilidade Total.
Uma outra aplicação notável de Bayes permite determinar a ocorrência de um dos Ai , dado que B
ocorreu, isto é, P (Ai |B).
5. Probabilidade 59

P (Ai ∩ B) P (Ai )P (B|Ai )


De fato, essa probabilidade condicional se escreve P (Ai |B) = = , isto é,
P (B) P (B)
tendo em conta o cálculo de P (B) da probabilidade total:

P (Ai )P (B|Ai ) P (Ai )P (B|Ai )


P (Ai |B) = = .
P (B) P (A1 )P (B|A1 ) + P (A2 )P (B|A2 ) + · · · + P (An )P (B|An )
Tal expressão resume o chamado Teorema de Bayes.

Exemplo 5.17
1. Uma determinada peça é manufaturada por 3 fábricas A, B e C, das quais A produz o dobro de

peças que B e as fábricas B e C produzem o mesmo número de peças. Sabe-se que 2% das peças

produzidas por A e B são defeituosas, enquanto 4% das produzidas por C são defeituosas. Todas as

peças produzidas são misturadas e colocadas em um depósito. Uma peça é selecionada aleatoriamente.

(a) Achar a probabilidade de que a peça seja defeituosa;

(b) Supondo que é defeituosa a peça selecionada, calcule a probabilidade de que tenha sido

produzida pela fábrica A.


Inicialmente, representando por A, B e C os eventos que indicam a origem da peça de cada fábrica,
temos P (A) = 50%, P (B) = P (C) = 25%, pela informação do total de peças produzidas. Também,

se D é o evento que indica que a peça é defeituosa, então P (D|A) = P (D|B) = 2% e P (D|C) = 4%.

Use um diagrama de árvore para acompanhar o cálculo de P (D). Observe que {A, B, C} é
uma partição do espaço amostral.

(a) Pelo teorema da probabilidade total, temos

P (D) = P (A)P (D|A)+P (B)P (D|B)+P (C)P (D|C) = 0, 5×0, 02+0, 25×0, 02+0, 25×0, 04 = 2, 50%
(b) Calculemos P (A|D) usando o Teorema de Bayes.

P (A)P (D|A) 0, 5 × 0, 02
P (A|D) = = = 0, 40 = 40%
P (D) 0, 025
2. Um exame de laboratório tem eciência de 95% para detectar uma doença quando essa doeça

existe de fato. Entretanto, o teste aponta um resultado falso positivo para 1% das pessoas sadias

testadas. Sabe-se, ainda, que 0, 5% da população tem a doença.

Aplica-se o teste a uma pessoa selecionada ao acaso.

(a) Achar a probabilidade de resultado positivo;

(b) Dado que o resultado do teste foi positivo, encontrar a probabilidade de que a pessoa tenha a

doença.

Use um diagrama de árvore para acompanhar os resultados!!


Consideremos os eventos: D (pessoa doente), T (teste positivo).
Dados: P (D) = 0, 005, P (D) = 0, 995, P (T |D) = 0, 95, P (T |D) = 0, 01, P (T |D) = 0, 05, P (T |D) =
0, 99.
(a) Pela probalidade total

P (T ) = P (D)P (T |D) + P (D)P (T |D) = 0, 005 × 0, 95 + 0, 995 × 0, 01 = 0, 0147


(b) Usando Bayes
P (D ∩ T ) 0, 005 × 0, 95 0, 00475 95
P (D|T ) = = = = = 0.3231
P (T ) 0, 0147 0, 0147 294
Pratique um pouco! Ache a probabilidade de que o teste forneça informação incorreta.

Sugestão. Examinando o evento F = (D ∩ T ) ∪ (D ∩ T ), encontraremos P (F ) = 0, 057450.


60 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Atividade-proposta 5.18
1. Um estudante resolve um teste com questões do tipo verdadeiro-falso. Ele sabe dar a solução correta

para 40% das questões. Quando responde a uma questão cuja solução conhece, ele dá a resposta

correta, e nos outros casos decide na cara ou coroa. Se uma questão foi respondida corretamente,

qual é a probabilidade de que ele sabia a resposta?

2. Duas máquinas A e B produzem 3000 peças em um dia. A máquina A produz 1000 peças, das

quais 3% são defeituosas. A máquina B produz as restantes 2000, das quais 1% são defeituosas. Da

produção total de um dia, uma peça é escolhida ao acaso, constatando-se que é defeituosa. Calcular

a probabilidade para que a peça tenha sido produzida pela máquina A.

5.19 Espaços innitos enumeráveis


Em várias aplicações, somos conduzidos a usar espaços amostrais enumeráveis, da forma

E = {a1 , a2 , . . . , an , . . .}, n ≥ 1 inteiro.


X
Se p(ai ) denota a probabilidade associada ao ponto amostral {ai }, suporemos, então que p(ai ) = 1
i≥1
(série numérica convergente, de soma 1).

Exemplo 5.20

Lançando um dado até que a face 4 apareça pela primeira vez, se k indica qualquer outra face, então

o espaço amostral é da forma E = {4, k4, kk4, kkk4, . . .}; as probabilidades associadas usam o caso
uniforme, em cada
2
lançamento, isto é: p1 = 1/6, p2 = (5/6)(1/6), p3 = (5/6) (1/6), ..., cuja soma

vale !
 2  2
1 51 5 1 1 5 5 1 1
+ + + ··· = 1+ + + ··· = = 1,
6 66 6 6 6 6 6 6 1 − (5/6)
onde usamos a soma da série geométrica convergente, de razão 0 < (5/6) < 1.
 n−1
5 1
Pondo p(n) = , n = 1, 2, 3, . . ., a probabilidade de ocorrência de n lançamentos, podemos,
6 6
por exemplo, calcular a probabilidade do seguinte evento A: os lançamentos terminam após um

número par de repetições. Temos:


∞  
X 5 125 5 25 5
P (A) = p(2n) = + + ··· = 1+ + ··· =
36 1296 36 36 11
n=1

Voltando um pouco, releia a Observação 2 de 5.10 sobre a propriedade de aditividade nita. No caso

atual, em que E é innito enumerável, seria desejável uma aditividade para uma coleção enumerável

(An )n≥1 de eventos de E, dois a dois disjuntos. Essa propriedade, denominada


  σ -aditividade, foi

X X
incorporada por Kolgomorov, explicitando a condição: P Ai  = P (Ai ).
i≥1 i≥1
5. Probabilidade 61

RESPOSTAS DAS ATIVIDADES PROPOSTAS

5.9
1. (a) P (2, 3, 5) = 3/6 = 1/2;
(b) P (5, 6) = 2/6 = 1/3.
2. (a)P (copas) = 13/52;
(b) P (copas ou espadas) = 13/52 + 13/52 = 1/2.
3. (a) P (pelo menos uma cara) = 1 − P (nenhuma cara) = 1 − P (kkk) = 1 − (1/8) = 7/8
(b) P (nenhuma cara) = P (kkk) = 1/8.
4. São 24 = 16 possíveis sequências para os sexos das crianças. Em 6 dessas congurações, há 2

casais: HMHM, MHMH,HMMH,MMHH, MHHM, HMMH, e em 8, há 3 lhos de um sexo e um de

outro: verique. Logo, é mais provável ter 3 lhos de um sexo e um de outro.

5. O quadro completo

soma 9 total pos. soma 10 total pos.

(1,2,6) 6 (1,4,5) 6

(1,3,5) 6 (1,3,6) 6

(1,4,4) 3 (2,2,6) 3

(2,3,4) 6 (2,3,5) 6

(2,2,5) 3 (2,4,4) 3

(3,3,3) 1 (3,3,4) 3

total 25 total 27

indica que a soma 10 é mais frequente que a soma 9.

5.12
1. 0,80

2. Dos dados P (s) = 0, 25; P (c) = 0, 50; P (s ∩ c) = 0, 125, segue

P (s ∪ c) = 0, 25 + 0, 50 − 0, 125 = 0, 625=.
3. (a) 0,125; (b) 0,125; (c) 0,5.

4. A soma dos dois resultados (faces) possui valores 2, 3, . . . , 12, dos quais são primos 2, 3, 5, 7, 11;
logo, as possíveis somas de duas parcelas consecutivas são (2,1) ou (1,2); (2,3) ou (3,2); (3,4) ou (4,3);
(5,6) ou (6,5). Assim, há 8 casos favoráveis dentre 36 possíveis: p = 8/36 = 2/9.
5. (a) 420/850 = 0, 494;
(b) 400/850 = 0, 471;
(c) 450/850 + 430/850 − 150/850 = 0, 859;
(d) 120/850 = 0, 141;
(e) 280/850 = 0, 329;
6. Inicialmente, completamos o quadro com os dados do problema.
62 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Resultado 2 3 4 5 6 7 8

(1,1) (1,2) (1,3) (1,4) (2,4) (3,4) (4,4)

(2,1) (2,2) (2,3) (3,3) (4.3)

(3,1) (3,2) (4,2)

(4,2)

Probabilidade 1/16 2/16 3/16 4/16 3/16 2/16 1/16

Temos: A = {6, 7, 8}, B = {2, 3, 4, 5, 6, 7}, C = {2, 4, 6, 8}, A ∪ B = {6, 7}, A ∩ B = E . Seguem,

então, as probabilidades:

P (A) = 3/16 + 2/16 + 1/16 = 6/16


P (B) = 1 − P B) = 1 − (1/16) = 15/16
P (C) = 8/16; P (A ∩ B) = 5/16; P (A ∪ B) = 1 (justique!)

7. 96/360 = 4/15
8. Com a mudança adotada, Ronaldo cou mais prejudicado que os demais jogadores. (Explique.)

5.15
1. (a) A e B não são mutuamente exclusivos, pois P (A ∪ B) = 0, 70 6= P (A) + P (B) = 0, 90;
(b) P (A ∩ B) = P (A) + P (B) − P (A ∪ B) = 0, 50 + 0, 40 − 0, 70 = 0, 20;
(c) P (A ∩ B) = P (A)P (B) = 0, 20, logo A e B são independentes;

(d) Segue de (c) que P (A|B) = P (A) e P (B|A) = P (B).


2. Temos P (A) = P (B) = P (C) = 2/4 = 1/2, P (A ∩ B) = P (cc) = 1/4, P (A ∩ C) = P (ck) = 1/4,
P (B ∩ C) = P (kc) = 1/4, logo, os eventos A, B e C são, dois a dois, independentes. Entretanto, de
A ∩ B ∩ C = φ vem P (A ∩ B ∩ C) = 0, que é diferente do produto P (A)P (B)P (C).
3. 5/9
4. Como o alvo não é atingido com a probabilidade 0,70, devemos achar 1 − (0, 7)n > 0, 8,
n tal que

ou (0, 7)
n < 0, 2. Calculando as potências para n = 1, 2, 3, 4, 5, encontramos (0, 7)2 = 0, 49,

0, 7)3 = 0, 341, (0, 7)4 = 0, 2401 e, nalmente, (0, 7)5 = 0, 1687.


5. P (A ∪ B) = 0, 92
6. Basta considerar dois casos, sem reposição e com reposição, respectivamente.

PP 6/56 9/64

PV 15/56 15/64

VP 15/56 15/64

VV 20/56 25/64

7. P (B ∩ M ) = 100/1000 = 0, 10; P (B|M ) = 100/440 = 0, 2273


8. P (X|A) = 0, 20/0, 60 = 1/3
5.18
1. A solução (de Bayes) decorre de um diagrama de árvore conveniente:

P (sabe ∩ acerta) 0, 4 · 1
P (sabe|acerta) = = = 4/7.
P (acerta) 0, 4 · 1 + 0, 6 · 0, 5
5. Probabilidade 63

2. Mesmo método de Bayes, veja o diagrama a seguir:

P ∩D (1/3) · 0, 03
P (A|D) = = = 3/5
P (D) (1/3) · 0, 03 + (2/3) · 0, 01

0,03 Def


A
H
1/3
HH
H Perf
0,97

Def
@
@ 0,01

2/3 @ 
@
H
B HHH
0,09 Perf
64 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

CAPÍTULO 6
FUNÇÕES DE DISTRIBUIÇÃO DE
PROBABILIDADE

Objetivos do Capítulo 6

(a) Descrever as características das variáveis aleatórias;

(b) Estabelecer as propriedades das distribuições discretas e de seus grácos;

(c) Explicitar os parâmetros da Distribuição Binomial;

(d) Descrever as distribuições contínuas;

(e) Estabecer a aplicabilidade da Distribuição Normal de Gauss;

(f ) Descrever aproximações de distribuições discretas pela distibuição normal.

6.1 VARIÁVEIS ALEATÓRIAS

Na descrição de um evento A⊂E de um espaço amostral E , seus elementos  pontos amostrais  não
são, necessariamente, variáveis numéricas. Entretanto, na maior parte das vezes, estamos interessados

em associar, a cada pontoa ∈ E , um número real X(a). Ora, essa associação corresponde a uma
função X : E −→ R, cuja imagem X(E) ⊂ R, como vimos adotando, é um conjunto nito ou innito

enumerável. Diremos que X : E −→ R é uma variável aleatória discreta.

Na realidade, exigiremos um pouco mais! Dado A ⊂ E , então podemos calcular a probabilidade

P (A) = P (X = xi ), onde X(ai ) = xi , se ai ∈ A, e X(ai ) 6= xi , se ai ∈


/ A.
A resumindo as considerações anteriores, a Função Densidade de Probabilidade associa a cada

valor xi assumido pela variável aleatóriaX , a probabilidade do evento Ai correspondente, isto é,


X
pi = p(xi ) = P (X = xi ) = P (Ai ), 1 ≤ i ≤ n, onde p(x) = 1.
x∈E
Diremos, ainda, que a função {(xi , p(xi )) ; i = 1, . . . , n} é a Distribuição de Probabilidade da

variável aleatória X.
6. Funções de distribuição de probabilidade 65

EXEMPLO 6.2

Consideremos o lançamento de 3 moedas; o espaço amostral E contém 8 pontos amostrais:


E = {(k, k, k), (c, k, k), (k, c, k), (k, k, c), (c, c, k), (c, k, c), (k, c, c), (c, c, c)}
Seja X o número de ocorrência de cara nesse lançamento; X assume os valores {0, 1, 2, 3}. Por
exemplo, o valor x = 0 corresponde ao evento A1 = {(k, k, k)}, com probabilidade P (A1 ) = 1/8, isto
é, com as notações anteriores, P (X = 0) = P (A1 ) = 1/8.

O quadro abaixo resume todos os resultados e determina a distribuição de probabilidades de X .

X Evento correspondente P (X)


0 A1 = {(k, k, k)} 1/8
1 A2 = {(c, k, k), (k, c, k), (k, k, c)} 3/8
2 A3 = {(c, c, k), (c, k, c), (k, c, c)} 3/8
3 A4 = {(c, c, c)} 1/8
Observemos que
P (X = 0) = P (A1 ) = 1/8; P (X = 1) = P (A2 ) = 3/8; P (X = 2) = P (A3 ) = 3/8; P (X = 3) = P (A4 ) = 1/8.

P (X)

3/8

1/8

X
0 1 2 3

6.3 Função de Distribuição Acumulada

Complementando as informações sobre variáveis aleatórias, vamos construir a função de distri-


buição acumulada associada a uma variável aleatória
X X : E −→ R. É a função F : R −→ [0, 1] tal
que, em cada x ∈ R, F (x) = P (X ≤ x) = p(xi ).
xi ≤x

Continuação do exemplo 6.2

Com os dados do exemplo acima, temos:


F (0) = P (X ≤ 0) = P (X = 0) = 1/8;
F (1) = P (X ≤ 1) = P (X = 0) + P (X = 1) = (1/8) + (3/8) = 4/8 = 1/2
F (2) = P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = F (1) + P (X = 2) = (4/8) + (3/8) = 7/8
F (3) = P (X ≤ 3) = F (2) + P (X = 3) = (7/8) + (1/8) = 1

F (X)

1 r
7/8 r

1/2 r

1/8 r
X
0 1 2 3
66 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Propriedades da função de distribuição acumulada

Acompanhe no gráco anterior as seguintes relações.

(a) Para cada x ∈ R, vale 0 ≤ F (x) ≤ 1.


De fato, temos F (x) = P (X ≤ x) e 0 ≤ P (X = x) ≤ 1.
(b) lim F (x) = 0; lim F (x) = 1;
x→−∞ x→∞
Se X = X(E) = {x1 , . . . , xn } é nito e crescentemente ordenado, então F (x) = 0 se x < x1 e

F (x) = 1 se x ≥ xn .
(c) F possui descontinuidade nita em cada ponto x0 onde P (X = x0 ) > 0, sendo contínua à direita

de x0 . Na realidade, o salto da função em x0 é a probabilidade P (X = x0 ).


(d) Probabilidade em intervalos.

P (a < X ≤ b) = F (b) − F (a);


P (a ≤ X ≤ b) = F (b) − F (a) + P (X = a);
P (a < X < b) = F (b) − F (a) − P (X = b).
Veriquemos, por exemplo, a primeira relação; observando que, na união (−∞, b] = (−∞, a] ∪ (a, b],
as ocorrências são mutuamente exclusivas, vem

P (X ≤ b) = P (X ≤ a) + P (a < X ≤ b)
P (a < X ≤ b) = P (X ≤ b) − P (X ≤ a)
P (a < X ≤ b) = F (b) − F (a).
(e) F é uma função crescente.

Pois vale 0 ≤ P (a < X ≤ b) = F (b) − F (a), isto é, F (b) ≥ F (a).

Exemplo 6.4

1. Condideremos uma urna contendo 3 bolas vermelhas e 5 pretas. Retirando três bolas sem reposi-

ção, denimos a variável aleatória X como o número de bolas pretas retiradas. Determinar a função

de distribuição de X.
O quadro abaixo resume os resultados.

X Evento correspondente P (X)


321 1
0 A1 = {(v, v, v)} 8 7 6 = 56
1 A2 = {(p, v, v), (v, p, v), (v, v, p)} 3 58 37 62 = 15
56
2 A3 = {(p, p, v), (p, v, p), (v, p, p)} 3 58 47 63 = 30
56
543 10
3 A4 = {(p, p, p)} 8 7 6 = 56
2. Dada a função de distribuição acumulada da variável X, obter a função de distribuição correspon-

dente. 


 0, se x<1

 1/3, se 1≤x<2
F (x) =


 1/2, se 2≤x<3

 1, se x≥3
Basta lembrar que cada salto nito da função em X =a é probabilidade P (X = a). Daí resulta a

função de distribuição procurada:

X 1 2 3

P(X) 1/3 1/6 1/2


6. Funções de distribuição de probabilidade 67

3. Seja X uma variável aleatória cuja função de probabilidade é dada por


1
P (X = i) = , i = 1, 2, 3, ....
2i
(a) Verique que, de fato, existe uma tal função de probabilidade;

(b) Calcule as probabilidades: P (X ≥ 3) e P (X é múltiplo de 3).

(a) Basta vericar a compatibilidade com a soma:



X 1 1 1 1/2
P (X = i) = + + + ··· = =1
2 4 8 1 − (1/2)
i=1
(b) Temos P (X ≥ 3) = P (X = 3) + P (X = 4) + P (X = 5) + · · ·
1 1 1 1/8
P (X ≥ 3) = + + + ··· = = 1/4
8 16 32 1 − (1/2)
Por outro lado: P (X é múltiplo de 3) = P (X = 3) + P (X = 6) + · · ·
1 1 1/8
P (X é múltiplo de 3) = + + ··· = = 1/7.
8 64 1 − (1/8)

Atividade-proposta 6.5

1. A tabela abaixo estabelece, de modo incompleto, uma distribuição de probabilidade:

X 0 1 2 3 4 5

P(X) 0 p2 p2 p p p2
(a) Ache p;
(b) Calcule P (X ≥ 4) e P (X < 3).
2. Seja a variável aleatória X, cuja distribuição de probabilidade é dada por:

X p(X)
−5 0, 19
5 0, 02
10 0, 23
15 0, 56
Total 1, 00
(a) Determine analiticamente a função de distribuição acumulada F (x) = P (X ≤ x) e faça seu gráco;
(b) Indique os valores: F (−6), F (0), F (8, 25), F (15, 25);
(b) Use a tabela dada para calcular as probabilidades P (X > 5), P (0 ≤ X < 10);
(c) Refazer o item (b), agora usando as propriedades de F.

6.6 MÉDIA, VARIÂNCIA E DESVIO PADRÃO

As medidas de posição e de dispersão que usamos nos Capítulos 3 e 4 para as distribuições de

frequência serão retomadas em relação às distribuições de probabilidade e os dois enfoques, como

veremos, mantêm as mesmas características.

Seja X uma variável aleatória discreta e {(xi , pi ) ; pi = P (X = xi ), i = 1, . . . n} uma sua distribuição


de probabilidade.

(a) A Média (ou o Valor médio) ou a Esperança (matemática) de X, notada E(X) = µ(X) = µ é o

número real dado por


n
X n
X
E(X) = xi P (X = xi ) = xi pi
i=1 i=1
68 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

(b) A Variância de X é dada por


n
X n
X
= σ2 = (xi − E(X))2 pi = (xi − µ)2 pi = E (X − E(X))2 ;

Var(X)
i=1 i=1
p
(c) O Desvio padrão de X vale σ= Var(X).

Propriedades

1. Se a e b são constantes, então:

E(a) = a; Var(a)=0
E(aX + b) = aE(X) + b; Var(aX + b) = a
2 Var(X)

2. E(X − µ) = 0;
3. Var(X) = E(X 2 ) − (E(X))2 = E(X 2 ) − µ2
De fato, temos Var(X) = E((X − µ)2 ) = E(X 2 − 2µX + µ2 ),
= E(X 2 ) − E(2µX) + E(µ2 ),
= E(X 2 ) − 2µE(X) + µ2 ,
= E(X 2 ) − 2µ2 + µ2 = E(X 2 ) − µ2 .
Observação. Veja, no exemplo abaixo, a notável simplicação da propriedade 3. para o cálculo da

variância.

EXEMPLO 6.7

1. Calcular a média E(X), a variância σ 2 (X) e o desvio padrão σ(X) da variável X do Exemplo 6.2.

Podemos organizar os cálculos como no quadro abaixo.

X P (X) X · P (X) X 2 · P (X)


0 1/8 0 0
1 3/8 3/8 3/8
2 3/8 6/8 12/8
3 1/8 3/8 9/8
µ = 12/8 = 1, 5 E(X 2 ) = 24/8 = 3
P
1
Vemos, então, que

µ(X) = 1, 5;
2 2 2
Var(X) = E(X ) − µ = 3 − 1, 5 = 0, 75;

σ(X) = 0, 75 = 0, 866.
Pratique um pouco. Calcule a variância acima, porém usando diretamente a denição.

X P (X) X · P (X) X − µ (X − µ)2 (X − µ)2 · P (X)


0 1/8 0 −1, 5 2, 25 0, 28125
1 3/8 3/8 −0, 5 0, 25 0, 09375
2 3/8 6/8 0, 5 0, 25 0, 09375
3 1/8 3/8 1, 5 2, 25 0, 28125
P
1 µ = 12/8 = 1, 5 0 Var(X) = 0, 75
2. Um jogador ganha 5$ se aparecem 2 caras, no lançamento de duas moedas; o jogador ganha 2$ se

aparece uma única cara e $1 se não aparece cara. Achar a esperança dos ganhos desse jogador.

Ora, é de 1/4 a probabilidade de ganhar 5$, de 1/2 de ganhar 2$ e de 1/4 para ganhar 1$, donde a
esperança E = 5(1/4) + 2(1/2) + (1/4) = 2, 50 dos ganhos. Quanto o jogador deverá pagar para que

o jogo seja equitativo?


6. Funções de distribuição de probabilidade 69

Atividade-proposta 6.8

1. Seja X o número de divisores positivos de um número natural sorteado de 1 a 10. Achar o número

médio E(X) dos divisores considerados, e também sua variância Var(X).


2. Um jogo consiste no lançamento de 3 moedas. Se der tudo cara ou tudo coroa, o ganho é de 6$,

mas, dando uma ou duas caras, a perda é de 2$. Use o resultado esperado desse jogo para decidir se

é neutra a regra das apostas.

6.9 A Distribuição Binomial

Para exemplicar as ferramentas que vimos apresentando, passaremos a descrever dois modelos de

distribuições: uma, discreta, será a famosa distribuição binomial; a outra, modelo das distribuições

contínuas, será a distribuição normal de Gauss  o que, por si só, aponta para aplicações

duradouras em todas as áreas.

Consideremos ensaios repetidos e independentes, em que ocorrem exatamente dois resultados

possíveis, que chamaremos sucesso (S), com probabilidade p, ou fracasso (F), com probabilidade

q = 1 − p. X representa o total de sucessos em n ensaios, os possíveis valores de X são 0, 1, 2, . . . , n


Se

e os pares (x, p(x)), onde p(x) = P (X = x), constituem a distribuição binomial.

Qual a origem do adjetivo binomial? Se você pensou em coecientes binomiais, acertou em cheio!

De fato, para caracterizar a probabilidade P (X = k) podemos iniciar com a sequência

SS . . . S}F
| {z | F {z
. . . F}
k n−k
formada de k sucessos n−k fracassos. Entretanto, a ordem de ocorrência dos resultados é irrelevante,
dadas as hipóteses de independência que estamos, tacitamente, assumindo. Em outras palavras,

dentren ensaios, queremos selecionar, em qualquer ordem, a ocorrência de k deles (e a não ocorrência
n
 k n(n − 1) · · · (n − k + 1)
de n−k deles). Essa escolha é a denição dos números binomiais
k = Cn = k!
.

Em denitivo,

P (X = k) = Cnk pk q n−k , k = 0, 1, . . . , n.
Para destacar que X tem a distribuiçao binomial, de parâmetros n e p, notaremos X ∼ b(n, p).
Propriedades Se X ∼ b(n, p), então

E(X) = np
Var(X) = npq = np(1 − p)

Faremos as respectivas vericações mais tarde, para não interromper o ritmo da discussão.

Exemplo 6.10

1. Em 5 lançamentos de uma moeda, seja X a variável aleatória igual ao número de vezes que ocorre

cara. Calcular a probabilidade de ocorrer

(a) duas caras;

(b) quatro caras;

(c) pelo menos uma cara.


 
5
Temos X = {0, 1, 2, 3, 4, 5}, X ∼ b(5, 1/2), P (X = x) = 0, 5x 0, 55−x , x = 0, 1, 2, 3, 4, 5.
x
70 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

 
5
(a) P (X = 2) = 0, 52 0, 53 = 10 × 0, 55 = 0, 3125;
2
 
5
(b) P (X = 4) = 0, 54 0, 5 = 5 × 0, 55 = 0, 15625;
4
5
(c) 1 − P (X = 0) = 1 − 0, 5 = 0, 96875.

2. Uma prova tem 50 questões, cada uma com 5 alternativas, das quais apenas uma é correta. Se um

aluno responde a esmo as questões da prova, ache a probabilidade desse aluno acertar 20 questões.

A probabilidade de acerto em cada questão é p = 1/5 = 0, 2, q = 1 − p = 0, 8, X ∼ b(50, 1/2).


 
50
Temos: P (X = 20) = 0, 220 0, 830 = 0, 000612.
20
Observemos que a gentil expressão acima exige umas contas valentes. Podemos usar uma calculadora

cientíca ou um programa numérico, como o EXCEL. No item posterior, com o auxílio da distribuição

normal, resolveremos novamente a questão de uma forma bem mais cômoda.

3. Numa clínica veterinária, 25% dos animais submetidos a um certo tratamento não sobrevivem;

recentemente, foram tratados 16 animais. Indicando por X o número de não sobreviventes e sabendo

que X ∼ b(16; 0, 25), determine:

(a) E(X) e Var(X); (b) P (2 < X ≤ 4);


(a) E(X) = np = 16 × 0, 2 = 3, 2; = npq = 16 × 0, 2 × 0, 8 = 2, 56
Var(X)
   
16 3 13 16
(b) P (2 < x ≤ 4) = P (X = 3) + P (X = 4) = 0, 25 0, 75 + 0, 254 0, 7512
3 4
= 0, 207876060 + 0, 225199065 = 0, 433075125

4. Num campeonato de tiro, um atirador acerta o alvo com probabilidade de 1/4.


(a) Supondo que o atirador dá 7 tiros, encontre a probabilidade de acertar o alvo pelo menos 2 vezes;

(b) Para acertar o alvo ao menos uma vez, com probabilidade maior do que 2/3, quantas vezes o

atirador deve atirar?

Seja X a variável aleatória associada aos acertos e aos erros do atirador; temos X ∼ b(n; 1/4).
(a) Se n = 7, basta considerar as probabilidades
2187 5103
P (X = 0) = q 7 = ( 43 )7 = e P (X = 1) = 7 14 ( 34 )6 =
16384 16384
2187 5103 4547
Vem, então, P (X ≥ 2) = 1 − P (X = 0) − P (X = 1) = 1 − − = .
16384 16384 8192
(b) Para que ocorra P (X ≥ 1) > (2/3) em n tentativas, basta ver que 1 − P (X = 0) > (2/3), ou
 n
n 3 1
P (X = 0) < (1/3), isto é, q < (1/3), ou < . Calculando as potências sucessivas de 3/4,
4 3
vemos que o menor n vericando a condição-solução é n = 4, ou seja, o atirador deve atirar 4 vezes.

Atividade-proposta 6.11

1. A equipe A vem apresentando a probabilidade de 2/3 de ganhar suas partidas; essa equipe deverá

jogar 4 partidas. Calcular a probabilidade da equipe A ganhar:

(a) exatamente duas partidas; (b) pelo menos uma partida;

(c) 3 ou 4 partidas.

2. Numa família de 6 lhos, em que as probabilidades de nascimento de menino ou menina são iguais

(p=q=1/2), achar as probabilidades:

(a) ocorrência de 3 meninos e 3 meninas;

(b) ocorrência de menos meninos do que de meninas.


6. Funções de distribuição de probabilidade 71

3. Em um experimento binomial com 3 provas, X ∼ b(3, p), a probabilidade de exatamente 2 sucessos


é 12 vezes a probabilidade de 3 sucessos. Ache o valor da probabilidade p.

4. Dada a variável X ∼ b(200; 0, 04), seja a variável Y = 4X − 5. Calcule E(Y ) e Var(Y ).

5. Um determinado artigo é vendido em caixa a preço de 20, 00 cada uma; o ritmo da produção

acusa 20% de artigos defeituosos considerando amostras de 25 artigos por caixa. Um comprador

fez a seguinte proposta: escolhe amostras de 25 artigos de cada caixa, e paga conforme artigo(s)

defeituoso(s) são identicados:

25,00$ se não há nenhum artigo defeituoso;

17,00$ se um ou dois artigos forem defeituosos;

10,00$ se três ou mais forem defeituosos.

Se X representa o número de artigos defeituosos, então suponha X ∼ b(25; 0, 2).


(a) Calcule cada probabilidade P (X = 0), P (1 ≤ X ≤ 2), P (X ≥ 1);
(b) Conclua o preço médio por caixa (Y ) da proposta do consumidor.

Face aos resultados obtidos, decida se o fabricante deve manter seu preço de 20,00$ por caixa.

6.12 Variáveis aleatórias contínuas

Partindo de uma função contínua X : E −→ R, cuja imagem é um intervalo I ⊂ R, como proceder

para associar a X uma função de distribuição de probabilidade?

O procedimento que usaremos nasceu com o cálculo de áreas sob grácos de funções contínuas via

integrais de Riemann. O gráco abaixo representa o histograma suavizado da variável discreta X.


Em outras palavras, mudando o enfoque para a curva suavizada (digamos, f ), o histograma pode

ser pensado como os retângulos de uma partição de um intervalo conveniente, contendo [1, 5], onde a

soma das áreas dos retângulos, de altura p(xi ) = f (xi ), é uma aproximação para a área sob o gráco
Z 4
de f; assim, por exemplo, P (X = 2) + P (X = 3) + P (X = 4) = P (2 ≤ X ≤ 4) ' f (x)dx.
2

Apoiados nesse modelo, ampliaremos as denições do caso discreto.

(1) Função Densidade de Probabilidade

Seja a variável aleatória X : E −→ R, tal que X(E) = R.


Consideremos a função real f denida em X(E), tal que

(a) f (x) ≥ 0, para cada x ∈ X(E);


Z +∞
(b) f (x)dx = 1;
−∞
Z b
(c) para qualquer intervalo [a, b] ⊂ R, P (a ≤ X ≤ b) = f (x)dx
a
72 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Diremos, então, que X é uma variável aleatória contínua, da qual f é uma função densidade de

probabilidade (f.d.p.). Para a existência da integral, basta supor que f possui um número nito de

descontinuidades em cada intervalo nito de X(E); uma tal classe de funções contempla, na prática,

a maioria das aplicações.

Contrariamente ao caso discreto, o valor f (x) não indica nenhuma probabilidade de X assumir
o valor isolado x. Na realidade, da denição acima, segue P (X = x0 ) = 0. Assim, só faz sentido em

realizar uma probabilidade em um intervalo. Em particular, temos


Z b
P (a < x < b) = P (a ≤ x < b) = P (a < x ≤ b) = P (a ≤ x ≤ b) = f (x)dx.
a
Observemos, ainda, que se X tomar valores somente em algum intervalo nito [a, b], podemos
estender a denição, pondo f (x) = 0 para x ∈
/ [a, b] e, desse modo, considerar f denida em R.
Para a esperança e a variância da variável X, a formulação discreta passa a ter a versão

contínua:
Z +∞
E(X) = µ = xf (x)dx
−∞
Z +∞
Var(X) = (x − µ)2 f (x)dx, ou, também Var(X) = E(X 2 ) − (E(X))2 .
−∞
(2) Função de Distribuição Acumulada
Z x
Ampliando novamente o caso discreto, para cada x ∈ R, denimos F (x) = P (X ≤ x) = f (t)dt
−∞
a chamada função de distribuição acumulada da variável aleatória contínua X.
Valem as propriedades  quase as mesmas de 6.3, salvo os novos itens (c) e (d):

(a) Para cada x ∈ R, vale 0 ≤ F (x) ≤ 1.


(b) lim F (x) = 0; lim F (x) = 1;
x→−∞ x→∞
(c) F é contínua em cada ponto x ∈ R, e derivável nos pontos de continuidade de f; nesses pontos
0
vale F (x) = f (x);

(d) P (a < X ≤ b) = F (b) − F (a) = P (a ≤ X < b) = P (a ≤ X ≤ b) = P (a < X < b).


(e) F é uma função crescente.

EXEMPLO 6.13

1. Distribuição Uniforme

Uma variável aleatória contínua X tem distribuição uniforme de probabilidade no intervalo nito

[a, b] ⊂ R se sua f.d.p. vale


(
1/(b − a) se a ≤ x ≤ b,
f (x) =
0 em caso contrário.

A altura 1/(b − a) é ajustada para que seja 1 a área do retângulo.

Essa variável aleatória representa o análogo contínuo dos resultados igualmente prováveis. Também

torna mais precisa a noção intuitiva de escolher ao acaso um ponto em um intervalo [a, b], signicando
que a coordenada X do ponto é uniformemente distribuída sobre [a, b].
6. Funções de distribuição de probabilidade 73

Pratique um pouco!
b
(b − a)2
Z
x b+a
Verique que E(X) = dx = ; também, mostre que Var(X) = .
a b−a 2 12
x
x−a
Z
1
A função de distribuição acumulada de X vale F (x) = dt = , isto é,
a b−a b−a


 0 se x < a,
 x−a
F (x) = se a ≤ x ≤ b,
 b−a

1 se x > b,

Por exemplo, um ponto é escolhido ao acaso no intervalo [0, 20]. Qual a probabilidade de que o ponto

escolhido esteja entre 2 e 10?


1
Temos P (2 ≤ X ≤ 10) = 8 × = 0, 4
20

6.14 Distribuição Normal

Uma variável aleatória contínua X tem Distribuição Normal de probabilidade se a sua f.d.p. é dada

por:
!2
1 x−µ
1 −
f (x) = √ e 2 σ , para cada x ∈ R.
2π σ

Principais características da função: µ−σ µ µ+σ


(a) Em X=µ ocorre o único ponto crítico, que é ponto de máximo global;

(b) Em µ±σ ocorrem pontos de inexão;

(c) A curva é simétrica em relação a µ;


(d) E(X) = µ e Var(X) = σ2.
O cálculo das probabilidades (que, raramente, usa a denição da gentil expressão de f (x)) é muito
X −µ
simplicado com a variável reduzida Z = , pois E(Z) = 0 e Var(Z) = 1; assim, são equivalentes
σ
2
as duas distribuições X ∼ N (µ, σ ) e Z ∼ N (0, 1).

As probabilidades da variável reduzida Z são tabeladas e fornecem (veja o apêndice), por exemplo, a
x0 − µ
probabilidade P (0 ≤ Z ≤ z0 ), onde z0 = .
σ

0 z0 Z
Como a área total é igual a 1, e a curva é simétrica em relação ao eixo vertical z = 0, cada metade

da f.d.p. padronizada envolve uma área de 0, 5, isto é,


P (Z ≥ 0) = P (Z ≤ 0) = 0, 5
Analogamente, para cada z0 > 0, são iguais as probabilidades (áreas!):
P (0 ≤ Z ≤ z0 ) = P (−z0 ≤ Z ≤ 0); P (Z ≥ z0 ) = P (Z ≤ −z0 ); P (Z ≥ z0 ) = 0, 5 − P (0 ≤ Z ≤ z0 ).
74 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Alguns valores típicos estão indicados abaixo.

Exemplos 6.15

1. Se Z ∼ N (0; 1), use a tabela normal para achar as probabilidades solicitadas.

(a) P (0 < Z ≤ 2, 23) = 0, 4871 (consulta direta);

(b) P (Z > −1, 45) = 0, 5 + P (0 < Z < 1, 45) = 0, 5 + 0, 4265 = 0, 9265;


(c) P (−2 < Z < 2) = 2 × P (0 < z < 2) = 2 × 0, 4772 = 0, 9544;
(d) P (−1 < Z < 2, 2) = P (0 < Z < 1) + P (0 < Z < 2, 2) = 0, 3413 + 0, 4783 = 0, 8186;
(e) P (|Z| > 1, 25) = P (Z > 1, 25) + P (Z < −1, 25) = 2 × (0, 5 − P (0 < Z < 1, 25))
P (|Z| > 1, 25) = 2 × (0, 5 − 0, 3944) = 0, 2112.
2. Dada X ∼ N (10; 4), isto é, µ = 10 e σ = 2, use variáveis reduzidas convenientes e a tabela normal

para encontrar as seguintes probabilidades.

(a) P (X < 10) = P (Z < (10 − 10)/2) = P (Z < 0) = 0, 5


(b) P (X > 11, 50) = P (Z > 0, 75) = 0, 5 − P (0 < Z < 0, 75) = 0, 5 − 0, 2734 = 0, 2266
(c) P (8 < X ≤ 12) = P (−1 < Z ≤ 1) = 2 × P (0 < Z < 1) = 2 × 0, 3413 = 0, 6826
(d) P (14, 8 < X < 16, 4) = P (2, 4 < Z < 3, 2) = P (0 < Z < 3, 2) − P (0 < Z < 2, 4)
P (14, 8 < X < 16, 4) = 0, 4993 − 0, 4918 = 0, 0075
3. Se X ∼ N (50; 16), determine X0 tal que

(a) P (X ≥ X0 ) = 0, 05
X0 − 50
Na tabela, o valor 0, 5 − 0, 05 = 0, 45 corresponde a Z0 = 1, 64, logo 1, 64 = , donde
4
X0 = 56, 56.
(b) P (X ≤ X0 ) = 0, 99
Na tabela, vemos que 0, 5 − 0, 01 = 0, 49 corresponde a Z0 = 2, 32, donde X0 = 59, 28.
4. Num certo concurso, as notas de classicação estão normalmente distribuídas, com parâmetros

µ = 7, 6 e σ = 1, 5. Sabe-se ainda que 16, 6% dos alunos que apresentaram melhores notas receberam
o grau A e 11, 9% dos alunos menos adiantados receberam grau B . Indicar o grau mínimo para

receber A e o grau mínimo para receber B .

Para achar Z0 P (Z > Z0 ) = 0, 166, vamos considerar P (0 < Z < Z0 ) = 0, 5 − 0, 166 = 0, 334;
tal que
X − 7, 6
na tabela, vemos que Z0 = 0, 97, isto é, = 0, 97, e X = 9, 055 ' 9.
1, 5
Usemos o mesmo raciocínio para P (Z < Z0 ) = 0, 119: observando que 0, 5 − 0, 119 = 0, 381, que

X − 7, 6
corresponde a Z0 = 1, 18, temos −1, 18 = , logo X = 5, 83 ' 5, 8.
1, 5
6. Funções de distribuição de probabilidade 75

Atividade-proposta 6.16

1. Dada X ∼ N (100; 25), isto é, µ = 100 e σ = 5, use variáveis reduzidas convenientes e a tabela

normal para encontrar as seguintes probabilidades.

(a) P (100 ≤ X ≤ 106);


(b) P (89 < X < 107);
(c) P (112 < X < 116);
(d) P (X > 108);
(e) P (X < 95 ou X > 110).
2. Em um exame, as notas brutas de dois estudantes foram 88 e 64, enquanto os escores reduzidos

foram 0, 8 e −0, 4. Achar a média e o desvio padrão dos graus desse exame.

3. As vendas de determinado produto apresentam distribuição normal com µ = 600 unidades/mês e

σ = 40 unidades/mês. Se a empresa decidir fabricar 700 unidades naquele mesmo mês, encontrar a

probabilidade de não poder atender a todos os pedidos, por estar com a produção completa.

4. As alturas de 10.000 alunos de um colégio têm distribuição aproximadamente normal, com média

170cm e desvio padrão 5cm. Determinar:

(a) O número esperado de alunos com altura superior a 165cm;


(b) Qual o intervalo simétrico em torno da média que conterá 75% das alturas?

6.17 Aproximação normal da distribuição binomial

 
n x n−x
Consideremos n ensaios binomiais, X ∼ b(n; p) e P (X = x) = p q , x = 0, 1, . . . n.
x
Um teorema fundamental (O Teorema do Limite Central) garante que, para valores de n suciente-

mente grandes, a distribuição binomial b(n; p) está muito próxima da distribuição normal de média

µ = np e desvio padrão σ = npq . Observe o histograma binomial abaixo, cuja área é próxima de
uma normal!

Em geral, se np ≥ 5 e nq ≥ 5, então suporemos válida a aproximação em tela.

Correção de continuidade  A passagem da situação discreta binomial para a distribuição con-

tínua normal exige alguns cuidados com os pontos extremos dos intervalos considerados. A acurácia

da aproximação melhora com as seguintes correções de continuidade:

(a) P (X = k) = P (k − 0, 5 < X < k + 0, 5);


(b) P (a ≤ X ≤ b) = P (a − 0, 5 < X < b + 0, 5)
76 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

Exemplos 6.18

1. No lançamento de 30 moedas honestas, encontre a probabilidade da ocorrência de mais de 20

caras, considerando:

(a) A distribuição binomialb(30; 0, 5).


30  
X 30
Temos P (X ≥ 21) = (0, 5)i (0, 5)30−i = 0,0214 . (cálculos no Excel)
i
i=21
(b1) A aproximação normal sem a correção da continuidade. Temos:
√ √
µ = np = 30 × 0, 5 = 15 e σ = npq = 30 × 0, 5 × 0, 5 = 2, 7386.
X −µ 21 − 15
Z= = = 2, 1909 ' 2, 19 que corresponde a 0, 4857, logo
σ 2, 7386
P (X ≥ 21) = 0, 5 − 0, 4857 = 0,0143 .

(b2) Com a correção de continuidade, calcularemos (atenção!) P (X > 20, 5) = P (Z > 2, 0083)
Usando Z0 ' 2, 01, vem 0,4778, logo 0, 5 − 0, 4778 = 0, 0222; assim, P (X > 20, 5) = 0,0222 .

Comparando os resultados obtidos, observe que a aproximação normal com correção é, de fato, muito

próxima do valor binomial correto.

2. A conabilidade de um mecanismo eletrônico é a probabilidade de que ele funcione adequadamente,

dentro das especicações para as quais foi projetado. Uma amostra de 1000 desses itens é escolhida

ao acaso e os itens são testados, obtendo-se 30 defeituosos. Calcule a probabilidade de se obter pelo

menos 30 itens defeituosos, supondo que é de 0,95 a conabilidade de cada item.

Os dados sendo binomiais, com X indicando o número de defeitos,


√ √
n = 1000, µ = np = 1000 × 0.05 = 50 e σ = npq = 47, 5 = 6, 89,
29, 5 − 50
usaremos a aproximação normal P (X ≥ 30) = P (X > 29, 5). Com Z = = −2, 975, segue
6, 89
P (Z > −2, 98) = 0, 5 + 0, 4986 = 0, 9986.

Atividade proposta 6.19

1. Uma prova tem 50 questões, cada uma com 5 alternativas, das quais apenas uma é correta. Se

um aluno responde a esmo as questões da prova, encontre a probabilidade desse aluno acertar 20

questões. Use uma distribuição normal conveniente para aproximar a binomial X ∼ b(50, 1/5), e

estimar a probabilidade P (X = 20), isto é, P (19, 5 < X < 20, 5). Cf. o Exemplo 6.10(2).

2. De um lote de produtos manufaturados, extraímos 100 itens ao acaso; se 10% dos itens do lote

são defeituosos, calcule a probabilidade de 12 itens serem defeituosos. Use os métodos:


 
100
(a) X ∼ b(100; 0, 1), P (X = 12) = (0, 1)12 (0, 9)88
12

(b) Aproximação normal: µ = np = 10, σ = npq = 3.
6. Funções de distribuição de probabilidade 77

6.20 Respostas das Atividades Propostas

6.5

1. (a) Devemos ter 0 + p2 + p2 + p + p + p2 = 1, donde a condição 3p2 + 2p − 1 = 0, ou p = 1/3,


descartada a solução espúria p = −1.

(b) P (X ≥ 4) = P (X = 4) + P (X = 5) = 1/3 + 1/9 = 4/9


P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2) = 1/9 + 1/9 = 2/9
2. (a) Aplicando a denição, temos:


 0, se x < −5

 0, 19, −5 ≤ x < 5


 se

F (x) = 0, 21, se 5 ≤ x < 10



0, 44 10 ≤ x < 15



 se

1, se x ≥ 15

6.8

1. Se X é o número de divisores do inteiro 1 ≤ n ≤ 10 sorteado, temos

X P (X) X · P (X) X 2 · P (X)


1 1/10 1/10 1/10
2 4/10 8/10 16/10
3 2/10 6/10 18/10
4 3/10 12/10 48/10
P
1 2, 7 8, 3
Logo, µ = 2, 7 e Var(X) = E(X 2 ) − µ2 = 8, 3 − 2, 72 = 1, 01.
2. No jogo em questão, tudo cara ou tudo coroa signica (ccc) ou (kkk), com probabili-

dade (2/8). Os demais 6 resultados comparecem com probabilidade 6/8, donde a esperança

E = (2/8) · 6 − (6/8) · 3 = 0, o que indica apostas equilibradas.

6.11

1. Temos b(4; 2/3), n = 4, p = 2/3 e q = 1/3.


P (2vitórias) = 24 · (2/3)2 (1/3) = 8/27;

(a)

(b) Como q 4 = 1/81 representa derrota nas 4 partidas, vitória em pelo menos uma vale 1−q 4 = 80/81.
(c) Vitória em 3 ou 4 partidas:
4
(2/3)3 (1/3) + (2/3)4 = 32/81 + 16/81 = 16/27

P (3 vit ou 4 vit) = 3

2. n = 6; p = q = 1/2; b(6; 1/2)


6 3 3

(a) P (3 meninos) =
3 (1/2) (1/2) = 20/64 = 5/16
6 6 5 6
(1/2)2 (1/2)4 = 11/32
 
(b) P (0) + P (1) + P (2meninos) = (1/2) +
1 (1/2)(1/2) + 2

3. p = 1/5 = 0, 2
78 Introdução à Estatística  [Ana Paula Marques & Antonio Carlos]

4. Inicialmente, temos E(X) = np = 200 · 0, 04 = 8 e Var(X) = npq = 7, 68. Como Y = 4X = 5,


segue

E(Y ) = 4E(X) − 5 = 32 − 5 = 27 e Var(Y ) = 16Var(X) = 16 · 7, 68 = 122, 88.


5. Se X é o número de artigos defeituosos, então X ∼ b(25; 0, 2). Temos

P (X = 0) = q 25 = 0, 8025 = 0, 00378
P (1 ≤ X ≤ 2) = P (X = 1) + P (X = 2) = 0, 02361 + 0, 07084 = 0, 09445
P (X ≥ 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2)) = 0, 90177
Se Y representa o pagamento por caixa do consumidor, temos

Y P(Y) YP(Y)

25,00 0,00378 0,0945

17,00 0,09445 1,60565

10,00 0,90177 9,0177


P
1 10,71785

Segue, então que E(Y ) = 10, 72 é o preço médio por caixa da proposta do comprador. Logo, o

fabricante deve manter seu preço de 20,00 por caixa.

6.16

1. Basta achar os valores da variável reduzida Z = (X − 100)/5.


(a) P (100 ≤ X ≤ 106) = P (0 ≤ Z ≤ 1, 2) = 0, 3849;
(b) P (89 ≤ X < 107) = P (−2, 2 ≤ Z < 1, 4) = P (0 ≤ Z < 2, 2) + P (0 < Z < 1, 4) = 0, 9053
(c) P (X > 108) = P (Z > 1, 6) = 0, 5 − 0, 4452 = 0, 0548;
(d) P (X < 95ouX > 110) = P (Z < −1) + P (Z > 2) = 0, 1818.
88 − µ 64 − µ
2. Temos = 0, 8 e = −0, 4, donde as relações
σ σ
88 = 0, 8σ + µ, 64 = −0, 4σ + µ; enm, obtemos µ = 72 e σ = 20.
3. Como µ = 600 e σ = 40, segue

P (X ≥ 700) = P (Z ≥ 2.5) = 0, 5 − 0, 4939 = 0, 0062 = 0, 62%


4. (a) Partindo de µ = 170 e σ = 5, vem que P (X > 165) = P (Z > −1) = 0, 5 + 0, 3413 = 0, 8413;
Logo, o número esperado vale 10000 × 0, 8413 = 8413;
(b) O intervalo é da forma P (µ − a < X < µ + a) = 0, 75, ou com Z = X − 170/5, vem
P (−a/5 < Z < a/5) = 0, 75. Ora, se P (0 < Z < z0 ) = 0, 375, então z0 = 1, 15 ; logo, a/5 = 1, 15 e

a = 5, 75, isto é, o intervalo procurado se escreve, (164, 25; 175, 75).


6.19

20
(0, 2)10 (0, 8)30 = 0, 000612.

1. Como vimos, o resultado exato é P (X = 20) = 50

Comparemos esse resultado com a normal de média µ = np = 50 · 0, 2 = 10 e desvio padrão σ2 =


npq = 8, σ = 2, 828. Usando a correção de continuidade, temos

P (19, 5 < X < 20, 5) = P (3, 359 < Z < 3, 713) = 0.4999 − 0.4995 = 0, 0004.
2. Mesmo raciocínio do problema anterior.
100
(0, 1)12 (0, 9)88 = 0, 0989

(a) P (X = 12) = 12

(b) Aproximação da normal: µ = np = 10 e σ= npq = 3
P (11, 5 < X < 12, 5) = P (0, 5 < Z < 0, 83) = 0, 2967 − 0, 1915 = 0, 1052.
REFERÊNCIAS BIBLIOGRÁFICAS

ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística aplicada. São

Paulo: Pioneira Thomson Learning, 2005.

CRESPO, Antônio Arnot. Estatística fácil. 17. ed. São Paulo: Saraiva, 2002.

LAPPONI, Juan Carlos. Estatística usando Excel. 4. ed. Rio de Janeiro, Elsevier, 2005.

LARSON, Ron & FARBER, Betsy. Estatística aplicada. 2. ed. São Paulo: Pearson Prentice Hall,

2007.

MARCUS, Daniel A. Combinatorics. Washington, MAA Service Center, 1998.

MORETTIN, Pedro Alberto & BUSSAB, Wilton. Estatística básica. 6. ed. São Paulo: Saraiva,

2010.

MORGADO, Augusto César de Oliveira et al. Análise combinatória e Probabilidade. 9. ed.

Sociedade Brasileira de Matemática, 2006 (Coleção Professor de Matemática, 2).

NIVEN, Ivan. Mathematics of Choice. Random House, The L.W.Singer Company. New York,

2004 (New Mathematical Library, 10).

SILVA, Paulo Afonso Lopes. Probabilidades & estatística. Rio de Janeiro, Reichmann & Afonso

Editores, 1999.

SPIEGEL, Murray R. Estatística. 3. ed. São Paulo: Makron Books, 1993 (Coleção Schaum).
Introdução à Estatística Ana Paula / Antonio Carlos

DISTRIBUIÇÃO NORMAL REDUZIDA


Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

Você também pode gostar