Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
INTRODUÇÃO À ESTATÍSTICA
Maceió-Alagoas
2011
UNIVERSIDADE FEDERAL DE ALAGOAS
Reitora
Ana Dayse Rezende Dorea
Vice-reitor
Eurico de Barros Lôbo Filho
Diretora da Edufal
Sheila Diab Maluf
Catalogação na fonte
Universidade Federal de Alagoas
Biblioteca Central – Divisão de Tratamento Técnico
Bibliotecária Responsável: Betânia Almeida dos Santos
S586i Fernandes, Ana Paula Lima Marques.
Introdução à Estatística / Ana Paula Lima Marques Fernandes, Antonio
Carlos Marques da Silva. – Maceió: EDUFAL, 2011.
ISBN: 978-85-7177-556-5
Instituto de Matemática
Juliene Barros
Revisora EAD
Introdução à Estatística
SUMÁRIO
• Apresentação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
• Capítulo 5 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . 46
• Referências Bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . 79
iv
APRESENTAÇÃO
A inclusão da Estatística como ferramenta básica presente em vários cursos de graduação vem promo-
vendo uma visão uniforme e multidisciplinar, abundantemente exemplicada no núcleo especíco das DCN
de Estatística (cf. MEC, junho de 1999), interagindo com a grande maioria das diversas áreas acadêmicas.
Os temas e os conteúdos assinalados devem, é claro, enfatizar as respectivas especicidades.
Para uso imediato dos cursos de EAD, notadamente das Licenciaturas, o presente texto, de caráter
introdutório, pretende ilustrar as variadas aplicações que decorrem de uma metodologia estatística adequada.
Descreveremos os procedimentos de Estatística Descritiva, os conceitos iniciais de Probabildade e das Fun-
ções de Distribuição (de probabilidade). Numa futura segunda parte do curso, ampliaremos o estudos das
distribuições de probabilidade discreta e contínua, e sua aplicação à Inferência Estatística, com ênfase nos
intervalos de conança e testes de hipótese.
A tônica da apresentação dos conteúdos procura preservar a formulação técnica adequada e o enfoque
matemático que leva em conta a experiência cognitiva do alunado.
Nesse sentido, procuramos descartar a apresentação vertical, de sabor dogmático e pouco eciente,
a nosso ver, para uma primeira abordagem dos conteúdos. Optamos por um enfoque mais informativo,
sem descuidar das condições de validade da teoria subjacente. Também procuramos explicitar os métodos
numéricos efetivos, eventualmente com o auxílio de algoritmos computacionais, ferramenta indispensável nas
atuais aplicações.
Cada capítulo é precedido de um resumo dos objetivos e de uma visão sistêmica dos conteúdos corres-
pondentes, quando pretendemos aguçar a curiosidade do público-alvo.
Os exercícios propostos ao longo do texto objetivam treinar os conceitos apresentados de modo direto
e amigável. Eventualmente, solicitamos a participação explícita do aluno; nesse caso, as armações do tipo
é fácil ver que... são absolutamente sinceras: não há armadilhas intencionais nem resultados de algibeira,
que poderiam exigir conhecimentos outros que não os apresentados nas notas.
O autor sênior, com uma prática docente que ultrapassou mais de 40 anos de experiência universitária,
vem acompanhando os trabalhos da jovem professora Ana Paula, cuja atração pelas diciplinas de Métodos
Quantitativos, aí incluída a Estatística, permitiu a redação a quatro mãos dessas notas.
Gostaríamos de receber de vocês, prezados alunos, o retorno sobre a ecácia e adequação das notas
para realizar os objetivos propostos, os exercícios e o detalhamento das soluções. São informações funda-
mentais para a correção de rumos e de conteúdos.
Bom trabalho!
v
1. Variáveis estatísticas e escalas de mensuração 7
CAPÍTULO 1
VARIÁVEIS ESTATÍSTICAS
E ESCALAS DE MENSURAÇÃO
Objetivos do Capítulo 1
1.1 INTRODUÇÃO
Atualmente, nos mais diversos campos de atividades, informações especícas sobre variados eventos
permitem indicar ou prever sua validade ou sugerir correções em seus possíveis desdobramentos.
• No feriadão de Corpus Christi, o trânsito provocou 25 mortos e 450 feridos nas estradas federais
de Minas;
• A qualicação docente das IFES em alguns setores acadêmicos é mais lenta do que em outros;
Parte das informações exemplicadas lança mão de resultados (e unidades) numéricas, outras usam
comparações entre atributos categóricos. Na realidade, nesses casos e em outros, análogos, diremos que
Muitas vezes, apesar do progresso tecnológico (como a eciência dos recursos computacionais), não é
Fatores como o alto custo de uma análise individualizada, ausência de recursos humanos e procedi-
Por exemplo, a observação da durabilidade de uma classe de lâmpadas, testando cada uma até que
queime, evidentemente inviabiliza o processo de vendas dessas lâmpadas. Contudo, se o teste for
usado para calcular a vida média de um lote de lâmpadas, esse resultado servirá de referência para
toda a produção.
População coleção de todos os possíveis elementos, objetos ou medidas que são de interesse para
o estudo de um determinado evento. (Observemos que o termo população está sendo usado em um
sentido mais amplo do que o signicado, mais comum, de conjunto de pessoas.)
• Um levantamento sobre toda uma população é denominado censo. No Brasil, o IBGE é encar-
Em 2010, o IBGE realizou o XII Censo Demográco, o grande retrato em extensão e pro-
fundidade da população brasileira e das suas características sócio-econômicas e a base sobre
a qual deverá se assentar todo o planejamento público e privado da próxima década. Ver
[www.ibge.gov.br].
• Antes de uma eleição, diversos órgãos de pesquisa e imprensa consultam um conjunto selecionado
tempo especicados, para vericar se o processo está sob controle e evitar a fabricação de peças
defeituosas;
para xar valores de propaganda ou então modicar ou eliminar programas com baixa audiência;
• Biólogos marcam peixes, pássaros, etc. para monitorar a espécie e tentar prever e estudar seus
inicial é o de uma amostra, os critérios que permitem validar as conclusões e sua generalização para
uma população, bem como a adequação da amostra ao estudo em questão, constituem métodos
• realiza um teste probabilístico sobre essa característica da qual se supõe ter um certo valor.
amostra serão referidas como parâmetros e estatísticas, isto é, um parâmetro é uma medida de
(a) Em uma vericação rotineira e aleatória das barracas de peixe das balanças, a Vigilância Sanitária
constatou que 10% delas não armazenavam o peixe a uma temperatura conveniente. Como a medida
numérica de 10% é relativa a uma parte (balanças) de todos os estabelecimentos que vendem peixe,
(b) Para estabelecer a longevidade média dos atuais Governadores dos estados brasileiros, sua idade
Exemplo 1.4
1. Uma administradora de planos de saúde realizou um levantamento com 1.020 homens e mulheres,
indicando que 76% das mulheres e 60% dos homens haviam feito um exame de condicionamento físico
no ano anterior.
Uma primeira inferência do resultado sugere que, dentre todos os usuários dos planos de saúde con-
siderados que fazem o exame, o número de mulheres é maior do que o número de homens.
2. Um certo instituto entrevistou uma amostra de 9.500 pessoas para vericar qual a primeira marca
de produto que vem à cabeça do consumidor. Dessa amostra, 1.140 disseram ser a do sabão Limpa-
melhor.
A informação veículada poderia ser mais objetiva, uma vez que (1.140/9.500) × 100 ' 12%, resultado
que explicita melhor a proporção dos que usam o sabão apontado, na amostra.
Atividade-proposta 1.5
1. Após um levantamento, há uma crítica inicial das observações para vericar a exatidão de cada
resposta. O objetivo é, se necessário, repetir alguma entrevista, reticar valores duvidosos, e preparar
relatório para ser colocado em uma escala numérica. Justicar a necessidade desse procedimento
inicial.
2. Um ex-ministro brasileiro armou que, nos Estados Unidos, os censos demográcos me pergunta-
vam se eu era caucasiano, mexicano, ariano, asiático, mongólico e outras classicações, cujo signicado
[eu] não conhecia. Discuta a precisão das informações obtidas em um censo demográco e indique
3. Uma amostra de analistas nanceiros da BOVESPA apontou para 44% de prognósticos incorretos
sobre os lucros de empresas de alta tecnologia, em 2009. Apresente uma inferência plausível desse
resultado.
4. Quando Lula foi eleito presidente em 2006, ele recebeu 60,83% dos votos válidos do segundo turno.
Tendo em conta a natureza dos valores assumidos por uma variável estatística, temos dois grandes
grupos de classicação:
(a) variáveis qualitativas (não métricas ou categóricas), cujos valores são atributos associados a
categorias;
(b) variáveis quantitativas (métricas), cujos valores pertencem a conjuntos numéricos, em geral
Variável Categoria
número de lhos de uma amostra de casais altura dos alunos matriculados na UFAL
apostas na Megasena nos últimos dez concursos precipitação pluviométrica em 2009 no Agreste
rável e resultam de uma contagem (enumeração). As variáveis contínuas tomam valores em (produtos
de) intervalos de números reais e estão associadas a processos de medidas. Por exemplo, na tabela (β)
acima, a primeira coluna é formada de variáveis discretas e a segunda coluna, de variáveis contínuas.
Observação 1 Quando uma variável numérica contínua X toma valores, por exemplo, em um intervalo
I ⊂ R, esse resultado signica, tão somente, que o conjunto S dos valores de X (S é o conjunto-universo
de X ) é um subconjunto de I , isto é, o intervalo I possui amplitude conveniente para permitir a in-
Exemplo Na medida das alturas h de uma amostra de 500 alunos da UFAL, podemos supor que
h1 < h < h2 , onde h1 = 0, 50m e h2 = 3m. Dependendo da precisão do instrumento de medida, uma
altura h pode ser, a priori, qualquer ponto do intervalo considerado. Feitas as medições, encontrare-
Exemplo As posições de entrada de aviões no controle aéreo de um aeroporto são indicadas por
radares/monitores, cujas telas são munidas de referencial cartesiano com escalas de grande preci-
Observação 2 Pode ser conveniente codicar numericamente uma variável qualitativa. É o caso, por
exemplo, do registro da variável sexo (masculino, feminino), cujos atributos podem ser designados por
Também é claro que o simples uso de um código numérico não altera a qualicação da variável;
assim, não são considerados quantitativos os valores das variáveis CPF 012.345.678-90, ou telefone
Existem quatro tipos ou níveis de medidas ou escalas de mensuração: nominal, ordinal, intervalar
e proporcional.
(1) A escala nominal classica os dados em categorias ou grupos.
Números podem ser usados para rotular (categorizar) os dados em diferentes grupos e permitem a
Exemplo A Receita Federal usa a seguinte Tabela de Códigos da Declaração de Bens e Direitos.
22 Aeronave
23 Embarcação
26 Linha telefônica
29 Outros
Exemplo Observe a tabela abaixo, de uma amostra de 700 pessoas, relativa à variável nominal
Estado civil.
Estado civil Número de pessoas
casado 340
solteiro 250
viúvo 40
divorciado 50
Total 700
Como vemos acima, as classes ou categorias podem ser rotuladas com números, o que não signica
que as operações aritméticas usuais com esses números tenham algum signicado em particular.
(2) A escala ordinal corresponde ao tipo nominal em que se podem ordenar as categorias, mas as
diferenças entre os registros de dados não são signicativas. Os números associados ao nível ordinal
têm apenas um signicado de classicação. [As estatísticas são moda, mediana e distribuição de
frequências].
Exemplos de dados ordinais incluem opinião, escalas de preferência e avaliação de conceitos.
Exemplo A tabela abaixo ilustra a variável ordinal Conceito para uma amostra de 30 alunos.
Conceito Número de alunos
A 4
B 6
C 15
D 3
E 2
Total 30
12 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
Exemplo Foram divulgados no dia 1º de julho de 2010 os primeiros resultados do IDEB (Índice
fundamental (1
a à 4a série) cou com nota média de 4,6. A segunda etapa (5
a a 8a série), cou com
4,0; o ensino médio, por sua vez, teve média 3,6. As médias, apesar de "vermelhas", estão acima das
metas traçadas pelo governo para o ano de 2009, que eram de 4,2, 3,7 e 3,5, respectivamente. A nota
(3) A escala intervalar permite armar que uma medida é igual ou diferente, maior e quanto maior
do que outra. Em particular, podemos quanticar a diferença entre as categorias ordinais, via uma
unidade de medida e a escolha de uma origem arbitrária. (Essa origem, às vezes, é chamada de zero,
embora não signique ausência da característica em estudo). Por construção, escalas intervalares são
preservadas por aplicações (bijetivas) do tipo y = ax + b, com a > 0, onde as constantes a e b são
A é mais quente que B , mas 104/50 = 2, 08 6= 4, pois os zeros das duas escalas não se correspondem.
0 0
Consideremos, em seguida, o corpo intermediário D , cuja temperatura vale 20 C =68 F , e observemos
que a tabela de variações ilustra a permanência da relação (dobro) das variações em cada escala:
0 0
C ∆C F ∆F
A 40 104
D 20 40-20=20 68 104-68=36
B 10 20-10=10 50 68-50=18
Exemplo Há vários calendários para indicar uma linha de tempo em anos. Observemos as seguintes
codicações numéricas: atualmente, o ano 2010 usa o formato do calendário gregoriano; este ano
será 5770 no calendário judaico, 1430 no calendário muçulmano, 2554 segundo os budistas e 5129 no
calendário maia. Dos exemplos mencionados, apenas o calendário gregoriano usa como origem a data
(4) A escala proporcional ou de razão possui todas as propriedades da escala intervalar: permite
comparar duas medidas ordinais quaisquer, estabelecer se uma é diferente, maior, quanto maior e,
ainda, quantas vezes a outra. Essa última comparação decorre da existência de um zero absoluto,
ponto da escala em que não existe a propriedade em questão. Assim, todas as operações aritméticas
são permitidas e duas escalas podem ser transformadas por aplicações lineares da forma y = ax, com
a > 0, o que preserva a origem. Por exemplo, y = x/100 transforma cm em m. [Estatísticas usadas:
Exemplo As medidas dos comprimentos de uma amostra de 50 parafusos de alta precisão constituem
uma escala proporcional. Idem para os pesos de uma amostra de pacotes de café ensacados à vácuo.
Exemplo No item (3) acima, há escalas de temperatura proporcionais: a escala Kelvin possui um
temperatura da superfície da Terra (331K) com a menor (184K), da ordem de 1,8 vezes.
1. Variáveis estatísticas e escalas de mensuração 13
1.8 Resumo
Exemplo 1.9
que implica alterar a escala de mensuração da variável. Se considerarmos uma delegação de lutadores
de boxe e a variável peso (ou massa) X de cada atleta, cujos valores (kg) são anotados de uma balança
adequada, então X é quantitativa contínua. Agora, se o peso X classicar a categoria do boxe, então
X é qualitativa ordinal:
(x, y) ∈ U = N × N, onde N = {0, 1, 2, ...} denota o conjunto dos números naturais, os eventos
A = {a abscissa do ponto de impacto não é menor do que a ordenada} = {(x, y); x ≥ y};
B = {o produto das coordenadas do ponto não é negativo} = {(x, y); xy ≥ 0};
C = {a soma dos valores absolutos das coordenadas é maior do que a unidade} = {(x, y); |x|+|y| ≥ 1}
Pratique um pouco Faça um esboço gráco dos quatro conjuntos considerados (o alvo inclusive).
1 1 1
U A @
@ C
−2 −1 0 s 1 2 −2 −1 0 s 1 2 −2 −1 0 s @1 2
@
@
@
−1 −1 −1
14 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
Atividade-proposta 1.10
1. Considere a seguinte cha cadastral solicitada por uma instituição nanceira para a liberação de
2. Sobre o segmento [a, b] ⊂ R escolhemos um ponto qualquer x; a seguir, sobre o segmento [a, x],
escolhemos o ponto y ; os pares (x, y) formam o conjunto-universo U . Represente, no plano cartesiano,
Descreva as posições do ponto M em AB para que a corda correspondente tenha comprimento maior
ou igual ao raio R.
Sugestão. Examine, cuidadosamente, a gura abaixo. Conclua que os pontos M procurados descrevem
As atividades propostas reetem a inuência dos excelentes textos citados na Bibliograa. Destacamos os
livros de Crespo (2002), Morgado (2006) e Morettin & Bussab (2010), que abordam tópicos mais avançados do
que os que apresentamos nessas notas. O sítio português www.alea.pt, voltado para o ensino de Estatística,
também é muito bem organizado.
1.5
1. Se for o caso, é necessário estudar e eliminar eventuais dados da amostra que podem não ser repre-
sentativos da população.
2. As informações obtidas não são completamente precisas porque dependem da veracidade das res-
postas do entrevistado. Além disso, responder de forma errada pode favorecer a propagação de êrro
3. Não é fácil fazer previsões para um mercado de ações, tanto mais quanto o nível de especicidade
1.10
1.
(a) qualitativa nominal; (b) quantitativa discreta proporcional;
bs bs
A
a+b
U 2
C
a s a s
s s x s s x
a b a a+b b
y y 2
bs bs
B D
a s a s
s s x s s x
a a+b b a a+b b
2 2
16 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
pontos P Q, de modo que os raios correspondentes às extemidades das cordas formam ângulos iguais
e
◦
a 30 com AB . Então, é fácil ver que os pontos M procurados descrevem o segmento (P, Q).
s
b b
b
b
b
b
b
b
b
A P b
bs Q B
2. Distribuição de Frequência 17
CAPÍTULO 2
DISTRIBUIÇÃO DE FREQUÊNCIA
Objetivos do Capítulo 2
2.1 INTRODUÇÃO
Iniciando nosso estudo da Estatística Descritiva, abordaremos, nesse capítulo, a análise das chamadas
i xi fi
1 x1 f1
2 x2 f2
. .
. .
. .
m xm fm
m
X
fi = n
i=1
Nessa tabela, fi , 1 ≤ i ≤ m, indica a frequência simples ou absoluta dos valores que representam
o número de dados de cada classe xi .
Exemplo 2.2 Observe a tabela abaixo, já considerada no Capítulo 1, de uma amostra de n = 700
pessoas, classicadas pela variável nominal Estado civil.
Estado civil fi
casado 360
solteiro 250
viúvo 40
divorciado 50
Total 700
Há quatro classes de frequências simples (f1 = 360, f2 = 250, f3 = 40, f4 = 50), uma para cada
Núm. irmãos fi
0 6
1 9
2 20
3 16
4 5
5 3
6 1
Total 60
O Exemplo revela sete classes de frequências simples.
(c) frequência acumulada de uma classe: é a soma das frequências simples anteriores à ordem da
1 9 0,150 15 0,250
2 20 0,333 35 0,583
3 16 0,267 51 0,850
4 5 0,083 56 0,933
5 3 0,050 59 0,983
6 1 0,017 60 1,000
Total 60 1,000
Pratique um pouco! Na tabela acima (Exemplo 2.3), complete a distribuição de frequência acres-
Exemplo 2.5 A leitura de dados pode ser implementada mais facilmente se as respectivas tabelas
possuirem um certa organização. Assim, por exemplo, chamaremos de tabela primitiva aquela em
que os dados (brutos) são apresentados tal qual como foram obtidos. Organizando os valores numa
certa ordenação (crescente ou decrescente) chamaremos a nova tabela de rol. Uma observação: cui-
dado para não trocar seis por meia-dúzia... Os algorítmos de ordenação não são muito amigáveis para
n.
◦ horas 0 1 2 3 4 5
. Determine:
◦
n. funcionários 20 10 16 9 3 2
(a) o número de empregados que não trabalharam nenhuma hora extra;
(b) o número de empregados que trabalharam pelo menos 4 horas;
(c) o número de empregados que trabalharam menos de 2 horas;
(d) o número de empregados que trabalharam no mínimo 3 e no máximo 5 horas;
(e) a percentagem dos empregados que trabalharam no máximo 2 horas.
xi fi f ri Fi
0 1 0,05 ?
1 ? 0,15 4
2 4 ? ?
3 ? 0,25 13
4 3 0,15 ?
5 2 ? 18
6 ? ? 19
7 ? ? ?
20 1,00
X
associados a variáveis contínuas. As variáveis são agrupadas em classes ou intervalos, por exemplo, do
tipo [a, b) (fechados à esquerda e abertos à direita), procurando preservar a qualidade da informação.
Normalmente são usadas de 5 a 15 classes com a mesma amplitude. Lembremo-nos que um pequeno
número de classes pode comprometer sua validade e um grande número, por outro lado, prejudica o
8, 96. Como achar o número k de classes, a amplitude h de cada intervalo (suposta constante) e os
0,90 0,90 1,28 1,82 1,88 2,00 2,01 2,12 2,43 2,78
2,82 2,88 2,93 3,63 3,67 3,73 3,96 4,00 4,07 4,10
4,15 4,17 4,26 4,30 4,65 5,09 5,28 5,36 5,41 5,54
5,84 6,00 6,54 6,67 7,35 7,77 8,14 8,45 8,67 8,96
20 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
É possível vericar que, em geral, vale k = 1 + 3, 3 log n = 1 + log2 n (usando uma aproximação
normal de uma distribuição binomial conveniente Regra de Sturges). Para uma rápida ordem
√
de grandeza, também usaremos k = n. Há vários outros procedimentos, que serão descritos
oportunamente.
Em nosso caso, como n = 40, vem k = 1 + 3, 3 log 40 = 6, 28 ' 6. Por outro lado, considerando
a amplitude amostral AA = x(max) − x(min) (diferença entre o valor máximo e o valor mínimo
AA 8, 06
da amostra), com AA = 8, 96 − 0, 90 = 8, 06, vemos que h = = ' 1, 343 teria um valor
k 6
numérico inconveniente. Optamos, então, por escolher k = 5 classes, e a amplitude de cada uma
8, 06
h= = 1, 612 ' 2; essa escolha considera, também, AA ' 10.
5
A partir desses resultados, podemos descrever os agrupamentos da distribuição, usando a seguinte
tabela:
i Índices fi
1 0 `2 5
2 2 ` 4 12
3 4 ` 6 14
4 6 ` 8 5
5 8 ` 10 4
P
fi = 40
constantes. Assim l2 = 2, L2 = 4; L4 = 8; l5 = 8; h2 = h4 = h5 = 2;
li + Li
d) O ponto médio xi de uma classe é o ponto médio do intervalo Ii : xi = ;
2
e) Amplitude total AT = L(max) − l(min), é a diferença entre o limite superior da última
i Índice fi xi f ri Fi F ri
1 0 `2 5 1 0,125 5 0,125
2 2 ` 4 12 3 0,300 17 0,425
3 4 ` 6 14 5 0,350 31 0,775
4 6 ` 8 5 7 0,125 36 0,900
5 8 ` 10 4 9 0,100 40 1,000
P P
= 40 = 1, 000
Pratique um pouco!
Completar a distribuição acima, acrescentando duas colunas percentuais, uma para cada frquência
Atividade-proposta 2.9
1. Os dados seguintes referem-se ao tempo de espera (em minutos) de 30 clientes em uma la de
23 - 19 - 07 - 21 - 16 - 13 - 11 - 16 - 33 - 22- 17 - 15 - 12 - 18 - 25 - 20 - 14 - 16 - 12 - 10- 08 - 20 - 16
14 - 19 - 23 - 36 - 30 - 28 - 35
Construa uma tabela de freqüência (fi ), agrupando as informações em classes de amplitude igual
a 5, a partir do menor tempo encontrado. Indique, também, as frequências relativas e acumuladas
(f ri , Fi , F ri ).
2. Considere a seguinte distribuição de frequência das faixas salariais (em salários mínimos) dos 120
funcionários de uma rede de locadoras:
faixas (s.m.) 1 ` 3 ` 5 ` 7 ` 9 ` 11
fi 30 48 24 10 8
Determine:
a) a amplitude total;
b) o limite superior da terceira classe;
c) o limite inferior da segunda classe;
d) o ponto médio da quarta classe;
e) a frequência da quarta classe;
f ) a frequência relativa da segunda classe;
g) a frequência acumulada da terceira classe;
h) a classe do 72◦ empregado.
i classes xi fi Fi f ri
1 0 `2 1 4 ? 0,04
2 2 `4 ? 8 ? ?
3 4 `6 5 ? 30 0,18
4 ? 7 27 ? 0,27
5 8 ` 10 ? 15 72 ?
6 10 ` 12 ? ? 83 ?
7 ? 13 10 93 0,10
8 14 ` 16 ? ? ? 0,07
P P
= ··· = ···
No gráco em setores (circulares), o total é representado pelo círculo, subdividido no mesmo número
de setores que a série de dados; as áreas dos setores são respectivamente proporcionais aos dados. É
fácil calcular cada área por meio de uma regra de três simples e direta, lembrando que o total da série
corresponde a 360 .
0
No caso dos setores circulares, os ângulos centrais podem ser determinados (em graus), multiplicando
(2) Variáveis quantitativas. Agora, as escalas numéricas são mais adequadas a inúmeras repre-
sentações grácas.
Essa aparência algo grosseira pode ser suavisada por um traçado de linhas convenientes. No caso de
dados agrupados em intervalos, o valor xi corresponde ao ponto médio da classe Ii . Ainda nesse caso,
para fazer o gráco começar e terminar sobre o eixo horizontal, é usual estender o lado esquerdo em
uma amplitude de classe antes do ponto médio da primeira classe e o lado direito em uma amplitude
(c) Polígono de frequência acumulada (ou ogiva), no caso de dados agrupados em intervalos, é for-
mado por segmentos de retas que unem os pontos (Li , Fi ), marcados sobre cada limite superior Li ,
com a escala vertical sendo as frequências acumuladas. O gráco começa no limite inferior da primeira
classe (com frequência cumulativa nula) e termina no limite superior da última classe (cuja frequência
(d) Histograma. Semelhante a um gráco de barras, é formado por retângulos justapostos, com bases
no eixo horizontal e pontos médios coincidentes com os pontos médios dos intervalos de classe; as lar-
guras dos retângulos são iguais às respectivas amplitudes dos intervalos e as alturas numericamente
iguais às frequências.
Exemplo 2.11
1. Observemos o gráco em bastão da seguinte distribuição.
xi fi Fi fi
2 4 4
6
3 7 11
4 5 16 4
5 2 18
6 1 19 2
7 1 20
P
= 20 1 2 3 4 xi5 6 7
Pratique um pouco! Superpor ao gráco de bastões acima, as correspondentes frequências acumuladas (Fi ),
já indicadas na distribuição dada. Não deixe de indicar as descontinuidades nitas do gráco!
2. Distribuição de Frequência 23
3. O exemplo ilustra um histograma e os polígonos de frequências com intervalos de classe (cf. 2.8).
Índice fi xi f ri Fi
0`2 5 1 0,125 5
2`4 12 3 0,300 17
4`6 14 5 0,350 31
6`8 5 7 0,125 36
8 ` 10 4 9 0,100 40
P P
= 40 = 1, 000
24 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
4. Problema-brinde
Verique que a área total dos retângulos de um histograma é igual à área limitada pelo polígono de
Atividade-proposta 2.12
1. Os dados de uma amostra de 50 refrigerantes indicaram a tabela abaixo.
Marca fi f ri f ri (%) Fi
Coca Light 8
Coca-cola 18
Guaraná 13
Pepsi 5
Sprite 6
50
P
percentuais.
as respostas categorizadas são representadas em ordem decrescente das respectivas frequências. Esse
tipo de ordenação, é claro, permite focalizar as respostas mais importantes, minimizando aquelas de
menor signicado.
um diagrama de Pareto, um polígono de frequências acumuladas. Faça, então, o que foi assinalado:
2.6
1. Vale a distribuição:
xi fi f ri f ri (%) Fi Fri
2 3 0,15 15 3 0,15
4 5 0,25 25 8 0,40
6 6 0,30 30 14 0,70
8 4 0,20 20 18 0,90
10 2 0,10 10 20 1,00
20 1,00 100%
P
2.9
1. Verique a validade dos resultados.
Tempo(min) xi fi f ri Fi F ri
7 ` 12 9,5 4 0,133 4 0,133
12 ` 17 14,5 10 0,333 14 0,466
17 ` 22 19,5 7 0,233 21 0,700
22 ` 27 24,5 4 0,133 25 0,833
27 ` 32 29,5 2 0,066 27 0,900
32 ` 37 34,5 3 0,100 30 1,000
30 1,000
P
Grácos (b), (c) abaixo; setores angulares (graus): coca-light 57,6; coca 129,6; pepsi 36; guaraná
Para o diagrama de Pareto, indicamos, abaixo, duas congurações, cada qual com seu polígono de
frequências acumuladas.
3. Medidas de Posição 27
CAPÍTULO 3
MEDIDAS DE POSIÇÃO
Objetivos do Capítulo 3
3.1 INTRODUÇÃO
O comportamento numérico das variáveis estatísticas está bem fundamentado em vários critérios
3.2 MÉDIA
28 + 32 + 42 + 46 + 52 180
X= = = 36; observe que a média pode não ser um dos valores de X.
5 5
28 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
partida.
P x i xi fi
fi = n. Desse modo, a expressão usual da média X = é escrita sob a forma X = X
n fi
de uma média aritmética ponderada.
xi fi xi fi
x1 f1 x1 f1
x2 f2 x2 f2
. .
. .
. .
xm fm xm fm
m
X m
X
fi xi fi
i=1 i=1
xi fi xi fi
0 6 0
1 9 9
2 20 40
3 16 48
4 5 20
5 3 15
6 1 6
Total 60 138
138
Vemos, então, que X= = 2, 3.
60
3. Medidas de Posição 29
mente com a frequência simples fi da classe, representa todos os pontos do intervalo. (Na realidade,
cada classe, o que exige conhecimentos de análise real mais adequados para um segundo curso).
X
xi fi
Admitindo esse resultado, vale a mesma expressão anterior X= X .
fi
Por exemplo, seja a distribuição do tempo de espera do prob. 2.9.1.
Tempo(min) xi fi fi xi
7 ` 12 9,5 4 38,00
12 ` 17 14,5 10 145,00
17 ` 22 19,5 7 136,50
22 ` 27 24,5 4 98,00
27 ` 32 29,5 2 59,00
32 ` 37 34,5 3 103,50
P
30 580,00
580
Vemos, então, que X= = 19, 33 min.
30
(d) Processo simplicado para o cálculo da média
Dependendo da ordem de grandeza dos dados X, o cálculo direto da média X̄ pode ser algo
X − X0
fastidioso. É possível usar uma mudança de variável conveniente, da forma Y = , que torna
h
mais simples todo o processo. De fato, tendo em conta as propriedades
X 3.2.1 da média, vemos que
X̄ − X0 h yi fi
Ȳ = , donde X̄ = X0 + hȲ , isto é X̄ = X0 + X . Em geral, a simplicação decorre
h fi
da escolha da origem X0 dentre os pontos médios da distribuição, de maior frequência. O parâmetro
14,5 10 0 0
19,5 7 1 7
24,5 4 2 8
29,5 2 3 6
34,5 3 4 12
P P
fi = 30 fi yi = 29
29
Enm, X̄ = 14, 5 + 5 = 19, 33 min.
30
Exemplo 3.3
1. Verique que a seguinte série numérica {4, −3, 2, −7, 5} não pode ser formada de desvios em relação
à (alguma) média aritmética.
Com efeito, a soma 4 + (−3) + 2 + (−7) + 5 = 1 não é nula, o que viola a propriedade 3.2.1.(a).
30 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
2. Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma média de
70 pontos em uma certa prova. Dada a média geral dos candidatos (masc. e fem.) de 64 pontos, qual
N
◦ Nome Idade Altura
1 Kelly 20 1,87
3 Denise 22 1,82
4 Ida 25 1,78
6 Tina 24 1,85
8 Cilene 23 1,83
9 Fátima 21 1,87
10 Márcia Fu 21 1,85
263
A idade média da seleção era I= ' 22anos.
12
Atividade-proposta 3.4
1. Sejam os conjuntos X = {1, 3, 7, 9, 10}, Y = {20, 60, 140, 180, 200} e Z = {10, 50, 130, 170, 190}.
Calcule a média X; usando as propriedades (3.2.1) da média, conclua Y e Z.
2. Calcule a média das seguintes distribuições:
xi 2 4 6 8 10
(a)
fi 3 5 6 4 2
faixas (s.m.) 1 ` 3 ` 5 ` 7 ` 9 ` 11
(b)
fi 30 48 24 10 8
comunidades, uma de base cultural alemã, outra, italiana. Indique qual das duas comunidades tem
xi 2 3 4 5 6 7
(a)
fi 25 30 48 111 98 88
yi 3 4 5 6 7 8 9
(b)
fi 48 51 48 41 32 14 6
5. Verique a validade da propriedade da média estabelecida em 3.2.1(d), sobre a soma dos desvios
3.5 MODA
X = {3, 4, 5, 7, 7, 7, 9, 11, 15}, então a moda vale 7. Podem ocorrer dois ou mais valores modais,
quando diremos que a distribuição é bimodal. É o caso de Y = {2, 3, 5, 5, 5, 7, 8, 9, 11, 11, 11), que
possui os valores modais 5 e 11. Enm, pode não ocorrer nenhum valor modal (caso amodal), como
em Z = {3, 6, 9, 13, 17, 19}.
(b) Dados agrupados sem intervalos de classe
A determinação da moda é imediata, bastando xar a variável de maior frequência. Esse é um
Por exemplo, abaixo, assinalamos a moda de cada distribuição. Na primeira, a moda corresponde à
solteiro 240 1 9
viúvo 40 2 20
divorciado 50 3 15
outra situação 10 4 5
Altura(cm) fi
150 ` 154 7
154 ` 158 11
158 ` 162 12
162 ` 166 10
P
fi = 40
Observação. Para dados agrupados em intervalos, o ponto médio de cada classe foi escolhido para
classe). Por essa razão, os processos relativos a distribuições pontuais valem, com poucas adaptações,
3.6 MEDIANA
A mediana (M d) é um valor que ocupa a posição central de uma série de observações ordenadas
(de forma crescente), em que 50% dos elementos devem estar abaixo de Md e 50% acima. É fácil
(ii) n par: há dois elementos centrais xn/2 e x(n/2)+1 ; a mediana é a média aritmética desses dois
valores.
1 6 8 1 5 7
2 10 18 2 7 14
3 11 29 3 8 22
4 5 34 4 6 28
Total 34 Total 28
P
Na primeira distribuição, temos ( fi )/2 = 34/2 = 17; ora, a menor frequência acumulada maior do
que 17 vale 18 que, por sua vez, corresponde ao valor 2 da varíável. Logo, M d = 2.
P
No segundo exemplo, vemos que ( fi )/2 = 28/2 = 14. Agora, há uma frequência acumulada, a
saber, F3 tal que F3 = 14, que corresponde ao valor 2 da variável. Então, tomamos a mediana como
classe mediana,
P
a menor frequência acumulada maior do que ( fi )/2, que nos dará a onde se
Pesos (kg) fi Fi
59 ` 64 2 2
64 ` 69 6 8
69 ` 74 9 17
74 ` 79 12 29
79 ` 84 8 37
84 ` 89 3 40
P
fi = 40
P
Com as notações acima temos: ( fi )/2 = 40/2 = 20, o que identica a classe mediana 74 ` 79;
(20 − 17) · 5
assim, F (ant) = 17, l∗ = 74, f ∗ = 12, h∗ = 5, donde M d = 74 + = 75, 25.
12
F 29
P
( fi )/2
f∗ 20
12
F(ant) 17
l∗ Md l∗ + h∗ 74 Md 79
Atividade-proposta 3.7
1. Calcule a moda e a mediana das distribuições:
xi 2 4 6 8 10
(a)
fi 3 5 6 4 2
faixas (s.m.) 1 ` 3 ` 5 ` 7 ` 9 ` 11
(b)
fi 30 48 24 10 8
2. Um livro com 50 páginas apresentou um número de erros de impressão por página conforme indi-
cado abaixo.
Calcule o número médio de erros por página, o número mediano de erros por página e o número modal
3. Durante um certo período de tempo, o rendimento de cinco ações na Bovespa está tabelado acima.
4. No processo para achar a mediana dos intervalos de classes, mostre que, se existir uma frequência
P
acumulada exatamente igual a ( fi )/2, então a mediana será o limite superior da classe correspon-
5. O departamento de pessoal de uma rma fez um levantamento dos salários dos 120 funcionários
1`3 0,25
3 ` 5 0,40
5 ` 7 0,20
7 ` 10 0,15
Total 1,00
a) Encontre o salário médio dos funcionários, o salário mediano e o salário moda;
b) Se for dado um aumento de 20% para todos os funcionários, qual será o novo salário médio?
número de valores, isto é, 50% do total n de valores, podemos considerar outras partições. Assim,
(a) os quartis dividem uma série em quatro partes iguais. Há três quartis, notados Q1 , Q2 = M d e
Q3 . O primeiro quartil é a posição Q1 tal que uma quarta parte 25% = 1/4 dos dados é menor do
que Q175% = 3/4 dos dados são superiores a Q1 . O segundo
e quartil Q2 = M d é a nossa mediana.
O terceiro quartil Q3 indica que 75% = 3/4 dos dados são menores do que ele e uma quarta parte
d1 , d2 , . . . , d9 . Temos d5 = M d = Q2 .
(c) os percentis são 99 valores que separam os valores em 100 partes iguais, notados p1 , p2 , . . . , p99 .
Observemos que p25 = Q1 , p50 = M d = Q2 = d5 , p75 = Q3 .
tadas pelos percentis 0%, 1%, 2%,. . . , 100%. Desse modo, qualquer dado da amostra estará sempre
entre 0% e 100%.
percentil
100%
##
#
p #
#
#
#
#
#
0 #
1 2 x n ordem
n−1 x−1
Como vemos na gura, vale a proporção = , donde as relações
100% − 0% p − 0%
x−1 p
p= × 100% e x = (n − 1) × +1
n−1 100
Tais relações são fundamentais para passar de ordem a percentil e vice-versa!
3. Medidas de Posição 35
Por exemplo, examinemos os seguintes dados, onde aparecem 11 resultados ordenados e os respectivos
percentis.
amostra 15 18 19 24 27 31 32 38 39 42 43
percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
x−1
Nesse caso, como n=11, temos × 100% = (x − 1) × 10%, o que permite vericar, dada a
p=
10
ordem, qual é o percentil correspondente: x=1 ⇒ p=0%; x=2 ⇒ p=10%; x=6 ⇒ p=50%. Recipro-
p p
camente, agora usando x = (11 − 1) × +1 = + 1, vemos que, se p = 80%, então a ordem
100 10
x = 9, que se refere ao valor 39.
Observação Há diversos processos de relacionar a ordem de dados ordenados com cada percentil.
Optamos pela forma acima construída, que é usada por dois importantes pacotes computacionais, a
saber, EXCEL e R. No programa R, inclusive, podem ser usados várias rotinas de cálculo.
correto.
Por exemplo, se X = {185, 196, 207, 305, 574, 597, 612}, então x1 = 10/4 = 2, 5 indica que o 1◦
quartil está entre 196 e 207; como 207-196=11, segue que 196 + 0, 5 × 11 = 196 + 5.5 = 201, 5, isto é,
Q1 = 201, 5.
Pratique um pouco! No exemplo acima, verique que Q3 = 585, 5.
(b) Dados com intervalos de classe. O procedimento é o mesmo usado para a mediana, agora
P
a comparação com as frequências acumuladas sendo feitas com o valor k fi /4, onde k=1 para o
(14 − 12)50
Q1 = 500 + = 500 + 10 = 510.
10
Dividendos fi Fi
400 ` 450 4 4
450 ` 500 8 12
500 ` 550 10 22
550 ` 600 14 36
600 ` 650 12 48
650 ` 700 8 56
P
fi = 56
P 3 × 56
(2) x3 = 3 fi /4 = = 42
4
A frequência acumulada 48 indica a classe 600 ` 650 para o quartil Q3 , isto é,
(42 − 36)50
Q3 = 600 + = 600 + 25 = 625.
12
36 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
Basta considerar o caso com intervalos de classe. Novamente, o processo é adaptado do cálculo da
P
mediana, onde a expressão k fi /100, k = 1, 2, . . . , 99, é usada na comparação com as frequências
acumuladas.
X
k( fi /100) − F (ant)
pk = l ∗ + h∗ ,
f∗
Por exemplo, calculemos o percentil p55 na tabela Dividendos anteriormente considerada. Temos:
55 P
x55 = fi = 0, 55×56 = 30, 8, o que seleciona a frequência acumulada 36 e o intervalo 550 ` 600;
100
(30, 8 − 22)50
assim, p55 = 550 + = 550 + 31, 43 = 581, 43.
14
Atividade-proposta 3.11
3 ` 5 48 2 ` 4 5
5 ` 7 24 4 ` 6 6
7 ` 9 10 6 ` 8 4
9 ` 11 8 8 ` 10 2
P P
=120 =20
(c) o 20
◦ percentil e o 90◦ percentil.
3. Medidas de Posição 37
3.4
Z̄ = Ȳ − 10 = 110.
P P
2. Basta usar a média ponderada ( fi xi )/ fi : (a) 5,70; (b)4,63.
3.7
1. (a) M o = 6, M d = 6; (b) M o = 4, M d = 4, 25
2. 0,66; 0,50; 0.
cuidado o caso geral para concuir a validade do resultado para qualquer medida.
3.11
1.(a) para os salários: Q1 = 3, Q3 = 6; para as notas: Q1 = 2, 8, Q3 = 6, 5.
(b) para os salários: D5 = 4, 25, D7 = 5, 5; para as notas: D5 = 2, 67, D7 = 6.
(c) para os salários: P20 = 2, 6, P90 = 8, 2; para as notas P20 = 2, 4, P90 = 8.
38 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
CAPÍTULO 4
MEDIDAS DE DISPERSÃO
Objetivos do Capítulo 4
4.1 INTRODUÇÃO
Quando descrevemos o comportamento numérico de um conjunto de valores X , vimos que, por exem-
plo, podemos usar a média de X como um valor típico ou representativo dos valores em estudo.
Entretanto, quando for necessário aferir o grau de homogeneidade daquela variável X , em torno de
uma medida de tendência central, recorremos às chamadas medidas de dispersão.
Por exemplo, sejam
X1 = {4, 5, 5, 6, 6, 7, 7, 8}, X2 = {1, 2, 4, 6, 6, 9, 10, 10} e X3 = {0, 6, 6, 7, 7, 7, 7.5, 7.5} as notas de
oito alunos em três avaliações nais de um dado curso. Observe que as médias são as mesmas:
m1 = m2 = m3 = 6, o que não signica que o desempenho dos alunos tenha sido o mesmo nas três
avaliações realizadas.
Na primeira avaliação, as notas estão, realmente, regularmente distribuídas em torno da média. Já na
segunda, vemos uma distorção maior: embora a maioria das notas sejam altas, algumas notas baixas
puxam a média para um valor menor. Na terceira prova, há apenas uma nota baixa, mas seu valor é
tal que de fato consegue diminuir a média do conjunto.
As medidas de dispersão de que trataremos nesse capítulo são: amplitude total, variância,
desvio padrão e coeciente de variação.
Por exemplo, se X = {4, 5, 5, 6, 6, 7, 7, 8}, então ATX = 8 − 4 = 4. Por outro lado, com Y =
{4; 4; 4; 2; 4, 3; 4, 5; 5; 5; 8}, então ATY = 8 − 4 = 4, a mesma amplitude. Observemos, contudo, que
a variável X apresenta uma dispersão bem mais uniforme que Y . Assim, apenas a informação da
amplitude não permite ter idéia de como os dados estão distribuídoss entre os extremos.
(b) Dados agrupados sem intervalos de classe
Vale, ainda, a mesma relação do item anterior: AT = x(max) − x(min)
xi 2 4 6 8 10
Por exemplo, a amplitude total da distribuição vale AT = 10 − 2 = 8.
fi 3 5 6 4 2
(c) Dados agrupados com intervalos de classe
Nesse caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior
da primeira classe: AT = L(max) − l(min).
Por exemplo, na distribuição abaixo, AT = 11 − 1.
faixas (s.m.) 1 ` 3 ` 5 ` 7 ` 9 ` 11
fi 30 48 24 10 8
A idéia é vericar, para uma variável numérica X , a tendência dos desvios em relação à média. Ora,
já vimos que é nula a soma dos desvios: (xi − X̄) = 0. o que nos conduz a considerar a média dos
P
quadrados dos desvios. Essa expressão é a variância de X . Tal como construída, a variância é
expressa em unidades ao quadrado. Para preservar as unidades originais, é usual considerar o desvio
padrão σ, raiz quadrada da variância.
Mais precisamente, numa população com n elementos, de média µ = ( xi )/n, a variância populaci-
P
onal vale σ 2 = [ (xi − µ)2 ]/n e o desvio padrão σ = [ (xi − µ)2 ]/n.
P pP
Passemos a explicitar os cálculos nos três casos de distribuições que vimos considerando.
40 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
Tal como zemos para a média, podemos reduzir o trabalho numérico do cálculo do desvio padrão σ
X − X0
com o auxílio de uma mudança de variável conveniente. De fato, se Y := , vimos em 4.3 que
h
σX
σY = ; a escolha de Y pode simplicar os cálculos!
h
Por exemplo, seja X = {136, 138, 141, 143, 157}.
Escolhendo Y = X − 140, temos Y = {−4, −2, 1, 3, 17}, cuja ordem de grandeza parece ser mais
319
sugestiva. Usando yi = 15 e yi2 = 319, segue σY2 = − (15/5)2 = 54, 8, donde σY = 7, 40.
P P
5
Enm, σX = σY = 7, 40.
O processo para o caso de dados agrupados em intervalos de classe pode ser assim sistematizado.
X − X0
Escolhemos a variável Y = , onde X0 é o ponto médio de maior frequência e h a amplitude
h
(comum) dos intervalos; temos σX = h σY .
Por exemplo, consideremos a distribuição, já complementada com as colunas relativas à variável Y .
custos (R$) 450 ` 550 ` 650 ` 750 ` 850 ` 950 ` 1050 ` 1150
fi 8 10 11 16 13 5 1
X − 800
Variável auxiliar Y = . Temos
100
xi fi yi fi yi fi yi2
500 8 −3 −24 72
600 10 −2 −20 40
700 11 −1 −11 11
800 16 0 0 0
900 13 1 13 13
1000 5 2 10 20
1100 1 3 3 9
P P P
h = 100 = 64 = −29 = 165
" 2 #
165 −29
Temos: σY2 = − = 2, 3728 ; σY = 1.54 ; σX = 100σY = 154.
64 64
Atividade-proposta 4.4
1. Em cada caso, calcule a variância e o desvio padrão, considerando (i) dados populacionais; (ii)
dados amostrais.
(a) {1, 3, 5, 6, 8, 13};
xi 0 1 2 3 4
(b)
fi 600 310 75 13 2
42 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
2. Calcule o desvio padrão por cálculo direto com os dados originais. Comprove o resultado, usando
o processo breve.
peso(kg) fi xi fi xi fi x2i yi fi yi fi yi2
59 ` 63 3 61
63 ` 67 5 65
67 ` 71 9 69
71 ` 75 12 73
75 ` 79 6 77
79 ` 83 5 81
P P P P P
h=4 = 40
3. Os operários de um setor industrial têm, em uma época 1, um salário médio de 5 salários mínimos
(s.m.) e desvio padrão de 2 s.m. Um acordo coletivo prevê, para uma época 2, um aumento linear de
60%, mais uma parte xa correspondente a 70% de um salário mínimo. Calcule a média e o desvio
padrão dos salários na época 2.
4.6 ASSIMETRIA
(a) (b)
(c)
Atividade-proposta 4.7
4.4
n
1. (a) pop. σ 2 = 14, 67, σ = 3, 83; amostr. s2 = 17, 60, s = 4, 20. Lembrar que s2 = σ 2 . No
n−1
caso, vale s2 = (6/5) 14, 67 = 17, 60.
(b) pop. σ 2 = 0, 4706, σ = 0, 6860.
2.
peso(kg) fi xi fi xi fi x2i yi fi yi fi yi2
59 ` 63 4 244 61 14884 −3 −12 36
63 ` 67 6 390 65 25350 −2 −12 24
67 ` 71 7 483 69 33327 −1 −7 7
71 ` 75 12 876 73 63948 0 0 0
75 ` 79 6 462 77 35574 1 6 6
79 ` 83 5 405 81 32805 2 10 20
2860 205888 93
P
h=4 = 40 −15
√ √
Temos σX = 34, 95 = 5, 92 cm. Alternativamente, pelo processo breve, achamos σY = 2, 184375 =
1, 48 , donde σX = 4σY = 5, 92.
3. Seja Y = 1, 6X + 0, 7 o novo salário. Temos Y = 1, 6X + 0, 70, donde Y = 1, 6 × 5 + 0, 70, ou
Y = 8, 70. Por outro lado, σY = 1, 6σX = 3, 20.
4.7
84 − 76 90 − 82
1. Os escores reduzidos são: zmat = = 0, 8; zf is = = 0, 5. Assim, ocorre uma posição
10 16
relativa mais alta em Matemática.
2. Como σB > σA , vemos que o tipo B tem maior dispersão absoluta. Por outro lado, os coecientes
280 310
de variação são CVA = = 18, 7% e CVB = = 16, 5%, indicando o tipo A como o de maior
1495 1875
variação ou dispersão relativa.
3. Temos X = 4, 70, σ = 2, 39, Q1 = 2, 8 e Q3 = 6, 5. Segue, então:
σ 2, 39
CV = = = 50, 84%;
X 4, 70
IQ = Q3 − Q1 = 6, 5 − 2, 8 = 3, 7
Q3 − Q1 3, 7
VQ = = = 39, 78%
Q3 + Q1 9, 3
46 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
CAPÍTULO 5
PROBABILIDADE
Objetivos do Capítulo 5
(d) Ampliar para o caso de espaços enumeráveis os axiomas de Kolgomorov (casos elementares).
lhantes, apontam para resultados essencialmente idênticos. Por outro lado, os experimentos que,
realizados sob as mesmas condições, produzem resultados geralmente diferentes e não previsíveis, são
desde o sec. XVI, em suas diversas vertentes. O formalismo da mecânica newtoniana, por exemplo,
Exemplo 5.2
Exemplo 5.3
(a) E = {c, k}, onde os eventos elementares são cara (c) e coroa (k);
(e) E = {t ∈ R ; t ≥ 0}.
Exemplo 5.4
1 2 3 4 5 6
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Consideremos a descrição dos seguintes eventos:
E1 : saída de faces iguais = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}
E2 : saída de faces de soma 11 = {(5, 6), (6, 5)
E3 : saída de faces de soma 1 = φ (evento impossível)
E5 : saída de faces onde um número é o triplo do outro = {(1, 3), (3, 1), (2, 6), (6, 2)}.
Exemplo 5.5
Os oito resultados dos 3 lançamentos de uma moeda podem ser indicados em um diagrama de árvore.
c (c, c, c)
c
H k
HH (c, c, k)
c
@ c (c, k, c)
@
@
kHH
H
k (c, k, k)
A c (k, c, c)
A c
A
HH
A H
A k (k, c, k)
k@
A
@ c (k, k, c)
@
kHH
H
k (k, k, k)
48 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
Por exemplo, relativamente ao lançamento de uma moeda equilibrada, a regularidade a longo termo
signica que a proporção de vezes que saiu cara tende a se estabilizar perto do valor 1/2. Observe a
simulação representada no quadro abaixo, em que a frequência relativa se aproxima do valor f = 0, 5.
# lançamentos # caras metade lançamentos(y) |y − x| freq.relativa
100 49 50 1 0,49
Diremos, então, que a probabilidade da saída de cara em qualquer lançamento da moeda vale p = 0, 5.
Um outro exemplo, para ilustrar a tendência numérica da frequência relativa, está resumido no
quadro abaixo, com os resultados do lançamento de um dado 1000 vezes e anotada a face virada para
cima.
face freq. abs. freq. rel.
1 159 15,9%
2 163 16,3%
3 160 16,0%
4 161 16,1%
5 86 8,6%
6 271 27,1%
A construção de Laplace
(a) Há um número nito n ≥ 1 de eventos elementares (casos possíveis ) cuja união é o espaço E ;
(b) Os eventos elementares são igualmente prováveis;
(c) Todo evento A ⊂ E é união de m eventos elementares (casos favoráveis), com m ≤ n.
#A m
Nessas condições, P (A) = = .
#E n
5. Probabilidade 49
5.7 Propriedades
As seguintes propriedades decorrem diretamente da denição anterior.
Exemplos 5.8
1. No lançamento de um dado, ache a probabilidade dos eventos: (i) o resultado é o número 1; (ii) o
Se A = {1}, então P (A) = 1/6. Mesmo valor para B = {2}: p(B) = 1/6. No terceiro caso, temos
C = A ∪ B , donde P (C) = P (A) + P (B) = (1/6) + (1/6) = 1/3, pois A e B são mutuamente
exclusivos. Enm, com D = {3, 4, 5, 6}, temos C ∪ D = E , logo P (C) + P (D) = P (E) = 1, donde
Temos #E = 6 × 6 = 36 e pondo A = {(x, y) ; x + y = 11} = {(5, 6), (6, 5)}, vem #A = 2, donde
2 1
P (A) = = .
36 18
3. Retomando o espaço amostral E do lançamento de uma moeda três vezes (cf. 5.5), indicar a
Sendo A = {(c, c, k), (c, k, c), (k, c, c)}, temos #A = 3. Como #E = 8, vemos que P (A) = 3/8.
4. Numa urna, existem 5 bolas, das quais 3 são vermelhas e 2 são pretas. Duas bolas são retiradas
Para facilitar a identicação dos resultados, suponhamos as bolas vermelhas numeradas 1,2,3; as
bolas pretas serão 4 e 5. O evento A = extrair duas bolas de cores diferentes é formado pelos 12
resultados (1, 4), (1, 5), )(2, 4), (2, 5), (3, 4), (3, 5), (4, 1), (4, 2), (4, 3), (5, 1), (5, 2), (5, 3).
Para caracterizar o total dos casos possíveis, temos de decidir se a amostragem será feita com
reposição ou sem reposição. Ora, no caso com reposição, quando se retira uma bola, verica-se
sua cor e a bola é devolvida à urna, para, só então, prosseguir com a segunda extração. Desse
modo, teremos 5
2 = 25 possibilidades para o espaço amostral. Por outro lado, no caso sem
reposição, obtemos 20 pontos para o espaço amostral, a saber, os 25 resultados menos os 5 pares
(1, 1, ), (2, 2, ), (3, 3), (4, 4), (5, 5) que correspondem à mesma bola. Em denitivo, com reposição:
menina? Supor que a probabilidade de nascimento de sl menino vale 1/2 e que o mesmo valor ocorre
para menina.
O espaço amostral envolve 16 eventos (use um diagrama de árvore para acompanhar a listagem):
{(M M M M ), (M M M F ), (M M F M ), (M M F F ), (M F M M ), (M F M F ), (M F F M ), (M F F F ),
(F M M M ), (F M M F ), (F M F M ), (F M F F ), (F F M M ), (F F M F ), (F F F M ), (F F F F )}. Agora,
para descrever o evento A o casal de 4 lhos só tem uma lha, basta considerar
Atividade-proposta 5.9
1. No lançamento de um dado, calcule a probabilidade da face de cima exibir (a) um número primo;
2. Na extração de uma carta de um baralho de 52 cartas, indique a probabilidade de sair (a) carta
3. Uma moeda é lançada 3 vezes. Indique a probabilidade de obter (a) pelo menos uma cara; (b)
nenhuma cara.
4. Um casal decidiu que vai ter 4 lhos. O que é mais provável: que tenha dois casais, ou três lhos
de um sexo e um do outro?
5. Considere o lançamento de 3 dados, anote cada número exibido na face de cima, e descreva as
possibilidades para que a soma dos pontos seja igual a (a) 9; (b) 10. 0 quadro abaixo resume algumas
(1,2,6) 6 (1,4,5) 6
(1,3,5) 6 (1,3,6) 6
(1,4,4) 3 (2,2,6) 3
6 (2,3,5) 6
(2,2,5) 3 (2,4,4) 3
(3,3,3)
total 25 total
Dado um espaço amostral E , uma função P denida para todos os subconjuntos de E (chamados
eventos) é uma probabilidade se
(a) 0 ≤ P (A) ≤ 1, para todo evento A ⊂ E;
(b) P (φ) = 0, P (E) = 1;
(c) Se A e B são disjuntos (mutuamente exclusivos), então P (A ∪ B) = P (A) + P (B).
Observação 1 É fácil ver que, efetivamente, a reformulação acima generaliza o método de Laplace.
Com efeito, dado qualquer conjunto nito Z = {z1 , . . . , zn }, seja P (zi ) = pi , onde os pi ≥ 0 são
números tais que p1 + · · · + pn = 1. Para cada A ⊂ Z , pondo P (A) a soma dos pi com zi ∈ A, obtemos
Propriedades
(1) P (A) = 1 − P (A)
De fato, temos 1 = P (E) = P (A ∪ A) = P (A) + P (A), donde o resultado.
P (A−B)+P (B −A)+P (A∩B)+P (A∩B), donde a relação pois P (A−B)+P (B −A)+P (A∩B) =
P (A ∪ B).
(5) P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C).
Pratique um pouco. Verique a validade dessa relação, uma ampliação evidente de (4).
Observação 2 Se considerarmos uma coleção nita {A1 , . . . An } de subconjuntos de E, dois a
dois disjuntos (ou mutuamente exclusivos), então, por indução sobre n, podemos vericar que
n n
!
X X
P Ai = P (Ai ), sempre que Ai ∩ Aj = φ (i 6= j ), o que generaliza a relação 5.10(c).
i=1 i=1
Tal igualdade exprime a aditividade nita de P .
Exemplos 5.11
Calcular as probabilidades P (A), P (B), P (C), P (D), P (A ∩ B), P (A ∩ C), P (A ∩ D), P (B ∩ C),
P (B ∩ D), P (A ∩ B ∩ C), P (A ∪ B), P (A ∪ D), P (A ∪ B ∪ C), P (A), P (A ∪ B).
Temos P (A) = 10/34, P (B) = 10/34, P (C) = 7/34, P (D) = 8/34, P (A ∩ B) = 3/34, P (A ∩ C) =
2/34, P (A ∩ D) = 0, P (B ∩ C) = 2/34, P (B ∩ D) = 0, P (A ∩ B ∩ C) = 1/34, P (A ∪ B) = 17/34,
P (A ∪ D) = 18/34, P (A ∪ B ∪ C) = 21/34, P (A) = 24/34 = 1 − P (A), P (A ∪ B) = 31/34 =
1 − P (A ∩ B).
2. Uma moeda foi cunhada de tal forma que é 4 vezes mais provável dar cara (c) do que coroa (k).
Se P (k) = p, então P (c) = 4p; também p + 4p = 1, donde p = 1/5, ou seja P (k) = 1/5 e P (c) = 4/5.
3. Um número entre 1 e 200 é escolhido aleatoriamente. Calcular a probalidade de que seja divisível
por 5 ou por 7.
Sejam A e B os eventos o número é divisível por 5 e o número é divisível por 7; o evento A∩B
signica o número é divisível por 35 (observe que 5 e 7 são primos relativos!).
Há [200/5] = 40 inteiros entre 1 e 200 divisíveis por 5, [200/7] = 28 divisíveis por 7 e [200/35] = 5
divisíveis por 35 (justique o uso da função [ ] maior inteiro!).
4. Uma cidade possui três jornais A, B e C. Uma amostragem de 1000 pessoas revelou o seguinte
perl de assinaturas: A:470, B:420, C:315, A e B:110, A e C:220, B e C: 140, A,B e C: 75. Escolhendo
ao acaso uma pessoa da amostra, calcular a probabilidade de que essa pessoa: (a) não assine nenhum
dos 3 jornais; (b) assine apenas um; (c) assine pelo menos dois jornais.
O diagrama de Venn indica todos os valores que nos interessam. Temos: (a)190 pessoas não assinam
nenhum dos jornais, logo a probabilidade procurada vale 190/1000 = 0, 190. (b) Assinam apenas
1 jornal o total de 215 + 245 + 30 = 490 pessoas, donde a probabilidade 490/1000 = 0, 490. (c)
Assinam dois ou mais jornais o total de assinantes 1000 − 190 = 810 menos os que só lêem 1 jornal:
1 1 1 11
(a) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = + − = ;
2 4 5 20
1 1
(b) P (A) = 1 − P (A) = 1 − = ;
2 2
3
(c) P (B) = ; (verique!)
4
1 1 3
(d) P (A ∩ B) = P (A − B) = P (A) − P (A ∩ B) = − = ;
2 5 10
1
(e) P (A ∩ B = ; (verique!)
20
11 9
(f ) P (A ∩ B) = P (A ∪ B) = 1 − P (A ∪ B) = 1 − = ;
20 20
1 4
(g) P (A ∪ B) = P (A ∩ B) = 1 − P (A ∩ B) = 1 − = .
5 5
6. Dos 148 pacientes internados em um hospital, 18 estão com a gripe AS (8 são mulheres). Dos
dessa pessoa:
H M Total gripe
Gripe 10 8 18
(c) Como há 80 mulheres não gripadas, vemos que 80/148 = 0, 541 é a probabilidade solicitada;
Atividade-proposta 5.12
1. Os metereologistas armam que há uma chance em 5 de chover no próximo domingo. Qual é a
de contrair ambas as doenças é 0, 125, ache a probabilidade da criança ter uma das duas doenças.
3. Um aluno (que não estudou...) deve responder a um teste de três questões do tipo certo/errado.
desse aluno:
(a) acertar as três questões; (b) errar as três questões; (c) acertar pelo menos duas questões.
que sejam sorteados dois números consecutivos, cuja soma seja um número primo.
5. Um grupo de 850 pessoas foi submetido a um teste para vericar o efeito de um antidepressivo em
relação ao enjôo que ele pode provocar nas pessoas. A tabela abaixo resume o resultado da pesquisa.
6. Considere a experiência aleatória que consiste em lançar 2 tetraedros regulares, com as faces
numeradas de 1 a 4, e em anotar a soma dos números das faces voltadas para baixo. O quadro
Resultado 2 3 4 5 6 7 8
(4,2)
1,2,3,4,5 e 6. Escolhido ao acaso um desses números, achar a probabilidade dele conter o algarismo 3
8. A tabela indica as apostas feitas por cinco amigos em relação ao resultado decorrente do lançamento
Para tornar o jogo mais ágil (?!), alguém sugeriu trocar o conectivo ou pelo conectivo e, em cada
aposta. Verique que essa alteração provoca maior redução nas chances de acertar o resultado para
divididos em dois módulos, o de Francês (110 alunos) e o de Inglês (140 alunos), assim distribuídos:
F I Total
H 40 60 100
M 70 80 150
(a) Qual a probabilidade de ser do módulo I (Inglês)? É claro que P (I) = 140/250 = 0, 56
(probabilidade a priori );
(b) Qual a probabilidade de ser do módulo I, dado que é mulher? Essa probabilidade a posteriori,
na realidade, usa a ocorrência do evento I em relação ao espaço amostral reduzido M, ao invés de
Denição
Sejam os eventos A
B num espaço amostral E , com P (A) > 0. A probabilidade condicional
e de B
dado A é o número P (B|A) denido por
P (A ∩ B) (∗) .
P (B|A) = , condição também escrita P (A ∩ B) = P (A) P (B|A)
P (A)
Se P (B) > 0, de modo análogo, temos também P (A ∩ B) = P (B) P (A|B) (∗∗) .
Cada relação assinalada acima é conhecida como Teorema da Multiplicação.
Observação 3 Nos casos de três ou mais eventos, o Teorema da Multiplicação possui a seguinte
generalização.
Se P (A1 ∩ A2 ∩ · · · ∩ An ) 6= 0, então
P (A1 ∩ A2 ∩ A3 ) = P (A3 |(A1 ∩ A2 ))P (A1 ∩ A2 ) = P (A3 |(A1 ∩ A2 ))P (A2 |A1 )P (A1 ).
Observação 4 Pode acontecer, supondo P (A) > 0 ou P (B) > 0, que as probabilidades condicionais
coincidam com as probabilidades calculadas no espaço original, isto é, P (B|A) = P (B) ou P (A|B) =
P (A); nesses casos , vale a relação P (A ∩ B) = P (A) P (B) . Diremos, então, que A e B são eventos
independentes.
Para 3 eventos, a condição de independência supõe que: (a) P (A ∩ B) = P (A)P (B);
(b) P (B ∩ C) = P (B)P (C); (c) P (A ∩ C) = P (A)P (C); (d) P (A ∩ B ∩ C) = P (A)P (B)P (C).
Exemplos 5.14
1. No lançamento de uma moeda 2 vezes, o espaço amostral é E = {cc, ck, kc, kk}. Sejam os eventos
A(o segundo lançamento dá cara)={cc, kc}, B(ambos os lançamentos dão cara)={cc} e C(o primeiro
Temos as probabilidades P (A) = 2/4 = 1/2, P (B) = 1/4, P (C) = 2/4 = 1/2. Calculemos as
probabilidades condicionais:
P (A ∩ C) 1/4
P (A|C) = = = 1/2 =⇒ A e C independentes, pois P (A|C) = P (A);
P (C) 1/2
P (B ∩ C) 1/4
P (B|C) = = = 1/2 =⇒ B e C dependentes, pois P (B|C) 6= P (B).
P (C) 1/2
Alternativamente, vale P (A ∩ C) = P (A)P (C) = (1/2)(1/2) = (1/4), mas P (B ∩ C) 6= P (B)P (C).
2. Consideremos os eventos A e B tais que P (A) = 3/8, P (B) = 5/8 e P (A ∪ B) = 3/4. Calcular as
P (A ∩ B) P (A ∩ B)
P (A|B) = = 2/5 e P (B|A) = = 2/3
P (B) P (A)
3. Sejam A e B eventos tais que P (A) = 0, 2, P (A ∪ B) = 0, 6 e P (B) = x. Calcular x sabendo que
4. A pontuação de dois jogadores, após 120 partidas de xadrez, mostrou que A ganhou 60 partidas,
Pondo P (A) = 60/120 = 1/2, P (B) = 40/120 = 1/3, P (EP ) = 20/120 = 1/6 (ocorrência de em-
pate), temos:
p1 = (1/52)(12/51);
(ii) se a primeira carta é uma dama que não é de copas, então a probabilidade é igual a p2 =
1 12 3 13 1
(3/52)(13/51). Desse modo, o resultado nal é p1 + p2 = + = .
52 51 52 51 52
6. Num curso de nivelamento, 25% dos candidatos não foram aprovados em Matemática, 15% perde-
(a) de que um aluno seja reprovado em Matemática, dado que foi reprovado em Física;
(b) de que um aluno seja reprovado em Física, dado que foi reprovado em Matemática;
7. Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se simultaneamente 3 bolas.
(a) nenhuma seja vermelha; (b) exatamente uma seja vermelha; (c) todas sejam da mesma cor.
independentes.
5. Probabilidade 57
Atividade-proposta 5.15
1. Sejam P (A) = 0, 50, P (B) = 0, 40 e P (A ∪ B) = 0, 70.
(a) A e B são eventos mutuamente exclusivos? Por que?
3. Uma caixa contém 4 válvulas defeituosas e 6 perfeitas. Duas válvulas são extraidas, juntas. Uma
delas é ensaiada e se verica ser perfeita. Qual a probabilidade da outra bola ser perfeita?
4. Um míssil atinge um alvo com a probabilidade de 0, 3. Ache quantos mísseis deverão ser disparados
5. A probabilidade de um aluno A resolver uma questão de prova é 0,80, enquanto que a do aluno B
é 0,60. Calcular a probabilidade de que a questão seja resolvida se os dois alunos tentarem resolvê-la
independentemente.
6. São retiradas duas bolas de uma urna contendo 3 bolas pretas e 5 bolas vermelhas. Determine todos
os resultados possíveis e suas respectivas probabilidades, supondo, para a primeira bola extraída:
Produto C 60 70 130
Universidades A B C
A tabela mostra, por exemplo, que 20% do total dos alunos que zeram o exame eram da universidade
X e tiveram conceito A; 5% eram da universidade Y e tiveram conceito C, e assim por diante. Sabendo-
se que um estudante arbitrariamente selecionado teve conceito A, calcular a probabilidade de que ele
a dois disjuntos e cuja união é o espaço dado) é uma ferramenta poderosa para tratar com a
Exemplo motivador Sabe-se que 80% dos pênaltis marcados a favor do Brasil são cobrados por
Flamengo e de 70%, em caso contrário. Um pênalti a favor do Brasil acaba de ser marcado.
(a) Qual a probabilidade do pênalti ser cobrado por um jogador do Flamengo e ser convertido?
P (F ∩ C) = P (F )P (C/F ) = 0, 8 × 0, 4 = 0, 32
Para resolver (b), observemos que apenas foram dadas as probabilidades condicionais do pênalti
ser convertido, dado que o batedor seja do Flamengo ou não. Somos levados, então, a decompor o
C = (F ∩ C) ∪ (F ∩ C) ,
logo
P (C) = P (F ∩ C) + P (F ∩ C) .
P (F ∩ C) = P (F )P (C|F ) = 0, 8 × 0, 4 = 0, 32;
P (F ∩ C) = P (F )P (C|F ) = 0, 2 × 0, 7 = 0, 14, logo
P (C) = 0, 32 + 0, 14 = 0, 46.
0,4 C F ∩C
F
HH
0,8 F ∩C
0,6H C
H
@ C F ∩C
@ 0,7
0,2 @
@
H
F HH
0,3H
C F ∩C
O diagrama de árvore ilustra o cálculo do produto, uma vez que representa as probabilidades
Caso geral Suponhamos a reunião disjuntaE = A1 ∪A2 ∪· · ·∪An , onde {A1 , A2 , . . . An } é uma par-
tição do espaço amostral E . Para cada evento B ⊂ E , vale B = (B∩A1 )∪(B∩A2 )∪· · ·∪(B∩An ), reu-
nião de eventos mutuamente exclusivos. Então, temos P (B) = P (B∩A1 )+P (B∩A2 )+· · ·+P (B∩An );
Exemplo 5.17
1. Uma determinada peça é manufaturada por 3 fábricas A, B e C, das quais A produz o dobro de
peças que B e as fábricas B e C produzem o mesmo número de peças. Sabe-se que 2% das peças
produzidas por A e B são defeituosas, enquanto 4% das produzidas por C são defeituosas. Todas as
peças produzidas são misturadas e colocadas em um depósito. Uma peça é selecionada aleatoriamente.
(b) Supondo que é defeituosa a peça selecionada, calcule a probabilidade de que tenha sido
se D é o evento que indica que a peça é defeituosa, então P (D|A) = P (D|B) = 2% e P (D|C) = 4%.
Use um diagrama de árvore para acompanhar o cálculo de P (D). Observe que {A, B, C} é
uma partição do espaço amostral.
P (D) = P (A)P (D|A)+P (B)P (D|B)+P (C)P (D|C) = 0, 5×0, 02+0, 25×0, 02+0, 25×0, 04 = 2, 50%
(b) Calculemos P (A|D) usando o Teorema de Bayes.
P (A)P (D|A) 0, 5 × 0, 02
P (A|D) = = = 0, 40 = 40%
P (D) 0, 025
2. Um exame de laboratório tem eciência de 95% para detectar uma doença quando essa doeça
existe de fato. Entretanto, o teste aponta um resultado falso positivo para 1% das pessoas sadias
(b) Dado que o resultado do teste foi positivo, encontrar a probabilidade de que a pessoa tenha a
doença.
Atividade-proposta 5.18
1. Um estudante resolve um teste com questões do tipo verdadeiro-falso. Ele sabe dar a solução correta
para 40% das questões. Quando responde a uma questão cuja solução conhece, ele dá a resposta
correta, e nos outros casos decide na cara ou coroa. Se uma questão foi respondida corretamente,
2. Duas máquinas A e B produzem 3000 peças em um dia. A máquina A produz 1000 peças, das
quais 3% são defeituosas. A máquina B produz as restantes 2000, das quais 1% são defeituosas. Da
produção total de um dia, uma peça é escolhida ao acaso, constatando-se que é defeituosa. Calcular
Exemplo 5.20
Lançando um dado até que a face 4 apareça pela primeira vez, se k indica qualquer outra face, então
o espaço amostral é da forma E = {4, k4, kk4, kkk4, . . .}; as probabilidades associadas usam o caso
uniforme, em cada
2
lançamento, isto é: p1 = 1/6, p2 = (5/6)(1/6), p3 = (5/6) (1/6), ..., cuja soma
vale !
2 2
1 51 5 1 1 5 5 1 1
+ + + ··· = 1+ + + ··· = = 1,
6 66 6 6 6 6 6 6 1 − (5/6)
onde usamos a soma da série geométrica convergente, de razão 0 < (5/6) < 1.
n−1
5 1
Pondo p(n) = , n = 1, 2, 3, . . ., a probabilidade de ocorrência de n lançamentos, podemos,
6 6
por exemplo, calcular a probabilidade do seguinte evento A: os lançamentos terminam após um
Voltando um pouco, releia a Observação 2 de 5.10 sobre a propriedade de aditividade nita. No caso
atual, em que E é innito enumerável, seria desejável uma aditividade para uma coleção enumerável
X X
incorporada por Kolgomorov, explicitando a condição: P Ai = P (Ai ).
i≥1 i≥1
5. Probabilidade 61
5.9
1. (a) P (2, 3, 5) = 3/6 = 1/2;
(b) P (5, 6) = 2/6 = 1/3.
2. (a)P (copas) = 13/52;
(b) P (copas ou espadas) = 13/52 + 13/52 = 1/2.
3. (a) P (pelo menos uma cara) = 1 − P (nenhuma cara) = 1 − P (kkk) = 1 − (1/8) = 7/8
(b) P (nenhuma cara) = P (kkk) = 1/8.
4. São 24 = 16 possíveis sequências para os sexos das crianças. Em 6 dessas congurações, há 2
5. O quadro completo
(1,2,6) 6 (1,4,5) 6
(1,3,5) 6 (1,3,6) 6
(1,4,4) 3 (2,2,6) 3
(2,3,4) 6 (2,3,5) 6
(2,2,5) 3 (2,4,4) 3
(3,3,3) 1 (3,3,4) 3
total 25 total 27
5.12
1. 0,80
P (s ∪ c) = 0, 25 + 0, 50 − 0, 125 = 0, 625=.
3. (a) 0,125; (b) 0,125; (c) 0,5.
4. A soma dos dois resultados (faces) possui valores 2, 3, . . . , 12, dos quais são primos 2, 3, 5, 7, 11;
logo, as possíveis somas de duas parcelas consecutivas são (2,1) ou (1,2); (2,3) ou (3,2); (3,4) ou (4,3);
(5,6) ou (6,5). Assim, há 8 casos favoráveis dentre 36 possíveis: p = 8/36 = 2/9.
5. (a) 420/850 = 0, 494;
(b) 400/850 = 0, 471;
(c) 450/850 + 430/850 − 150/850 = 0, 859;
(d) 120/850 = 0, 141;
(e) 280/850 = 0, 329;
6. Inicialmente, completamos o quadro com os dados do problema.
62 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
Resultado 2 3 4 5 6 7 8
(4,2)
Temos: A = {6, 7, 8}, B = {2, 3, 4, 5, 6, 7}, C = {2, 4, 6, 8}, A ∪ B = {6, 7}, A ∩ B = E . Seguem,
então, as probabilidades:
7. 96/360 = 4/15
8. Com a mudança adotada, Ronaldo cou mais prejudicado que os demais jogadores. (Explique.)
5.15
1. (a) A e B não são mutuamente exclusivos, pois P (A ∪ B) = 0, 70 6= P (A) + P (B) = 0, 90;
(b) P (A ∩ B) = P (A) + P (B) − P (A ∪ B) = 0, 50 + 0, 40 − 0, 70 = 0, 20;
(c) P (A ∩ B) = P (A)P (B) = 0, 20, logo A e B são independentes;
ou (0, 7)
n < 0, 2. Calculando as potências para n = 1, 2, 3, 4, 5, encontramos (0, 7)2 = 0, 49,
PP 6/56 9/64
PV 15/56 15/64
VP 15/56 15/64
VV 20/56 25/64
P (sabe ∩ acerta) 0, 4 · 1
P (sabe|acerta) = = = 4/7.
P (acerta) 0, 4 · 1 + 0, 6 · 0, 5
5. Probabilidade 63
P ∩D (1/3) · 0, 03
P (A|D) = = = 3/5
P (D) (1/3) · 0, 03 + (2/3) · 0, 01
0,03 Def
A
H
1/3
HH
H Perf
0,97
Def
@
@ 0,01
2/3 @
@
H
B HHH
0,09 Perf
64 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
CAPÍTULO 6
FUNÇÕES DE DISTRIBUIÇÃO DE
PROBABILIDADE
Objetivos do Capítulo 6
Na descrição de um evento A⊂E de um espaço amostral E , seus elementos pontos amostrais não
são, necessariamente, variáveis numéricas. Entretanto, na maior parte das vezes, estamos interessados
em associar, a cada pontoa ∈ E , um número real X(a). Ora, essa associação corresponde a uma
função X : E −→ R, cuja imagem X(E) ⊂ R, como vimos adotando, é um conjunto nito ou innito
variável aleatória X.
6. Funções de distribuição de probabilidade 65
EXEMPLO 6.2
P (X)
3/8
1/8
X
0 1 2 3
F (X)
1 r
7/8 r
1/2 r
1/8 r
X
0 1 2 3
66 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
F (x) = 1 se x ≥ xn .
(c) F possui descontinuidade nita em cada ponto x0 onde P (X = x0 ) > 0, sendo contínua à direita
P (X ≤ b) = P (X ≤ a) + P (a < X ≤ b)
P (a < X ≤ b) = P (X ≤ b) − P (X ≤ a)
P (a < X ≤ b) = F (b) − F (a).
(e) F é uma função crescente.
Exemplo 6.4
1. Condideremos uma urna contendo 3 bolas vermelhas e 5 pretas. Retirando três bolas sem reposi-
ção, denimos a variável aleatória X como o número de bolas pretas retiradas. Determinar a função
de distribuição de X.
O quadro abaixo resume os resultados.
dente.
0, se x<1
1/3, se 1≤x<2
F (x) =
1/2, se 2≤x<3
1, se x≥3
Basta lembrar que cada salto nito da função em X =a é probabilidade P (X = a). Daí resulta a
X 1 2 3
Atividade-proposta 6.5
X 0 1 2 3 4 5
P(X) 0 p2 p2 p p p2
(a) Ache p;
(b) Calcule P (X ≥ 4) e P (X < 3).
2. Seja a variável aleatória X, cuja distribuição de probabilidade é dada por:
X p(X)
−5 0, 19
5 0, 02
10 0, 23
15 0, 56
Total 1, 00
(a) Determine analiticamente a função de distribuição acumulada F (x) = P (X ≤ x) e faça seu gráco;
(b) Indique os valores: F (−6), F (0), F (8, 25), F (15, 25);
(b) Use a tabela dada para calcular as probabilidades P (X > 5), P (0 ≤ X < 10);
(c) Refazer o item (b), agora usando as propriedades de F.
(a) A Média (ou o Valor médio) ou a Esperança (matemática) de X, notada E(X) = µ(X) = µ é o
Propriedades
E(a) = a; Var(a)=0
E(aX + b) = aE(X) + b; Var(aX + b) = a
2 Var(X)
2. E(X − µ) = 0;
3. Var(X) = E(X 2 ) − (E(X))2 = E(X 2 ) − µ2
De fato, temos Var(X) = E((X − µ)2 ) = E(X 2 − 2µX + µ2 ),
= E(X 2 ) − E(2µX) + E(µ2 ),
= E(X 2 ) − 2µE(X) + µ2 ,
= E(X 2 ) − 2µ2 + µ2 = E(X 2 ) − µ2 .
Observação. Veja, no exemplo abaixo, a notável simplicação da propriedade 3. para o cálculo da
variância.
EXEMPLO 6.7
1. Calcular a média E(X), a variância σ 2 (X) e o desvio padrão σ(X) da variável X do Exemplo 6.2.
µ(X) = 1, 5;
2 2 2
Var(X) = E(X ) − µ = 3 − 1, 5 = 0, 75;
√
σ(X) = 0, 75 = 0, 866.
Pratique um pouco. Calcule a variância acima, porém usando diretamente a denição.
aparece uma única cara e $1 se não aparece cara. Achar a esperança dos ganhos desse jogador.
Ora, é de 1/4 a probabilidade de ganhar 5$, de 1/2 de ganhar 2$ e de 1/4 para ganhar 1$, donde a
esperança E = 5(1/4) + 2(1/2) + (1/4) = 2, 50 dos ganhos. Quanto o jogador deverá pagar para que
Atividade-proposta 6.8
1. Seja X o número de divisores positivos de um número natural sorteado de 1 a 10. Achar o número
mas, dando uma ou duas caras, a perda é de 2$. Use o resultado esperado desse jogo para decidir se
Para exemplicar as ferramentas que vimos apresentando, passaremos a descrever dois modelos de
distribuições: uma, discreta, será a famosa distribuição binomial; a outra, modelo das distribuições
contínuas, será a distribuição normal de Gauss o que, por si só, aponta para aplicações
possíveis, que chamaremos sucesso (S), com probabilidade p, ou fracasso (F), com probabilidade
Qual a origem do adjetivo binomial? Se você pensou em coecientes binomiais, acertou em cheio!
SS . . . S}F
| {z | F {z
. . . F}
k n−k
formada de k sucessos n−k fracassos. Entretanto, a ordem de ocorrência dos resultados é irrelevante,
dadas as hipóteses de independência que estamos, tacitamente, assumindo. Em outras palavras,
dentren ensaios, queremos selecionar, em qualquer ordem, a ocorrência de k deles (e a não ocorrência
n
k n(n − 1) · · · (n − k + 1)
de n−k deles). Essa escolha é a denição dos números binomiais
k = Cn = k!
.
Em denitivo,
P (X = k) = Cnk pk q n−k , k = 0, 1, . . . , n.
Para destacar que X tem a distribuiçao binomial, de parâmetros n e p, notaremos X ∼ b(n, p).
Propriedades Se X ∼ b(n, p), então
E(X) = np
Var(X) = npq = np(1 − p)
Faremos as respectivas vericações mais tarde, para não interromper o ritmo da discussão.
Exemplo 6.10
1. Em 5 lançamentos de uma moeda, seja X a variável aleatória igual ao número de vezes que ocorre
5
(a) P (X = 2) = 0, 52 0, 53 = 10 × 0, 55 = 0, 3125;
2
5
(b) P (X = 4) = 0, 54 0, 5 = 5 × 0, 55 = 0, 15625;
4
5
(c) 1 − P (X = 0) = 1 − 0, 5 = 0, 96875.
2. Uma prova tem 50 questões, cada uma com 5 alternativas, das quais apenas uma é correta. Se um
aluno responde a esmo as questões da prova, ache a probabilidade desse aluno acertar 20 questões.
cientíca ou um programa numérico, como o EXCEL. No item posterior, com o auxílio da distribuição
3. Numa clínica veterinária, 25% dos animais submetidos a um certo tratamento não sobrevivem;
recentemente, foram tratados 16 animais. Indicando por X o número de não sobreviventes e sabendo
(b) Para acertar o alvo ao menos uma vez, com probabilidade maior do que 2/3, quantas vezes o
Seja X a variável aleatória associada aos acertos e aos erros do atirador; temos X ∼ b(n; 1/4).
(a) Se n = 7, basta considerar as probabilidades
2187 5103
P (X = 0) = q 7 = ( 43 )7 = e P (X = 1) = 7 14 ( 34 )6 =
16384 16384
2187 5103 4547
Vem, então, P (X ≥ 2) = 1 − P (X = 0) − P (X = 1) = 1 − − = .
16384 16384 8192
(b) Para que ocorra P (X ≥ 1) > (2/3) em n tentativas, basta ver que 1 − P (X = 0) > (2/3), ou
n
n 3 1
P (X = 0) < (1/3), isto é, q < (1/3), ou < . Calculando as potências sucessivas de 3/4,
4 3
vemos que o menor n vericando a condição-solução é n = 4, ou seja, o atirador deve atirar 4 vezes.
Atividade-proposta 6.11
1. A equipe A vem apresentando a probabilidade de 2/3 de ganhar suas partidas; essa equipe deverá
(c) 3 ou 4 partidas.
2. Numa família de 6 lhos, em que as probabilidades de nascimento de menino ou menina são iguais
5. Um determinado artigo é vendido em caixa a preço de 20, 00 cada uma; o ritmo da produção
acusa 20% de artigos defeituosos considerando amostras de 25 artigos por caixa. Um comprador
fez a seguinte proposta: escolhe amostras de 25 artigos de cada caixa, e paga conforme artigo(s)
Face aos resultados obtidos, decida se o fabricante deve manter seu preço de 20,00$ por caixa.
O procedimento que usaremos nasceu com o cálculo de áreas sob grácos de funções contínuas via
ser pensado como os retângulos de uma partição de um intervalo conveniente, contendo [1, 5], onde a
soma das áreas dos retângulos, de altura p(xi ) = f (xi ), é uma aproximação para a área sob o gráco
Z 4
de f; assim, por exemplo, P (X = 2) + P (X = 3) + P (X = 4) = P (2 ≤ X ≤ 4) ' f (x)dx.
2
Diremos, então, que X é uma variável aleatória contínua, da qual f é uma função densidade de
probabilidade (f.d.p.). Para a existência da integral, basta supor que f possui um número nito de
descontinuidades em cada intervalo nito de X(E); uma tal classe de funções contempla, na prática,
Contrariamente ao caso discreto, o valor f (x) não indica nenhuma probabilidade de X assumir
o valor isolado x. Na realidade, da denição acima, segue P (X = x0 ) = 0. Assim, só faz sentido em
contínua:
Z +∞
E(X) = µ = xf (x)dx
−∞
Z +∞
Var(X) = (x − µ)2 f (x)dx, ou, também Var(X) = E(X 2 ) − (E(X))2 .
−∞
(2) Função de Distribuição Acumulada
Z x
Ampliando novamente o caso discreto, para cada x ∈ R, denimos F (x) = P (X ≤ x) = f (t)dt
−∞
a chamada função de distribuição acumulada da variável aleatória contínua X.
Valem as propriedades quase as mesmas de 6.3, salvo os novos itens (c) e (d):
EXEMPLO 6.13
1. Distribuição Uniforme
Uma variável aleatória contínua X tem distribuição uniforme de probabilidade no intervalo nito
Essa variável aleatória representa o análogo contínuo dos resultados igualmente prováveis. Também
torna mais precisa a noção intuitiva de escolher ao acaso um ponto em um intervalo [a, b], signicando
que a coordenada X do ponto é uniformemente distribuída sobre [a, b].
6. Funções de distribuição de probabilidade 73
Pratique um pouco!
b
(b − a)2
Z
x b+a
Verique que E(X) = dx = ; também, mostre que Var(X) = .
a b−a 2 12
x
x−a
Z
1
A função de distribuição acumulada de X vale F (x) = dt = , isto é,
a b−a b−a
0 se x < a,
x−a
F (x) = se a ≤ x ≤ b,
b−a
1 se x > b,
Por exemplo, um ponto é escolhido ao acaso no intervalo [0, 20]. Qual a probabilidade de que o ponto
Uma variável aleatória contínua X tem Distribuição Normal de probabilidade se a sua f.d.p. é dada
por:
!2
1 x−µ
1 −
f (x) = √ e 2 σ , para cada x ∈ R.
2π σ
As probabilidades da variável reduzida Z são tabeladas e fornecem (veja o apêndice), por exemplo, a
x0 − µ
probabilidade P (0 ≤ Z ≤ z0 ), onde z0 = .
σ
0 z0 Z
Como a área total é igual a 1, e a curva é simétrica em relação ao eixo vertical z = 0, cada metade
Exemplos 6.15
(a) P (X ≥ X0 ) = 0, 05
X0 − 50
Na tabela, o valor 0, 5 − 0, 05 = 0, 45 corresponde a Z0 = 1, 64, logo 1, 64 = , donde
4
X0 = 56, 56.
(b) P (X ≤ X0 ) = 0, 99
Na tabela, vemos que 0, 5 − 0, 01 = 0, 49 corresponde a Z0 = 2, 32, donde X0 = 59, 28.
4. Num certo concurso, as notas de classicação estão normalmente distribuídas, com parâmetros
µ = 7, 6 e σ = 1, 5. Sabe-se ainda que 16, 6% dos alunos que apresentaram melhores notas receberam
o grau A e 11, 9% dos alunos menos adiantados receberam grau B . Indicar o grau mínimo para
Para achar Z0 P (Z > Z0 ) = 0, 166, vamos considerar P (0 < Z < Z0 ) = 0, 5 − 0, 166 = 0, 334;
tal que
X − 7, 6
na tabela, vemos que Z0 = 0, 97, isto é, = 0, 97, e X = 9, 055 ' 9.
1, 5
Usemos o mesmo raciocínio para P (Z < Z0 ) = 0, 119: observando que 0, 5 − 0, 119 = 0, 381, que
X − 7, 6
corresponde a Z0 = 1, 18, temos −1, 18 = , logo X = 5, 83 ' 5, 8.
1, 5
6. Funções de distribuição de probabilidade 75
Atividade-proposta 6.16
1. Dada X ∼ N (100; 25), isto é, µ = 100 e σ = 5, use variáveis reduzidas convenientes e a tabela
foram 0, 8 e −0, 4. Achar a média e o desvio padrão dos graus desse exame.
σ = 40 unidades/mês. Se a empresa decidir fabricar 700 unidades naquele mesmo mês, encontrar a
probabilidade de não poder atender a todos os pedidos, por estar com a produção completa.
4. As alturas de 10.000 alunos de um colégio têm distribuição aproximadamente normal, com média
n x n−x
Consideremos n ensaios binomiais, X ∼ b(n; p) e P (X = x) = p q , x = 0, 1, . . . n.
x
Um teorema fundamental (O Teorema do Limite Central) garante que, para valores de n suciente-
mente grandes, a distribuição binomial b(n; p) está muito próxima da distribuição normal de média
√
µ = np e desvio padrão σ = npq . Observe o histograma binomial abaixo, cuja área é próxima de
uma normal!
tínua normal exige alguns cuidados com os pontos extremos dos intervalos considerados. A acurácia
Exemplos 6.18
caras, considerando:
(b2) Com a correção de continuidade, calcularemos (atenção!) P (X > 20, 5) = P (Z > 2, 0083)
Usando Z0 ' 2, 01, vem 0,4778, logo 0, 5 − 0, 4778 = 0, 0222; assim, P (X > 20, 5) = 0,0222 .
Comparando os resultados obtidos, observe que a aproximação normal com correção é, de fato, muito
dentro das especicações para as quais foi projetado. Uma amostra de 1000 desses itens é escolhida
ao acaso e os itens são testados, obtendo-se 30 defeituosos. Calcule a probabilidade de se obter pelo
1. Uma prova tem 50 questões, cada uma com 5 alternativas, das quais apenas uma é correta. Se
um aluno responde a esmo as questões da prova, encontre a probabilidade desse aluno acertar 20
questões. Use uma distribuição normal conveniente para aproximar a binomial X ∼ b(50, 1/5), e
estimar a probabilidade P (X = 20), isto é, P (19, 5 < X < 20, 5). Cf. o Exemplo 6.10(2).
2. De um lote de produtos manufaturados, extraímos 100 itens ao acaso; se 10% dos itens do lote
6.5
6.8
dade (2/8). Os demais 6 resultados comparecem com probabilidade 6/8, donde a esperança
6.11
(b) Como q 4 = 1/81 representa derrota nas 4 partidas, vitória em pelo menos uma vale 1−q 4 = 80/81.
(c) Vitória em 3 ou 4 partidas:
4
(2/3)3 (1/3) + (2/3)4 = 32/81 + 16/81 = 16/27
P (3 vit ou 4 vit) = 3
3. p = 1/5 = 0, 2
78 Introdução à Estatística [Ana Paula Marques & Antonio Carlos]
P (X = 0) = q 25 = 0, 8025 = 0, 00378
P (1 ≤ X ≤ 2) = P (X = 1) + P (X = 2) = 0, 02361 + 0, 07084 = 0, 09445
P (X ≥ 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2)) = 0, 90177
Se Y representa o pagamento por caixa do consumidor, temos
Y P(Y) YP(Y)
Segue, então que E(Y ) = 10, 72 é o preço médio por caixa da proposta do comprador. Logo, o
6.16
20
(0, 2)10 (0, 8)30 = 0, 000612.
1. Como vimos, o resultado exato é P (X = 20) = 50
P (19, 5 < X < 20, 5) = P (3, 359 < Z < 3, 713) = 0.4999 − 0.4995 = 0, 0004.
2. Mesmo raciocínio do problema anterior.
100
(0, 1)12 (0, 9)88 = 0, 0989
(a) P (X = 12) = 12
√
(b) Aproximação da normal: µ = np = 10 e σ= npq = 3
P (11, 5 < X < 12, 5) = P (0, 5 < Z < 0, 83) = 0, 2967 − 0, 1915 = 0, 1052.
REFERÊNCIAS BIBLIOGRÁFICAS
ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística aplicada. São
CRESPO, Antônio Arnot. Estatística fácil. 17. ed. São Paulo: Saraiva, 2002.
LAPPONI, Juan Carlos. Estatística usando Excel. 4. ed. Rio de Janeiro, Elsevier, 2005.
LARSON, Ron & FARBER, Betsy. Estatística aplicada. 2. ed. São Paulo: Pearson Prentice Hall,
2007.
MORETTIN, Pedro Alberto & BUSSAB, Wilton. Estatística básica. 6. ed. São Paulo: Saraiva,
2010.
NIVEN, Ivan. Mathematics of Choice. Random House, The L.W.Singer Company. New York,
SILVA, Paulo Afonso Lopes. Probabilidades & estatística. Rio de Janeiro, Reichmann & Afonso
Editores, 1999.
SPIEGEL, Murray R. Estatística. 3. ed. São Paulo: Makron Books, 1993 (Coleção Schaum).
Introdução à Estatística Ana Paula / Antonio Carlos