Você está na página 1de 41

Estudo dirigido – Estatística básica

Conteúdo
Unidade 1

• Conceitos básicos em estatística: população, amostra, variável e classificação de variáveis;


• Amostragem: motivos que levam a selecionar uma amostra, conceito de amostra representativa, margem de
erro, descrição das técnicas usuais de amostragens. Diferença entre técnicas de amostragem probabilística e
não probabilística;
• Construção e interpretação de tabelas de frequência: frequência absoluta, frequência relativa, frequência
acumulada absoluta e frequência acumulada relativa;
• Construção e interpretação de histogramas e Ogiva de Galton;
• Interpretação do gráfico básicos: barras, setores, dispersão;
• Interpretação do gráfico ramo-e-folha;
• Interpretação do gráfico de caixas (box plot).

Unidade 2

• Cálculo e interpretação das medidas estatísticas usuais: média, mediana, moda, quartil, percentil, variância,
desvio padrão, coeficiente de variação (CV) e coeficiente de assimetria (AS) para dados individuais;
• Cálculo das medidas estatísticas usuais para dados agrupados em tabelas de frequência com classe;
• Cálculo das medidas estatísticas usuais para dados agrupados em tabelas de frequência sem classe;
• Calcular média, mediana e desvio-padrão dos dados dispostos em um gráfico: barras, histograma e ramo-e-
folha;
• Forma de distribuição dos dados: simétrica, assimétrica à esquerda/direita. Intensidade do grau da
assimetria;
• Correlação linear: Construir e analisar o diagrama de dispersão. Calcular a covariância e o coeficiente de
correlação de Pearson, analisar o sentido e o grau da intensidade da correlação.

Unidade 3

• Conceitos básicos: experimento aleatório, espaço amostral, retirada com e sem reposição, diagrama em
árvore e diagrama de Venn;
• Conceito básico de conjuntos: união, interseção, complemento de eventos, eventos disjuntos, eventos
mutuamente excludentes e eventos independentes;
• Cálculo de probabilidade: regra da adição P(A ou B), da multiplicação P(A e B) e do complemento, P(Ac);
• Probabilidade condicional P(A | B) = probabilidade de A ocorrer, dado que B ocorreu;
• Probabilidade para eventos independentes: P(A e B) = P(A)*P(B);
• Critério para verificar se os eventos são independentes
 P(A e B) = P(A)*P(B) ou
 P(A) = P(A | B) ou
 P(B) = P(B | A)

Unidade 4

• Variáveis aleatórias: definição, tipos e valor esperado;


• Valor esperado E(X), variância Var (X) e desvio-padrão DP(X) de variável aleatória discreta;
• Distribuição de probabilidade discreta: modelo binomial;
• Distribuição de probabilidade contínua: modelo normal;
• Uso da tabela norma padrão REDUZIDA;
• Aproximação normal para binomial.

Bons estudos e boa prova!


Prof. José Aguinaldo - Estatística Básica - 1
Unidade 1
Na unidade 1, vimos alguns conceitos necessários em um curso introdutório em estatística. Reveja
a definição de população e amostra e a relação deles com o parâmetro e estatística. Veja o conceito
de variável e como ela pode ser classificada.

Use a classificação que você aprendeu no texto da unidade 1 disponibilizado no ambiente virtual. A
classificação apresentada no livro do Larson e Farber é outra forma de classificar, que no fundo, é
muito parecida com a que usamos no material de apoio.

Veja se você aprendeu...

As duas variáveis abaixo foram retiradas do questionário da PNAD (Pesquisa Nacional por
Amostra de Domicílios). Como você classificaria estas variáveis (qualitativa nominal,
qualitativa ordinal, quantitativa contínua ou quantitativa discreta)?

Figura 1

Uma amostra bem selecionada é crucial na estatística. Leia mais sobre o que é uma amostra
representativa, margem de erro e os métodos de amostragem aleatória (aleatória simples,
aleatória sistemática, aleatória estratificada e aleatória por conglomerado).

Nesta unidade 1, optei por mostrar apenas uma fórmula para calcular o tamanho da amostra, já que
era preciso de alguns conceitos que você só iria ver na unidade 2.

Prof. José Aguinaldo - Estatística Básica - 2


Veja se você aprendeu...

Uma amostra aleatória simples precisa ser retirada de uma população de peixes de certa
espécie que vive em um lago. O objetivo é estimar a proporção de peixes que estão com
comprimento ideal para comercialização. Qual deveria ser o tamanho da amostra (n) de
forma a garantir uma margem de erro de ± 4% nesta estimativa? E se a população neste
lago fosse estimada em 1000 peixes, qual deveria o tamanho desta amostra?

Resp: n = 625 peixes n = 385 peixes

Cada método de amostragem aleatória tem suas vantagens e desvantagens e eles não são usados
de forma isolada na prática. Eles são combinados e usados de acordo com a complexidade da
população. Veja no site do IBGE (www.ibge.gov.br) as metodologias das diversas pesquisas
realizadas pelo instituto.

Em uma amostra aleatória estratificada devemos distribuir (alocar) o tamanho da amostra para cada
estrato. Há algumas formas disto ser feito, o que aprendemos na unidade 1 foi alocação
proporcional. O que significa isto?

Bem, significa que se, em um estrato, temos 30% da população, então neste estrato também
devemos ter cerca de 30% da amostra. Leia na unidade 1, como deve ser feita a alocação
proporcional da amostra.

Veja se você aprendeu...

Um estudo deve ser realizado em uma acidade com doze mil adultos. Estes adultos foram
estratificados em quatro grupos segundo a renda familiar. No primeiro estrato ficaram
3.600 adultos, no segundo 4.800, no terceiro 2.400 e no quarto 1.200. Se uma amostra de
150 adultos deve ser selecionada, qual deveria ser o tamanho da amostra em cada estrato?

RESP: 45, 60, 30 e 15

Prof. José Aguinaldo - Estatística Básica - 3


Tabela de frequência sem classe

Uma forma de resumir os dados obtidos a partir de um estudo é através de tabelas de frequência.
Estas tabelas podem mostrar a frequência de cada valor individual (ou seja, quantas vezes um valor
apareceu) ou a frequência de valores dentro de um intervalo (classe).

Relembre na unidade 1 como é construída uma tabela de frequência sem classe e uma tabela de
frequência com classe e como são obtidas a frequência absoluta simples (f), frequência relativa
simples (fr), frequência absoluta acumulada (F) e a frequência relativa acumulada (Fr).

Veja se você aprendeu...

Abaixo temos o número de faltas no último mês para uma amostra de 16 funcionários de
uma pequena empresa. Crie uma tabela de frequência sem classe para o número de faltas.
Use a frequência absoluta simples (f) a frequência relativa simples (fr).

0, 5, 3, 1, 0, 2, 0, 1, 3, 2, 0, 3, 0, 1, 2, 2

Tabela 1
Frequência Frequência
Faltas absoluta relativa
f fr
0
1
2
3
4
5

Quais são os valores da frequência absoluta simples (f) e da frequência relativa simples (F)
da terceira linha?

RESP: 4 e 0,25 (ou 25%)

Prof. José Aguinaldo - Estatística Básica - 4


Tabela de frequência com classe

Ao construir uma tabela de frequência com classe, a notação A |-- B significa que devemos contar a
quantidade de valores que estão no intervalo de A (incluído) a B (não incluído).

Veja se você aprendeu...

Os dados abaixo se referem ao número de gols dos artilheiros nas últimas edições da copa
do mundo promovida pela FIFA. Complete a tabela de frequência usando a frequência
absoluta simples (f), frequência relativa simples (fr), frequência absoluta acumulada (F) e
frequência relativa acumulada (Fr). Quais são os valores da frequência absoluta simples (f)
e da frequência absoluta acumulada (F) da classe com maior frequência?

5 5 8 6 6 6 6 6 6 7 10 9 5 13 11 9 8 5 8

Tabela 2
Gols f fr F Fr
4 | 6
6 | 8
8 | 10
10 | 12
12 | 14

RESP: 7 e 11

Prof. José Aguinaldo - Estatística Básica - 5


Histograma e Ogiva de Galton

Um dos principais gráficos usados para distribuição de frequência com classe é o histograma e a
Ogiva de Galton. Releia sobre este conteúdo na unidade 1 e, caso ainda tenha dúvidas, recorra ao
livro do Larson.

Veja se você aprendeu...

Os dados abaixo se referem ao número de gols dos artilheiros nas últimas edições da copa
do mundo promovida pela FIFA.

5 5 8 6 6 6 6 6 6 7 10 9 5 13 11 9 8 5 8

Construa um histograma e uma Ogiva de Galton para o número de gols feitos. Use as
classes iniciando em 4 e indo até 14 com amplitude de 2, ou seja, 4 |-- 6, ..., 12 |-- 14.

Gráfico 1

Ao estudar um histograma é importante saber que um dos eixos é a variável e o outro eixo é a
frequência absoluta ou a frequência relativa. Veja qual das frequências está sendo usada (absoluta
ou relativa). Cada coluna no histograma é uma classe (ou intervalo) e a altura dele é a frequência.

Explore o histograma, dizendo qual é a forma de distribuição dos dados (simétrica, assimétrica a
direita ou assimétrica à esquerda), quantas classes há no histograma, qual é a amplitude de cada
classe, qual a classe com menor ou maior frequência e qual o limite inferior e superior desta classe.

Prof. José Aguinaldo - Estatística Básica - 6


Interpretando o histograma

Veja se você aprendeu...

Uma psicóloga infantil registrou a idade das crianças atendidas por ela no último mês. O
histograma abaixo mostra a distribuição destas idades, onde o eixo vertical representa a
quantidade de crianças.

Gráfico 2

Analisando o histograma, complete abaixo:

Este histograma tem ______ classes, com amplitude de ______ anos. A classe com maior
frequência tem limite inferior e superior igual a ______ anos e ______ anos,
respectivamente. Deste grupo, ______crianças têm no mínimo 10 anos, o que
corresponde a ______%. Observando este histograma, pode-se dizer que a forma de
distribuição das idades é _____________________________. Considerando que este
grupo possa ser considerado uma amostra representativa de uma população com 500
crianças, o número esperado de crianças atendidas nesta população com 10 anos ou mais
é igual a ______ crianças.

RESP: 5, 2, 6 e 8, 3, 15%, 75

Prof. José Aguinaldo - Estatística Básica - 7


Unidade 2
As medidas estatísticas como a média, mediana, percentis e desvio-padrão são usadas na
caracterização de um conjunto de dados. Se seu interesse é verificar se uma máquina está
produzindo peças com diâmetro certo, você seleciona uma amostra de peças e calcula a média
destes diâmetros. A média é uma medida de tendência central (MTC) assim como a mediana e a
moda. Há também outras médias como a média ponderada, média geométrica e média harmônica.

Agora, se você percebe que a máquina está produzindo peças com diâmetros bem diferentes do
valor certo e para ver se esta variação está em um nível aceitável, você deveria usar uma medida
de variabilidade como o desvio-padrão. Além do desvio-padrão, temos também a amplitude, a
variância e o coeficiente de variação.

Para fechar o grupo das medidas estatísticas, temos as medidas separatrizes (medidas de posição
não central) que são os percentis, quartis e decis.

Veja na unidade 2 como cada uma destas medidas é calculada, refaça os cálculos dos exemplos
resolvidos para você “perceber” onde está a sua dificuldade. Lembre-se de que os dados podem
estar individualizados (dados brutos) ou estar em uma tabela de frequência (sem classe ou com
classe).

Vamos começar com as medidas estatística para dados individuais ...

Medidas estatísticas para dados individuais

Veja se você aprendeu...

Os dados a seguir representam o número de erros tipográficos em uma amostra de


dezesseis páginas escolhidas ao aleatoriamente de um livro

5, 0, 0, 0, 3, 0, 0, 1, 2, 1, 3, 1, 2, 2, 2, 3

a) Calcule a média, a mediana, a moda, a variância, o desvio-padrão e o coeficiente de


variação do número de erros para esta amostra.
b) Usando índice de assimetria de Pearson, qual é a forma de distribuição dos dados.
c) Se estes dados vêm de uma amostra representativa de um livro com 440 páginas,
qual o total esperado de erros neste livro?

RESP: (a) 1.56, 1.5, 0, 2.13, 1.46, 93,3% (b) 0,13 moderada assimetria a direita (c) 625

Prof. José Aguinaldo - Estatística Básica - 8


Releia as propriedades da média e desvio-padrão e entenda que multiplicar e/ou dividir cada valor
de um conjunto de dados por uma constante, faz com que média e o desvio-padrão também fique
multiplicada e/ou dividida por esta constante. Por outro lado, somar e/ou subtrair uma constante
de cada valor, faz com que apenas a média fique somada e/ou subtraída desta constante. O valor
do desvio-padrão fica inalterado.

Veja se você aprendeu...

Volte aos dados do exercício anterior sobre o número de erros. Usando apenas as
propriedades da média e desvio-padrão, qual será a média, o desvio-padrão, a variância e
o coeficiente de variação para cada situação abaixo.

Situação 1: Cada número de erro acima foi acrescido do valor oito: 13, 8, 8, ..., 11

Situação 2: Cada número de erro acima foi multiplicado pelo valor cinco: 25, 0, 0, ..., 15

RESP: (1) 9.56, 1.46, 15.3% (2) 3.12, 2.92, 93,3%

Prof. José Aguinaldo - Estatística Básica - 9


Gráfico de caixa

O diagrama de caixa, também chamado de box plot, é um gráfico que usa os quartis na sua
construção. Veja novamente, na unidade 2, a parte que explica sobre o box plot, percentil e quartil.
Lembre-se que o 1º quartil (q1) separa os 25% menores valores dos demais, o segundo quartil (q2)
é igual a mediana e o terceiro quartil (q3) separa os 25% maiores valores dos demais.

Não se preocupe com a construção do box plot e sim se deve interpretá-lo, prestando muita atenção
onde fica localizado os três quartis (q1, q2 e q3), se há ou não valores atípicos (outliers) e como
avaliar a “forma” da distribuição dos dados (assimétrico esquerdo/direito ou simétrico) olhando
apenas a posição da linha que corresponde ao q2 dentro da caixa.

Veja se você aprendeu...

O gráfico de caixa abaixo mostra o tempo de atendimento (em minutos) para os caixas de
um supermercado antes e após o treinamento. Qual o valor aproximado do primeiro quartil
do tempo antes do treinamento? E o valor do terceiro quartil do tempo depois do
treinamento? E a mediana do tempo antes e depois do treinamento?

Gráfico 3

RESP: 14, 12.2, 16 e 10 minutos

Prof. José Aguinaldo - Estatística Básica - 10


... outras médias

A média ponderada dos valores leva em consideração os pesos de cada valor ao calcular a média.
Veja na unidade 2 como é feito o cálculo da média ponderada.

Veja se você aprendeu...

O preço de fechamento de um ativo é o último preço em que ele foi negociado numa
sessão. Abaixo temos os preços de fechamento nos últimos seis dias, sendo o último valor
o mais recente.

30, 35, 41, 28, 45, 38

Calcule a média destes preços, ponderadas pelos respectivos pesos: 1, 2, 3, 4, 5 e 6.

RESP: 37.52

A média simples e média ponderada são as mais comuns, mas em algumas situações é preciso usar
outros tipos de médias, como por exemplo, a média geométrica e média harmônica.

Veja se você aprendeu...

O IDH (Índice de Desenvolvimento Humano) é um indicador de quão desenvolvida está uma


região. O IDH é uma média geométrica a partir de três outros indicadores relativos a
Expectativa de vida ao nascer, Educação e Renda. Supondo que para uma região, os valores
para estes três indicadores são, respectivamente, 0,837 e 0,589 e 0,535, calcule o IDH desta
região.

RESP: 0,641

Veja se você aprendeu...

Um motorista realizou o trajeto de ida e volta entre as cidades A e B na parte da manhã com
velocidade média de 95 km/h na ida e 100 km/h na volta e novamente à tarde fez o mesmo
trajeto, tendo uma velocidade média de 90 km/l na ida e 120 km/l na volta. Qual a velocidade
média deste motorista para realizar todo o percurso nestas viagens? Use a média harmônica
entre as quatro velocidades (80, 100, 90, 120).

RESP: 100,07

Prof. José Aguinaldo - Estatística Básica - 11


Agora, vamos ver as medidas estatística para dados agrupados em tabelas ...

Medidas estatísticas para tabela de frequência sem classe

Em uma tabela de frequência sem classe, você não pode esquecer das frequências (contagens) de
cada valor da variável. A tabela 3 é um exemplo de tabela de frequência sem classe. Nela, temos a
quantidade de faltas para um grupo de 16 funcionários. A variável de interesse está na primeira
coluna (faltas) e a segunda coluna mostra a quantidade de funcionários. Temos cinco funcionários
com zero falta, três funcionários com apenas uma falta e assim por diante.

Tabela 3
Faltas Frequência
0 5
1 3
2 4
3 3
4 0
5 1

Neste tipo de tabelas é comum o aluno calcular a média de faltas assim

0+1+2+3+4+5
é = ERRADO
6

A mediana também costuma ser calculada errada pelo aluno que ordena apenas os valores da
primeira coluna, esquecendo-se das frequências de cada um na segunda coluna. Usando apenas os
valores da primeira coluna, a mediana seria (erradamente) igual a 2.5 (= média dos dois valores
centrais 2 e 3).

0, 1, 2, 3, 4, 5 mediana = 2.5 - ERRADO

Você tem de lembrar que são cinco valores 0, três valores 1, quatro valores 2, e assim
sucessivamente. Uma forma fácil de calcular as mediadas estatísticas é “expandir” os valores da
tabela de frequência, replicando cada valor de acordo com a sua frequência. Os dados da tabela 3
ficaria assim:

0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 5

Prof. José Aguinaldo - Estatística Básica - 12


Veja se você aprendeu...

A tabela a seguir mostra a distribuição do número de faltas no último mês para uma amostra
de dezesseis funcionários de uma pequena empresa.

Faltas Frequência
0 5
1 3
2 4
3 3
4 0
5 1

Calcule a média, a mediana, a moda e o desvio-padrão do número de faltas.

RESP: 1.56 ; 1.5 ; 0 ; 1.46

Prof. José Aguinaldo - Estatística Básica - 13


Medidas estatísticas para tabela de frequência com classe

Em tabela de frequência com classe, você deve primeiro calcular o ponto médio de cada classe da
sua variável antes de calcular a média, a variância e o desvio-padrão. A tabela 4 é um exemplo de
dados agrupados em tabela de frequência com classe. Nela, a variável de interesse é o salário (na
primeira coluna) e quantidade de pessoas (frequência) na segunda coluna. Quatro pessoas têm
salários no intervalo de 4 mil a menos de 6 mil reais, sete pessoas têm salários de 6 mil a menos de
8 mil reais e assim por diante.

Tabela 4
Salário Frequência
4 | 6 4
6 | 8 7
8 | 10 5
10 | 12 2
12 | 14 1

Para calcular a média, a variância e o desvio-padrão dos salários será necessário primeiro calcular o
ponto médio de cada classe (somar os limites inferior e superior e dividir a soma por dois). A
sugestão aqui, é acrescentar mais uma coluna para colocar estes pontos médios: 5, 7, 9, 11 e 13

Fique atento para não cometer os erros que citei na tabela 3, onde as frequências de cada valor não
são levadas em consideração.

5 + 7 + 9 + 11 + 13
é = =9 ERRADO
5

5, 6, 7, 9, 11, 13 mediana = 9 ERRADO

Veja na unidade 2, como se calcula a média, a variância e o desvio-padrão dos dados agrupados em
tabela de frequência com classe. Uma sugestão é criar, além de uma coluna com os pontos médios
(PM) de cada classe, outra coluna com o produto PM x Freq e outra com o produto PM2 x Freq e
partir da soma destas duas colunas, calcular a média amostral e a variância amostral (s2). As
fórmulas seriam estas:

∑  ∑   − !∑"


̅ =  =

onde x = ponto médio !PM"
∑ ! − 1"

Veja na unidade 2 as demais fórmulas para a mediana e a moda.

Prof. José Aguinaldo - Estatística Básica - 14


Veja se você aprendeu...

Os dados abaixo se referem aso salários, em mil reais, para uma amostra de dezenove
pessoas com curso superior.

Idade Frequência
4 | 6 4
6 | 8 7
8 | 10 5
10 | 12 2
12 | 14 1

Calcule a média, a mediana, a moda e o desvio-padrão dos salários destas pessoas.

RESP: 7.84 mil ; 7.57 mil ; 7.20 mil ; 2.24 mil

Prof. José Aguinaldo - Estatística Básica - 15


Medidas estatísticas a partir de um histograma

O gráfico 4 mostra o histograma do tempo de estudos para uma amostra de dezesseis funcionários
de uma empresa. Três funcionários estudaram de 4 a 6 anos e assim por diante.

Gráfico 4

Para calcular as medidas estatísticas, fica mais fácil se você colocar as informações do gráfico em
uma tabela com classe, como mostrado a seguir, e depois calcular as medidas estatísticas que
precisam (como vimos antes).

Tempo Frequência
4 | 6 3
6 | 8 6
... ...

Prof. José Aguinaldo - Estatística Básica - 16


Veja se você aprendeu...

O histograma abaixo mostra a distribuição do tempo de estudo para uma amostra de 16


funcionário de uma empresa, onde o eixo vertical representa a quantidade de
funcionários.

Calcule a média, a mediana, a moda, a variância e o desvio-padrão do tempo de estudos


destes funcionários.

RESP: 8 ; 7.67 ; 7.2 ; 5.33 ; 2.31

Prof. José Aguinaldo - Estatística Básica - 17


Medidas de assimetria

São medidas que nos permitem descrever a “forma” como os dados se distribuem (simétrica ou
assimétrica esquerda/direita) bem como quantificar o grau de assimetria. Veja no material de apoio
a escala que usamos para dizer se a assimetria é forte ou fraca.

O indicador mais comum de assimetria é o coeficiente de assimetria de Pearson

3 !é − /"
. =
/01 23ã1

Se o módulo do valor de As, for no mínimo 1, então temos uma forte assimetria para direita (As
positivo) ou para esquerda (As negativo).

Veja se você aprendeu...

Calcule o coeficiente de assimetria de Pearson para o tempo de estudos mostrado no


histograma abaixo.

RESP: As = 0,43 → moderada assimetria a direita (ou assimetria positiva)

Prof. José Aguinaldo - Estatística Básica - 18


Covariância e Correlação linear

A covariância e coeficiente de correlação de Pearson são medidas usadas para verificar o tipo e o
grau da relação que há entre duas variáveis numéricas. Das duas medidas, daremos preferência em
usar o coeficiente de correlação de Pearson (rxy), por se tratar de uma medida que não depende das
unidades das variáveis. Releia o material sobre o coeficiente de correlação de Pearson no ambiente
virtual e também na unidade 9.1 do livro do Larson e Farber.

O quadro a seguir fornece um guia para interpretar a intensidade da correlação entre as variáveis.

Valor de 356 (+ ou -) Interpretação


De 0.0 a menos de 0,2 Correlação linear muito fraca
De 0.2 a menos de 0,4 Correlação linear fraca
De 0.4 a menos de 0,7 Correlação linear moderada
De 0.7 a menos de 0,9 Correlação linear forte
De 0.9 a menos de 1.0 Correlação linear muito forte
Igual a 1,0 Correlação linear perfeita

 ∑ 7 − !∑  ∑ 7"
356 =
8 ∑   − !∑ " ∙ 8 ∑ 7  − !∑ 7"

Veja se você aprendeu...

A tabela abaixo mostra a escolaridade dos filhos (X) e a escolaridade média dos pais (Y)
para uma amostra de oito indivíduos. A escolaridade é obtida como o número de anos de
estudo. Existe correlação entre o nível de escolaridade dos filhos e o nível de escolaridade
médio dos pais?

Calcule o coeficiente de correlação de Pearson entre as variáveis Y e X e descreva o tipo


de correlação que há entre elas.

Tabela 5
X Y
0 2
0 3
2 2
3 5
4 9
4 8
5 8
7 15

RESP: rxy = +0,93. Há uma forte correlação positiva entre os níveis de escolaridade de pais
e filhos.

Prof. José Aguinaldo - Estatística Básica - 19


Unidade 3
A unidade 3 aborda os conceitos básicos de probabilidades. Lembre-se, a probabilidade é um
número que SEMPRE deve estar no intervalo de [0 ; 1] e ela mede o quão provável é o resultado de
um evento. Probabilidade próxima de 1 indica um resultado muito provável e probabilidade próxima
de 0 indica que o resultado é pouco provável de ocorrer. Para calcular as probabilidades, podemos
usar três abordagens: clássica, frequentista e a subjetiva. Vamos nos concentrar nas duas primeiras.
Reveja o material que estão no ambiente virtual e no capítulo 3 do livro do Larson e Farber.

Veja se você aprendeu...

A probabilidade de chover amanhã é:

a) / G b) 5/2 c) 2/5 d) π

R: “c”

Na abordagem clássica, a probabilidade do evento A ocorrer é dada por:

!." no. de resultados favoráveis ao evento .


:!." = =
!;" no. de resultados possíveis no espaço amostral ;

Veja se você aprendeu...

Uma urna contém três bolas brancas e seis vermelhas. Retirando uma bola ao acaso, qual é
a probabilidade de sair uma bola vermelha?

RESP: 0,6667

Prof. José Aguinaldo - Estatística Básica - 20


Veja se você aprendeu...

Um jogo consiste em lançar duas vezes um dado não viciado. O jogador A escolhe faces iguais
e o jogador B escolhe soma de as faces ser no mínimo dez. Qual destes jogadores têm maior
chance de ganhar?

RESP: Nenhum, pois as chances são as mesmas (= 0,1667)

Veja se você aprendeu...

Dez fichas numeradas de 1 a 10 são misturadas em uma caixa. Se duas fichas são extraídas
da caixa, sucessivamente e sem reposição, qual é a probabilidade de a soma ser 10?

RESP: 4/45 = 0,0889

Na abordagem frequentista, a probabilidade do evento A ocorrer é dada por:

I Número de vezes que A ocorreu


:!." H =
 Número repetições do experimento

Veja se você aprendeu...

A tabela abaixo mostra a quantidade de peças com defeito que vieram de cada fornecedor
(A, B e C). Se uma peça é escolhida ao acaso, determine a probabilidade:

a) da peça ser defeituosa?


b) da peça ser defeituosa e ter vindo do fornecedor A?

Fornecedor
Peça com defeito
A B C
Sim 52 20 12
Não 448 380 288

RESP: a) 0,07 b) 0,043

Prof. José Aguinaldo - Estatística Básica - 21


Probabilidade condicional

É a probabilidade de um evento ocorrer, sabendo que um outro evento já ocorreu. Neste caso, o
“novo” espaço amostral é formado pelos resultados que estão apenas no primeiro evento que já
ocorreu.

Definição: Sejam A e B dois eventos no espaço amostral S, a probabilidade condicional de A dado


que ocorreu o evento B, é representado por P!A | Q"

!. ∩ Q" ú/31 / 3/STU1 V1S /U3/ . / Q


P!A | Q" = =
!Q" ú/31 / 3/STU1 / Q

ou

:!. ∩ Q"
P!A | Q" =
:!Q"

Veja se você aprendeu...

Seleciona duas sementes, ao acaso, uma a uma e sem reposição de uma sacola que contém
10 sementes de flores vermelhas e 5 de flores brancas. Qual é a probabilidade de que:

a) a primeira semente seja vermelha?


b) a segunda seja branca sabendo que a primeira foi vermelha?

RESP: a) 0,6667 b) 0,3571

Prof. José Aguinaldo - Estatística Básica - 22


Veja se você aprendeu...

A tabela abaixo mostra a quantidade de peças com defeito que vieram de cada fornecedor
(A, B e C). Se uma peça é escolhida ao acaso, determine a probabilidade:

a) da peça ser defeituosa, sabendo que é do fornecedor A.


b) da peça ser do fornecedor A, sabendo que é defeituosa.

Fornecedor
Peça com defeito
A B C
Sim 52 20 12
Não 448 380 288

RESP: a) 0,104 b) 0,619

Veja se você aprendeu...

Um dado usual e não viciado é lançado duas vezes. Determine a probabilidade

a) da soma ser oito.


b) da soma ser oito, sabendo que o primeiro lançamento foi 5.

RESP: a) 0,1389 b) 0,1667

Prof. José Aguinaldo - Estatística Básica - 23


Regras da probabilidade

Reveja as três regras que nos ajudam a obter as probabilidades.


W/X3 1 V12T//U1: :!." + :!.Z " = 1
W/X3  çã1: :!. ∪ Q" = :!." + :!Q" − :!. ∩ Q"
W/X3  STU2TVçã1: :!. ∩ Q" = P!." ∙ P!Q | ." 1S :!. ∩ Q" = P!Q" ∙ P!. | Q"

Veja se você aprendeu...

Considere dois eventos A e B com probabilidades P(A) = 1/4, P(B) = 1/2 e P(A | B) = 2/5.
Calcule as probabilidades abaixo:
a) P(Ac)
b) P(A ∩ B)
c) P(A ∪ B)
d) P(B | A)

RESP: a) 0,75 b) 0,20 c) 0,55 d) 0,80

Veja se você aprendeu...

Uma caixa contém 3 bolas vermelhas, 4 bolas amarelas e 2 bolas brancas. Duas bolas são
retiradas ao acaso e sem reposição. A probabilidade de ambas serem da mesma cor é:

a) 13/72 b) 1/18 c) 5/18 d) 1/9 e) 1/4

RESP: letra “c”

Prof. José Aguinaldo - Estatística Básica - 24


Eventos independentes

Reveja o conceito de eventos independentes e não o confunda com eventos disjuntos. Dois eventos
são disjuntos se não houver interseção entre eles. Por exemplo, os eventos A = “número par” e
B = “número ímpar” são disjuntos, pois não há interseção entre eles. Por outro lado, dois eventos
são independentes se a ocorrência de um deles não altera a probabilidade do outro ocorrer e isto
pode ser expressa como P(A) = P(A | B). Este resultado diz que a probabilidade do A no geral é igual
a probabilidade do A na presença do B.

Definição: Dois eventos A e B são independentes se, e somente se,


:!. ∩ Q" = P!." ∙ P!Q"

Veja se você aprendeu...

A probabilidade de João resolver um problema é 5/6 e de Maria resolver o mesmo problema


é 4/7. Considerando que João e Maria resolvam o problema de forma independente, qual é
a probabilidade de:

a) ambos resolverem o problema


b) nenhum deles resolver
c) João resolver e Maria não
d) pelo menos um deles resolver

RESP: a) 0,4762 b) 0,0714 c) 0,3571 d) 0,9286

Veja se você aprendeu...

Considerando o Diagrama de Venn abaixo, (a) os eventos A e B são independentes? (b) E os


eventos B e C são independentes?

RESP: (a) Sim e (b) Não

Prof. José Aguinaldo - Estatística Básica - 25


Veja se você aprendeu...

A tabela abaixo mostra os resultados obtidos, após a empresa passar por uma reformulação
no seu quadro de funcionários. Pode-se dizer que os eventos D = “Ser demitido” e A = “Ter
mais de 5 anos” são independentes?

RESP: Não, pois ...

Prof. José Aguinaldo - Estatística Básica - 26


Eventos do tipo “pelo menos um ...”

Os eventos do tipo “pelo menos um ...” ou “no mínimo um ...” têm o mesmo significado. Veja os
resultados possíveis ao lançar uma moeda três vezes.

S = {KKK, KKC, KCK, CKK, CKC, CCK, CKK, CCC}

Quando se fala sair pelo menos uma cara (C), seriam todos os valores KKC, KCK, CKK, CKC, CCK,
CKK, CCC} com exceção de KKK (= não sair cara).

Podemos dizer que a probabilidade de “pelo menos um” é complementar da probabilidade de


“nenhum ocorrer”.
:!2/T1 /1 S 1V133/3" = 1 − :!/ℎS 1V133/3"

Veja se você aprendeu...

Suponha que um tipo de míssil acerta o alvo com probabilidade de 0,4.

a) se três mísseis são lançados, qual é a probabilidade de pelo menos um deles acertar o
alvo?
b) quantos mísseis deveriam ser lançados para garantir que a probabilidade pelo menos
um dos mísseis acertar o alvo seja de 90% ou mais?

RESP: a) 0,784 b) 5

Veja se você aprendeu...

Em uma cidade, a probabilidade de nascer um menino é 0,51.

a) Se uma família pretende ter 4 filhos, qual é a probabilidade de nascer pelo menos uma
menina.
b) Se nesta cidade há 1000 famílias com 4 filhos cada, qual é o número esperado de famílias
com pelo menos uma menina?

RESP: a) 0,9323 b) 932

Prof. José Aguinaldo - Estatística Básica - 27


Unidade 4
Uma distribuição de probabilidade descreve as probabilidades de uma variável assumir
determinados valores. Esta distribuição pode ser para variável discreta (número de peças com
defeito, por exemplo) ou para variável contínua (velocidade do carro, por exemplo).

Distribuição de probabilidade discreta

Neste tipo de distribuição é possível obter as probabilidades de cada valor possível da variável
discreta. As probabilidades são representadas por P(X = x), P(x) ou mesmo f(x), sendo o mais comum
os dois primeiros.

Toda distribuição discreta deve satisfazer estas duas propriedades:

0 ≤ :!" ≤ 1 as probabilidades P(x) devem estar no intervalo [0;1]


∑ :!" = 1 a soma das probabilidades deve ser igual a um.

QUESTÃO 1) - A tabela abaixo mostra a distribuição de probabilidade para a variável discreta


X = “número de peças com defeitos” em um lote com oito peças.

x 0 1 2 3 4 5 6 7 8
P(x) 0.02 0.09 0.21 0.28 0.23 0.1 0.04 0.02 0.01

a) Calcule a probabilidade de pelo menos duas peças com defeitos neste lote.
b) Calcule a probabilidade de mais de seis peças com defeitos neste lote.

Solução ---------------------------------------------------------------------------------------------------------------------

a) Os termos “pelo menos duas peças” e “no mínimo duas peças” significam a mesma coisa (X ≥ 2)
Então, vamos ter que calcular a probabilidade P(X ≥ 2).

P(X ≥ 2) = P(2) + P(3)+ P(4)+ P(5)+ P(6)+ P(7)+ P(8) (repare que o 2 foi considerado)
= 0.21 + 0.28 + ... + 0.01 = 0.89 ou 89%

Veja que somamos as probabilidades de todos os valores, exceto dos valores 0 e 1, que ficaram de
fora. Podemos, também, obter a mesma resposta somando P(0) e P(1) e depois subtraindo de 1,
que é a soma de todas as probabilidade.

P(X ≥ 2) = 1 – (soma das probabilidades que sobraram) = 1 – [P(0) + P(1)] = 1 – (0.02+0.09) = 0.89

b) “Mais de seis peças” pode ser escrita como X > 6. Então, a probabilidade que se pede é

P(X > 6) = P(7)+ P(8) = 0.02 + 0.01 = 0.03 ou 3% (repare que o 6 não foi considerado)

Atenção: Relembre o significado dos sinais de desigualdades < ; > ; ≥ e ≤, já que muitos dos erros
cometidos é justamente no uso equivocado destes sinais.

Prof. José Aguinaldo - Estatística Básica - 28


Veja se você aprendeu...

Considerando uma amostra de dez currículos, a tabela abaixo mostra a distribuição de


probabilidade para a quantidade de currículos que são descartados por erro de ortografia.

Calcule a probabilidade de
a) pelo menos um currículo ser descartado por erro de ortografia;
b) exatamente três currículos serem descartados por erro de ortografia;
c) mais de três currículos serem descartados por erro de ortografia;
d) no máximo três currículos serem descartados por erro de ortografia;
e) no mínimo três currículos serem descartados por erro de ortografia;
f) menos de três currículos serem descartados por erro de ortografia;

RESP: a) 0,98 b) 0.14 c) 0.73 d) 0,27 e) 0,87 f) 0,13

Valor esperado e variância de uma variável discreta

A distribuição de probabilidade de uma variável discreta pode ser descrita pelas medidas descritivas média,
mediana, moda, variância, coeficiente de variação e outras. Normalmente, calculamos no mínimo o valor
esperado e a variância da distribuição.

Valor esperado

O valor esperado, E(X) ou µ, é simplesmente a média dos valores da variável considerando as probabilidades
de cada um como pesos. Então, basta multiplicar cada valor x da variável pela sua probabilidade P(x) e depois
somar.

^!_" = ` :!" = `0T13 ∙ 231a

Variância e desvio-padrão

A variância e o desvio-padrão são medidas de variabilidade dos valores da variável. A variância, Var(X) ou σ2,
e o desvio-padrão, DP(X) ou σ, são obtidas pelas fórmulas abaixo:

• Variância
b3!_" = ∑! − c" :!" = ∑!0T13 − /" ∙ 231a ou

b3!_" = ∑   :!" − c = ∑0T13  ∙ 231a − /

• Desvio-padrão
d:!_" = √b3âV

Prof. José Aguinaldo - Estatística Básica - 29


QUESTÃO 2) – A tabela abaixo mostra a distribuição de probabilidade do Valor Presente Líquido
(VPL), em mil reais, do projeto A em três cenários (pessimista, moderado e otimista).

Cenário → Pessimista Moderado Otimista


VPL -3,00 20,00 50,00
P(x) 0,15 0,55 0,30

Calcule o valor esperado e o desvio-padrão do VPL.

Solução ---------------------------------------------------------------------------------------------------------------------

Crie as linhas (3) e (4) e depois calcule o valor esperado E(X) e o desvio-padrão DP(X).

X (1) -3 20 50 SOMA
P(x) (2) 0,15 0,55 0,30 --
xP(x) (3) = (1) x (2) -0,45 11 15 25,55
x2P(x) (4) = (1)2 x (2) 1,35 220 750 971,35

Valor esperado: ^!_" = ∑ :!" = 25,55 mil reais

Variância: b3!_" = ∑   :!" − c = 971,35 – 25,552 = 318,55

Desvio-padrão: d:!_" = √b.W = 8318,55 = 17,85 mil reais

Veja se você aprendeu...

A árvore de decisão abaixo mostra o VPL de dois projetos (A e B) em três cenários: pessimista
(P), moderado (M) e otimista (O) com probabilidades de 0,15, 0,55 e 0,30, respectivamente.
Assumindo que valor inicial de investimento será igual em cada projeto, qual deles é o mais
viável? Use o valor esperado para tomar a decisão.

DICA: Coloque os valores em tabela, como foi feito na questão anterior.

RESP: E(XA) = 25,5 mil e E(XB) = 31 mil. Projeto B é mais viável (maior valor esperado)

Prof. José Aguinaldo - Estatística Básica - 30


Distribuição de probabilidade binomial

A distribuição de probabilidade binomial ou simplesmente distribuição binomial é uma das


distribuições mais usuais para variável discreta. Suponha, por exemplo, que vamos fazer cinco
lançamentos independentes de um dado usual honesto. Qual é probabilidade de sair exatamente
duas vezes a face seis nestes lançamentos?

A probabilidade de sair a face seis ao lançar um dado uma vez é 1/6 = 0,17 (ou 17%) e de não sair a
face seis é 5/6 = 0,83 (ou 83%). Vamos definir S = “sair a face seis (= sucesso)” e F = “não sair a face
seis (= fracasso)”.

Para sair exatamente duas vezes a face seis, poderia ser nos dois primeiros lançamentos (SSFFF),
nos dois últimos (FFFSS) ou em outras posições. As dez formas diferentes são:

SSFFF ; SFFFS ; SFFSF ; SFSFF ; FFSFS ; FFSSF ; FSFFS ; FSFSF ; FSSFF ; FFFSS

Como sabemos que são dez?

Usando a combinação de 5 tomado de 2 em 2, representado por C5,2

 ! 5 5! 5! 120 120
ij,k = l m = → ip, = l m = = = = = 10
 ! ! − "! 2 2! !5 − 2"! 2! 3! 2 ∙ 6 12

Veja que, em cada sequência, temos dois sucessos (S) com probabilidade 0,17 cada uma e três
fracassos (F) com probabilidade de 0,83 cada uma. A probabilidade de ocorrer cada sequência seria
0,17 × 0,83G e como são dez sequências, a probabilidade final seria a soma destas probabilidades,
o que daria 10 × 0,17 × 0,83G .

:!_ = 2" = 10 ∙ 0,17 ∙ 0,83G = 0,1652

Substituindo o valor 10 pela combinação ip,, temos a fórmula da distribuição binomial.

:!_ = 2" = ip, ∙ 0,17 ∙ 0,83G

Definição
Se X segue a distribuição binomial com n provas independentes com cada uma tendo
probabilidade de sucesso p igual em cada prova, a probabilidade de ocorrer x sucessos é

  !
:!" = l m ∙ 2 5 ∙ !1 − 2"jr5 com l m=  = 0,1,2, … , 
  ! ! − "!

O valor esperado e variância de uma distribuição binomial são:

Valor esperado Variância Desvio-padrão


^!_": c = 2 b3!_": t  = 2!1 − 2" d:!_": t = 82!1 − 2"

Prof. José Aguinaldo - Estatística Básica - 31


No exemplo acima, foi usado o dado usual, mas a mesma distribuição poderia ser usada para os
casos abaixo:

• Em uma linha de produção de peças, 17% da produção é de peças com defeito. Calcule a
probabilidade de duas estarem com defeito em uma amostra de cinco peças.

• Em uma disciplina, 17% dos alunos são reprovados. Calcule a probabilidade de dois alunos
serem reprovados em uma amostra de cinco alunos.

• Em uma cidade, 17% das famílias vivem abaixo da linha da pobreza. Calcule a probabilidade
de duas famílias viverem abaixo da linha da pobreza em uma amostra de cinco famílias.

QUESTÃO 3) Um vendedor de produtos para celulares sabe que 30% das pessoas que compram a
bateria genérica de um modelo de celular acabam voltando para trocar o produto no período de um
mês. Se oito baterias foram vendidas, calcule a probabilidade de:

a) no máximo duas voltarem para troca no período de um mês.


b) mais de duas voltarem para troca.

Solução ---------------------------------------------------------------------------------------------------------------------

Por que temos que usar a distribuição binomial?

É porque ...
• temos n = 8 baterias independentes;
• cada bateria ou é trocada (=sucesso) ou não é trocada (= fracasso)
• a probabilidade de uma bateria ser trocada é sempre igual a 0,3, não interessando qual
seja a bateria, ou seja, a probabilidade de sucesso é constante e igual a p = 0,3.

Então, vamos usar o modelo binomial com n = 8 e p = 0,3

8!
:!" = ∙ 0,35 ∙ !1 − 0,3"jr5 1/  = 0,1,2,3,4,5,6,7,8
! !8 − "!

... no máximo duas voltarem para troca no período de um mês.

:!_ ≤ 2" = :!0" + :!1" + :!2" = (veja que o 2 foi usado)

8! 8! 8!
= ∙ 0,3u ∙ 0,7v + ∙ 0,3w ∙ 0,7x + ∙ 0,3 ∙ 0,7y
0! 8! 1! 7! 2! 6!

= 0,0576 + 0,1977 + 0,2965 = 0,5518

Prof. José Aguinaldo - Estatística Básica - 32


... mais de duas voltarem para troca

:!_ z 2" = :!3" + :!4" + ⋯ + :!8" 1S = 1 − :!0" + :!1" + :!2"

8! 8! 8!
=1−| ∙ 0,3u ∙ 0,7v + ∙ 0,3w ∙ 0,7x + + ∙ 0,3 ∙ 0,7y }
0! 8! 1! 7! 2! 6!

= 1 − 0,0576 + 0,1977 + 0,2965 = 0,4482

Lembre-se do fatorial de x: ! = ! − 1"! − 2" … 2 ∙ 1

Exemplos: 4! = 4x3x2x1 = 24 ; 3! = 3x2x1 = 6 ; 0! = 1

6! 6 × 5 × 4!
= = 6 × 5 = 30
4! 4!

Veja se você aprendeu...

No pregão de ontem 70% das ações na bolsa de valores caíram de preço. Supondo que
você tem uma carteira com oito ações, calcule a probabilidade de:

a) exatamente seis ações tenham caído de preço;


b) no mínimo seis ações tenham caído de preço;
c) no máximo seis tenham caído de preço;

RESP: a) 0,2965 b) 0,5518 c) 0,7447

Prof. José Aguinaldo - Estatística Básica - 33


Distribuição de probabilidade normal
A distribuição de probabilidade normal, ou simplesmente distribuição normal, é uma distribuição
de probabilidade para variável contínua e é considerada a principal distribuição de probabilidade na
Estatística. Esta distribuição ocorre naturalmente em diversas situações de medições físicas,
biológicas e sócias e pode ser usada como aproximação para outras distribuições de probabilidade.
Em muitas análises estatísticas é exigido que os dados sejam provenientes de populações
distribuídas normalmente.

A distribuição normal é definida pela média (µ) e pelo desvio-padrão (σ), seu gráfico se apresenta
em forma de sino e é simétrica em torno da média, como pode ser visto na figura a seguir.

µ X

O desvio-padrão mostra como os valores estão afastados da média. Aproximadamente, 68% dos
valores estão dentro do intervalo de ±1σ da média, 95% dos valores estão dentro do intervalo de
±2σ da média e 99,7% dos valores estão dentro de ±3σ da média, como mostrado na figura a seguir.

13,6% 13,6%

0,13% 2,1% 2,1%


34,1%
34,1%

0,13%

-3σ -2σ -1σ µ +1σ +2σ +3σ

A distribuição normal com média µ = 0 e desvio-padrão σ = 1 é conhecida como distribuição normal


padrão e denotado pela letra Z. As probabilidades desta distribuição são tabeladas, sendo que há
tabelas que mostram as probabilidades á esquerda do valor z ou à direita do valor z ou no intervalo
de [0 ; z]. A tabela que mostra as probabilidade no intervalo [0 ; z] é chamada de tabela normal
reduzida e é esta que usaremos.

Como exemplo, vamos obter a probabilidade P(0 ≤ Z ≤ 1,92).


Tabela Z
O valor 0,4726 é a área Z 2
(= probabilidade) sombreada
sob a curva normal no 1,9 0,4726
intervalo [0 ; 1,92].

Procurar 1,9 na primeira


coluna e o 2 na primeira linha
0 1,92 Z

Prof. José Aguinaldo - Estatística Básica - 34


Abaixo são mostrados os diversos casos de se obter as probabilidades usando a tabela normal
padrão reduzida. Os valores em vermelho são obtidos diretamente na tabela.

CASO 1) Probabilidade no intervalo [0 ; z] ou [-z ; 0]

Calcule as probabilidades P(0 ≤ Z ≤ +1,92) e (-1,92 ≤ Z ≤ 0).

0,4726
P(0 ≤ Z ≤ 1,92) = 0,4726.

A probabilidade 0,4726 foi obtida diretamente na tabela Z.

0 1,92

0,4726 P(-1,92 ≤ Z ≤ 0) = 0,4726

Por simetria é igual a probabilidade no intervalo [0 ; 1,92]

-1,92 0

CASO 2) Probabilidade no intervalo [z ; +∞) e (-∞ ; -z]

Calcule as probabilidades P(Z ≥ +1,92) e P(Z ≤ -1,92).

0,4726
P(Z ≥ 1,92) = 0,5 - 0,4726 = 0,0274

Por que foi subtraído de 0,5?


Por que a área acima (e abaixo) de 0 sob a curva normal é 0,5 (50%).
Como queremos o valor da área à direita de 1,92, tivemos que
0
0 1,92 subtrair o valor 0,4726 de 0,5.

0,4726 P(Z ≤ -1,92) = 0,5 - 0,4726 = 0,0274

Por simetria, a área à esquerda de -1,92 é igual à área à direita de +1,92.

-1,92 0

Prof. José Aguinaldo - Estatística Básica - 35


CASO 3) Probabilidade no intervalo (-∞ ; z] e [-z ; +∞)

Calcule as probabilidades P(Z ≤ +1,92) e P(Z ≥ -1,92).

P(Z ≤ +1,92) = 0,5 + 0,4726 = 0,9726


0,4726
Por que foi somado 0,5?
Por que a área abaixo de 0 sob a curva normal é 0,5 (50%). Como
0,5 queremos o valor da área à esquerda de +1,92, então seria a área
0 de [-∞ ; 0] + área de [-1,92 ; 0] = 0,5 + 0,4726 = 0,9726
0 1,92

0,4726
P(Z ≥ -1,92) = 0,5 + 0,4726 = 0,9726

0,5 Por simetria, a área à direita de -1,92 é igual à área à


esquerda de +1,92.
-1,92 0

CASO 4) Probabilidade no intervalo [+z1 ; +z2] e [-z1 ; -z2]

Calcule as probabilidades P(+1,25 ≤ Z ≤ +1,92) e P(-1,92 ≤ Z ≤ -1,25)


P(+1,25 ≤ Z ≤ +1,92) = 0,4726 – 0,3944 = 0,0782

Por que os valores foram subtraídos?


Por que o valor da área no intervalo [0 ; 1,25] está “dentro” da
área no intervalo [0 ; 1,92]
00 1,25 1,92

P(-1,92 ≤ Z ≤ -1,25) = 0,4726 – 0, 3944 = 0,0782

Por simetria, a área no intervalo [-1,92 ; -1,25] é igual à área do intervalo


[+1,25 ; +1,92].

-1,92 -1,25 0

CASO 5) Probabilidade no intervalo [-z1 ; +z2]

Calcule a probabilidade P(-1,92 ≤ Z ≤ +1,25).


0, 3944 P(-1,92 ≤ Z ≤ +1,25) = 0,4726 + 0, 3944 = 0,8669
0,4726

Por que os valores foram somados?


Por que o valor da área no intervalo [-1,92 ; +1,25] é formado
pela soma das áreas nos intervalos [-1,92 ; 0] e [0 ; +1,25]
-1,92 0 1,25

Prof. José Aguinaldo - Estatística Básica - 36


Padronização da variável

Uma variável X normalmente distribuída com média µ e desvio-padrão σ pode ser “transformada”
em uma variável com distribuição normal padrão calculando o escore z abaixo. Assim, é possível
usar a tabela normal padrão.

_−c
~=
t
QUESTÃO 4) A altura das mulheres de uma população segue uma distribuição normal, com média
160 cm e variância de 36 cm2. Uma mulher é selecionada ao acaso, qual é a probabilidade:

a) da altura ser no mínimo 175 cm?


b) da altura estar no intervalo de 1,40 m a 1,70 m?
c) da altura ser exatamente 175 cm?

Solução ---------------------------------------------------------------------------------------------------------------------

Se variância = 36, então o desvio-padrão será t = √36 = 6 V

a) P(X ≥ 175) = 0,62%.

Na distribuição normal (ou qualquer distribuição contínua), a probabilidade de a variável ter


valores “maiores que k” ou “no mínimo k” é igual em ambos os casos. Ou seja, P(X ≥ 175) = P(X >
175)

P(X ≥ 175) = P(Z ≥ 2,50) = 0,5 – 0,4938 = 0,0062 ou 0,62% 0,49386

Z175 = (175 - 160) / 6 = 2,50 (tabela Z = 0,4938)

0
160 175
0 2,50

b) P(140 ≤ X ≤ 170) = 95,21%

P(140 ≤ X ≤ 170) = P(-3,33 ≤ Z ≤ +1,67) = 0,4996 + 0,4525 = 0,9521 ou 95,21%


0,4996 0,4525
Z140 = (140 - 160) / 6 = -3,33 (tabela Z = 0,4996)
Z170 = (170 - 180) / 6 = +1,67 (tabela Z = 0,4525)

140 160 170


-3,33 0 1,67
c) P(X = 175) = 0.

Na distribuição normal (ou qualquer distribuição contínua), a probabilidade de a variável ter


exatamente um valor é teoricamente zero.

Prof. José Aguinaldo - Estatística Básica - 37


Veja se você aprendeu...

O tempo que os candidatos gastam para terminar um teste segue a distribuição normal com
média de 60 minutos e desvio-padrão de 10 minutos. Calcule a probabilidade de um
candidato terminar o teste:

a) no intervalo de 60 a 79,2 minutos;


b) no intervalo 48 a 60 minutos;
c) após 79,2 minutos;
d) antes de 79,2 minutos;
e) abaixo de 40,8 minutos;
f) no intervalo 34,2 a 72,5 minutos;
g) no intervalo 72,5 a 85,8 minutos;
h) no intervalo 40 a 50 minutos;

Aproximação normal para binomial

Uma variável X com distribuição binomial com n tentativas independentes com probabilidade de
sucesso igual a p, pode ser aproximada por uma distribuição normal com média µ e variância σ2
iguais a:

c = 2 / t  = 2!1 − 2"

Então, a variável Z abaixo segue a normal padrão.

_ − 2
~=
82!1 − 2"

A aproximação acima só será válida se as condições 2  5 / !1 − 2"  5 forem ambas


satisfeitas.

Prof. José Aguinaldo - Estatística Básica - 38


QUESTÃO 5) Sabe-se que 20% das declarações do imposto de renda ficam retidas na malha fina
da Receita Federal. Um contador foi responsável por fazer 150 declarações.

a) Usando a aproximação normal (sem correção de continuidade), qual é a probabilidade de


no mínimo vinte destas declarações ficarem retidas na malha fina? E de até 30% destas
declarações ficarem retidas na malha fina?
b) Calcule o valor esperado, desvio-padrão e o coeficiente de variação da variável
X = “número de declarações retidas”

Solução ---------------------------------------------------------------------------------------------------------------------

a1)
P(X ≥ 20) = P(Z ≥ -2,04) = 0,5 + 0,4793 = 0,9793 ou 97,93%

_ − 2 20 − 150 ∙ 0.2
~u = = = −2,04 !Ua/T = 0,4793"
82!1 − 2" √150 ∙ 0.2 ∙ 0.8

30% de 150 = 45
P(X ≤ 45) = P(Z ≤ 3,06) = 0,5 + 0,4989 = 0,9989 ou 99,89%

_ − 2 45 − 150 ∙ 0,2
~€p = = = 3,06 !Ua/T = 0,4793"
82!1 − 2" 8150 ∙ 0,2 ∙ 0,8

b)
valor esperado: E(X) = np = 150⋅0,2 = 30 declarações (= média)

variância: Var(X) = np(1-p) = 150⋅0,2⋅0,8 = 24


desvio-padrão: DP(X) = √24 = 4,9 declarações (aproximadamente 5)

coeficiente de variação: CV = DP / média = 4,9 / 30 = 0,16 (ou 16%)

Veja se você aprendeu...

No pregão de ontem 70% das ações na bolsa de valores caíram de preço. Em uma amostra
de 130 ações, qual é a probabilidade:

a) de no mínimo 100 ações tenham caído de preço;


b) no máximo 105 ações tenham caído de preço;
c) de 60% a 80% da amostra tenham caído de preço.

RESP: a) 0,0427 b) 0,9963 c) 0,9872

Prof. José Aguinaldo - Estatística Básica - 39


Aproximação normal com correção de continuidade

A correção de continuidade é procedimento usado para melhorar a probabilidade obtida quando se


usa a aproximação normal para uma variável com distribuição discreta, como a Binomial, por
exemplo. Esta aproximação é somente somar ou subtrair 0,5 ao valor da variável X “antes” de fazer
a padronização. Desta forma você irá cobrir os valores que estão entre os valores inteiros de uma
variável discreta.

42 43 44 45 46

Com a correção de continuidade, o valor 42, por exemplo, passaria a ser representados pelo
intervalo [41,5 ; 42,5] e o valor 43 passaria a ser representado pelo intervalo [42,5 ; 43,5] e assim
sucessivamente.

41,5 42,5 43,5 44,5 45,5 46,5


42 43 44 45 46

Caso você precise calcular a probabilidade P(X ≤ 42), você deveria calcular a probabilidade
P(X ≤ 42,5) com a correção de continuidade.

Então, para usar a correção de continuidade você deve antes fazer:

• P(X ≤ a) = P(X ≤ a + 0.5)


• P(X ≥ a) = P(X ≥ a – 0.5)
• P(a ≤ X ≤ b) = P(a – 0,5 ≤ X ≤ a + 0.5)

Prof. José Aguinaldo - Estatística Básica - 40


QUESTÃO 6) Sabe-se que 20% das declarações do imposto de renda ficam retidas na malha fina
da Receita Federal. Um contador foi responsável por fazer 150 declarações. Usando a aproximação
normal (com correção de continuidade), (a) qual é a probabilidade de no mínimo vinte destas
declarações ficarem retidas na malha fina? (b) E de exatamente 30 destas declarações ficarem
retidas na malha fina?

Solução ---------------------------------------------------------------------------------------------------------------------

a)
P(X ≥ 25) = P(X ≥ 20 - 0,5) = P(X ≥ 19,5) = P(Z ≥ -1,12) = 0,5 + 0,3686 = 0,8686 ou 86,86%

19,5 − 150 ∙ 0,2


~w,p = = −1,12 !Ua/T = 0,3686"
8150 ∙ 0,2 ∙ 0,8

b)

P(X = 30) = P(30 - 0,5 ≤ X ≤ 30 + 0,5) = P(29,5 ≤ X ≤ 30,5) = P(-0,1 ≤ Z ≤ +0,1)


= 0,0398 + 0,0398 = 0,0796 ou 7,96%

29,5 − 150 ∙ 0,2 30,5 − 150 ∙ 0,2


~,p = = −0,10 !Ua/T = 0,0398" ; ~Gu,p = = +0,10 !Ua/T = 0,0398"
8150 ∙ 0,2 ∙ 0,8 8150 ∙ 0,2 ∙ 0,8

Veja se você aprendeu...

No pregão de ontem 70% das ações na bolsa de valores caíram de preço. Em uma amostra
de 130 ações, usando a aproximação normal (com correção de continuidade) determine a
probabilidade:

a) de no mínimo 100 ações tenham caído de preço.


b) no máximo 105 ações tenham caído de preço.
c) de 60% a 80% da amostra tenham caído de preço.

RESP: a) 0,0516 b) 0,9973 c) 0,9902

Prof. José Aguinaldo - Estatística Básica - 41