Escolar Documentos
Profissional Documentos
Cultura Documentos
br
SUMÁRIO
ANÁLISE EXPLORATÓRIA DE DADOS .................................................................. Erro! Indicador não definido.
1.1 ESTATÍSTICA DESCRITIVA E INFERENCIAL ............................................................................................ 2
1.2 ETAPAS DE UMA PESQUISA ................................................................................................................ 2
1.3 NOMENCLATURA ESTATÍSTICA ........................................................................................................... 2
1.4 TIPOS DE VARIÁVEIS ........................................................................................................................... 2
1.5 REPRESENTAÇÕES ESTATÍSTICAS ........................................................................................................ 4
1.5.1 TABELAS ...................................................................................................................................... 4
1.5.2 GRÁFICOS .................................................................................................................................... 5
Unidade experimental ou parcela: é o elemento que vai ser observado ou a unidade que
vai receber o tratamento. Por exemplo, dependendo do experimento, a unidade experimental
pode ser um animal, uma peça fabricada, uma pessoa, etc.
Estatística: é uma característica descritiva dos elementos da amostra, como por exemplo,
a média de alguma variável, etc.
Exemplos:
Exemplos:
Exemplos:
Exemplo: Visando planejar uma dieta alimentar padrão para os funcionários de certa
empresa, um nutricionista anotou o peso e a altura de 10 deles. Tomando X e Y para descrever,
Note que o nutricionista poderia ter julgado relevante tomar a idade Z dos funcionários.
Neste caso, teríamos uma variável tridimensional (X, Y, Z) descrita por ternas ordenadas (xi, yi,
zi). Poder-se-ia incluir, também, a variável sexo (qualitativa).
1.5.1 TABELAS
As tabelas de frequência são utilizadas para a organização dos dados para uma melhor
análise dos dados.
As tabelas podem ser simples com por exemplo:
1.5.2 GRÁFICOS
A principal função dos gráficos é tornar a informação mais visual os mais comuns são os de
colunas e os de setores.
Gráfico de colunas
Gráfico de setores
SUMÁRIO
DISTRIBUIÇÃO DE FREQUÊNCIAS
2- DISTRIBUIÇÃO DE FREQUÊNCIAS
2.2. ROL
É o arranjo dos dados brutos em ordem de frequência crescente ou decrescente.
Solução:
Exemplo 2:
Analisando a tabela abaixo que apresenta as frequências acumuladas das idades de 20 jovens entre
14 e 20 anos, julgue o item subsequente.
Idade 𝐹𝑎𝑐
(anos)
2
14
4
15
9
16
12
17
15
18
18
19
20
20
SUMÁRIO
3- MEDIDAS DE POSIÇÃO ............................................................................................................................. 2
3.1. MÉDIA ARITMÉTICA .............................................................................................................................. 2
3.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS............................................................................. 2
3- MEDIDAS DE POSIÇÃO
3- MEDIDAS DE POSIÇÃO
26
𝑥̅ = = 2,6
10
Para facilitar:
268
𝑥̅ = = 6,7
40
Exemplo 3:
Analisando a tabela abaixo que apresenta as frequências acumuladas das idades de 20 jovens entre
14 e 20 anos, julgue o item a seguir.
Idade 𝐹𝑎𝑐
(anos)
2
14
4
15
9
16
12
17
15
18
18
19
20
20
Exemplo 4
Um concurso é composto por cinco etapas. Cada etapa vale 100 pontos. A pontuação final de cada
candidato é a média de suas notas nas cinco etapas. A classificação obedece à ordem decrescente das
pontuações finais. O critério de desempate baseia-se na maior nota na quinta etapa.
SUMÁRIO
3- MEDIDAS DE POSIÇÃO ............................................................................................................................. 2
3.3. MEDIANA .......................................................................................................................................... 2
3.4. MEDIANA PARA DADOS AGRUPADOS EM CLASSES ............................................................................ 3
3.5. MODA ............................................................................................................................................... 4
3.6. MODA PARA DADOS AGRUPADOS EM CLASSES ................................................................................ 4
1) MODA BRUTA .................................................................................................................................. 5
2) FÓRMULA DE CZUBER ...................................................................................................................... 5
3- MEDIDAS DE POSIÇÃO
3.3. MEDIANA
Colocados os valores em ordem crescente, mediana é o elemento que ocupa a posição
central. Indicando a mediana por Md e o número de observações por n, dois casos devem ser
considerados:
𝑛+1
1º) Se n for ímpar, a mediana será o elemento de ordem .
2
2º) Se n for par, a mediana será a média aritmética entre os elementos centrais, de ordem
𝑛 𝑛
𝑒 2 + 1.
2
Exemplos:
a) 5, 7, 8, 10, 14.
11+1
n = 11, n é ímpar, logo a mediana será o elemento de ordem = 6º 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜
2
Md = 3
b)
n = 42, n é par, logo a mediana será a média entre os elementos de ordem 21º e 22º
Md = 87.
O procedimento usado para o cálculo da mediana para dados agrupados é dado a seguir.
1º passo: calcula-se a ordem n/2;
2º passo: pela frequência acumulada identifica-se a classe que contém a mediana (classe
Md);
3º passo: utiliza-se a fórmula:
𝑛
( 2 − ∑ 𝑓) . ℎ
𝑀𝑑 = 𝑙𝑀𝑑 +
𝑓𝑀𝑑
Exemplo:
Determinar a mediana para a variável renda familiar.
𝑛
1º Passo: 2 = 20
2º Passo: classe Md
3º Passo:
(20−15).2
𝑀𝑑 = 6 + 14 = 6 + 0,7 = 6,7
3.5. MODA
Moda (Mo) é o valor que aparece mais vezes, isto é, o valor ao qual esteja associada à
frequência absoluta mais alta.
Exemplos:
a) 2, 6, 8, 8, 8, 8, 10, 10, 12, 12, 18 Mo = 8.
b) 4, 4, 5, 5, 6, 6 Conjunto amodal.
d) 1, 2, 3, 4, 5 Conjunto amodal.
A classe que apresenta maior frequência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os
limites da classe modal. Existem diversas fórmulas para o cálculo da moda. Veremos duas delas.
1) MODA BRUTA
Uma ideia aproximada da moda e muito útil em problemas práticos é a moda bruta,
definida como o ponto médio da classe modal.
2) FÓRMULA DE CZUBER
Procedimento:
1º) Identifica-se a classe modal.
2º) Aplica-se a fórmula:
𝑑1
𝑀𝑜 = 𝑙 + ℎ
𝑑1 + 𝑑2
Onde:
𝑙 é o limite inferior da classe modal;
𝑑1 é a diferença entre a frequência da classe modal e a imediatamente anterior;
𝑑2 é a diferença entre a frequência da classe modal e a imediatamente posterior;
ℎ é a amplitude da classe modal.
Exemplo:
Determinar a moda para a variável renda familiar:
Média = 6,7.
Mediana = 6,7.
Moda = 6,8.
a) Escolha da média
b) Escolha da mediana
c) Escolha da moda
SUMÁRIO
3- MEDIDAS DE POSIÇÃO ............................................................................................................................. 2
3.7 - QUARTIS .......................................................................................................................................... 2
3.8 - DECIS ............................................................................................................................................... 3
3.9 - PERCENTIS ....................................................................................................................................... 4
3- MEDIDAS DE POSIÇÃO
3.7 - QUARTIS
𝑛
( 4 − ∑ 𝑓) . ℎ
𝑄1 = 𝑙𝑄1 +
𝑓𝑄1
Determinação de Q3:
1º Passo: calcula-se 3n/4;
2º Passo: identifica-se a classe Q3 pela frequência acumulada;
3º Passo: aplica-se a fórmula:
3𝑛
( 4 − ∑ 𝑓) . ℎ
𝑄3 = 𝑙𝑄3 +
𝑓𝑄3
1º Passo: n = 40;
𝑛 3𝑛
𝑄1: = 10 𝑄3: = 30
4 4
𝑛
( 4 − ∑ 𝑓) . ℎ (10 − 5). 2
𝑄1 = 𝑙𝑄1 + =4+ =5
𝑓𝑄1 10
3𝑛
( 4 − ∑ 𝑓) . ℎ (30 − 29). 2
𝑄3 = 𝑙𝑄3 + =8+ = 8,25
𝑓𝑄3 8
Então, 25% dos elementos estão abaixo de Q 1 = 5, ou seja, 25% das famílias ganham menos
que 5 salários mínimos e 75% dos elementos estão abaixo de Q 3 = 8,25, ou seja, 75% das famílias
ganham menos que 8,25 salários mínimos.
3.8 - DECIS
Os decis são valores que dividem um conjunto de dados em 10 partes iguais. O cálculo é
dado por:
𝑖𝑛
1º Passo: calcula-se 10, onde i = 1, 2, 3, 4, 5, 6, 7, 8 e 9;
2º Passo: identifica-se a classe Di pela frequência acumulada;
3º Passo: aplica-se a fórmula:
𝑖𝑛
(10 − ∑ 𝑓) . ℎ
𝐷𝑖 = 𝑙𝐷𝑖 +
𝑓𝐷𝑖
3.9 - PERCENTIS
𝑖𝑛
1º Passo: calcula-se 100, onde i = 1, 2, ...99;
2º Passo: identifica-se a classe Pi pela frequência acumulada;
3º Passo: aplica-se a fórmula:
𝑖𝑛
(100 − ∑ 𝑓) . ℎ
𝑃𝑖 = 𝑙𝑃𝑖 +
𝑓𝑃𝑖
Exemplo: Determinar o decil 1 (D1) e o percentil 90 (P90) para a variável renda familiar:
1º Passo: n = 40;
40 90.40
D1: =4 P90: = 36
10 100
𝑛
(10 − ∑ 𝑓) . ℎ ( 4 − 0). 2
𝐷1 = 𝑙𝐷1 + = 2+ = 3,6
𝑓𝐷1 5
90𝑛
( 100 − ∑ 𝑓) . ℎ (36 − 29). 2
𝑃90 = 𝑙𝑃90 + =8+ = 9,75
𝑓𝑃90 8
Então, 10% dos elementos estão abaixo de D1 = 3,6, ou seja, 10% das famílias ganham
menos que 3,6 salários mínimos e 90% das famílias ganham menos que 9,75 salários mínimos.
SUMÁRIO
4- MEDIDAS DE DISPERSÃO
Quando encontramos a média de um conjunto de dados, podemos verificar a variabilidade
ou dispersão dos dados, ou seja, a distância que eles se encontram da média. Queremos saber
se os dados estão próximos ou mais afastados da média.
A dispersão (variação) dos dados pode ser verificada através das seguintes medidas de
dispersão: amplitude total, variância, desvio padrão e coeficiente de variação.
4.2 VARIÂNCIA
Definimos como variância, a soma dos quadrados das diferenças entre os dados e a média
dividido pelo número de dados.
n n
x
i 1
i x
2
x
i
2
i 1
𝜎2 = Para população
n n
n
x
i 1
i x
2
𝑠2 = Para amostra
n 1
Exemplo 1
Sete crianças brincam em um parquinho e suas idades são 6, 4, 3, 6, 7, 3 e 6. Qual a
variância das idades?
Exemplo 2
(ESAF-2012) A variância da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 é igual a
a) 3.
b) 2.
c) 1.
d) 4.
e) 5.
Exemplo 3
(ESAF – AFRFB – 2009) A tabela mostra a distribuição de frequências relativas
populacionais (f’) de uma variável X:
Sabendo que “a” é um número real, então a média e a variância de X são, respectivamente:
Exemplo 1
Sete crianças brincam em um parquinho e suas idades são 6, 4, 3, 6, 7, 3 e 6. Qual desvio padrão
das idades?
SUMÁRIO
4- MEDIDAS DE DISPERSÃO .............................................................................................................................................................. 2
4.4 VARIÂNCIA PARA DADOS AGRUPADOS ......................................................................................................................... 2
4.5 COEFICIENTE DE VARIAÇÃO ................................................................................................................................................ 3
4- MEDIDAS DE DISPERSÃO
fi x
i 1
i
2
𝜎2 = Para população
n
fix x
i 1
i
2
𝑠2 = Para amostra
n 1
Exemplo: Considere a amostra com a renda famílias de 40 famílias. Determine qual a variância
e o desvio padrão dessa distribuição.
Logo:
280
𝑥= =7
40
Variância
n
fix x
i
2
176
𝑠2 = i 1
4,5
n 1 39
Desvio padrão
𝑠 = √𝑠 2 = √4,5 ≅ 2,1
Portanto, podemos afirmar que a renda média deste grupo de 40 famílias é de 7 salários
mínimos, com uma variação de 2,1 salários mínimos, medidas pelo desvio padrão.
𝑠
𝐶𝑉 = 𝑥̅ . 100 , para amostras.
𝜎
𝐶𝑉 = 𝜇 . 100 , para população.
Grupo A: 1, 3 e 5;
Grupo B: 53, 55 e 57.
𝑠 2
𝐶𝑉 = . 100 = . 100 = 66,67%
𝑥̅ 3
𝑠 2
𝐶𝑉 = . 100 = . 100 = 3,64%
𝑥̅ 55
Um CV = 66,67 % indica uma dispersão dos dados em relação à média muito grande, ou seja,
a dispersão relativa é alta. Já um CV = 3,64 % indica que a dispersão dos dados em relação à média
é pequena.
Exemplo
(FCC – BACEN – 2006) Com relação às medidas de posição e de dispersão, é correto
afirmar:
a) Dobrando todos os valores dos salários dos funcionários de uma empresa, tem-se
que o salário médio desses funcionários e a respectiva variância também ficam dobrados.
SUMÁRIO
5- MEDIDAS DE ASSIMETRIA E CURTOSE..................................................................................2
5.1- MEDIDAS DE ASSIMETRIA...................................................................................................2
5.2 – MEDIDA DE CURTOSE..........................................................................................................3
𝑥̅ −𝑀𝑜
𝐴 𝑠 (𝑃 ) = , em que se 𝐴𝑠 (𝑃) = 0, a distribuição é simétrica.
𝑠
Se 𝐴𝑠 (𝑃) > 0, a distribuição é assimétrica positiva.
Se 𝐴𝑠 (𝑃) < 0, a distribuição é assimétrica negativa.
3
2 ⊢ 4
10
4 ⊢ 6
14
6 ⊢ 8
10
8 ⊢ 10
3
10 ⊢ 12
Total 40
𝑥̅ = 7
𝑑1 4
𝑀𝑜 = 𝑙 + ℎ =6+ .2 = 7
𝑑1 + 𝑑2 4+4
𝑠 = √𝑠 2 = √4,5 ≅ 2,1
𝑥̅ −𝑀𝑜
𝐴 𝑠 (𝑃 ) = , onde se 𝐴𝑠 (𝑃) = 0, a distribuição é simétrica
𝑠
Quando |As(P)| < 0,15, podemos considerar a distribuição como praticamente simétrica.
Por outro lado, costuma-se considerar a assimetria como moderada se 0,15 < |A s(P)| < 1,
e forte se |As(P)| > 1.
𝑄1 + 𝑄3 − 2𝑄2
𝐴 (𝑌 ) =
𝑄3 − 𝑄1
Uma distribuição cuja curva tem a forma da curva 1, tem seu coeficiente de curtose
C = 0,263 e é dita mesocúrtica.
Se ela tem uma curva mais afilada, como a curva 2, ela é dita leptocúrtica e tem C < 0,263.
Se a curva é mais achatada, como a curva 3, ela é dita platicúrtica e tem coeficiente de
curtose C > 0,263.
𝑄3−𝑄1 𝑑𝑄 𝑄3−𝑄1
𝐶 (𝐾 ) = 2(𝐷9−𝐷1) = 𝐷9−𝐷1 , onde 𝑑𝑄 = 2
Exemplo: Na distribuição
𝑛
( 4 − ∑ 𝑓) . ℎ (10 − 5). 2
𝑄1 = 𝑙𝑄1 + =4+ =5
𝑓𝑄1 10
3𝑛
( − ∑ 𝑓) . ℎ (30 − 29)
𝑄3 = 𝑙𝑄3 + 4 =8+ = 8,25
𝑓𝑄3 8
𝑛
(10 − ∑ 𝑓) . ℎ ( 4 − 0). 2
𝐷1 = 𝑙𝐷1 + = 2+ = 3,6
𝑓𝐷1 5
9𝑛
(10 − ∑ 𝑓) . ℎ (36 − 29). 2
𝐷9 = 𝑙𝐷9 + = 8+ = 9,75
𝑓𝐷9 8
𝑄3 − 𝑄1 8,25 − 5
𝐶 (𝐾 ) = = = 0,264
2(𝐷9 − 𝐷1) 2(9,75 − 3,6)
SUMÁRIO
PROBABILIDADES ......................................................................................................................................... 2
INTRODUÇÃO........................................................................................................................................... 2
EXPERIMENTOS ALEATÓRIOS ............................................................................................................... 2
DEFINIÇÃO ............................................................................................................................................... 2
PROBABILIDADES
INTRODUÇÃO
EXPERIMENTOS ALEATÓRIOS
Chamamos de experimentos aleatórios aqueles que, repetidos em idênticas condições,
produzem resultados diferentes. Embora não saibamos qual o resultado que irá ocorrer em um
experimento, em geral, conseguimos descrever o conjunto de todos os resultados possíveis que
podem ocorrer.
Exemplos:
a) Lançar uma moeda e observar a face de cima.
b) Lançar um dado e observar o nº da face de cima.
ESPAÇO AMOSTRAL: Chamamos de espaço amostral, e indicamos por S ou , um conjunto
formado por todos os resultados possíveis de um experimento aleatório.
Exemplos:
a) Lançar uma moeda e observar a face de cima.
S = { C,R}, em que C representa cara e R coroa.
b) Lançar um dado e observar o nº da face de cima.
S = {1, 2, 3, 4, 5, 6}
EVENTO: Um evento é um conjunto de resultados do experimento; em termos de conjunto, é
um subconjunto do espaço amostral. Em geral indicamos um evento por uma letra maiúscula
do alfabeto: A, B, ..., X, Y, Z.
Os eventos que possuem um único elemento são chamados eventos elementares.
Exemplo:
Um dado é lançado e observa-se o nº da face de cima.
S = {1, 2, 3, 4, 5, 6}
Eis alguns eventos:
a) Ocorrência de nº impar. A = {1, 3, 5};
b) Ocorrência de nº primo. B = {2, 3, 5};
c) Ocorrência de nº menor que 4. C = {1, 2, 3};
d) Ocorrência de nº menor que 7. D = {1, 2, 3, 4, 5, 6} = S (evento certo)
e) Ocorrência de nº maior ou igual a 7. E = (evento impossível)
DEFINIÇÃO
Para calcular a probabilidade temos que efetuar uma divisão entre o evento desejado e o
total de eventos possíveis, ou seja, a probabilidade de um evento A acontecer será as
possibilidades de A acontecer dividido pelo total de possibilidades.
nA
PA
n S
P A
evento desejado
eventos possíveis
2. Ao lançarmos dois dados e somarmos os valores das duas faces voltados para cima, qual
a probabilidade de o resultado ser maior que 8.
4. Dois dados são lançados simultaneamente. Determine a probabilidade da soma das faces
voltadas para cima ser 8 ou o produto ser ímpar.
5. Em uma caixa existem 5 bolas brancas e 8 bolas vermelhas. Duas bolas são retiradas
aleatoriamente sem reposição. Qual a probabilidade de serem vermelhas?
8. Uma urna contém 10 bolas, das quais 3 são brancas, 5 são vermelhas e 2 são azuis. Qual
a probabilidade retirar uma bola ao acaso e ela:
a) Ser branca
b) Não ser branca
9. Em uma sala tem 5 homens e 6 mulheres. Qual a probabilidade de escolhermos 3 pessoas
e pelo menos uma delas ser homem.
SUMÁRIO
PROBABILIDADES EXEMPLOS ....................................................................................................................... 2
PROBABILIDADES EXEMPLOS
1. Um casal pretende ter 4 filhos. Qual a probabilidade de serem 2 de cada sexo?
2. Uma urna contém 3 bolas brancas e 4 bolas pretas. Tira-se, sucessivamente, 2 bolas.
Então a probabilidade de as bolas serem da mesma cor, é:
3. Um prédio de três andares, com dois apartamentos por andar, tem apenas três
apartamentos ocupados. A probabilidade de cada um dos três andares tenha exatamente
um apartamento ocupado é:
4. Dois jogadores, A e B vão lançar um par de dados. Eles combinam que, se a soma dos
números dos dados for 5, A ganha, e, se essa soma for 8, B é quem ganha. Os dados são
lançados. Sabe-se que A não ganhou. Qual a probabilidade de B ter vencido?
6. Em uma gaveta, cinco pares diferentes de meias estão misturados. Retirando-se ao acaso
duas meias, a probabilidade de que elas sejam do mesmo par é de:
7. Em uma urna temos 100 bolas numeradas de 1 a 100. Qual a probabilidade de retirarmos
duas bolas e a soma dos valores contidos nas bolas ser 100?
1
8. A probabilidade de um casal ter um filho de olhos azuis é igual a 3 . Se o casal pretende
ter 4 filhos, a probabilidade de que no máximo dois tenham olhos azuis é:
SUMÁRIO
VARIÁVEIS ALEATÓRIAS DISCRETAS.............................................................................................................. 2
ESPERANÇA MATEMÁTICA ....................................................................................................................... 2
VARIÂNCIA ............................................................................................................................................... 3
DESVIO PADRÃO ...................................................................................................................................... 3
Definição: Função de Probabilidade é a função que associa a cada valor assumido pela
V.A, a probabilidade do evento correspondente, isto é, P(X = xi) = P(Ai) , i = 1, 2, ... , n.
∑ 𝑝(𝑥𝑖 ) = 1
𝑖=1
ESPERANÇA MATEMÁTICA
Existem características numéricas que são muito importantes em uma distribuição de
probabilidade de uma V.A. discreta. São os parâmetros das distribuições. Um primeiro
parâmetro é a esperança matemática (ou simplesmente média) de uma V.A.
𝑛
1 3 3 1 12
𝐸 (𝑋 ) = ( 0) + (1) + (2) + (3 ) = = 1,5
8 8 8 8 8
2). Uma seguradora paga R$ 3.000,00 em caso de acidente de carro e cobra uma taxa de R$
100,00. Sabe-se que a probabilidade de que um carro sofra acidente é de 2%. Quanto espera a
seguradora ganhar por carro segurado?
VARIÂNCIA
Define-se variância de uma V.A. como:
𝑉𝐴𝑅 = 𝐸 (𝑋 2 ) − {𝐸 (𝑋)}2 , onde 𝐸 (𝑋 2 ) = ∑𝑛𝑖=1(𝑥𝑖)2 𝑝(𝑥𝑖 )
DESVIO PADRÃO
Por definição, desvio padrão é a raiz quadrada da variância, ou seja,
𝜎 = √𝑉𝐴𝑅
Fórmula prática para o cálculo da variância:
𝑉𝐴𝑅 = 𝐸 (𝑋 2 ) − {𝐸 (𝑋)}2
1 6 1 6 2
𝐸 (𝑋 ) = (0) + (1) + (2) = + = 1
8 8 8 8 8
1 6 1 6 4 10
𝐸 (𝑋 2 ) = (0)2 + (1)2 + (2)2 = + = = 1,25
8 8 8 8 8 8
SUMÁRIO
DISTRIBUIÇÕES TEÓRICAS DE VARIÁVEIS ALEATÓRIAS DISCRETAS ................................................................ 2
1 DISTRIBUIÇÃO DE BERNOULLI ............................................................................................................... 2
ESPERANÇA E VARIÂNCIA ..................................................................................................................... 2
2 DISTRIBUIÇÃO BINOMIAL .................................................................................................................. 2
3 DISTRIBUIÇÃO DE POISSON ............................................................................................................... 3
0 𝑓𝑟𝑎𝑐𝑎𝑠𝑠𝑜
𝑋={ com P(X = 0) = q e P(X = 1) = p.
1 𝑠𝑢𝑐𝑒𝑠𝑠𝑜
A variável aleatória X tem distribuição de BERNOULLI, e sua função de probabilidade é dada
por:
𝑃(𝑋 = 𝑥 ) = 𝑝 𝑥 . 𝑞1−𝑥
ESPERANÇA E VARIÂNCIA
𝐸 (𝑋) = 𝑝; 𝑉𝐴𝑅(𝑋) = 𝑝. 𝑞; 𝐷𝑃(𝑋) = √𝑝. 𝑞
Exemplo: Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna.
Seja X: nº de bolas verdes. Calcular E(X), VAR(X) e determinar P(X).
30 3
𝑋=0→𝑞= =
50 5
20 2
𝑋=1→𝑝= =
50 5
2 𝑥 3 1−𝑥
𝑃 (𝑋 = 𝑥 ) = ( ) . ( )
5 5
2 2 3 6
𝐸 (𝑋 ) = 𝑝 = 5 𝑉𝐴𝑅(𝑋) = 5 . 5 = 25
2 DISTRIBUIÇÃO BINOMIAL
Considere n tentativas independentes de um mesmo experimento aleatório. Cada
tentativa admite apenas dois resultados: sucesso (p) e fracasso (q). Seja X: número de sucessos
em n tentativas.
A função distribuição da V.A. Binomial é dada por:
𝑛
𝑃(𝑋 = 𝑘) = ( ) . 𝑝𝑘 . 𝑞 𝑛−𝑘 em que k é o número de sucessos.
𝑘
A variável X tem distribuição binomial, com parâmetros n e p, sendo indicada pela notação
X: B (n , p).
Se X: B (n , p) E(X) = np; VAR(X) = npq e DP (X) = √𝑛𝑝𝑞
Exemplos:
1). Uma moeda é lançada 10 vezes. Qual a probabilidade de saírem 6 caras?
10 1 6 1 4
( )
𝑃 𝑋 = 6 = ( ).( ) .( )
6 2 2
1 1 210 105
𝑃(𝑋 = 6) = 210. . = = ≅ 0,205
64 16 1024 512
2). Em uma fábrica, 40% das peças produzidas são provenientes da máquina A. Qual a
probabilidade de obter pelo menos 2 peças da máquina A, num dia em que se retirou uma
amostra de 6 peças?
X: nº de peças da máquina A.
4 6
𝑝 = 10 e 𝑞 = 10
6 4 0 6 6 46.656
𝑃 (𝑋 = 0) = ( ) . ( ) . ( ) =
0 10 10 1.000.000
6 4 1 6 5 186624
𝑃 (𝑋 = 1) = ( ) . ( ) . ( ) =
1 10 10 1.000.000
46.656 186624
𝑃 (𝑋 ≥ 2) = 1 − [ + ]
1.000.000 1.000.000
233.280
𝑃 (𝑋 ≥ 2) = 1 − [ ]
1.000.000
766720
𝑃 (𝑋 ≥ 2) = = 0,7767
1.000.000
3 DISTRIBUIÇÃO DE POISSON
Considere a probabilidade de ocorrência de sucessos em um determinado intervalo.
Seja X o número de sucessos no intervalo. Então:
𝑒 −𝜆 𝜆𝑘
𝑃 (𝑋 = 𝑘 ) = Onde 𝜆 é a média.
𝑘!
Exemplo: Numa central telefônica chegam 300 telefonemas por hora. Qual a probabilidade de
que:
(Considere 𝑒 −5 = 0,0067
a) Num minuto não haja nenhum chamado;
b) Em dois minutos haja 2 chamados.
𝑒 −550
𝑃 (𝑋 = 0) = = 0,0067
0!
𝑒 −10 102
𝑃 (𝑋 = 2) = =0,00225
2!
SUMÁRIO
DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS ........................................................................................ 2
INTRODUÇÃO........................................................................................................................................... 2
DISTRIBUIÇÃO CONTÍNUA UNIFORME ...................................................................................................... 2
VALOR ESPERADO E VARIÂNCIA ........................................................................................................... 2
DISTRIBUIÇÃO EXPONENCIAL ................................................................................................................... 3
PROBABILIDADE EXPONENCIAL ............................................................................................................ 3
VALOR ESPERADO E VARIÂNCIA ........................................................................................................... 4
15−5
Por exemplo a P(5<x<15) = 20−0 = 0,5 = 50%
Ou P(5<x<15)= 10.0,05=0,5
VALOR ESPERADO E VARIÂNCIA
𝑋𝑀 +𝑋𝑚 (𝑋𝑀 −𝑋𝑚 )2
𝐸 (𝑋 ) = 𝑉𝐴𝑅(𝑋) =
2 12
DISTRIBUIÇÃO EXPONENCIAL
PROBABILIDADE EXPONENCIAL
Para compreender melhor como estudar um fenômeno que segue distribuição
Exponencial, será abordado o mesmo exemplo apresentado em Poisson, modificando a variável
de interesse.
Exemplo:
Em uma certa cidade ocorrem em média 6 acidentes de moto por hora. Para uma
distribuição exponencial vamos considerar que o tempo médio entre dois acidentes é de 10
minutos. Qual a probabilidade de o tempo entre dois acidentes ser menor ou igual a 10 minutos?
Em primeiro lugar, é necessário obter a taxa de ocorrência por minuto. Logo como temos
6 acidentes por hora e uma hora tem 60 min o índice de acidentes por minuto é de 0,1
Contudo, trabalhando com a ideia de taxa constante de ocorrência, a função densidade de
probabilidade pode ser expressa pela seguinte fórmula:
𝑓 (𝑋) = 𝜆𝑒 −𝜆𝑥
Em que:
𝑓(𝑋): corresponde à função densidade de probabilidade da variável aleatória contínua X;
𝜆: corresponde à taxa de ocorrência do fenômeno estudado por unidade de tempo;
𝑒: constante Neperiana; ou número de Euler 𝑒 ≅ 2,72;
𝑥: valor de tempo ou espaço que a variável contínua pode assumir, sendo 𝑥 ≥ 0.
Para o exemplo em questão, com 𝜆 = 0,1 ocorrência/min, a função densidade de
probabilidade fica seguinte forma:
1 1
𝐸 (𝑋 ) = para o exemplo acima 𝐸 (𝑋) = = 10 min entre acidentes
𝜆 0,1
1 1 1
𝑉𝐴𝑅(𝑋) = = 0,01 = 100 𝐷𝑃(𝑋) =
𝜆2 𝜆
SUMÁRIO
DISTRIBUIÇÕES NORMAL ............................................................................................................................. 2
INTRODUÇÃO........................................................................................................................................... 2
PROPRIEDADES DA NORMAL ................................................................................................................ 3
PADRONIZAÇÃO DE UMA DISTRIBUIÇÃO NORMAL ............................................................................... 5
DISTRIBUIÇÕES NORMAL
INTRODUÇÃO
A distribuição normal conhecida também como distribuição gaussiana é sem dúvida a
mais importante distribuição contínua.
Uma variável aleatória contínua X tem distribuição normal de probabilidade se a sua Função
Densidade de Probabilidade (f.d.p.) é dada por:
1 𝑋−𝜇 2
1 − ( )
𝑓 (𝑥 ) = 𝑒 2 𝜎 para −∞ < 𝑥 < ∞
𝜎 √2𝜋
Assim, uma variável aleatória contínua X que segue uma distribuição Normal tem como
parâmetros a média (µ) e variância (σ2), simbolicamente representado por:
𝑿~𝑵(𝝁, 𝝈𝟐 )
PROPRIEDADES DA NORMAL
Outra informação muito relevante trata-se da propriedade da curva Normal, que pode ser
ilustrada da seguinte forma:
Isso significa que se uma variável aleatória que segue uma distribuição Normal apresenta
68,3% de seus valores no intervalo de um desvio-padrão (±1𝜎) a contar de cada lado da média
(µ); 95,5% no intervalo de dois desvios-padrões (±2𝜎) a contar da média; e 99,7% no intervalo
de três desvios-padrões (3σ) a contar da média.
Exemplo:
𝑿~𝑵(𝝁, 𝝈𝟐 )
𝑋~𝑁(23,4)
Exemplo 2:
𝑋−𝜇
𝑍=
𝜎
Sendo que:
𝑋: corresponde a um valor específico da variável aleatória X com distribuição Normal;
𝜇: corresponde à média da variável aleatória X;
𝜎: corresponde ao desvio padrão da variável aleatória X;
𝑍: corresponde a um valor transformado com distribuição Normal Padrão
correspondente ao valor de X.
Dessa forma, temos a definição de uma característica muito importante: toda variável que
apresentar uma distribuição Normal Padrão sempre terá média igual a zero e desvio padrão
igual a 1. Assim:
𝑍~𝑁(0,1)
Logo, se 𝑋~𝑁(𝜇, 𝜎 2 ) então 𝑍~𝑁(0,1)
14−20
X1 = 14; 𝑍1 = = −3
2
16−20
X2 =16; 𝑍2 = = −2
2
18−20
X3 = 18; 𝑍3 = = −1
2
20−20
X4 = 20; 𝑍4 = =0
2
Exemplo de Aplicação
Um fabricante de baterias sabe por experiência passada, que as baterias de sua fabricação
têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem
aproximadamente distribuição normal. Oferece uma garantia de 312 dias, isto é, troca as
baterias que apresentarem falhas nesse período. Fabrica 10.000 baterias mensalmente.
Quantas baterias, o fabricante, deverá trocar pelo uso da garantia, mensalmente?( use
𝑃(𝑍 ≥ 2,88) = 0,002)
𝜇 = 600 𝑑𝑖𝑎𝑠
𝑋: duração da bateria. {
𝜎 = 100 𝑑𝑖𝑎𝑠
312−600
𝑃(𝑋 ≤ 312) = 𝑃(𝑍 ≤ −2,88) pois 𝑍 = = −2,88
100
Exercício
Uma enchedora automática de refrigerantes está regulada para que o volume médio de líquido em
cada garrafa seja de 1000 cm3 e desvio padrão de 10 cm3. Admita que o volume siga uma distribuição
normal.( dados 𝑃 (𝑍 ≤ 1) = 0,8413 e 𝑃(𝑍 ≤ 2) = 0,9772
a) Qual é a porcentagem de garrafas em que o volume de líquido é menor que 990 cm 3?
b) Qual é a porcentagem de garrafas em que o volume de líquido não se desvia da média em mais
do que dois desvios padrões?
Seja,
X: volume médio de líquido em cada garrafa.
X~N(1000, 102)
=10 2=20
-2 = 1000-20 = 980 e +2 = 1000+20 = 1020.
9801000 1020 1000
P(980 X 1020 ) P Z
P
(
2
Z
2
)
P(
Z
2
)
P
(
Z
2
)
10 10
P(Z 2)P(Z 2)P (
Z 2)1 P(Z 2) 2*P
(
Z
2
)
1
2
*
0,
9
7
7
2
1
0
,
9
5
4
49
5
%
SUMÁRIO
TRANSFORMAÇÃO DE VARIÁVEL ALEATÓRIA ............................................................................................... 2
CONCEITO ................................................................................................................................................ 2
EFEITO DE UMA CONSTANTE COM VARIÁVEIS ALEATÓRIAS ..................................................................... 2
TRANSFORMAÇÃO DA NORMAL PADRÃO ................................................................................................ 3
TRANSFORMAÇÃO DE SOMA DE VARIÁVEIS ALEATÓRIAS ......................................................................... 3
Exemplo:
Uma variável aleatória X corresponde ao número de investigados que podem ser presos
dos três possíveis suspeitos de uma investigação criminal sobre lavagem de dinheiro. A
probabilidade de um prisioneiro ser preso corresponde a 60% e são eventos independentes. A
variável Y corresponde ao dinheiro, em mil R$, retornado aos cofres públicos, conforme o
resultado dessa investigação. Sabe-se que a investigação gerou gastos de R$ 5 mil, porém cada
investigado preso gera um retorno financeiro ao Estado no valor de R$ 12 mil. Qual é o valor
esperado [E(Y)] e o desvio padrão [DP(Y)] da variável aleatória Y?
A cada investigado preso tem-se um retorno de R$ 12 mil aos cofres públicos e haverá um
gasto de R$ 5 mil reais pela investigação, independentemente de prender ou não alguém.
𝑋−𝜇
𝑍=
𝜎
𝐸 (𝑋 ) − 𝜇
𝐸 (𝑍 ) = =0
𝜎
EXEMPLO:
Duas variáveis aleatórias X e Y correspondem ao tempo para efetuar uma determinada
operação judicial. Ambas possuem distribuição Normal e são independentes entre si. A variável
X tem média igual a 42 min e desvio padrão igual a 3 min. Por outro lado, a variável Y tem média
igual 34 min e desvio padrão de 5 min. Outra variável aleatória W é o resultado da diferença
dos tempos, isto é, diferença entre a variável X com Y (𝑊 = 𝑋 − 𝑌). Qual é o valor esperado
[E(W)] e a variância [Var(W)] dessa nova variável aleatória?
Esquematizando:
SUMÁRIO
AMOSTRAGEM ............................................................................................................................................ 2
INTRODUÇÃO........................................................................................................................................... 2
TIPOS DE AMOSTRAS ............................................................................................................................... 2
TIPOS DE AMOSTRAGEM PROBABILÍSTICA............................................................................................ 2
AMOSTRAGEM
INTRODUÇÃO
O assunto de amostragem trabalha essencialmente sobre como os dados serão coletados
de modo que essa coleta represente fidedignamente o fenômeno que se pretende
compreender, isto é, o objeto de estudo.
Nesse conteúdo, desenvolve-se o ponto de partida de qualquer análise Estatística: a
determinação do objeto de estudo e como os dados serão coletados. Os dados brutos são
praticamente a matéria-prima da Estatística e, se eles forem extraídos de forma viciada
(tendenciosa), qualquer inferência obtida gerará informações inválidas e incoerentes ao
fenômeno estudado.
TIPOS DE AMOSTRAS
Amostra probabilística ou aleatória – uma amostra é probabilística quando o esquema
de amostragem usado permite atribuir a cada elemento da população uma
probabilidade conhecida, diferente de zero, de entrar para a amostra. É com apenas
este tipo de amostra, que se pode utilizar processos estatísticos para se fazer
inferências, pois somente neste caso pode-se avaliar a probabilidade do erro
amostral.
Amostra não probabilística – uma amostra é não probabilística quando existe uma
escolha deliberada dos seus elementos.