Você está na página 1de 67

alfaconcursos.com.

br

SUMÁRIO
ANÁLISE EXPLORATÓRIA DE DADOS .................................................................. Erro! Indicador não definido.
1.1 ESTATÍSTICA DESCRITIVA E INFERENCIAL ............................................................................................ 2
1.2 ETAPAS DE UMA PESQUISA ................................................................................................................ 2
1.3 NOMENCLATURA ESTATÍSTICA ........................................................................................................... 2
1.4 TIPOS DE VARIÁVEIS ........................................................................................................................... 2
1.5 REPRESENTAÇÕES ESTATÍSTICAS ........................................................................................................ 4
1.5.1 TABELAS ...................................................................................................................................... 4
1.5.2 GRÁFICOS .................................................................................................................................... 5

MUDE SUA VIDA!


1
alfaconcursos.com.br

ANÁLISE EXPLORATÓRIA DE DADOS


1.1 ESTATÍSTICA DESCRITIVA E INFERENCIAL
A estatística pode ser definida como a ciência que trata com a organização, descrição,
análise e interpretação de conjuntos de dados.
A estatística descritiva descreve um conjunto de dados sem tirar conclusões de caráter
mais genérico e a inferência estatística tirar conclusões sobre uma determinada população
utilizando apenas uma parte dela.

1.2 ETAPAS DE UMA PESQUISA


Em uma pesquisa estatística precisamos coletar dados que possam fornecer informações
capazes de responder nossos questionamentos. Mas para que os resultados de uma pesquisa
tenham confiabilidade, a coleta dos dados e a sua análise devem ser feitas de forma criteriosa e
objetiva.
As principais etapas de uma pesquisa são:

a) definição do problema (objetivos);


b) planejamento da pesquisa;
c) execução da pesquisa;
d) dados;
e) análise dos dados;
f) resultados;
g) conclusões.

1.3 NOMENCLATURA ESTATÍSTICA

População: é o conjunto de todos os elementos que formam o universo de nosso estudo e


que são passíveis de serem observados.

Amostra: é um subconjunto da população.

Unidade experimental ou parcela: é o elemento que vai ser observado ou a unidade que
vai receber o tratamento. Por exemplo, dependendo do experimento, a unidade experimental
pode ser um animal, uma peça fabricada, uma pessoa, etc.

Parâmetro: é uma característica descritiva dos elementos da população, como por


exemplo, a média de alguma variável, a proporção de algum atributo, etc.

Estatística: é uma característica descritiva dos elementos da amostra, como por exemplo,
a média de alguma variável, etc.

MUDE SUA VIDA!


2
alfaconcursos.com.br

1.4 TIPOS DE VARIÁVEIS

As variáveis são classificadas em dois grupos: variáveis quantitativas e variáveis


qualitativas.

Variáveis quantitativas: são aquelas que descrevem quantidades e são associadas a


números. As variáveis quantitativas são classificadas em discretas e contínuas.

Variáveis quantitativas discretas: assumem apenas determinados valores no campo dos


reais. Em geral, descrevem problemas de contagem. Assumem, portanto, somente valores
inteiros.

Exemplos:

a) Número de filhos em casais residentes em uma determinada cidade.


b) Pontos obtidos jogando-se 5 vezes um dado.

Variáveis quantitativas contínuas: podem teoricamente assumir qualquer valor de um


subconjunto dos números reais.

Exemplos:

a) Idade de pessoas residentes em uma determinada cidade.


b) Peso de pessoas residentes em uma determinada cidade.
c) Altura de pessoas residentes em uma determinada cidade.

Variáveis qualitativas: são usadas para descrever qualidades.

Exemplos:

a) Conceito obtido pelos alunos de matemática (A, B, C, D, E).


b) Sexo dos alunos da turma (M, F).
c) Classe de renda dos operários de certo bairro (baixa, média, alta).
d) Raça dos bovinos criados em uma fazenda (holandês, nelore, zebu).

Obs.: As variáveis qualitativas são classificadas em ordinais e nominais.

Variáveis qualitativas ordinais: quando houver um sentido de ordenação em seus


possíveis valores, como nas variáveis citadas nos itens a e c.

Variáveis qualitativas nominais: quando não houver sentido de ordenação, em seus


valores, como nas variáveis citadas nos itens b e d.

Variáveis Bidimensionais ou multidimensionais


Podem ocorrer, em problemas práticos, que tenhamos interesse em estudar,
simultaneamente, dois ou mais atributos quantitativos, qualitativos ou ambos.

Exemplo: Visando planejar uma dieta alimentar padrão para os funcionários de certa
empresa, um nutricionista anotou o peso e a altura de 10 deles. Tomando X e Y para descrever,

MUDE SUA VIDA!


3
alfaconcursos.com.br

respectivamente, as variáveis quantitativas contínuas peso em kg e altura em cm, temos a


variável bidimensional (X, Y) e um conjunto de pares ordenados (xi, yi). Por exemplo:

(X, Y) = {(65, 175), (82, 181), ..., (70, 172)}.

Note que o nutricionista poderia ter julgado relevante tomar a idade Z dos funcionários.
Neste caso, teríamos uma variável tridimensional (X, Y, Z) descrita por ternas ordenadas (xi, yi,
zi). Poder-se-ia incluir, também, a variável sexo (qualitativa).

1.5 REPRESENTAÇÕES ESTATÍSTICAS

1.5.1 TABELAS

As tabelas de frequência são utilizadas para a organização dos dados para uma melhor
análise dos dados.
As tabelas podem ser simples com por exemplo:

-Número de defeitos por unidade.

Ou com intervalos de classes com várias informações.

Notas dos 50 alunos de uma turma

1.5.2 GRÁFICOS

MUDE SUA VIDA!


4
alfaconcursos.com.br

A principal função dos gráficos é tornar a informação mais visual os mais comuns são os de
colunas e os de setores.

Gráfico de colunas

Gráfico de setores

MUDE SUA VIDA!


5
alfaconcursos.com.br

SUMÁRIO

DISTRIBUIÇÃO DE FREQUÊNCIAS .................................................................................................................. 2


2- DISTRIBUIÇÃO DE FREQUÊNCIAS .......................................................................................................... 2
2.1. DADOS BRUTOS. ............................................................................................................................ 2
2.2. ROL. .............................................................................................................................................. 2
2.3. AMPLITUDE TOTAL OU “RANGE” (R). ............................................................................................. 2
2.4. FREQUÊNCIA ABSOLUTA (𝒇𝒊). ........................................................................................................ 2
2.5. DISTRIBUIÇÃO DE FREQUÊNCIA. .................................................................................................... 2
2.6. NÚMERO DE CLASSES (K). .............................................................................................................. 2
2.7. AMPLITUDE DAS CLASSES (H). ....................................................................................................... 3
2.8. LIMITES DAS CLASSES. ................................................................................................................... 3
2.9. PONTO MÉDIO DAS CLASSES (𝑿𝒊). ................................................................................................. 3
2.10. FREQUÊNCIA ABSOLUTA ACUMULADA (FAC). .............................................................................. 3
2.11. FREQUÊNCIA RELATIVA (RI). ........................................................................................................ 3
2.12. FREQUÊNCIA RELATIVA ACUMULADA (RI). ................................................................................... 3

MUDE SUA VIDA!


1
alfaconcursos.com.br

DISTRIBUIÇÃO DE FREQUÊNCIAS
2- DISTRIBUIÇÃO DE FREQUÊNCIAS

Alguns conceitos fundamentais

População é um conjunto de indivíduos ou objetos que apresentam pelo menos uma


característica em comum. A população pode ser finita ou infinita. 

Amostra – Considerando-se a impossibilidade, na maioria das vezes, do tratamento de


todos os elementos da população, retira-se uma amostra. Portanto, amostra é um subconjunto
da população.

Os procedimentos para a representação das distribuições de frequências são dados a


seguir.

2.1. DADOS BRUTOS


O conjunto dos dados numéricos obtidos após a crítica dos valores coletados constitui-se
nos dados brutos.

2.2. ROL
É o arranjo dos dados brutos em ordem de frequência crescente ou decrescente.

2.3. AMPLITUDE TOTAL OU “RANGE” (R)


É a diferença entre o maior e o menor valor observado.

2.4. FREQUÊNCIA ABSOLUTA (𝒇𝒊)


É o número de vezes que o elemento aparece na amostra, ou o número de elementos
pertencentes a uma classe.

2.5. DISTRIBUIÇÃO DE FREQUÊNCIA


É o arranjo dos valores e suas respectivas frequências.

2.6. NÚMERO DE CLASSES (K)


Não há uma fórmula exata para o cálculo do número de classes. São dadas duas soluções.

a) K = 5 para n 25 e K √𝑛, para n > 25;

b) Fórmula de Sturges K 1 3,22 log n.

MUDE SUA VIDA!


2
alfaconcursos.com.br

2.7. AMPLITUDE DAS CLASSES (H)


h R K
Assim como no caso do número de classes (K), a amplitude das classes (h) deve ser
aproximada para um número inteiro.

2.8. LIMITES DAS CLASSES


Existem diversas maneiras de expressar os limites das classes.

a) a b, a classe compreende valores de a, inclusive, até b, exclusive.


b) a b, a classe compreende valores de a, exclusive, até b, inclusive.
c) a b, a classe compreende valores de a, exclusive, até b, exclusive.
d) a b, a classe compreende valores de a, inclusive, até b, inclusive.

2.9. PONTO MÉDIO DAS CLASSES (𝑿𝒊)


É a média aritmética entre o limite superior e o limite inferior da classe.

2.10. FREQUÊNCIA ABSOLUTA ACUMULADA (FAC)


É a soma das frequências dos valores inferiores ou iguais ao valor dado.

2.11. FREQUÊNCIA RELATIVA (RI)


É dada por
𝑓
𝑟𝑖 = 𝑛𝑖

2.12. FREQUÊNCIA RELATIVA ACUMULADA (RI)


É o quociente entre a frequência acumulada da classe e o total de elementos,

𝐹𝑎𝑐
𝑅𝑖 = 
𝑛


Exemplo1:
Dado o rol de 50 notas, formar uma distribuição de frequências:

Solução:

Amplitude total (R): R = 97 – 33 = 64;


Número de classes por Sturges (K): K 1 3,22 log50 1 3,22(1,7) 7;
Número de classes por raiz (K): 𝐾 ≅ √50 ≅ √49 = 7;
64
Amplitude das classes (h): ℎ = 7 = 9,14. Para facilitar usaremos h = 10.

MUDE SUA VIDA!


3
alfaconcursos.com.br

Logo, a distribuição de frequências será:

Exemplo 2:
Analisando a tabela abaixo que apresenta as frequências acumuladas das idades de 20 jovens entre
14 e 20 anos, julgue o item subsequente.

Idade 𝐹𝑎𝑐
(anos)
2
14
4
15
9
16
12
17
15
18
18
19
20
20

Ao selecionarmos um aluno com 16 anos ou mais, a probabilidade de ele ter menos de 18


anos é de 50%.
( ) certo ( ) errado

MUDE SUA VIDA!


4
alfaconcursos.com.br

MUDE SUA VIDA!


5
alfaconcursos.com.br

SUMÁRIO
3- MEDIDAS DE POSIÇÃO ............................................................................................................................. 2
3.1. MÉDIA ARITMÉTICA .............................................................................................................................. 2
3.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS............................................................................. 2

MUDE SUA VIDA!


1
alfaconcursos.com.br

3- MEDIDAS DE POSIÇÃO
3- MEDIDAS DE POSIÇÃO

As principais medidas de posição são chamadas medidas de tendência central, pois,


representam um conjunto de observações pelos seus valores médios, em torno dos quais
tendem a concentrarem-se os dados.

3.1. MÉDIA ARITMÉTICA


Para encontrar a média 𝑥̅ somamos todos os valores e dividimos pelo número de valores
Ex.1:
Determinar a média aritmética dos valores 3, 7, 8, 10 e 12.
3 + 7 + 8 + 10 + 12
𝑥̅ = =8
5

3.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS


Ex.2:
a). Determinar a média aritmética da seguinte distribuição.

Para facilitar montamos a seguinte tabela.

26
𝑥̅ = = 2,6
10

b). Determinar a renda média da distribuição.

Para facilitar:

MUDE SUA VIDA!


2
alfaconcursos.com.br

268
𝑥̅ = = 6,7
40

Exemplo 3:
Analisando a tabela abaixo que apresenta as frequências acumuladas das idades de 20 jovens entre
14 e 20 anos, julgue o item a seguir.

Idade 𝐹𝑎𝑐
(anos)
2
14
4
15
9
16
12
17
15
18
18
19
20
20

A média das idades dos jovens da tabela é superior a 17.


( ) certo ( ) errado

Exemplo 4
Um concurso é composto por cinco etapas. Cada etapa vale 100 pontos. A pontuação final de cada
candidato é a média de suas notas nas cinco etapas. A classificação obedece à ordem decrescente das
pontuações finais. O critério de desempate baseia-se na maior nota na quinta etapa.

Dadas as informações acima, julgue o item a seguir.


Na ordem de classificação final do concurso o primeiro colocado foi o candidato C.
( ) certo ( ) errado

MUDE SUA VIDA!


3
alfaconcursos.com.br

SUMÁRIO
3- MEDIDAS DE POSIÇÃO ............................................................................................................................. 2
3.3. MEDIANA .......................................................................................................................................... 2
3.4. MEDIANA PARA DADOS AGRUPADOS EM CLASSES ............................................................................ 3
3.5. MODA ............................................................................................................................................... 4
3.6. MODA PARA DADOS AGRUPADOS EM CLASSES ................................................................................ 4
1) MODA BRUTA .................................................................................................................................. 5
2) FÓRMULA DE CZUBER ...................................................................................................................... 5

MUDE SUA VIDA!


1
alfaconcursos.com.br

3- MEDIDAS DE POSIÇÃO
3.3. MEDIANA
Colocados os valores em ordem crescente, mediana é o elemento que ocupa a posição
central. Indicando a mediana por Md e o número de observações por n, dois casos devem ser
considerados:

𝑛+1
1º) Se n for ímpar, a mediana será o elemento de ordem .
2

2º) Se n for par, a mediana será a média aritmética entre os elementos centrais, de ordem
𝑛 𝑛
𝑒 2 + 1.
2

Exemplos:

1) Calcular a mediana para os valores.

a) 5, 7, 8, 10, 14.

b) 10, 14, 15, 5, 7, 8.

2) Calcular a mediana para as seguintes distribuições.


a)

11+1
n = 11, n é ímpar, logo a mediana será o elemento de ordem = 6º 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜
2

Md = 3

MUDE SUA VIDA!


2
alfaconcursos.com.br

b)

n = 42, n é par, logo a mediana será a média entre os elementos de ordem 21º e 22º

Md = 87.

3.4. MEDIANA PARA DADOS AGRUPADOS EM CLASSES

O procedimento usado para o cálculo da mediana para dados agrupados é dado a seguir.
1º passo: calcula-se a ordem n/2;
2º passo: pela frequência acumulada identifica-se a classe que contém a mediana (classe
Md);
3º passo: utiliza-se a fórmula:

𝑛
( 2 − ∑ 𝑓) . ℎ
𝑀𝑑 = 𝑙𝑀𝑑 +
𝑓𝑀𝑑

𝑙𝑀𝑑 é o limite inferior da classe Md;

∑ 𝑓 é a soma das frequências anteriores a classe Md;

𝑓𝑀𝑑 é a frequência absoluta da classe Md;

ℎ é a amplitude da classe Md.

Exemplo:
Determinar a mediana para a variável renda familiar.

MUDE SUA VIDA!


3
alfaconcursos.com.br

Preenchendo a frequência acumulada na tabela:

𝑛
1º Passo: 2 = 20
2º Passo: classe Md
3º Passo:
(20−15).2
𝑀𝑑 = 6 + 14 = 6 + 0,7 = 6,7

3.5. MODA

Moda (Mo) é o valor que aparece mais vezes, isto é, o valor ao qual esteja associada à
frequência absoluta mais alta.

Exemplos:
a) 2, 6, 8, 8, 8, 8, 10, 10, 12, 12, 18 Mo = 8.

b) 4, 4, 5, 5, 6, 6 Conjunto amodal.

c) 1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 6, 6 Mo1 = 2 e Mo2 = 5 Conjunto bimodal.

d) 1, 2, 3, 4, 5 Conjunto amodal.

3.6. MODA PARA DADOS AGRUPADOS EM CLASSES

A classe que apresenta maior frequência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os
limites da classe modal. Existem diversas fórmulas para o cálculo da moda. Veremos duas delas.

MUDE SUA VIDA!


4
alfaconcursos.com.br

1) MODA BRUTA
Uma ideia aproximada da moda e muito útil em problemas práticos é a moda bruta,
definida como o ponto médio da classe modal.

2) FÓRMULA DE CZUBER
Procedimento:
1º) Identifica-se a classe modal.
2º) Aplica-se a fórmula:

𝑑1
𝑀𝑜 = 𝑙 + ℎ
𝑑1 + 𝑑2
Onde:
𝑙 é o limite inferior da classe modal;
𝑑1 é a diferença entre a frequência da classe modal e a imediatamente anterior;
𝑑2 é a diferença entre a frequência da classe modal e a imediatamente posterior;
ℎ é a amplitude da classe modal.

Exemplo:
Determinar a moda para a variável renda familiar:

1º) Classe modal: 6 8;

2º) Aplica-se a fórmula:


4
𝑀𝑜 = 6 + 4+6 2 = 6 + 0,8 = 6,8

Observa-se, então, que para o conjunto de dados utilizado, obteve-se:

Média = 6,7.
Mediana = 6,7.
Moda = 6,8.

MUDE SUA VIDA!


5
alfaconcursos.com.br

Relação entre média, mediana e moda.


Em uma distribuição simétrica, observa-se que a média = mediana = moda.

Em uma distribuição assimétrica positiva, observa-se que a média mediana moda.

Em uma distribuição assimétrica negativa, observa-se que a média mediana moda.


MUDE SUA VIDA!


6
alfaconcursos.com.br

Utilização das medidas de tendência central


De maneira geral, uma primeira ideia sobre qual delas escolher pode ser dada pelos
seguintes itens:

a) Escolha da média

i) Quando é necessário o tratamento matemático;


ii) Quando os dados têm distribuição aproximadamente simétrica;
iii) Quando for necessário obter posteriormente outros parâmetros que podem
depender da média, como o desvio padrão, a variância, etc.

b) Escolha da mediana

i) Quando há valores discrepantes que podem “distorcer” a média;


ii) Quando desejamos conhecer o ponto central exato da distribuição;
iii) Quando a distribuição dos dados é muito assimétrica.

c) Escolha da moda

i) Quando a medida de interesse é o ponto mais típico ou popular dos dados;


ii) Quando precisamos apenas de uma rápida ideia sobre a tendência central dos dados.

MUDE SUA VIDA!


7
alfaconcursos.com.br

SUMÁRIO
3- MEDIDAS DE POSIÇÃO ............................................................................................................................. 2
3.7 - QUARTIS .......................................................................................................................................... 2
3.8 - DECIS ............................................................................................................................................... 3
3.9 - PERCENTIS ....................................................................................................................................... 4

MUDE SUA VIDA!


1
alfaconcursos.com.br

3- MEDIDAS DE POSIÇÃO

3.7 - QUARTIS

Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:


Q1 = 1º quartil, deixa 25% dos elementos abaixo.
Q2 = 2º quartil, coincide com a mediana, deixa 50% dos elementos abaixo.
Q3 = 3º quartil, deixa 75% dos elementos abaixo.

As fórmulas para a determinação dos quartis Q 1 e Q3 são semelhantes à usada para o


cálculo da mediana.
Determinação de Q1:
1º Passo: calcula-se n/4;
2º Passo: identifica-se a classe Q1 pela frequência acumulada;
3º Passo: aplica-se a fórmula:

𝑛
( 4 − ∑ 𝑓) . ℎ
𝑄1 = 𝑙𝑄1 +
𝑓𝑄1

Determinação de Q3:
1º Passo: calcula-se 3n/4;
2º Passo: identifica-se a classe Q3 pela frequência acumulada;
3º Passo: aplica-se a fórmula:
3𝑛
( 4 − ∑ 𝑓) . ℎ
𝑄3 = 𝑙𝑄3 +
𝑓𝑄3

Exemplo: Determinar Q1 e Q3 para a variável renda familiar:

1º Passo: n = 40;
𝑛 3𝑛
𝑄1: = 10 𝑄3: = 30
4 4

MUDE SUA VIDA!


2
alfaconcursos.com.br

2º Passo: pela frequência acumulada identifica-se a classe Q1 e a classe Q3.

3º Passo: aplicam-se as fórmulas:

𝑛
( 4 − ∑ 𝑓) . ℎ (10 − 5). 2
𝑄1 = 𝑙𝑄1 + =4+ =5
𝑓𝑄1 10
3𝑛
( 4 − ∑ 𝑓) . ℎ (30 − 29). 2
𝑄3 = 𝑙𝑄3 + =8+ = 8,25
𝑓𝑄3 8

Então, 25% dos elementos estão abaixo de Q 1 = 5, ou seja, 25% das famílias ganham menos
que 5 salários mínimos e 75% dos elementos estão abaixo de Q 3 = 8,25, ou seja, 75% das famílias
ganham menos que 8,25 salários mínimos.

3.8 - DECIS

Os decis são valores que dividem um conjunto de dados em 10 partes iguais. O cálculo é
dado por:

𝑖𝑛
1º Passo: calcula-se 10, onde i = 1, 2, 3, 4, 5, 6, 7, 8 e 9;
2º Passo: identifica-se a classe Di pela frequência acumulada;
3º Passo: aplica-se a fórmula:

𝑖𝑛
(10 − ∑ 𝑓) . ℎ
𝐷𝑖 = 𝑙𝐷𝑖 +
𝑓𝐷𝑖

MUDE SUA VIDA!


3
alfaconcursos.com.br

3.9 - PERCENTIS
𝑖𝑛
1º Passo: calcula-se 100, onde i = 1, 2, ...99;
2º Passo: identifica-se a classe Pi pela frequência acumulada;
3º Passo: aplica-se a fórmula:

𝑖𝑛
(100 − ∑ 𝑓) . ℎ
𝑃𝑖 = 𝑙𝑃𝑖 +
𝑓𝑃𝑖

Exemplo: Determinar o decil 1 (D1) e o percentil 90 (P90) para a variável renda familiar:

1º Passo: n = 40;
40 90.40
D1: =4 P90: = 36
10 100

2º Passo: pela frequência acumulada identifica-se a classe D1 e a P90;

𝑛
(10 − ∑ 𝑓) . ℎ ( 4 − 0). 2
𝐷1 = 𝑙𝐷1 + = 2+ = 3,6
𝑓𝐷1 5

90𝑛
( 100 − ∑ 𝑓) . ℎ (36 − 29). 2
𝑃90 = 𝑙𝑃90 + =8+ = 9,75
𝑓𝑃90 8

MUDE SUA VIDA!


4
alfaconcursos.com.br

Então, 10% dos elementos estão abaixo de D1 = 3,6, ou seja, 10% das famílias ganham
menos que 3,6 salários mínimos e 90% das famílias ganham menos que 9,75 salários mínimos.

MUDE SUA VIDA!


5
alfaconcursos.com.br

SUMÁRIO

4- MEDIDAS DE DISPERSÃO .......................................................................................................................... 2


4.1 AMPLITUDE TOTAL ............................................................................................................................. 2
4.2 VARIÂNCIA ......................................................................................................................................... 2
4.3 DESVIO PADRÃO................................................................................................................................. 3

MUDE SUA VIDA!


1
alfaconcursos.com.br

4- MEDIDAS DE DISPERSÃO
Quando encontramos a média de um conjunto de dados, podemos verificar a variabilidade
ou dispersão dos dados, ou seja, a distância que eles se encontram da média. Queremos saber
se os dados estão próximos ou mais afastados da média.
A dispersão (variação) dos dados pode ser verificada através das seguintes medidas de
dispersão: amplitude total, variância, desvio padrão e coeficiente de variação.

4.1 AMPLITUDE TOTAL

É a diferença entre o maior e o menor valor observado: R = xmáx. – xmín..


A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da
série. Por este motivo, não é muito utilizada como medida de dispersão. Ela é apenas uma
indicação aproximada da dispersão ou variabilidade.

4.2 VARIÂNCIA

Definimos como variância, a soma dos quadrados das diferenças entre os dados e a média
dividido pelo número de dados.

n n

 x
i 1
i  x
2
 x   
i
2

i 1
𝜎2 = Para população
n n
n

 x
i 1
i  x
2

𝑠2 = Para amostra
n 1

𝜎 2 - Quando calculamos a variância de uma população.


𝑠 2 - Quando calculamos a variância de uma amostra.

Exemplo 1
Sete crianças brincam em um parquinho e suas idades são 6, 4, 3, 6, 7, 3 e 6. Qual a
variância das idades?

Exemplo 2
(ESAF-2012) A variância da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 é igual a

a) 3.
b) 2.
c) 1.
d) 4.
e) 5.

MUDE SUA VIDA!


2
alfaconcursos.com.br

Exemplo 3
(ESAF – AFRFB – 2009) A tabela mostra a distribuição de frequências relativas
populacionais (f’) de uma variável X:

Sabendo que “a” é um número real, então a média e a variância de X são, respectivamente:

4.3 DESVIO PADRÃO


O desvio padrão é definido como a raiz quadrada positiva da variância 𝑠 = √𝑠 2 ou 𝜎 = √𝜎 2
A variância e o desvio padrão mostram a dispersão dos dados em relação à média, ou seja, a
distância média de cada valor em relação à média. O desvio padrão trabalha com a mesma unidade
da variável, sendo de maior interesse que a variância nas aplicações práticas.

Exemplo 1
Sete crianças brincam em um parquinho e suas idades são 6, 4, 3, 6, 7, 3 e 6. Qual desvio padrão
das idades?

MUDE SUA VIDA!


3
alfaconcursos.com.br

SUMÁRIO
4- MEDIDAS DE DISPERSÃO .............................................................................................................................................................. 2
4.4 VARIÂNCIA PARA DADOS AGRUPADOS ......................................................................................................................... 2
4.5 COEFICIENTE DE VARIAÇÃO ................................................................................................................................................ 3

MUDE SUA VIDA!


1
alfaconcursos.com.br

4- MEDIDAS DE DISPERSÃO

4.4 VARIÂNCIA PARA DADOS AGRUPADOS


O cálculo da variância para dados agrupados é dado por

 fi x   
i 1
i
2

𝜎2 = Para população
n

 fix  x 
i 1
i
2

𝑠2 = Para amostra
n 1

Exemplo: Considere a amostra com a renda famílias de 40 famílias. Determine qual a variância
e o desvio padrão dessa distribuição.

Renda Familiar Número de


(Salário Mínimo) famílias
2 ⊢ 4 3
4 ⊢ 6 10
6 ⊢ 8 14
8 ⊢ 10 10
10 ⊢ 12 3
Total 40

Renda Familiar Número de Ponto médio xifi


(Salário Mínimo) famílias xi
2 ⊢ 4 3 3 9
4 ⊢ 6 10 5 50
6 ⊢ 8 14 7 98
8 ⊢ 10 10 9 90
10 ⊢ 12 3 11 33
Total 40 280

Logo:
280
𝑥= =7
40

MUDE SUA VIDA!


2
alfaconcursos.com.br

Para calcular a variância usamos (𝑥𝑖 − 𝑥̅ )2

Renda Familiar Número de Ponto médio (𝑥𝑖 − 𝑥̅ )2 (𝑥𝑖 − 𝑥̅ )2 . 𝑓𝑖


(Salário Mínimo) famílias xi
2 ⊢ 4 3 3 16 48
4 ⊢ 6 10 5 4 40
6 ⊢ 8 14 7 0 0
8 ⊢ 10 10 9 4 40
10 ⊢ 12 3 11 16 48
Total 40 40 176

Variância
n

 fix  x 
i
2

176
𝑠2 = i 1
  4,5
n 1 39

Desvio padrão

𝑠 = √𝑠 2 = √4,5 ≅ 2,1

Portanto, podemos afirmar que a renda média deste grupo de 40 famílias é de 7 salários
mínimos, com uma variação de 2,1 salários mínimos, medidas pelo desvio padrão.

4.5 COEFICIENTE DE VARIAÇÃO


O coeficiente de variação é definido como o quociente entre o desvio padrão e a média
aritmética. É frequentemente expresso em porcentagem pela fórmula:

𝑠
𝐶𝑉 = 𝑥̅ . 100 , para amostras.

𝜎
𝐶𝑉 = 𝜇 . 100 , para população.

Exemplo: Considere amostras de dois grupos, referentes a idades de pessoas. Obtenha o


coeficiente de variação.

Grupo A: 1, 3 e 5;
Grupo B: 53, 55 e 57.

Para o grupo A, tem-se que: x = 3 anos; 𝑠 2 = 4, 𝑠 = 2

𝑠 2
𝐶𝑉 = . 100 = . 100 = 66,67%
𝑥̅ 3

Para o grupo B, tem-se que: x = 55 anos; 𝑠 2 = 4, 𝑠 = 2

𝑠 2
𝐶𝑉 = . 100 = . 100 = 3,64%
𝑥̅ 55

MUDE SUA VIDA!


3
alfaconcursos.com.br

Um CV = 66,67 % indica uma dispersão dos dados em relação à média muito grande, ou seja,
a dispersão relativa é alta. Já um CV = 3,64 % indica que a dispersão dos dados em relação à média
é pequena.

Exemplo
(FCC – BACEN – 2006) Com relação às medidas de posição e de dispersão, é correto
afirmar:

a) Dobrando todos os valores dos salários dos funcionários de uma empresa, tem-se
que o salário médio desses funcionários e a respectiva variância também ficam dobrados.

b) A diferença entre a variância e o desvio padrão de uma sequência de números é


nula somente no caso em que a variância e o desvio padrão são iguais a zero.

c) Em qualquer distribuição de valores, a diferença entre a média e a moda é sempre


maior ou igual a zero.

d) Multiplicando todos os valores de uma sequência de números positivos por um


número positivo tem-se que o respectivo coeficiente de variação não se altera.

e) O coeficiente de variação correspondente a uma série de números positivos é igual


à divisão do quadrado da respectiva média aritmética pela variância.

MUDE SUA VIDA!


4
alfaconcursos.com.br

SUMÁRIO
5- MEDIDAS DE ASSIMETRIA E CURTOSE..................................................................................2
5.1- MEDIDAS DE ASSIMETRIA...................................................................................................2
5.2 – MEDIDA DE CURTOSE..........................................................................................................3

MUDE SUA VIDA!


1
alfaconcursos.com.br

5- MEDIDAS DE ASSIMETRIA E CURTOSE


5.1- MEDIDAS DE ASSIMETRIA
As medidas de assimetria caracterizam como e quanto à distribuição de frequências se
afasta da condição de simetria.
Dentre os vários estimadores da assimetria, tem-se o coeficiente de assimetria de
Pearson, dado por:

𝑥̅ −𝑀𝑜
𝐴 𝑠 (𝑃 ) = , em que se 𝐴𝑠 (𝑃) = 0, a distribuição é simétrica.
𝑠
Se 𝐴𝑠 (𝑃) > 0, a distribuição é assimétrica positiva.
Se 𝐴𝑠 (𝑃) < 0, a distribuição é assimétrica negativa.

Considere a amostra com a renda famílias de 40 famílias. Determine qual a variância e o


desvio padrão dessa distribuição.

Renda Familiar Número de


(Salário Mínimo) famílias

3
2 ⊢ 4
10
4 ⊢ 6
14
6 ⊢ 8
10
8 ⊢ 10
3
10 ⊢ 12
Total 40

𝑥̅ = 7
𝑑1 4
𝑀𝑜 = 𝑙 + ℎ =6+ .2 = 7
𝑑1 + 𝑑2 4+4

𝑠 = √𝑠 2 = √4,5 ≅ 2,1

𝑥̅ −𝑀𝑜
𝐴 𝑠 (𝑃 ) = , onde se 𝐴𝑠 (𝑃) = 0, a distribuição é simétrica
𝑠

Quando |As(P)| < 0,15, podemos considerar a distribuição como praticamente simétrica.
Por outro lado, costuma-se considerar a assimetria como moderada se 0,15 < |A s(P)| < 1,
e forte se |As(P)| > 1.

- Outros coeficientes de assimetria estão disponíveis na literatura. Dentre eles o


coeficiente de assimetria de Yule, definido em função das separatrizes:

𝑄1 + 𝑄3 − 2𝑄2
𝐴 (𝑌 ) =
𝑄3 − 𝑄1

MUDE SUA VIDA!


2
alfaconcursos.com.br

5.2 – MEDIDA DE CURTOSE

O coeficiente de curtose de uma distribuição fornece uma medida do achatamento da


curva que a descreve.

Uma distribuição cuja curva tem a forma da curva 1, tem seu coeficiente de curtose
C = 0,263 e é dita mesocúrtica.

Se ela tem uma curva mais afilada, como a curva 2, ela é dita leptocúrtica e tem C < 0,263.

Se a curva é mais achatada, como a curva 3, ela é dita platicúrtica e tem coeficiente de
curtose C > 0,263.

Dentre os vários coeficientes de curtose disponíveis, tem-se o coeficiente de Keley,


definido com base nas separatrizes.

𝑄3−𝑄1 𝑑𝑄 𝑄3−𝑄1
𝐶 (𝐾 ) = 2(𝐷9−𝐷1) = 𝐷9−𝐷1 , onde 𝑑𝑄 = 2

MUDE SUA VIDA!


3
alfaconcursos.com.br

Exemplo: Na distribuição

𝑛
( 4 − ∑ 𝑓) . ℎ (10 − 5). 2
𝑄1 = 𝑙𝑄1 + =4+ =5
𝑓𝑄1 10
3𝑛
( − ∑ 𝑓) . ℎ (30 − 29)
𝑄3 = 𝑙𝑄3 + 4 =8+ = 8,25
𝑓𝑄3 8
𝑛
(10 − ∑ 𝑓) . ℎ ( 4 − 0). 2
𝐷1 = 𝑙𝐷1 + = 2+ = 3,6
𝑓𝐷1 5
9𝑛
(10 − ∑ 𝑓) . ℎ (36 − 29). 2
𝐷9 = 𝑙𝐷9 + = 8+ = 9,75
𝑓𝐷9 8

𝑄3 − 𝑄1 8,25 − 5
𝐶 (𝐾 ) = = = 0,264
2(𝐷9 − 𝐷1) 2(9,75 − 3,6)

Como o coeficiente de curtose C > 0,263. A curva é dita Platicúrtica.

MUDE SUA VIDA!


4
alfaconcursos.com.br

SUMÁRIO
PROBABILIDADES ......................................................................................................................................... 2
INTRODUÇÃO........................................................................................................................................... 2
EXPERIMENTOS ALEATÓRIOS ............................................................................................................... 2
DEFINIÇÃO ............................................................................................................................................... 2

MUDE SUA VIDA!


1
alfaconcursos.com.br

PROBABILIDADES
INTRODUÇÃO
EXPERIMENTOS ALEATÓRIOS
Chamamos de experimentos aleatórios aqueles que, repetidos em idênticas condições,
produzem resultados diferentes. Embora não saibamos qual o resultado que irá ocorrer em um
experimento, em geral, conseguimos descrever o conjunto de todos os resultados possíveis que
podem ocorrer.
Exemplos:
a) Lançar uma moeda e observar a face de cima.
b) Lançar um dado e observar o nº da face de cima.
ESPAÇO AMOSTRAL: Chamamos de espaço amostral, e indicamos por S ou , um conjunto
formado por todos os resultados possíveis de um experimento aleatório.
Exemplos:
a) Lançar uma moeda e observar a face de cima.
S = { C,R}, em que C representa cara e R coroa.
b) Lançar um dado e observar o nº da face de cima.
S = {1, 2, 3, 4, 5, 6}
EVENTO: Um evento é um conjunto de resultados do experimento; em termos de conjunto, é
um subconjunto do espaço amostral. Em geral indicamos um evento por uma letra maiúscula
do alfabeto: A, B, ..., X, Y, Z.
Os eventos que possuem um único elemento são chamados eventos elementares.
Exemplo:
Um dado é lançado e observa-se o nº da face de cima.
S = {1, 2, 3, 4, 5, 6}
Eis alguns eventos:
a) Ocorrência de nº impar. A = {1, 3, 5};
b) Ocorrência de nº primo. B = {2, 3, 5};
c) Ocorrência de nº menor que 4. C = {1, 2, 3};
d) Ocorrência de nº menor que 7. D = {1, 2, 3, 4, 5, 6} = S (evento certo)
e) Ocorrência de nº maior ou igual a 7. E = (evento impossível)

DEFINIÇÃO
Para calcular a probabilidade temos que efetuar uma divisão entre o evento desejado e o
total de eventos possíveis, ou seja, a probabilidade de um evento A acontecer será as
possibilidades de A acontecer dividido pelo total de possibilidades.

nA 
PA  
n S

MUDE SUA VIDA!


2
alfaconcursos.com.br

P  A 
evento desejado
eventos possíveis

O número de eventos possíveis é chamado de espaço amostral.


EXEMPLOS
1. Qual a probabilidade de lançarmos um dado honesto e o resultado ser um número par ou
primo?

2. Ao lançarmos dois dados e somarmos os valores das duas faces voltados para cima, qual
a probabilidade de o resultado ser maior que 8.

3. Ao lançarmos dois dados qual a probabilidade de saírem dois números iguais.

4. Dois dados são lançados simultaneamente. Determine a probabilidade da soma das faces
voltadas para cima ser 8 ou o produto ser ímpar.

5. Em uma caixa existem 5 bolas brancas e 8 bolas vermelhas. Duas bolas são retiradas
aleatoriamente sem reposição. Qual a probabilidade de serem vermelhas?

6. Em um lote com 12 peças, 4 são defeituosas.


a) Sendo retirada uma peça desse lote qual a probabilidade dela não ser defeituosa?
b) Sendo retiradas duas peças desse lote qual a probabilidade das duas serem defeituosas?
c) Sendo retiradas duas peças desse lote qual a probabilidade de uma ser defeituosa e a
outra não ser?
7. Em uma caixa temos 5 bolas brancas, 8 bolas pretas e 7 bolas vermelhas. Ao retirarem
uma bola da caixa aleatoriamente qual a probabilidade de a mesma ser branca?

8. Uma urna contém 10 bolas, das quais 3 são brancas, 5 são vermelhas e 2 são azuis. Qual
a probabilidade retirar uma bola ao acaso e ela:
a) Ser branca
b) Não ser branca
9. Em uma sala tem 5 homens e 6 mulheres. Qual a probabilidade de escolhermos 3 pessoas
e pelo menos uma delas ser homem.

MUDE SUA VIDA!


3
alfaconcursos.com.br

SUMÁRIO
PROBABILIDADES EXEMPLOS ....................................................................................................................... 2

MUDE SUA VIDA!


1
alfaconcursos.com.br

PROBABILIDADES EXEMPLOS
1. Um casal pretende ter 4 filhos. Qual a probabilidade de serem 2 de cada sexo?

2. Uma urna contém 3 bolas brancas e 4 bolas pretas. Tira-se, sucessivamente, 2 bolas.
Então a probabilidade de as bolas serem da mesma cor, é:

3. Um prédio de três andares, com dois apartamentos por andar, tem apenas três
apartamentos ocupados. A probabilidade de cada um dos três andares tenha exatamente
um apartamento ocupado é:

4. Dois jogadores, A e B vão lançar um par de dados. Eles combinam que, se a soma dos
números dos dados for 5, A ganha, e, se essa soma for 8, B é quem ganha. Os dados são
lançados. Sabe-se que A não ganhou. Qual a probabilidade de B ter vencido?

5. Se num grupo de 10 homens e 6 mulheres sorteamos 3 pessoas para formarem uma


comissão, qual a probabilidade de que essa comissão seja formada por 2 homens e 1
mulher?

6. Em uma gaveta, cinco pares diferentes de meias estão misturados. Retirando-se ao acaso
duas meias, a probabilidade de que elas sejam do mesmo par é de:

7. Em uma urna temos 100 bolas numeradas de 1 a 100. Qual a probabilidade de retirarmos
duas bolas e a soma dos valores contidos nas bolas ser 100?

1
8. A probabilidade de um casal ter um filho de olhos azuis é igual a 3 . Se o casal pretende
ter 4 filhos, a probabilidade de que no máximo dois tenham olhos azuis é:

MUDE SUA VIDA!


2
alfaconcursos.com.br

9. A probabilidade de que um médico acerte o diagnóstico de um paciente é de 95%. Dado


que esse médico tenha errado o diagnóstico, a probabilidade de não ser processado pelo
paciente é 90%. Qual a probabilidade de que o médico erre o diagnóstico e seja
processado pelo paciente?

10. Lançando-se determinada moeda tendenciosa, a probabilidade de sair cara é o dobro da


probabilidade de sair coroa. Em dois lançamentos dessa moeda, a probabilidade de sair
o mesmo resultado é igual a:

MUDE SUA VIDA!


3
alfaconcursos.com.br

SUMÁRIO
VARIÁVEIS ALEATÓRIAS DISCRETAS.............................................................................................................. 2
ESPERANÇA MATEMÁTICA ....................................................................................................................... 2
VARIÂNCIA ............................................................................................................................................... 3
DESVIO PADRÃO ...................................................................................................................................... 3

MUDE SUA VIDA!


1
alfaconcursos.com.br

VARIÁVEIS ALEATÓRIAS DISCRETAS


DEFINIÇÃO: Sejam E um experimento e S o espaço associado ao experimento. Uma função X,
que associe a cada elemento s S um nº real X(s), é denominada Variável Aleatória (V.A.).
Exemplo: E: lançamento de três moedas;
X: número de ocorrência da face cara;
Determinar a distribuição de probabilidade de X.
O espaço amostral do experimento é:
S = {CCC, CCR, CRC, RCC, CRR, RCR, RRC, RRR}
Se X é o número de caras, X assume os valores 0, 1, 2 e 3

Pode-se, também, associar às probabilidades de X assumir um dos valores, ou seja, as


probabilidades dos eventos correspondentes:

Definição: Função de Probabilidade é a função que associa a cada valor assumido pela
V.A, a probabilidade do evento correspondente, isto é, P(X = xi) = P(Ai) , i = 1, 2, ... , n.

Ao conjunto {(xi , p(xi)) , i = 1, 2, ... , n} denomina-se Distribuição de Probabilidades da


V.A. X como em (1).
Para que haja uma distribuição de probabilidade de uma V.A. X é necessário que:
𝑛

∑ 𝑝(𝑥𝑖 ) = 1
𝑖=1

Exemplo: Lançam-se 2 dados. Seja X: soma das faces. Determinar a distribuição de


probabilidade da variável aleatória X.

ESPERANÇA MATEMÁTICA
Existem características numéricas que são muito importantes em uma distribuição de
probabilidade de uma V.A. discreta. São os parâmetros das distribuições. Um primeiro
parâmetro é a esperança matemática (ou simplesmente média) de uma V.A.
𝑛

𝐸 (𝑋) = ∑ 𝑥𝑖. 𝑝(𝑥𝑖)


𝑖=1

MUDE SUA VIDA!


2
alfaconcursos.com.br

Notação: E(X), μ(x), μx, μ.


Exemplos:
1) Dada a seguinte distribuição de probabilidades:

1 3 3 1 12
𝐸 (𝑋 ) = ( 0) + (1) + (2) + (3 ) = = 1,5
8 8 8 8 8

2). Uma seguradora paga R$ 3.000,00 em caso de acidente de carro e cobra uma taxa de R$
100,00. Sabe-se que a probabilidade de que um carro sofra acidente é de 2%. Quanto espera a
seguradora ganhar por carro segurado?

E(X) = R$ 40,00 (lucro médio por carro).

VARIÂNCIA
Define-se variância de uma V.A. como:
𝑉𝐴𝑅 = 𝐸 (𝑋 2 ) − {𝐸 (𝑋)}2 , onde 𝐸 (𝑋 2 ) = ∑𝑛𝑖=1(𝑥𝑖)2 𝑝(𝑥𝑖 )

Notação: VAR(X), V(X), 2 (X ), 2 .

DESVIO PADRÃO
Por definição, desvio padrão é a raiz quadrada da variância, ou seja,
𝜎 = √𝑉𝐴𝑅

Fórmula prática para o cálculo da variância:

𝑉𝐴𝑅 = 𝐸 (𝑋 2 ) − {𝐸 (𝑋)}2 , onde 𝐸 (𝑋 2 ) = ∑𝑛𝑖=1(𝑥𝑖)2 𝑝(𝑥𝑖 )

Exemplo: Dada a distribuição de probabilidades:

MUDE SUA VIDA!


3
alfaconcursos.com.br

𝑉𝐴𝑅 = 𝐸 (𝑋 2 ) − {𝐸 (𝑋)}2

1 6 1 6 2
𝐸 (𝑋 ) = (0) + (1) + (2) = + = 1
8 8 8 8 8

1 6 1 6 4 10
𝐸 (𝑋 2 ) = (0)2 + (1)2 + (2)2 = + = = 1,25
8 8 8 8 8 8

𝑉𝐴𝑅 = 𝐸 (𝑋 2 ) − {𝐸 (𝑋)}2 = 1,25 − 1 = 0.25

𝜎 = √𝑉𝐴𝑅 = √0,25 = 0.5

MUDE SUA VIDA!


4
alfaconcursos.com.br

SUMÁRIO
DISTRIBUIÇÕES TEÓRICAS DE VARIÁVEIS ALEATÓRIAS DISCRETAS ................................................................ 2
1 DISTRIBUIÇÃO DE BERNOULLI ............................................................................................................... 2
ESPERANÇA E VARIÂNCIA ..................................................................................................................... 2
2 DISTRIBUIÇÃO BINOMIAL .................................................................................................................. 2
3 DISTRIBUIÇÃO DE POISSON ............................................................................................................... 3

MUDE SUA VIDA!


1
alfaconcursos.com.br

DISTRIBUIÇÕES TEÓRICAS DE VARIÁVEIS ALEATÓRIAS


DISCRETAS
1 DISTRIBUIÇÃO DE BERNOULLI
Considere uma única tentativa de um experimento aleatório. Pode-se ter sucesso ou
fracasso nessa tentativa. Seja p a probabilidade de sucesso e q a probabilidade de fracasso, com
p + q = 1.
Seja X: o nº de sucessos em uma única tentativa do experimento.
X assume os valores:

0 𝑓𝑟𝑎𝑐𝑎𝑠𝑠𝑜
𝑋={ com P(X = 0) = q e P(X = 1) = p.
1 𝑠𝑢𝑐𝑒𝑠𝑠𝑜
A variável aleatória X tem distribuição de BERNOULLI, e sua função de probabilidade é dada
por:
𝑃(𝑋 = 𝑥 ) = 𝑝 𝑥 . 𝑞1−𝑥
ESPERANÇA E VARIÂNCIA
𝐸 (𝑋) = 𝑝; 𝑉𝐴𝑅(𝑋) = 𝑝. 𝑞; 𝐷𝑃(𝑋) = √𝑝. 𝑞
Exemplo: Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna.
Seja X: nº de bolas verdes. Calcular E(X), VAR(X) e determinar P(X).

30 3
𝑋=0→𝑞= =
50 5
20 2
𝑋=1→𝑝= =
50 5

2 𝑥 3 1−𝑥
𝑃 (𝑋 = 𝑥 ) = ( ) . ( )
5 5
2 2 3 6
𝐸 (𝑋 ) = 𝑝 = 5 𝑉𝐴𝑅(𝑋) = 5 . 5 = 25

2 DISTRIBUIÇÃO BINOMIAL
Considere n tentativas independentes de um mesmo experimento aleatório. Cada
tentativa admite apenas dois resultados: sucesso (p) e fracasso (q). Seja X: número de sucessos
em n tentativas.
A função distribuição da V.A. Binomial é dada por:

𝑛
𝑃(𝑋 = 𝑘) = ( ) . 𝑝𝑘 . 𝑞 𝑛−𝑘 em que k é o número de sucessos.
𝑘
A variável X tem distribuição binomial, com parâmetros n e p, sendo indicada pela notação
X: B (n , p).
Se X: B (n , p) E(X) = np; VAR(X) = npq e DP (X) = √𝑛𝑝𝑞
Exemplos:
1). Uma moeda é lançada 10 vezes. Qual a probabilidade de saírem 6 caras?

MUDE SUA VIDA!


2
alfaconcursos.com.br

10 1 6 1 4
( )
𝑃 𝑋 = 6 = ( ).( ) .( )
6 2 2

1 1 210 105
𝑃(𝑋 = 6) = 210. . = = ≅ 0,205
64 16 1024 512

2). Em uma fábrica, 40% das peças produzidas são provenientes da máquina A. Qual a
probabilidade de obter pelo menos 2 peças da máquina A, num dia em que se retirou uma
amostra de 6 peças?
X: nº de peças da máquina A.
4 6
𝑝 = 10 e 𝑞 = 10

𝑃 (𝑋 ≥ 2) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1)]

6 4 0 6 6 46.656
𝑃 (𝑋 = 0) = ( ) . ( ) . ( ) =
0 10 10 1.000.000

6 4 1 6 5 186624
𝑃 (𝑋 = 1) = ( ) . ( ) . ( ) =
1 10 10 1.000.000

46.656 186624
𝑃 (𝑋 ≥ 2) = 1 − [ + ]
1.000.000 1.000.000

233.280
𝑃 (𝑋 ≥ 2) = 1 − [ ]
1.000.000

766720
𝑃 (𝑋 ≥ 2) = = 0,7767
1.000.000

3 DISTRIBUIÇÃO DE POISSON
Considere a probabilidade de ocorrência de sucessos em um determinado intervalo.
Seja X o número de sucessos no intervalo. Então:

𝑒 −𝜆 𝜆𝑘
𝑃 (𝑋 = 𝑘 ) = Onde 𝜆 é a média.
𝑘!

A variável X assim definida tem distribuição de Poisson.


E (X) = e VAR(X) = .

Exemplo: Numa central telefônica chegam 300 telefonemas por hora. Qual a probabilidade de
que:
(Considere 𝑒 −5 = 0,0067
a) Num minuto não haja nenhum chamado;
b) Em dois minutos haja 2 chamados.

MUDE SUA VIDA!


3
alfaconcursos.com.br

a) X: nº de chamadas por minuto = 5,

𝑒 −550
𝑃 (𝑋 = 0) = = 0,0067
0!

b) dois minutos = 10,

𝑒 −10 102
𝑃 (𝑋 = 2) = =0,00225
2!

MUDE SUA VIDA!


4
alfaconcursos.com.br

SUMÁRIO
DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS ........................................................................................ 2
INTRODUÇÃO........................................................................................................................................... 2
DISTRIBUIÇÃO CONTÍNUA UNIFORME ...................................................................................................... 2
VALOR ESPERADO E VARIÂNCIA ........................................................................................................... 2
DISTRIBUIÇÃO EXPONENCIAL ................................................................................................................... 3
PROBABILIDADE EXPONENCIAL ............................................................................................................ 3
VALOR ESPERADO E VARIÂNCIA ........................................................................................................... 4

MUDE SUA VIDA!


1
alfaconcursos.com.br

DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS


INTRODUÇÃO
A distribuição de probabilidade é o instrumento na Estatística que descreve o
comportamento aleatório que um fenômeno pode apresentar. No caso de variáveis aleatórias
contínuas é que a distribuição esta diluída na densidade de probabilidade, ou seja,
probabilidade sob intervalo de valores, e é representada por uma curva de probabilidade. Desse
modo, é muito indicado visualizar a representação gráfica para compreender todos os
resultados do experimento aleatório junto as probabilidades.
As principais distribuições contínuas de probabilidade são:

DISTRIBUIÇÃO CONTÍNUA UNIFORME


É a mais simples de todas: a probabilidade de se gerar qualquer ponto em um intervalo
contido no espaço amostral é proporcional ao tamanho do intervalo.
Por exemplo se considerarmos que o valor de x pode ser qualquer número de 0 a 20 ou
seja 𝑥 ∈ [0,20], podemos afirmar que a probabilidade de 4 < 𝑥 < 7 e 12 < 𝑥 < 15 é a mesma.
Logo podemos afirmar que a função densidade está representada graficamente pela
função:
1 1
𝑓 (𝑥 ) = = = 0,05
𝑋𝑀 − 𝑋𝑚 20 − 0

15−5
Por exemplo a P(5<x<15) = 20−0 = 0,5 = 50%

Ou P(5<x<15)= 10.0,05=0,5
VALOR ESPERADO E VARIÂNCIA
𝑋𝑀 +𝑋𝑚 (𝑋𝑀 −𝑋𝑚 )2
𝐸 (𝑋 ) = 𝑉𝐴𝑅(𝑋) =
2 12

20+0 (20−0) 2 400


No exemplo acima 𝐸 (𝑋) = = 10 𝑉𝐴𝑅(𝑋) = = = 33,33
2 12 12

MUDE SUA VIDA!


2
alfaconcursos.com.br

DISTRIBUIÇÃO EXPONENCIAL

A distribuição contínua Exponencial de probabilidade é utilizada para descrever o tempo


ou o espaço transcorrido para que um determinado evento aconteça. Essa distribuição
apresenta uma conexão muito próxima com a distribuição de Poisson, pois a Exponencial
descreve o tempo entre as ocorrências de sucessivos eventos de uma Poisson.
Poisson: número de ocorrências em um intervalo de tempo (frequência).
Exponencial: Tempo entre ocorrências (período).

PROBABILIDADE EXPONENCIAL
Para compreender melhor como estudar um fenômeno que segue distribuição
Exponencial, será abordado o mesmo exemplo apresentado em Poisson, modificando a variável
de interesse.
Exemplo:
Em uma certa cidade ocorrem em média 6 acidentes de moto por hora. Para uma
distribuição exponencial vamos considerar que o tempo médio entre dois acidentes é de 10
minutos. Qual a probabilidade de o tempo entre dois acidentes ser menor ou igual a 10 minutos?
Em primeiro lugar, é necessário obter a taxa de ocorrência por minuto. Logo como temos
6 acidentes por hora e uma hora tem 60 min o índice de acidentes por minuto é de 0,1
Contudo, trabalhando com a ideia de taxa constante de ocorrência, a função densidade de
probabilidade pode ser expressa pela seguinte fórmula:
𝑓 (𝑋) = 𝜆𝑒 −𝜆𝑥
Em que:
𝑓(𝑋): corresponde à função densidade de probabilidade da variável aleatória contínua X;
𝜆: corresponde à taxa de ocorrência do fenômeno estudado por unidade de tempo;
𝑒: constante Neperiana; ou número de Euler 𝑒 ≅ 2,72;
𝑥: valor de tempo ou espaço que a variável contínua pode assumir, sendo 𝑥 ≥ 0.
Para o exemplo em questão, com 𝜆 = 0,1 ocorrência/min, a função densidade de
probabilidade fica seguinte forma:

𝑓(𝑋) = 0,1𝑒 −0,1𝑥

MUDE SUA VIDA!


3
alfaconcursos.com.br

𝑃(𝑋 ≤ 𝑥 ) = 𝑒 −𝜆𝑥 = 𝑒 −0,1.10 ≅ 0,3678

VALOR ESPERADO E VARIÂNCIA

1 1
𝐸 (𝑋 ) = para o exemplo acima 𝐸 (𝑋) = = 10 min entre acidentes
𝜆 0,1

1 1 1
𝑉𝐴𝑅(𝑋) = = 0,01 = 100 𝐷𝑃(𝑋) =
𝜆2 𝜆

MUDE SUA VIDA!


4
alfaconcursos.com.br

SUMÁRIO
DISTRIBUIÇÕES NORMAL ............................................................................................................................. 2
INTRODUÇÃO........................................................................................................................................... 2
PROPRIEDADES DA NORMAL ................................................................................................................ 3
PADRONIZAÇÃO DE UMA DISTRIBUIÇÃO NORMAL ............................................................................... 5

MUDE SUA VIDA!


1
alfaconcursos.com.br

DISTRIBUIÇÕES NORMAL
INTRODUÇÃO
A distribuição normal conhecida também como distribuição gaussiana é sem dúvida a
mais importante distribuição contínua.
Uma variável aleatória contínua X tem distribuição normal de probabilidade se a sua Função
Densidade de Probabilidade (f.d.p.) é dada por:

1 𝑋−𝜇 2
1 − ( )
𝑓 (𝑥 ) = 𝑒 2 𝜎 para −∞ < 𝑥 < ∞
𝜎 √2𝜋

As principais características dessa função são:


 Tem formato de “sino”;
 Sua distribuição é simétrica;
 As medidas de centralidade coincidem (Média = Mediana = Moda);
 Os quartis são equidistantes (𝑄2 − 𝑄1 = 𝑄3 − 𝑄2 );
 Probabilidade de 50% para cada lado de sua forma simétrica;
 É unimodal;
 Sua curtose é Mesocúrtica;
 Prolonga-se de -∞ a +∞;
 Valores distantes da média apresentam menor probabilidade;
 É especificada pela média e desvio-padrão (σ).

MUDE SUA VIDA!


2
alfaconcursos.com.br

Assim, uma variável aleatória contínua X que segue uma distribuição Normal tem como
parâmetros a média (µ) e variância (σ2), simbolicamente representado por:

𝑿~𝑵(𝝁, 𝝈𝟐 )
PROPRIEDADES DA NORMAL
Outra informação muito relevante trata-se da propriedade da curva Normal, que pode ser
ilustrada da seguinte forma:

Isso significa que se uma variável aleatória que segue uma distribuição Normal apresenta
68,3% de seus valores no intervalo de um desvio-padrão (±1𝜎) a contar de cada lado da média
(µ); 95,5% no intervalo de dois desvios-padrões (±2𝜎) a contar da média; e 99,7% no intervalo
de três desvios-padrões (3σ) a contar da média.

MUDE SUA VIDA!


3
alfaconcursos.com.br

Exemplo:

𝑿~𝑵(𝝁, 𝝈𝟐 )

𝑋~𝑁(23,4)

Exemplo 2:

MUDE SUA VIDA!


4
alfaconcursos.com.br

PADRONIZAÇÃO DE UMA DISTRIBUIÇÃO NORMAL


Geralmente, utiliza-se a letra Z para representar uma variável com distribuição Normal
padrão ou variável com distribuição Normal reduzida. Qualquer distribuição Normal X
específica pode ser transformada matematicamente em uma variável Normal padronizada Z da
seguinte forma:

𝑋−𝜇
𝑍=
𝜎

Sendo que:
𝑋: corresponde a um valor específico da variável aleatória X com distribuição Normal;
𝜇: corresponde à média da variável aleatória X;
𝜎: corresponde ao desvio padrão da variável aleatória X;
𝑍: corresponde a um valor transformado com distribuição Normal Padrão
correspondente ao valor de X.

Dessa forma, temos a definição de uma característica muito importante: toda variável que
apresentar uma distribuição Normal Padrão sempre terá média igual a zero e desvio padrão
igual a 1. Assim:
𝑍~𝑁(0,1)
Logo, se 𝑋~𝑁(𝜇, 𝜎 2 ) então 𝑍~𝑁(0,1)

Exemplo de relação entre X e Z:


Seja X: N(20, 4). Achar os valores reduzidos correspondentes a X1 = 14, X2 =
16, X3 = 18, X4 = 20.

14−20
X1 = 14; 𝑍1 = = −3
2

16−20
X2 =16; 𝑍2 = = −2
2

18−20
X3 = 18; 𝑍3 = = −1
2

20−20
X4 = 20; 𝑍4 = =0
2

MUDE SUA VIDA!


5
alfaconcursos.com.br

Exemplo de Aplicação

Um fabricante de baterias sabe por experiência passada, que as baterias de sua fabricação
têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem
aproximadamente distribuição normal. Oferece uma garantia de 312 dias, isto é, troca as
baterias que apresentarem falhas nesse período. Fabrica 10.000 baterias mensalmente.
Quantas baterias, o fabricante, deverá trocar pelo uso da garantia, mensalmente?( use
𝑃(𝑍 ≥ 2,88) = 0,002)
𝜇 = 600 𝑑𝑖𝑎𝑠
𝑋: duração da bateria. {
𝜎 = 100 𝑑𝑖𝑎𝑠
312−600
𝑃(𝑋 ≤ 312) = 𝑃(𝑍 ≤ −2,88) pois 𝑍 = = −2,88
100

𝑃(𝑍 ≤ −2,88) = 𝑃(𝑍 ≥ 2,88)=0,002

Deverá substituir mensalmente: 10000(0,002) = 20 baterias

Exercício
Uma enchedora automática de refrigerantes está regulada para que o volume médio de líquido em
cada garrafa seja de 1000 cm3 e desvio padrão de 10 cm3. Admita que o volume siga uma distribuição
normal.( dados 𝑃 (𝑍 ≤ 1) = 0,8413 e 𝑃(𝑍 ≤ 2) = 0,9772
a) Qual é a porcentagem de garrafas em que o volume de líquido é menor que 990 cm 3?
b) Qual é a porcentagem de garrafas em que o volume de líquido não se desvia da média em mais
do que dois desvios padrões?

Seja,
X: volume médio de líquido em cada garrafa.
X~N(1000, 102)

a) Qual é a porcentagem de garrafas em que o volume de líquido é menor que 990 cm 3?


 990 1000 
P (X 9 90 ) P Z  P (Z 1) P(Z 1 ) 
1 P (
Z  1)1 0,8 4
13 0,159
 10 
Portanto, em 15,9% das garrafas o volume de líquido é menor que 990 cm3.

b) Qual é a porcentagem de garrafas em que o volume de líquido não se desvia da média


em mais do que dois desvios padrões?

=10  2=20
-2 = 1000-20 = 980 e +2 = 1000+20 = 1020.
9801000 1020 1000 
P(980  X 1020 ) P  Z 

P

(
2
Z
2
)
P(
Z

2
)
P
(
Z

2
)
 10 10 
 P(Z  2)P(Z  2)P (
Z 2)1 P(Z 2) 2*P 
(
Z
2
)
1
2
*
0,
9
7
7
2
1
0
,
9
5
4
49
5
%

MUDE SUA VIDA!


6
alfaconcursos.com.br

SUMÁRIO
TRANSFORMAÇÃO DE VARIÁVEL ALEATÓRIA ............................................................................................... 2
CONCEITO ................................................................................................................................................ 2
EFEITO DE UMA CONSTANTE COM VARIÁVEIS ALEATÓRIAS ..................................................................... 2
TRANSFORMAÇÃO DA NORMAL PADRÃO ................................................................................................ 3
TRANSFORMAÇÃO DE SOMA DE VARIÁVEIS ALEATÓRIAS ......................................................................... 3

MUDE SUA VIDA!


1
alfaconcursos.com.br

TRANSFORMAÇÃO DE VARIÁVEL ALEATÓRIA


CONCEITO
A transformação de variáveis aleatórias consiste na aplicação de operações matemáticas
que modificam os valores que uma variável aleatória pode assumir. Essa ferramenta pode ser
aplicada para transformar uma variável aleatória X, de um respectivo fenômeno, em outra
variável aleatória Y, que representa outro fenômeno no mundo real. Vamos abordar essa
transformação a partir de um exemplo.

EFEITO DE UMA CONSTANTE COM VARIÁVEIS ALEATÓRIAS


Uma variável aleatória pode ser transformada a partir de uma operação matemática com
uma constante. Assim, podemos ter os valores que uma variável aleatória pode assumir
modificados com operação de soma/subtração ou multiplicação/divisão por um mesmo
valor (constante). Para isso, precisamos compreender o que ocorre com os valores da variável
aleatória, além do valor esperado e da variância. Basicamente, aqui temos as mesmas
propriedades da média e da variância vistas na transformação uniforme de um conjunto de
dados, abordado em Estatística Descritiva.

Exemplo:
Uma variável aleatória X corresponde ao número de investigados que podem ser presos
dos três possíveis suspeitos de uma investigação criminal sobre lavagem de dinheiro. A
probabilidade de um prisioneiro ser preso corresponde a 60% e são eventos independentes. A
variável Y corresponde ao dinheiro, em mil R$, retornado aos cofres públicos, conforme o
resultado dessa investigação. Sabe-se que a investigação gerou gastos de R$ 5 mil, porém cada
investigado preso gera um retorno financeiro ao Estado no valor de R$ 12 mil. Qual é o valor
esperado [E(Y)] e o desvio padrão [DP(Y)] da variável aleatória Y?

A variável aleatória X corresponde a um fenômeno que se encaixa nos pressupostos de


uma distribuição Binomial:

𝐸 (𝑋) = 𝑛. 𝑝 = 3.0,6 = 1,8 presos.

𝑉𝑎𝑟(𝑋) = 𝑛. 𝑝. 𝑞 = 3.0,6.0,4 = 0,72.

𝐷𝑝 = √𝑛. 𝑝. 𝑞 = √0,72 = 0,85.

A variável Y corresponde a outro fenômeno valor recuperado.

𝑌 = 12𝑋 − 5 em milhares de reais.

A cada investigado preso tem-se um retorno de R$ 12 mil aos cofres públicos e haverá um
gasto de R$ 5 mil reais pela investigação, independentemente de prender ou não alguém.

MUDE SUA VIDA!


2
alfaconcursos.com.br

Valor Esperado E(Y):

𝐸 (𝑌) = 12. 𝐸 (𝑋) − 5 = 12.1,8 − 5 = 16,6 Mil.

𝑉𝑎𝑟(𝑋) = 122 . 0,72 = 144.0,72 = 103,68.

TRANSFORMAÇÃO DA NORMAL PADRÃO


Outro exemplo de transformação de variáveis aleatórias muito aplicada é a padronização
de uma variável contínua X com distribuição Normal em Z com distribuição Normal Padrão.
O cálculo de padronização transforma qualquer variável em uma distribuição com média
igual a zero e desvio padrão igual a 1. O procedimento matemático é o seguinte:

𝑋−𝜇
𝑍=
𝜎

𝐸 (𝑋 ) − 𝜇
𝐸 (𝑍 ) = =0
𝜎

Na variância a soma ou subtração não a afetam mais a multiplicação e a divisão sim.


Quando multiplicamos ou dividimos a variável por uma constante a VAR é multiplicada ou
dividida por essa constante ao quadrado.

𝑉𝐴𝑅 (𝑋) − 𝜇 𝑉𝐴𝑅(𝑋)


𝑉𝐴𝑅(𝑍) = = =1
𝜎 𝜎2

TRANSFORMAÇÃO DE SOMA DE VARIÁVEIS ALEATÓRIAS


Outro procedimento muito cobrado nesse assunto consiste na soma de variáveis
aleatórias, resultando em uma nova variável. Quando duas variáveis aleatórias são somadas,
temos a alteração nos valores que ela pode assumir, bem como se modifica a distribuição das
suas probabilidades.

EXEMPLO:
Duas variáveis aleatórias X e Y correspondem ao tempo para efetuar uma determinada
operação judicial. Ambas possuem distribuição Normal e são independentes entre si. A variável
X tem média igual a 42 min e desvio padrão igual a 3 min. Por outro lado, a variável Y tem média
igual 34 min e desvio padrão de 5 min. Outra variável aleatória W é o resultado da diferença
dos tempos, isto é, diferença entre a variável X com Y (𝑊 = 𝑋 − 𝑌). Qual é o valor esperado
[E(W)] e a variância [Var(W)] dessa nova variável aleatória?

MUDE SUA VIDA!


3
alfaconcursos.com.br

𝐸 (𝑊) = 𝐸 (𝑋) − 𝐸 (𝑌) = 42 − 34 = 8 𝑚𝑖𝑛

𝑉𝐴𝑅(𝑊) = 𝑉𝐴𝑅 (𝑋) + 𝑉𝐴𝑅(𝑌) = 32 + 52 = 34

Esquematizando:

MUDE SUA VIDA!


4
alfaconcursos.com.br

SUMÁRIO
AMOSTRAGEM ............................................................................................................................................ 2
INTRODUÇÃO........................................................................................................................................... 2
TIPOS DE AMOSTRAS ............................................................................................................................... 2
TIPOS DE AMOSTRAGEM PROBABILÍSTICA............................................................................................ 2

MUDE SUA VIDA!


1
alfaconcursos.com.br

AMOSTRAGEM
INTRODUÇÃO
O assunto de amostragem trabalha essencialmente sobre como os dados serão coletados
de modo que essa coleta represente fidedignamente o fenômeno que se pretende
compreender, isto é, o objeto de estudo.
Nesse conteúdo, desenvolve-se o ponto de partida de qualquer análise Estatística: a
determinação do objeto de estudo e como os dados serão coletados. Os dados brutos são
praticamente a matéria-prima da Estatística e, se eles forem extraídos de forma viciada
(tendenciosa), qualquer inferência obtida gerará informações inválidas e incoerentes ao
fenômeno estudado.

TIPOS DE AMOSTRAS
 Amostra probabilística ou aleatória – uma amostra é probabilística quando o esquema
de amostragem usado permite atribuir a cada elemento da população uma
probabilidade conhecida, diferente de zero, de entrar para a amostra. É com apenas
este tipo de amostra, que se pode utilizar processos estatísticos para se fazer
inferências, pois somente neste caso pode-se avaliar a probabilidade do erro
amostral.

 Amostra não probabilística – uma amostra é não probabilística quando existe uma
escolha deliberada dos seus elementos.

TIPOS DE AMOSTRAGEM PROBABILÍSTICA


 Amostra casual simples ou amostra aleatória simples
Uma amostra é casual simples se todos os elementos da população têm a mesma
probabilidade de entrar para a amostra.
 Amostra sistemática
Trata-se de uma variação da amostragem simples ao acaso, muito conveniente quando a
população está naturalmente ordenada, como fichas em um fichário, listas telefônicas etc.
Seja N o tamanho da população e n o tamanho da amostra. Então, calcula-se o intervalo de
amostragem N/n ou o inteiro mais próximo.
Exemplo:
𝑁
Seja N = 40 e n = 10. Então; 𝑛 = 4. Sorteia-se um número de 1 a 4, por exemplo, 3. Logo,
os elementos de números 3; 7; 11; 15; 19; 23; 27; 31; 35 e 39 serão os componentes da amostra.
 Amostra estratificada
Uma amostra será estratificada quando existir grande variabilidade entre grupos da
população e pequena variabilidade dentro de cada grupo. Neste caso, cada grupo será
considerado como um estrato e retira-se de cada grupo uma amostra casual simples.
Obs.: Não é necessário usar estratos do mesmo tamanho e nem há necessidade
de utilizar proporções uniformes de amostragem em todos os grupos.

MUDE SUA VIDA!


2
alfaconcursos.com.br

Exemplo: Dada a população de 50.000 operários da indústria automobilística, formar uma


amostra de 5% de operários para estimar seu salário médio.
Usando a variável “cargo” para estratificar essa população, e considerando amostras
de 5% de cada estrato obtido, chega-se ao seguinte quadro.

 Amostra por conglomerados


Muitas vezes a construção de um cadastro dos elementos amostrais é impossível, muito
trabalhoso ou muito dispendioso.
Exemplo:
Pretende-se fazer uma pesquisa de opinião, envolvendo famílias de uma determinada
cidade. Como é muito difícil obter um cadastro de todas as famílias, pode-se planejar uma
amostra da seguinte forma: com um mapa da cidade delimita-se os bairros e as quadras; toma-
se como unidade amostral, primeiramente os bairros e dentre eles sorteia-se uma amostra
casual simples. Em seguida, tomando-se como unidade amostral, as quadras dos bairros
selecionados é feito, novamente, um sorteio. Ao conjunto de famílias que habitam as quadras
sorteadas dá-se o nome de conglomerado, sendo elas que serão investigadas na pesquisa.

MUDE SUA VIDA!


3

Você também pode gostar