Escolar Documentos
Profissional Documentos
Cultura Documentos
JOELMIR FELICIANO
O que é Estatística ?
Produção
Produção
Tipo 1
é mais
produtivo
do que o
x11 x12 ... x1n Tipo 2? x21 x22 ... x2n
Raciocínio Estatístico
População Dados
Amostragem
Estatística
Descritiva
Inferência Estatística
(Probabilidade)
JOELMIR FELICIANO
Noções Básicas
Qual é a proporção de
brasileiros desnutridos?
=?
• Resultados demorados;
População
Amostra
x : Estatística.
Vantagens da Amostragem.
Tipos de Variáveis
nominal
Qualitativa
ordinal
Variável
discreta
Quantitativa
contínua
Exercícios
Sexo Freqüência
Masculino 10
Feminino 8
Total 18
Fonte: E.W.
Para efeito de comparação: Tabela de
freqüência relativa
Fonte: E.W.
Tabelas de distribuição de freqüência.
Quando os dados são quantitativos contínuos, não conseguimos resumir a
informação da mesma forma anterior. Neste caso precisamos organizar
os dados em uma tabela de distribuição de frequências. Veja os dados
abaixo,
Tabela 1.7: Peso ao nascer de nascidos vivos, em quilogramas
2,522 3,200 1,900 4,100 4,600 3,400
2,720 3,720 3,600 2,400 1,720 3,400
3,125 2,800 3,200 2,700 2,750 1,570
2,250 2,900 3,300 2,450 4,200 3,800
3,220 2,950 2,900 3,400 2,100 2,700
3,000 2,480 2,500 2,400 4,450 2,900
3,725 3,800 3,600 3,120 2,900 3,700
2,890 2,500 2,500 3,400 2,920 2,120
3,110 3,550 2,300 3,200 2,720 3,150
3,520 3,000 2,950 2,700 2,900 2,400
3,100 4,100 3,000 3,150 2,000 3,450
3,200 3,200 3,750 2,800 2,720 3,120
2,780 3,450 3,150 2,700 2,480 2,120
3,155 3,100 3,200 3,300 3,900 2,450
2,150 3,150 2,500 3,200 2,500 2,700
3,300 2,800 2,900 3,200 2,480
3,250 2,900 3,200 2,800 2,450
Fonte: IBGE
Exemplo de tabela de distribuição de
freqüência.
Tabela 1.9: Peso de recém nascidos.
Classe Ponto médio Freqüência
1,5 |--- 2,0 1,750 3
2,0 |--- 2,5 2,250 16
2,5 |--- 3,0 2,750 31
3,0 |--- 3,5 3,250 34
3,5 |--- 4,0 3,750 11
4,0 |--- 4,5 4,250 4
4,5 |--- 5,0 4,75 1
• Ordenar os dados
Intervalo da amostra
• Amplitude =
Número de classes
31%
54%
15%
G a s o lin a A lc o o l D ie s e l
Gráfico de Barras.
Gráfico de barras bastante usado com variáveis qualitativas e quantitativas
discretas. Ideal para quando temos várias classes de categorias.
Figura 1.2: Distribuição das reclamações via 0800.
25
25
20
15 13
Freqüência
10 8
7
0
Mau atendimento Troca de mercadoria Mercadoria com defeito Falta de variedade
Reclamações
Histograma
O histograma é a representação gráfica para variáveis quantitativas
contínuas. Este tipo de representação mostra a forma da distribuição
da variável. É de fundamental importância na aplicação dos conceitos
de inferência estatística
Figura 1.3:
Ponto médio
Espalhamento
dos dados
Diagramas de Dispersão
Quando temos dados emparelhados e desejamos verificar se existe uma
associação entre esses dados, usamos como análise preliminar o diagrama
de dispersão.
Figura 1.4: Diagrama de dispersão: Temperatura X Rendimento de PQ.
100
90
80
70
60
Rendimento
50
40
30
20
10
0
0 20 40 60 80 100 12 0
T e m p e ra tu ra
Exercícios
1. Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo indagou
sobre os diferentes tipos usados nas suas locomoções diárias. Dentre ônibus, metro e
trem, o número de diferentes meios de transportes utilizados foi o seguinte:
2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2 e 3.
22, 22, 22, 22, 23, 23, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 27, 28, 35 e 40.
Medidas de Centralidade.
Medidas de Posição.
Cálculo de Médias
x xi x1 x 2 x n Dados Brutos.
1 n 1
n i 1 n
i 1
Onde :
x i = i - ésimo elemento da amostra ou o ponto médio da variável contínua.
f i = i - ésimo elemento da frequência relativa.
n i = i - ésimo elemento da frequência .
n = tamanho da amostra.
k = número de classes.
Medidas de Centralidade
• Média Aritmética de um conjunto de valores é o valor
obtido somando-se todos eles e dividindo-se o total pelo
número de valores.
14000
12000
10000
8000
6000
4000
2000
0
1 2 3 4 5 6 7
x n x n
1
Me 2 2
2
Exemplos para o cálculo da
Mediana:
Serie 1: 12, 124, 32, 10, 18, 29 e 100 n= 7; impar
Ordenar : 10, 12, 18, 29, 32, 100 e 124.
Me x n 1 x ( 4) 29
2
x n x n
1 x (3) x ( 4) 18 29
Me 2 2
23.5
2 2 2
Moda
Medidas de Posição
Variável
qualitativa
Ex: 4,5,4,6,5,8,4,4
Mo = 4
Medidas Separatrizes
As medidas de posição possibilitam um melhor
entendimento dos dados, focalizando sua posição
relativa em relação ao conjunto como um todo.
Mediana: divide os dados ordenados em duas partes iguais.
Posição
100%
0%
Ordem
1 x n
Medidas Separatrizes
• Usando a semelhança de triângulos, vamos ter:
n 1 x 1
100 0 P 0
x 1
P * 100%
n 1
P
x (n 1) * 1
100
Medidas Separatrizes: Exemplo1.
Série de 27 32 64 65 58 62 59 54 29 30 26 48 47
Dados 46 43 38 29 32 35 37 31 43 45 42 37 36
Série 26 27 29 29 30 31 32 32 35 36 37 37 38
Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13
Série 42 43 43 45 46 47 48 54 58 59 62 64 65
Ordem 14 15 16 17 18 19 20 21 22 23 24 25 26
Medidas Separatrizes: Exemplo.
P 32
x (n 1) * 1 (26 1) * 1 9
100 100
d = Intervalo Interquartil =
= Primeiro Quartil = 25% do dados à esquerda e 75% à direita.
= Segundo Quartil = Md(X) = 50% dos dados à esquerda e 50% à direita
= Terceiro Quartil = 75% dos dados à esquerda e 25% à direita.
Descritiva 4
Medidas de dispersão.
Medidas de dispersão
Problema:
Uma empresa farmacêutica realiza um teste com dois
medicamentos para a mesma finalidade em um grupo de 14 pessoas,
sendo que 7 tomaram o medicamento A e as outras 7 o B.O tempo de
reação foi anotado para cada individuo:
Tabela 1: Tempo de reação dos medicamentos.
80
70
60
50
Tempo de Reação
M e d .A
40 M e d .B
M é d ia
30
20
10
0
1 2 3 4 5 6 7
P a c ie n te s
Medidas de Dispersão
• Amplitude Total: Diferença entre o maior e menor valor da série de
dados. No exemplo temos.
MedA : 72 15 57
MedB : 37 33 4
xi x , onde i 1,2,..., n.
(x
n
i x) 0
i 1
Medidas de Dispersão.
Confirmando o resultado.
Med.A Med.B
xi (xi x) xi (xi x)
15 -20 35 0
61 26 35 0
48 13 36 1
16 -19 34 -1
72 37 33 -2
17 -18 35 0
16 -19 37 2
Soma 0 Soma 0
Medidas de Dispersão
Variância Amostral: É dada quando trabalhamos com amostras.
1
1
n 2
S (X ) xi x x1 x xn x Dados Brutos.
2 2 2
n x x n x x Tabelas.
n 1 i 1 n 1
n x x
1 1
k 2
S (X )
2 2 2
n 1 n 1
i i 1 1 k k
i 1
Onde :
x i = i - ésimo elemento da amostra ou o ponto médio da variável contínua.
f i = i - ésimo elemento da frequência relativa.
n i = i - ésimo elemento da frequência .
n = tamanho da amostra.
k = número de classes.
Medidas de Dispersão.
Calculando a variância amostral para o MedA, temos:
(15 35 ) 2
( 61 35 ) 2
... (16 35 ) 2
3660
S (X )
2
610
7 1 6
( 35 35 ) 2
( 35 35 ) 2
... ( 37 35 ) 2
10
S (X )
2
1.666
7 1 6
Medidas de Dispersão.
Algumas conclusões relacionadas com a variância.
S(X ) S 2(X )
x1 x xn x Dados Brutos.
2 2
Var( X ) n x x n x x n x x Tabelas.
n i 1 n
1 1
k 2
2 2
Var( X ) f x x f x x f x x Tabelas.
n n
i i 1 1 k k
i 1
k 2
2 2
i i 1 1 k k
i 1
Onde :
x i = i - ésimo elemento da amostra ou o ponto médio da variável contínua.
f i = i - ésimo elemento da frequência relativa.
n i = i - ésimo elemento da frequência .
n = tamanho da amostra.
k = número de classes.
Medidas de Dispersão.
Desvio Padrão Populacional.
( X ) DP( X ) Var ( X )
Coeficiente de variação: Mede a variabilidade em termos relativos,
dividindo o desvio padrão pela média.
S
CVa 100%
x
Índices para avaliar a variação dos dados.
Baixa: menor que 10%
Médio: de 10% a 20%
Alto: de 20% a 30%
Muito Alto: acima de 30%
Medidas de Centralidade
Tabela 2.0 – Número de Filhos
a) Suponha duas amostras colhidas de uma mesma população, sendo uma de tamanho 100
e outra de tamanho 200. Então, não há dúvida de que a amostra de tamanho maior é mais
representativa da população, certo? Justifique.
• Num voo internacional uma companhia serve dois tipos de pratos: peixe ou
frango. Um banco de dados contém os pedidos feitos nos últimos 200 voos.
Pretende-se planejar o número de cada tipo à ser colocado a disposição dos
passageiros.
Exercícios
4. Vinte e cinco residências de um bairro foram sorteadas e visitadas por um
entrevistador que, entre outras questões, perguntou sobre o número de televisores. Os
dados foram os seguintes:
2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2.
5. Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso
avaliado ao fim de um mês. Os dados referentes ao ganho de peso (em kg) foram os
seguintes:
1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5 e 2,2
Marca de TV GA FB HW
Média 8000 8200 8000
Mediana 8000 9000 7000
Desvio Padrão 600 1500 2500
Justifique.
Furtos 0 1 2 3 4
1/4 1/2 1/8 1/16 1/16
Exercícios
10. Num jogo de dados, um jogador paga R$ 5 para lançar um dado equilibrado
e ganha R$ 10 se der face 6, ganha R$ 5 se der face 5 e não ganha nada com as
outras faces. Defina a variável lucro por jogada como sendo o saldo do que o
jogador ganhou menos o pagamento inicial. Determine média, moda, mediana e
variância, desvio padrão dessa variável.
12. Estudando uma nova técnica de sutura, foram contados os dias necessários
para a completa cicatrização de determinada cirurgia.
Os resultados de 25 pacientes foram os seguintes: 6, 8, 9, 7, 8, 6, 6, 7, 8, 9, 10,
7, 8, 10, 9, 9, 9, 7, 6, 5, 7, 7, 8, 10 e 11. Organize os dados em uma tabela de
frequência e calcule a média, mediana e a moda.
Exercícios
13. Uma amostra de vinte empresas, de porte médio, foi escolhida para um estudo
sobre o nível educacional dos funcionários do setor de
vendas. Os dados coletados, quanto ao número de empregados com curso superior
completo, são apresentados abaixo:
Empresas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Média 1 0 0 3 0 1 1 2 2 2 0 2 0 2 0 1 1 2 3 2
15. Um hospital maternidade está planejando a ampliação dos leitos para recém-
nascidos. Para tal, fez um levantamento dos últimos 50 nascimentos obtendo a
informação sobre o número de dias que os bebês permanecem no hospital antes
de terem alta. Os dados já ordenados foram:
1,1,1,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,5,5,5,5,
5,5,6,7,7,8,15.
a. organize os dados em uma tabela de frequências.
b. calcule a média, moda, mediana e quartis.
c. determine a variância e o desvio padrão.
d. você identifica alguma valor excepcional (outlier) entre os dados? Caso sim
retire-o da série e refaça os cálculos dos itens a, b e c. Comente as
diferenças encontradas
Exercícios
16. O departamento de atendimento ao consumidor de uma concessionária de veículos
recebe, via telefone, as reclamações dos clientes. O número de chamadas dos últimos 30
dias foram anotadas e os resultados foram: 3, 4, 5, 4, 4, 5, 6, 9, 4,4, 5, 6, 4, 3, 6, 7, 4,5, 4,
5, 7, 8, 8, 5, 7, 5, 4, 5, 7, e 6.
17. Um hospital maternidade está planejando a ampliação dos leitos para recém-nascidos.
Para tal, fez um levantamento dos últimos 50 nascimentos obtendo a informação sobre o
número de dias que os bebês permanecem no hospital antes de terem alta. Os dados já
ordenados foram: 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3,
3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 7, 7, 8, 15.
Paciente 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Colesterol 186 194 197 199 203 203 205 206 206 208 209 211 214 218 225
Erros Frequência
0 25
1 20
2 3
3 1
4 1
Total 50
2 2 3 10 13 14 15 15 16 16
18 18 20 21 22 22 23 24 25 25
26 27 29 29 30 32 36 42 44 45
45 46 48 52 58 59 61 61 61 65
66 66 68 75 78 80 89 90 92 97
26. O que acontece com a mediana, média e desvio padrão de uma série de
dados quando:
Duração do Números de
Casamento Divórcios
2800
1400
600
150
50
Total 5000