Escolar Documentos
Profissional Documentos
Cultura Documentos
2
Definição de Estatística
3
Áreas da Estatística
4
ESTATÍSTICA DESCRITIVA
5
PROBABILIDADE
6
INFERENCIA ESTATISTICA
7
Etapas da Analise
Estatística
8
AMOSTRAGEM
Uma área importante em muitas aplicações Estatísticas é a da Tecnologia de
Amostragem.
Exemplos de Aplicação:
• Pesquisa de mercado,
• Pesquisa de opinião,
• Avaliação do processo de produção,
• Praticamente em todo experimento.
9
Amostragem Aleatória
Cada elemento da população tem a
mesma chance de ser escolhido.
Amostragem Estratificada
Classificar a população em, ao
menos dois estratos e extrair uma
amostra de cada um.
Amostragem Sistemática
Escolher cada elemento de ordem k.
10
Amostragem por Conglomerados
Dividir em seções a área populacional,
selecionar aleatoriamente algumas dessas
seções e tomar todos os elementos das
mesmas.
Amostragem de Conveniência
Utilizar resultados de fácil acesso.
11
Exemplo 1
12
Na eleição Presidencial
Os Institutos de Pesquisa de opinião
colhem periodicamente amostras de
eleitores para obter as estimativas de
intenção de voto da população. As
estimativas são fornecidas com um valor e
uma margem de erro.
O quadro do Instituto Toledo &
Associados, a seguir refere-se à intenção
de voto no 1º turno das eleições para o
governo em 2002.
13
Intenção de voto para presidente do Brasil-2002
Voto estimulado,em % do total de votos.A ultima pesquisa
ouviu 2.202 eleitores- Margem de erro de 2,09%
46,3%
34,9% 40,5%
Lula(PT) 34,3%
33,6%
22,8% 23,3%
Serra(PSDB) 17,6%
13,8% 14,8%
13,8% 12,1%
Ciro(PPS)
9,0%
Garotinho(PSB) 12,6% 10,5%
11,3%
14
Confronto no segundo turno.
15
Tabela 1.1 Informação do estado civil, grau de instrução, número de filhos, idade e procedência de 36
funcionários sorteados ao acaso da empresa MB.(Bussab e Morettin)
16
17
Variável
Qualquer característica associada a uma população
Classificação de variáveis
Nominal sexo, cor dos olhos
Qualitativa
Ordinal Classe social, grau de instrução
Contínua Peso, altura,salario
Quantitativa
Discreta Número de filhos, numero de
carros
18
Medidas Resumo
Variáveis Quantitativas
19
Medidas de Posição
Variavel
Ex: 4,5,4,6,5,8,4,4 qualitativa
Mo = 4
20
Média
n
x1 x2 x3 ... x x i
x n
i 1
n n
Ex:2,5,3,7,8
Média = [(2+5+3+7+8)/5]=5
21
Mediana
A mediana é o valor da variável que ocupa a
posição central de um conjunto de n dados
ordenados.
Posição da mediana: (n+1)/2
Ex: 2,5,3,7,8
Dados ordenados: 2,3,5,7,8 => (5+1)/2=3
=> Md = 5
Ex: 3,5,2,1,8,6
Dados ordenados:1,2,3,5,6,8 =>
(6+1)/2=3,5 => Md=(3+5)/2=4
22
Percentis
O percentil de ordem px100 (0<p<1), em um
conjunto de dados de tamanho n, é o valor da
variável que ocupa a posição px(n+1) do conjunto
de dados ordenados.
O percentil de ordem p (ou p-quantil) deixa
px100% das observações abaixo dele na amostra
ordenada.
Casos Particulares:
Percentil 50 = mediana, segundo quartil(md,Q2,q(0,5))
Percentil 25= primeiro quartil (Q1), q(0,25)
Percentil 75= terceiro quartil (Q3) , q(0,75)
23
Exemplos
Ex(1): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
=>n=10
Posição Md:0,5(n+1)=0,5x11=>Md=(3+3,1)/2=3,05
Posição de Q1:0,25(11)=2,75=> Q1=(2+2,1)/2=2,05
Posição de Q3:0,75(11)=8,25=>Q3=(3,7+6,1)/2=4,9
Ex(2):0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6
=>n=11
Md=5,3 Q1=1,7 Q3=12,9
24
Exemplo 2: Considere as notas de um teste de 3 grupos de alunos:
0 10
G1
10
0
G2
0 10
G3
5
Temos : x 1 x3 x3 5 Md 1 Md 3 Md 3 5
25
Medidas de Dispersão
Grupo 1, A=4
Grupo 2, A=8
Grupo 3, A=0
26
Intervalo-Interquartil (d)
Ex(1): 15,5,3,8,10,2,7,11,12
Q1=4,5 e Q3=11,25
d =Q3-Q1=4,9-2,05=2,85
Max,Min,Q1,Q3,Q2: importantes para se ter uma boa ideia da
forma dos dados (simetrica ou assimetrica) e construir box-plots
27
Variância
n
( x1 x )
2
( x x ) ... ( x x )
2
2
n
2
i
x
i 1
x 2
S 2
n 1 n 1
Desvio padrão S
28
Cálculo da variância para o grupo 1:
(3 5) 2
( 4 5) 2
(5 5) 2
(6 5) 2
(7 5) 2
10
S
2
2,5
5 1 4
G1 : S 2,5 2
S 1,58
G 2 : S 10 2
S 3,16
G3 : S 0 2
S 0
29
Coeficiente de Variação (CV)
É uma medida de dispersão relativa;
30
Exemplo 4: Altura e peso de alunos
31
ORGANIZAÇÃO E REPRESENTAÇÃO DOS DADOS
32
Exemplo 1: Considere ao variável grau de Instrução dos dados da
tabela 1.(Variável qualitativa)
Tabela de freqüência
Grau de
Contagem fi f ri f ri %
instrução
1o Grau 12 0,3333 33,3%
2o Grau 18 0,5000 50 %
Superior 6 0,1667 16.7%
60,00%
50,00%
50,00%
40,00%
33,33%
30,00%
20,00% 16,70%
10,00%
0,00%
1o Grau 2o Grau Superior
34
Diagrama circular para a variavel grau de instrução
Diagrama circular para a variável grau de
1oGrau (33.3%)
instrução
Superior
17% 1o Grau
33%
2o Grau
50%
35
2. Organização e representação de variáveis quantitativas
36
Observação 1: A partir da tabela 2.1 podemos recuperar as 20
observação da tabela 1.1, ou seja, aqui não temos perda de
informação dos dados originais.
Mo=2
35%
35
25%
%de funcionários
25
20%
15%
15
5%
5
0 1 2 3 4 5
Número
de filhos
37
Determinação das medidas de posição e medidas de dispersão para
variáveis quantitativas discretas agrupados em tabela de freqüências:
• Média: X 1 f1 X 2 f 2 X k f k
X
i 1
i fi
X
n n
( X 1 X ) 2 f1 ( X 2 X ) 2 f 2 ( X k X ) 2 f k
(X
i 1
i X )2 fi
S
2
n 1 n 1
Cálculo da variância para os dados da tabela 2.1
S S 2 0,858553 0,927
39
2.2 Quantitativas continuas: Os seus valores podem ser qualquer
número real e ainda geralmente existe um grande nùmero de
valores diferentes. Como proceder a construir uma tabela de
frequência nestes casos?
NOTAÇÃO: 4,0|----7,0
40
2.2 Procedimento de construção de tabelas de freqüência para
variáveis contínuas:
PRIMEIRO INTERVALO :
Limite inferior : LI 1 MIN
Limite superior : LS1 LI 1 h
41
SEGUNDOINTERVALO:
Limite inferior : LI 2 LS1
Limite superior : LS2 LI 2 h
k - ÉSIMO INTERVALO :
Limite inferior : LI k LSk 1
Limite superior : LSk LI k h
42
• Ponto médio (ou marca de classe) de cada intervalo de classe:
LS i LI i
X í´
2
• Contagem dos dados pertencentes a cada intervalo.
•Freqüências absolutas de cada intervalo de classe.
•Freqüências relativas de cada intervalo de classe.
•Freqüências acumuladas absolutas de cada intervalo de classe.
i
Fi f 1 f 2 f i f
j 1
j
Fi
Fri f r1 f r2 f ri f r j ; ou Fri
j 1 n
43
Exemplo: Considere a variável salário da empresa comercializadora de
produtos de informática.
Procedimento:
1. Considere k=5.
2. MIN=4; MAX=23,30.
3. A=MAX-MIN=23,30-4=19,30
4. h=19,3/5=3,86
5. h3,9
6. Cálculo dos limites de cada intervalo:
PRIMEIRO INTERVALO
LI 1 4
LS1 4 3,9 7,9
SEGUNDO INTERVALO
LI 2 7,9
LS 2 7,9 3,9 11,8
Os demais limites dos intervalos foram gerados seguindo o
procedimento anterior.
44
4 7,9 5,95; 7,9 11,8 9,85.....
• Ponto médio:X 1 X 2´
´
2 2
De forma similar obtém-se os outros pontos médios.
45
Representação gráfica:
• Histograma de freqüências relativas (em %) para a variável salário
33,33%
30 27,78%
%de funcionários
20 19.44%
16,67%
10
2,7%
0
4.0 7.9 11.8 15.7 19.6 23.5
Salário
46
• Histograma de freqüência acumulada relativa (em %)
Aprox. 61% dos empregados
possuim salário inferior a 12
Frequência acumulada percentual (%) salarios mínimos
97,22% 100%
100
80,56%
61,11%
50
27,78%
Salario
Aprox. 19% dos empregados possuim
salário superior a 16 salários mínimos
47
Gráfico de Ramo e Folhas: Variável salário
4 00 56
5 25 73
6 26 66 86
7 39 44 59
8 12 46 74 95
9 13 35 77 80 • Valores concentrados entre 4 e 19
10 53 76
11 06 59 • Leve assimetria na direção dos valores
12 00 79
grandes( assimétrica à direita)
13 23 60 85
14 69 71
• Destaque do valor 23.30
15 99
16 22 61
17 26
18 75
19 40
20
21
22
23 30
48
Medidas de posição e medidas de dispersão para variáveis
contínuas agrupadas em tabela de freqüências.
k
• Média: X ´
fi
f1 f 2 X k´
i
X 1´ X 2´ fk i 1
X
n n
Exemplo: Considere a tabela 2.2
5,95 10 9,85 12 13,75 7 17,65 6 21,55 1
X
36
401,4
11,15
35
Se calculamos a média para dados não agrupados apresentadas
anteriormente resulta:
X 1 X 2 X 36 4 4,36 23,30
X 11,122
36 36
49
2
f X
k
´
X
• Variância:
i i
i 1
S2
n 1
Exemplo: Considere a tabela 2.2. Vimos que X 11,15
i Intervalos
de classe
X´i fi
f i X i´ X
2
f X
5
i
´
i X
i 1 699,66
S2 19,99029 S 4,47105 (Desvio Padrão)
36 1 35
50
Esquema dos cinco números
x(1) Q1 Q2 Q3 x(n)
Total Observações n
Mediana Q2
Quartis Q1 Q3
51
Boxplot
O BOXPLOT representa os dados através de um retângulo
construído com os quartis e fornece informação sobre valores
extremos. (veja o esquema embaixo)
52
Exemplo de construção de um Boxplot. Com a finalidade de
aumentar o peso (em Kg) um regime alimentar foi aplicado em 12
pessoas. Os resultados (ordenados) foram:
-0,7 2,5 3,0 3,6 4,6 5,3 5,9 6,0 6,2 6,3 7,8 11,2.
53
11.2
Observação
exterior
(discrepante
ou atipica)
54
Boxplot de Salário por educação Boxplot de Salário por educação
25
3
Salario
Grau Instrucao
15
2
1
5
1 2 3
5 15 25
Grau de Instrucao
Salario
Outro
Capi tal
Interi or
5 15 25
Salario
55
Criar Boxplot da idade x sexo da sala em R.
Boxplot de comparação:
> boxplot(1~2, main="Boxplot Comparativo: Idade x Sexo", col=c("red", "blue"))
56