Você está na página 1de 38

Aula Introdutria

Aula Introdutria
Aula ministrada por
Prof. Carlos Alberto (Caio) Dantas
Prof. Vanderlei da Costa Bueno
Prof. Vladimir Belitsky
Autoria de
Prof. Carlos Alberto (Caio) Dantas
FORMATAO & DESIGN
Clber da Costa Figueiredo
figuecl@usp.br
Thiago Rodrigo Alves Carneiro
thiagorodrigo@ime.usp.br

A Estatstica originou-se com a coleta e


construo de tabelas de dados para o
governo.

A situao evoluiu e esta coleta de dados


representa somente um dos aspectos da
Estatstica.
O Que Estatstica?
O Que Estatstica?
Estatstica
Estatstica
Populao
Caractersticas
Amostra
Informaes contidas
nos dados
Concluses
sobre as
caractersticas
da populao
Tcnicas de amostragem
Anlise
descritiva
Inferncia
estatstica
Amostragem
Amostragem
a area da Estatstica que trata da
obteno de amostras que sejam
representativas da populao
Exemplos de utilizao: Pesquisa de
Mercado, Pesquisa de opinio pblica,
Ensaios de medicamentos e em
praticamente todo experimento.
Estatstica
Estatstica
Descritiva
Descritiva
A disponibilidade de uma grande
quantidade de dados e de
mtodos computacionais muito
eficientes revigorou esta rea da
Estatstica.
Inferncia Estatstica
Inferncia Estatstica
A inferncia estatstica procura
com base nos dados
amostrais tirar concluses
sobre a populao.
Probabilidade
Probabilidade
A inferncia estatstica baseia-
se na Teoria das Probabilidades
que constroe modelos para os
fenomenos aleatrios, isto ,
aqueles em que esta presente a
incerteza.
Exemplo: Inteno de
Exemplo: Inteno de
voto
voto
Numa pesquisa eleitoral, um Instituto
de Pesquisa procura, com base nos
resultados de um levantamento
aplicado a uma amostra da
populao, prever o resultado da
eleio.
Considere o Candidato A
Considere o Candidato A
Denomine por a proporo de
pessoas que votaro em A na
eleio.
Denomine por a proporo de
pessoas no levantamento de
opinio (amostra) que expressam
inteno de voto em A.
p
^
p
Amostra
Amostra
POPULAO o conjunto de elementos
que nos interessa estudar.
AMOSTRA qualquer subconjunto da
populao.
clique aqui para voltar
Populao e Amostra
Populao e Amostra
Podemos usar o valor de
Podemos usar o valor de
para estimar a proporo
para estimar a proporo
da populao.
da populao.
p
^
p
Estimao
Estimao
Evoluo da inteno de voto para prefeito de So Paulo realizada Evoluo da inteno de voto para prefeito de So Paulo realizada
entre os dias 29 e 30 de outubro de 2004 (2 Turno). entre os dias 29 e 30 de outubro de 2004 (2 Turno).
Pesquisa contratada pela TV Globo, em % do total de votos. Pesquisa contratada pela TV Globo, em % do total de votos.
A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com 95% A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com 95%
de confiana. de confiana.
Estatstica Descritiva
Estatstica Descritiva
Etapa inicial da anlise
utilizada para descrever e
resumir os dados
Exemplo
Exemplo
Arquivo
Arquivo
Pulse
Pulse
do Minitab
do Minitab
Refere-se a um experimento feito por alunos.
Cada aluno registrou sua altura, peso, sexo,
hbito de fumar, nvel de atividade fsica
usual e pulsao em repouso.
Ento todos eles jogaram moedas e aqueles
que tiraram cara fizeram corrida estacionria
por um minuto.
Depois disso todos os alunos mediram
novamente sua pulsao.
Informaes do arquivo
Informaes do arquivo
Pulse
Pulse
Information of the worksheet
Information of the worksheet
Column Count Column Count Name Name
C1 92 Pulse1 C1 92 Pulse1
C2 92 Pulse2 C2 92 Pulse2
C3 92 Ran (1:correu, 2:no correu) C3 92 Ran (1:correu, 2:no correu)
C4 92 Smokes (1:fumante, 2:no fumante) C4 92 Smokes (1:fumante, 2:no fumante)
C5 92 Sex (1:masculino, 2:feminino) C5 92 Sex (1:masculino, 2:feminino)
C6 92 Height C6 92 Height
C7 92 Weight C7 92 Weight
C8 92 Activity (1:leve, 2:moderada, 3:forte) C8 92 Activity (1:leve, 2:moderada, 3:forte)
(Pulsao antes de correr) (Pulsao antes de correr)
(Pulsao depois de correr) (Pulsao depois de correr)
MTB > INFO
MTB > INFO
Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity
64 88 1 2 1 66.00 140 2 64 88 1 2 1 66.00 140 2
58 70 1 2 1 72.00 145 2 58 70 1 2 1 72.00 145 2
62 76 1 1 1 73.50 160 3 62 76 1 1 1 73.50 160 3
66 78 1 1 1 73.00 190 1 66 78 1 1 1 73.00 190 1
64 80 1 2 1 69.00 155 2 64 80 1 2 1 69.00 155 2
74 84 1 2 1 73.00 165 1 74 84 1 2 1 73.00 165 1
84 84 1 2 1 72.00 150 3 84 84 1 2 1 72.00 150 3
68 72 1 2 1 74.00 190 2 68 72 1 2 1 74.00 190 2
62 75 1 2 1 72.00 195 2 62 75 1 2 1 72.00 195 2
...... ......
Informaes do arquivo Pulse
Informaes do arquivo Pulse
Dimetro Dimetro Altura Altura Volume Volume 8,3
70 10,3 12,9 85 33,8
8,6 65 10,3 13,3 86 27,4
8,8 63 10,2 13,7 71 25,7
10,5 72 16,4 13,8 64 24,9
10,7 81 18,8 14,0 78 34,5
10,8 83 19,7 14,2 80 31,7
11,0 66 15,6 14,5 74 36,3
11,0 75 18,2 16,0 72 38,3
11,1 80 22,6 16,3 77 42,6
11,2 75 19,9 17,3 81 55,4
11,3 79 24,2 17,5 82 55,7
11,4 76 21,0 17,9 80 58,3
11,4 76 21,4 18,0 80 51,5
11,7 69 21,3 18,0 80 51,0
12,0 75 19,1 20,6 87 77,0
12,9 74 22,2
Arquivo Trees do Minitab
Arquivo Trees do Minitab
Classificao
Classificao
NOMINAL NOMINAL NOMINAL NOMINAL
ORDINAL ORDINAL ORDINAL ORDINAL
QUALITATIVA QUALITATIVA
QUALITATIVA QUALITATIVA
QUANTITATIVA QUANTITATIVA
QUANTITATIVA QUANTITATIVA
CONTNUA CONTNUA CONTNUA CONTNUA
DISCRETA DISCRETA DISCRETA DISCRETA
peso, altura
nmero de filhos, nmero de carros
sexo, cor dos olhos
classe social, grau de instruo
Varivel
Varivel
Qualquer caracterstica associada a uma populao.
Variveis Quantitativas
Variveis Quantitativas
Mnimo, Mximo, Moda, Mdia, Mediana, Quartis
Amplitude, Intervalo-Interquartil, Varincia, Desvio
Padro, Coeficiente de Variao
MEDIDAS DE POSIO:
MEDIDAS DE DISPERSO:
Mximo (max):
Mximo (max):
a maior observao
a maior observao
Mnimo (min):
Mnimo (min):
a menor observao
a menor observao
Moda (mo):
Moda (mo):
o valor (ou atributo) que
o valor (ou atributo) que
ocorre com maior freqncia.
ocorre com maior freqncia.
Medidas de Posio
Medidas de Posio
Ex.: 4, 5, 4, 6, 5, 8, 4
Ex.: 4, 5, 4, 6, 5, 8, 4
mo = 4
mo = 4
max = 8
max = 8
min = 4
min = 4
Ex: 2, 5, 3, 7, 8
2+5+3+7+8
5
= 5
n
x
n
x x x x
x
n
i
i
n

+ + + +

1 3 2 1
...
Mdia
Mdia
-
X =
Valor que deixa
Valor que deixa
50%
50%
das observaes sua esquerda
das observaes sua esquerda
Ex(A): 2, 5, 3, 7, 8
Dados ordenados: 2, 3, 5, 7, 8
Md = 5
Ex(B): 3, 5, 2, 1, 8, 6
Dados ordenados: 1, 2, 3, 5, 6, 8
Md = (3 + 5) / 2 = 4
Mediana (Md)
Mediana (Md)
A mediana pode ser obtida ordenando-se os dados e
A mediana pode ser obtida ordenando-se os dados e
encontrando-se o valor que corresponde a posio
encontrando-se o valor que corresponde a posio
(n+1)/2, se
(n+1)/2, se
n
n
for mpar.
for mpar.
Se
Se
n
n
for par, a mediana corresponde a mdia aritmtica
for par, a mediana corresponde a mdia aritmtica
dos valores da posio anterior e posterior a (n+1)/2.
dos valores da posio anterior e posterior a (n+1)/2.

Primeiro Quartil (Q1):
Primeiro Quartil (Q1):
valor que deixa 25%
valor que deixa 25%
das observaes sua esquerda.
das observaes sua esquerda.
Terceiro Quartil (Q3):
Terceiro Quartil (Q3):
valor que deixa 75%
valor que deixa 75%
das observaes sua esquerda.
das observaes sua esquerda.
Ex(A): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
Md = 3,05 Q1 = 2,05 Q3 = 4,9
Ex(B): 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6
Md = 5,3 Q1 = 1,7 Q3 = 12,9
1 e 3 Quartil
1 e 3 Quartil
Posio de Q1
Posio de Q1
Como encontrar Q1
Como encontrar Q1
4
1 n
P1
+

Valor de Q1
Valor de Q1
a)
a)
Se P1 for um nmero inteiro, ento
Se P1 for um nmero inteiro, ento


Q1 = y
Q1 = y
P1 P1

onde y
onde y
1 1
,y
,y
2 2
,,y
,,y
n n
so os dados ordenados
so os dados ordenados
b) Se P1 no for inteiro, sejam P1
b) Se P1 no for inteiro, sejam P1
- -
e P1
e P1
+ +
os
os
inteiros imediatamente abaixo e acima de
inteiros imediatamente abaixo e acima de
P1, respectivamente. Ento
P1, respectivamente. Ento
2
y y
Q1
P1 P1
- +
+

clique aqui
para voltar
Posio de Q3
Posio de Q3
Como encontrar Q3
Como encontrar Q3
4
1) 3(n
P3
+

Valor de Q3
Valor de Q3
a)
a)
Se P3 for um nmero inteiro, ento
Se P3 for um nmero inteiro, ento


Q3 = y
Q3 = y
P3 P3
b) Se
b) Se

p
p
3 3
no for inteiro, ento com a mesma
no for inteiro, ento com a mesma
notao do caso anterior
notao do caso anterior
2
y y
Q3
P3 P3
- +
+

clique aqui
para voltar
Grupo 1: 3,4,5,6,7
Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5
Temos: x
1
= x
2
= x
3
= 5 md
1
= md
2
= md
3
= 5
Exemplo: Considere as notas de um teste de
Exemplo: Considere as notas de um teste de
3 grupos de alunos
3 grupos de alunos
G 1
10 0
* * * * *
G 2
0 10
* * * * *
G 3
0 10
*
*
*
*
*
Amplitude (A): mximo - mnimo [mx - min]
Amplitude (A): mximo - mnimo [mx - min]
Medidas de Disperso
Medidas de Disperso
Finalidade: encontrar um valor que resuma a
Finalidade: encontrar um valor que resuma a
variabilidade de um conjunto de dados
variabilidade de um conjunto de dados
Para os grupos anteriores, temos:
Para os grupos anteriores, temos:
Grupo 1, A = 4
Grupo 1, A = 4
Grupo 2, A = 8
Grupo 2, A = 8
Grupo 3, A = 0
Grupo 3, A = 0
a diferena entre o terceiro quartil e
o primeiro quartil, ou seja, Q3 - Q1
Ex.(A): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
Q1 = 2,05 e Q3= 4,9
Q3 - Q1 = 4,9 - 2,05 = 2,85
Intervalo-Interquartil
Intervalo-Interquartil
1
) (
1
) ( ... ) ( ) (
1
2
2 2
2
2
1
2

+ + +

n
x x
n
x x x x x x
s
n
i
i
n
Varincia o DesvioPadr
Varincia e Desvio Padro
Varincia e Desvio Padro
( ) ( ) ( ) ( ) ( ) [ ]
( ) ( ) ( ) ( ) ( ) [ ]
[ ] 5 , 2
4
10
4 1 0 1 4
4
1
2 1 0 1 2 -
4
1
5 7 5 6 5 5 5 4 5 3
4
1
s
2 2 2 2 2
2 2 2 2 2
2
1
+ + + +
+ + + +
+ + + +
( ) ( ) ( ) ( ) ( ) [ ]
[ ] 10
4
40
6 1 4 0 4 6 1
4
1
5 9 5 7 5 5 5 3 5 1
4
1
s
2 2 2 2 2
2
2
+ + + +
+ + + +
Grupo 1: 3,4,5,6,7
Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5
Temos: x
1
= x
2
= x
3
= 5 md
1
= md
2
= md
3
= 5
Exemplo: Considere as notas de um teste de
Exemplo: Considere as notas de um teste de
3 grupos de alunos
3 grupos de alunos
G 1
10 0
* * * * *
G 2
0 10
* * * * *
G 3
0 10
*
*
*
*
*
Varincia para os Grupos 1, 2 e 3
Varincia para os Grupos 1, 2 e 3
G1: s
2
= 2,5 s = 1, 58
G2: s
2
= 10 s = 3,16
G3: s
2
= 0 s = 0
Frmulas Alternativas
Frmulas Alternativas
( )
1
1
]
1

,
_


,
_

1
]
1


,
_

2
n
1 i
i
n
1 i
2
i
2
n
1 i
2
i
2
x
n
1
x
1 n
1
x n x
1 n
1
s
Exemplo: Considere o grupo G1
( ) [ ] [ ] 5 , 2
4
10
125 135
4
1
5 5 135
4
1
135 49 36 25 16 9
7 6 5 4 3
2
2
2 2 2 2 2
1
2

+ + + +
+ + + +

s
x
n
i
i

uma medida de disperso relativa


uma medida de disperso relativa

elimina o efeito da magnitude dos dados


elimina o efeito da magnitude dos dados

exprime a variabilidade em relao mdia


exprime a variabilidade em relao mdia
% 100
x
s
CV
Coeficiente de Variao (CV)
Coeficiente de Variao (CV)
Exemplo 1
Exemplo 1
Altura e peso de alunos
Altura 1,143m 0,063m 5,5%
Peso 50 kg 6kg 12%
Mdia
Desvio
Padro
Coef. de
Variao
Concluso: Os alunos so duas vezes mais
dispersos quanto ao peso do que quanto altura
Exemplo 2
Exemplo 2
Alturas de meninos de uma amostra e
alturas de homens adultos de outra amostra.

Concluso: Em relao s mdias, as alturas dos
homens e dos meninos apresentam variabilidade quase
iguais.
Desvio
Padro
Coef. De
Variao
Mdia
Meninos 50 6 12%
Homens 160 16 10%