Você está na página 1de 19

AULA1-AULA5

Estatística Descritiva

Prof. Victor Hugo Lachos Davila


oO que é a estatística ?
Para muitos, a estatística não passa de conjuntos
de tabelas de dados numéricos. Os estatísticos são
pessoas que coletam esses dados.

•A estatística originou-se com a coleta e construção de


tabelas de dados para os governos
• A situação evoluiu e esta coleta de dados representa
somente um dos aspectos da estatística.

2
INFERENCIA ESTATISTICA
PROBABILIDADE
ESTATÍSTICA DESCRITIVA
Definição
Áreasde daEstatística
Estatística
E o estudo de técnicas que possibilitam a
extrapolação, aé um
A estatística descritiva grande
a etapa inicial daconjunto
análise de
Adados,
teoriapara
utilizada dedescrever
das probabilidades
informações nos permite
e resumir osedados.
conclusões
A
A estatística
1.- é um
Estatística conjunto
Descritiva de quantidade
técnicas que permite,
descrever
disponibilidade
obtidas
de forma a os fenômenos
de
partir
uma
sistemática,
grande
da amostra.
organi
zar,
aleatórios,
descrever,
de
analisar
ou
dados
e2.-
deProbabilidade
métodos computacionais muito eficientes
seja, aqueles
erevigorou
interpretar emdaque
estádados
área oriundosestá presente
de estudos
estatística. ou a
incerteza.
experimentos,
3.- Inferênciarealizados
estatísticaem qualquer área do
conhecimento.

3
Na eleição Presidencial
Os Institutos Etapas deAmostragem
daPesquisa
Analise de opinião
por Conglomerados
AMOSTRAGEM
colhem periodicamente Exemplo
Estatística
Dividir 1
em
Amostragem Aleatória
seções amostras
a área populacional, de
Cada
selecionar elemento da algumas
aleatoriamente população tem a
dessas
eleitores para obter
Uma área importante em muitas aplicações
mesmas.
as
seções e mesma
tomar estimativas
chance
todos osde
Estatísticas
ser escolhido.
elementos
é a da
das
Tecnologia de
de
intenção
Numa pesquisade
Amostragem.
voto
eleitoral,
um institutoda depopulação.
pesquisa As
procura, com base nos resultados de um
estimativas
levantamento são fornecidas
aplicado a uma amostra com
da um valor e
Exemplos de Aplicação: Amostragem de Conveniência
uma margem
população, prever
• Pesquisa de mercado,
de
o erro.
resultado Amostragem
da
Utilizar
eleição.
resultados de
Estratificada
fácil acesso.
Classificar a população em, ao
O• Pesquisa
quadro
de opinião, do Instituto menos dois estratosToledo
e extrair uma &
amostra de cada um.
Associados, a seguir refere-se à intenção
• Avaliação do processo de produção,
• Praticamente em todo experimento.
de voto no 1º turno das eleições para o
governo em 2002. Amostragem Sistemática
Escolher cada elemento de ordem k.
4
Tabela 1.1 Informação do estado civil, grau de instrução, número de filhos, idade e procedência de 36
funcionários sorteados ao acaso da empresa MB.(Bussab e Morettin)

Intenção de voto para


presidente do Brasil-2002
Voto estimulado,em % do total de votos.A .ultima pesquisa
Confronto noMargem
segundo
ouviu 2.202 eleitores-
turno
de erro de 2,09%

46,3%

34,9% 40,5%

Lula(PT) 34,3%

33,6%
22,8% 23,3%
Serra(PSDB) 17,6%
13,8% 14,8%
13,8% 12,1%
Ciro(PPS)
9,0%
Garotinho(PSB) 12,6% 10,5%
11,3%

M aio Junio Jul/Ago Set/Out

Gráfico de setores ou em forma de pizza


Fonte:Pesquisa toledo& Associados. 5
6
Mediana
A mediana Medidas
é o Variável
valor Resumo
da variável que ocupa a
posição central
Medidas dedeMédia
um conjunto de n dados
Posição
Variáveis Quantitativas
ordenados.
Qualquer característica associada a uma população
n

Posição da
MEDIDAS DE mediana:
x POSIÇÃO:
1 + x Moda, (n+1)/2
2 + xMédia,
Classificação de ... ∑
+ x n Percentís,
3 + Mediana,
variáveis
x i

Moda(mo):
x =
Quartis. É o valor n(ou atributo) = quei = 1n
Ex: 2,5,3,7,8 Nominal sexo, cor
.Moda
dos olhos

{
ocorre com maior freqüência
Qualitativa
Dados ordenados: 2,3,5,7,8 => (5+1)/2=3
OrdinalAmplitude,
MEDIDAS DE DISPERSÃO: Intervalo-Interquartil,
Classe social, grau de instrução
=>
Ex: Md =
Variância, 5 Padrão,
Desvio
4,5,4,6,5,8,4,4 Coeficiente de Variação.
Variavel
Ex:2,5,3,7,8 Contínua Peso, altura,salario

{
qualitativa
Ex: 3,5,2,1,8,6
Quantitativa
Mo= 4
Número de filhos, numero de
Dados
Média = ordenados:1,2,3,5,6,8
[(2+5+3+7+8)/5]=5
Discreta carros =>
7
(6+1)/2=3,5 => Md=(3+5)/2=4
Percentis
O percentil de ordem px100 (0<p<1), em um
conjunto de dados de tamanho n, é o valor da
variável que ocupa a posição px(n+1) do conjunto
de dados ordenados.
O percentil de ordem p (ou p-quantil) deixa
px100% das observações abaixo dele na
amostra ordenada.
Casos Particulares:
Percentil 50=mediana, segundo quartil(md,Q2,q(0,5))

8
Percentil 25= primeiro quartil (Q1), q(0,25)
Percentil 75= terceiro quartil (Q3) , q(0,75)

9
Intervalo-Interquartil (d)
Exemplo
O 2:
Considere
p-quantil, 0<p<1, Exemplos
as notas
Medidas
pode de um teste
de Dispersão
ser calculado de 3 grupos de alunos:
como:
É a diferença entre o terceiro quartil e o primeiro
Ex(1):
Grupo 1:15,5,3,8,10,2,7,11,
quartil, 3,ou
4, 5,seja,6, 7; Grupo 12
1, 3,
2: 5, 7,9; e Grupo 3: 5,5,5,5, 5.
=>n=9 x , d= Q3-Q1
se p = p =
i − 0 .5
, i = 1,..., n
=> ordenamos : 2<3<5<7<8<10<11<12<15 n
Finalidade: (1
(i)
- encontrar
f ) q ( p ) um
f q valor
( p
i
),quese resuma
p p ap
q( p0) = + i <
i10
< i +1
P1=1/18;
variabilidade
xp2=3/18;
,
i
de umi
p3=5/18;
conjunto se p4=7/18;
i +1
pde dados
p p5=1/2;
Ex(1):
G1 15,5,3,8,10,2,7,11,12
p6=11/18;x p7=13/18; p8=15/18;
< 1
se pp9=17/18
(1)

> p 10
0 (n), n
Amplitude
Q1=4,5
G2 (A):
eA=máx-min
Q3=11,25
Posição Md : q(0.5)=8
Para
Onde:os grupos anteriores, temos:
Posição de Q1 : q(0.25)=4, 5
d =Q3-Q1=4,9-2,05=2,85
Posição depQ3 p
:−q(0.75)=11, 25 i −0.5
Estatisticasde ordem
f =0 1, A=4 i , pi
Grupo 10
G3 i p i + 1 − p i importantesnpara se ter uma boa ideia
Max,Min,Q1,Q3,Q2: da
Grupo A=8(simetrica 5ou=assimetrica) e construir box-plots
2,dados
forma dos
Grupo 3,xA=0 ( 1 )x ≤ xx ( 2 )5 ≤ xMd ...... ≤
( 3 ) ≤ Md x 5
Temos: x = = = = = Md (=
n ) 10
1 3 3 1 3 3
ORGANIZAÇÃO E REPRESENTAÇÃO DOS DADOS
Cálculo da variância para o grupo 1:
Coeficiente
Uma Variância
Exemplo 4:Adeltura
das formas organizar ede
e peso Variação
de
resumir alunos (CV)
a informação contida em dados
observados é por meio de tabela de freqüências e gráficos.
) É 4,
G1:3, uma5,medida
6, 7: de dispersão
Vimos que:relativa;
x n
2
...+(x x) ∑( )
2
Média
2 2
Desvio padrão xi −xde
= 5Coeficiente
(x1 −x ) + (x 2− x) + n−dados
=;
) (3 Elimina
52
) (4
22
o
S5) =(5efeito
52
) (6 da
2
5) (magnitude
2
7 5) 10 dos i=1
− + − + − + − + −
S2 = de freqüência: relaciona ncategorias variação
1 =2,5 (ou classes) nde
Tabela −= −1valores,
juntamente
Altura
5−1
com contagem
1,143m
4
(ou freqüências)
0,063m do número5,5%
de valores que se
Exprime
Desvio
enquadram
a variabilidade
empadrão
em relação a média
S ou classe.
cada categoria
) Peso 50Kg 6kg 12%
Desvio padrão duas
Útil Comparar S = ou2,mais
5 =1,variáveis
58
)
1. Variáveis qualitativas: Podemos construir tabela de freqüência
Desvio Padrão
2 S : S = Variância
G1 : S CV
= 2=,5 ×S100=1%,58
que os quantificam por categoria de classificação e sua
representação gráfica é mediante gráfico de barras, gráfico
setorial ou em forma
2
X de pizza.
G 2 : S =10 S = 3,16
Conclusão: Com relação as médias, os alunos são,
aproximadamente, duas vezes is madispersos quanto ao peso
do que quanto a 2altura
G3 : S = 0 S =0 11
2. Organização e representação de variáveis quantitativas
2.1Representação
Quantitativas discretos:
gráficaOrganizam-se
de variáveismediante tabelas de
qualitativas
frequências
Exemplo e a representação
1:Considere gráfica
ao variável grau é mediantedos
de Instrução gráfico
dadosde
dabarras
tabela .(
1Variável
• Gráfico
Exemplo: qualitativa
de Barras
Considere )
a variável número de filhos dos dados da tabela 1.
Tabela de freqüência
• Diagrama
Grau circular,
de de sectores ou em forma de “pizza”
Tabela 2.1:Distribuição Contagem de freqüênciasfi f ri
de funcionários fri % da empresa,
instruçãoDiagrama de barras para a variável
segundo o número de filhos grau de instrução
1o Grau 12 0,3333 33,3%
60 ,00%
i Número de Número de % de funcionários
2o50Grau
,00% filhos 1850 ,00%
funcionários 0,5000 50(f%ri)
(Xi ) (fi )
6 0,1667 16.7%
1 Superior 0 33 ,33%
40 ,00%
4 20%
30 ,00%
2 total 1 n=36 5 1,0000 25%
100 %
3 20 ,00% 2 7 16 ,70% 35%
f :Frequência
4 10 ,00% absoluta
3 da categoria i (número
3 de indivíduos 15%
i
que
5 pertencem5à categoria
0 ,00%
i 1 5%
fi total 1 o Grau 2 o20
Grau Superior 100%
f = : Frequência relativa da categoria i
ri n 12
ri ri

13
2.2 Procedimento de construção de tabelas de freqüência para
variáveis contínuas:
•Observação
Variância: 1: A
Determinação daspartir dadetabela
medidas posição2.1e podemos
medidas de recuperar
dispersão
paraas 20
1. Escolha
observação
variáveis dao tabela
número1.1,
quantitativas deou intervalos
discretas seja,
pados de
emclasse
aqui
agru não
tabela (k)
temos perdak de
de freqüências: 2
informação dos dados originais.

2. Identifique 2 o menor valor 2 (MIN) e o valor (
2 máximo (MAX)
X i − X ) fi
dos
2.2 ( X 1 − X ) f 1 continuas:
+ ( X Os X ) fvalores
2 − seus (kX k −qualquer
2 + L +podem X ) fk
S 2 Quantitativas
=dados. ser
=
i =1
Representação
número real
e gráfica
ainda : Diagrama
geralmente de Barras
existe um grande nùmero de n −1

3. Calcule a amplitude dos n − 1
dados (A): X
A=MAX i f i –MIN
•valores
Média: diferentes. X1 fComo
1 + X 2 fproceder
2 +L + X k af k construir
tabelauma 2.1tabela de A
i=1
Cálculo da variância
X= para os dados da =
frequência
4. Calculenestes casos? n de cada intervalo
o comprimento n de classe (h): h =
2 4(0 −1,65) 2 + 5(1 −1,65) 2 + 7 ( 2 −1,65) 2 + 3(3 −1,65) 2 + (5 −1,65) 2
S = 35% k
Exemplo:
5. Arredonde
35
Considereoa valortabelade 2.1he de
determine
19
forma a média
que Mo=2
sejadeobtido
filhos um
dos número
funcionários.
A 16,3125
conveniente.
alternativa consiste25%em construir classes ou faixas de valores e
= 19 o número0,858553
= 0 ×4 + 1×ocorrências
5 +2de 7cada
3×3intervalo
5 ×1cada33de
%de funcionários

contar
6. Obtenha
X
25
os de
limites
20%
× + +em faixa
classe.
1,65
20 20
Desvio padrão:
= 15% = =
PRIMEIRO15 INTERVALO :
• Mediana: 2
SDados
=
Limite S
inferior
=
ordenados: 0,858553
: LI 1 = MIN
= 0,9275%
No caso da variavel salario podemos considerar as seguintes
21 = 12+2h 2 2 3 3 3 5 =>
5
faixasLimite 0 superior
0 0valores:
de 1 1 : 1LS
0 1 1[4,0; 0
7,0);
1
2 LI
2[7,0;10,0);......
2 3 4 5

=> Md
(20+1)/2=10,5 Número
=(2+2)/2=2
de filhos 14

NOTAÇÃO: 4,0|----7,0
SEGUNDO INTERVALO : ncias, constituída pelas seguintes
Limite inferior : LI 2 = LS 1 Limite superior :
LS 2 = LI 2 + h
Os intervalos são fechados á

k - ÉSIMO INTERVALO :
Limite inferior : LI k = LS k −1
Limite superior : LS k = LI k + h

15
7. Construa uma tabela de freqüê
colunas:
• Número de ordem de cada intervalo (i) •
Limites de cada intervalo.
esquerda e aberta à direita: NOTAÇÃO:|----

16
• Mediana (Md) 0,5n − Fi −1 ⎞
Md = LI i + ⎛⎜ ⎟⎟ × h
Medidas
Exemplo:Considere de posição e amedidas
variável de salário ⎜
dispersãoempresa
da para f variáveis
comercializadora de
Representação
Útil
• Ponto para médio encontrar
(ou gráfica:
marca os de d
percentis:
classe) ⎝
de Exemplo
cada
i
⎠ Q2
intervalo ou Md
de classe
:
••i :Gráfico
produtos
contínuas
Moda (mo): de
é Histograma
a classede informática.
agrupadas
demédianaRamo moe= freqüência
(Folhas
em

tabela
1
⎜⎜: Variável
éLIoi intervalo
+ de
⎞ h
acumulada
⎟⎟ ×freqüências.
de salário
classe relativa
onde (emdos
a coluna %)F na TDF
´⎝ ,18LS ⎠,9LI
11 d + d k27de
. Histograma
• Histograma usando
de densidade
freqüências − i +
relativa s i Md
frequência
´ (em %) − 7 ,(mais
para 9 a variável
comum!)salário
i
• Média:
superou
i 4: Classeo00modal 50´% dos dados) Xclasse
í ´ = que61 i f= ⇒ Md = 10 ,(5f ))

Procedimento: (é aquela Xtem
% i dos
maior empregados
frequência tem salário
absoluta
X561 f1 + X 2 f 2 +L X 33
´
k f k ,33 i =%
12 22 , 22
1. LI
LI 5 Considere
: Limite
X =
25
: é o limite 73 k=5.
inferior
inferior da classe mediana.
= inferior a 12 salarios mínimos i
n da classe modal.
Frequência acumulada percentual (%)
n
2.F MIN=4;
6 i
•7 Contagem MAX=23,30.
26 66 86
dos 22.22%
: éf a frequência 100 dados
acumuladapertencentes absoluta ada cadaclasseintervalo.
anterior Área=1
a classe mediana
i 39 44 59 97,22% 100%
3. d
Exemplo:
81 12
f
A=MAX-MIN=23,30-4=19,30
i- 1= i Considere
− i −1 46 74 95
a tabela 2.2
•Freqüências
f : frequência
4. d102h=19,3/5=3,86
9
f 13 f
absolutas
absoluta de cada
da33,33% ,33% intervalo
classe
• Valores
33 mediana.
80,56%concentradosde classe. entre 4 e 19
i = i − i +1 × 5 ,95 10 9 ,85 12 13 ,75 7 17 ,65 6 21 ,55
× + Assimétricaa ×1 direita
35 77 80

X
53 76
+ × + × +
5.h•Freqüências
hcompriment
11: ≈3,9 = 30o do27,78%
30
relativasintervalo
27,78%de cada de
• ,11%
Leve classe.
intervalo
36 assimetria dena classe.
direção dos valores
h : compriment
6. 13Cálculo23dos
06 59 o do
limites
intervalo
de
61
cada
de classe.
intervalo: 7,1%*3,9=27,6
grandes( assimétrica à direita)
12 00 79
60 401,4
ários

•Freqüências acumuladas absolutas de %cada intervalo de classe.


85
Exemplo: PRIMEIRO
=
Exemplo: Considere Considere = 11,a
50 INTERVALO 15tabela
a tabela 2.2
2.2. 19.44
19.44% TDF
20
20
• Destaque do valor 23.30
14 69 71
%defuncion

35 1616,67%
,67% i
15
LI =99 4 27,78%


1 f 12 > F
f22 j=≠ 2f⇒ + if2dados
=2,+⇒ éLanão+
classe fagrupados
=modal f apresentadas
26 =
Já que,
16 22 61
Se 17 calculamos
F = a média para
n / i =2 , é a classe mediana
Já que, =
LS 2 4 +
10
10
3 , 9 j i= > 17 , 9 2 i j 1 j
anteriormente
18 1 75 2
SEGUNDO resulta:
INTERVALO
=
19 40
2,7%
2,7%
•Freqüências acumuladas relativa de cada ,30⎞ 3,9⎞ 8,55 de classe.
intervalo
0
20
LI X 1=LI 0 ,5
⎛1L + −
7⎛ X, 900d+ n F
X ⎞ 4h+ 4,736 18
L⎛12+− −
2310
21 XMd = + ⎜ ⎞
1
⎟ ⎛ ,9 + 10
mo = LI2 2 +⎜ + 2 2 ⎜

4.0
f ×
×
,9 +=⎜ 11.8+ ⎜ 15.7
h36=⎟77.9 12 i ⎟ ×19.6 ⎟
= 3,23.5
11,122
× 9 =9,014
F
22 LS
= = d1 +d 2⎜7 , 936⎝ 3 ⎟
, 9 1
= = 11⎠ , 8 ⎜ 36 ⎝
(12 10) (12 =7) ⎠ ⎟
⎝ + Fri⎠ = f r1 + Md −f r + f−
4.0
4.0 7.9
7.9 11.8
11.8 15.7
15.7 19.6
19.6 23.5
23.5


23 2 30 f r2 +
⎝ L Salário
+Salario
i =
Salário rj ; ou
⎠ Fri = i
Os demais
19% possuimlimites
saláriodos interval
superior a 16 os foram n
j =1 gerados seguindo o
Este resultado difere do valor obtido anteriormente. Porque?
procedimento
saláriosanterior.
mínimos 17
Exemplo de construção de um Boxplot. Com a finalidade de
aumentar o peso (em Kg) um regime alimentar foi aplicado em 12
pessoas. Os resultados (ordenados) foram:
Esquema dos cinco números
Boxplot
O-0,7
BOXPLOT
2,5 3,0representa os dado
3,6 4,6 5,3 s5,9
através de um
6,0 6,2 6,3retângulo
7,8 11,2.
construído com os quartis e fornece informação sobre valores
extremos.
xCalculando
(1)
(veja
Q1 o esquema
as medidas embaixo)
Q2temos: Q3 x(n)
Mediana (md ou Q2) = 5,6kg
Total Observações n
1º.quartil (Q1) = 3,3kg
3º.quartilMediana
(Q3) = 6,25kg Q2

Quartis Q1 Q3
d=intervalo interquartil = Q3-Q1 =2,95kg Logo
as linhas Extremos
auxiliares correspondem
x(1) aos pontos: x(n)
Q1-1,5d = -1,25kg
Q3+1,5d = 10,675kg

18
Boxplot de Salário por educação Boxplot de Salário por educação

25

3
11.2
Observação
Salario

Grau Instrucao
15
2

exterior
5
1
(discrepante
1 2
Grau de Instrucao
3 5 ouatipica)
15
Salario
25

Boxplot de Salário por região de procedência


Região de Procedência

Outro

Capital

Exemplo:Considere os dados da tabela 1.1, o boxplot para variável


salário por educação e região deprocedência dos funcionários da
Interior

empresa. 5 15 25
Salario

19

Você também pode gostar