Você está na página 1de 64

ESTATSTICA APLICADA ESTATSTICA APLICADA

no Excel
Tpicos de Matemtica Aplicada Tpicos de Matemtica Aplicada
07/08/2008 1
Bertolo
O que Estatstica?
A estatstica pode ser entendida como um
conjunto de mtodos usados para conjunto de mtodos usados para
1. colecionar (planejamento e obteno),
2. classificar (organizar, resumir, interpretar) e
3. analisar dados (extrair concluses). 3 a a sa dados (e t a co c uses)
A origem da palavra Estatstica est associada
palavra status (Estado em latim palavra status (Estado em latim
06/06/2008 2 Bertolo Bertolo
Exemplo
07/08/2008 Bertolo Bertolo 3
Divises da Estatstica
ESTATSTICA DESCRITIVA: Envolve a coleta, a
organizao a descrio dos dados e o clculo e organizao, a descrio, dos dados e o clculo e
interpretao de coeficientes. Esta parte est associada
a clculos de mdias, varincias, estudo de grficos, g
tabelas, etc.. a parte mais conhecida.
ESTATSTICA INDUTIVA ou INFERENCIAL: Envolve a ESTATSTICA INDUTIVA ou INFERENCIAL: Envolve a
anlise e a interpretao dos dados (associados a uma
margem de incerteza) cujos mtodos que se g ) j q
fundamentam na teoria da probabilidade. Nela
encontramos a Estimao de Parmetros, Testes de
Hipteses, Modelagens, etc.
07/08/2008 Bertolo Bertolo 4
Diagrama
AMOSTRAGEM: o ponto de partida (na prtica) para todo
um Estudo Estatstico um Estudo Estatstico.
Um dos objetivos da anlise e interpretao de dados
buscar um modelo para as observaes Estes modelos buscar um modelo para as observaes. Estes modelos
podem ser essencialmente determinsticos ou no-
determinsticos (probabilsticos ou estocsticos). (p )
07/08/2008 Bertolo Bertolo 5
Populao e Amostra
Populao a coleo de todas as observaes
t i i b d t i d f potenciais sobre determinado fenmeno.
Amostra da populao o conjunto de dados Amostra da populao o conjunto de dados
efetivamente observados, ou extrados. Sobre
os dados da amostra que se desenvolvem os os dados da amostra que se desenvolvem os
estudos, com o objetivo de se fazerem
inferncias sobre a populao inferncias sobre a populao.
07/08/2008 Bertolo Bertolo 6
Os Conflitos e as Contradies
A inferncia estatstica permite chegar a concluses
amplas (gerais sobre o universo estudado) a partir de amplas (gerais, sobre o universo estudado) a partir de
uma srie mais restrita (amostra) de informaes (dados
estatsticos). Da a importncia do ensino da estatstica estatsticos). Da a importncia do ensino da estatstica
na formao de vrias categorias profissionais de nvel
superior.
Por meio da estatstica fazemos, por exemplo, melhor
anlise dos conflitos e contradies que estamos
i d t i t pesquisando no momento e, assim, ns tomamos
decises que iro influenciar a resoluo dos conflitos
at ento discutidos at ento discutidos.
07/08/2008 Bertolo Bertolo 7
Anlise Exploratria dos Dados
Veja como funciona a estatstica para que no haja
flit t di conflitos nem contradies:
1) coleta de dados;
2) apreciao ou crtica dos dados;
3) apurao dos dados;
4) exposio dos dados.
A pesquisa feita atravs de questionrios, que podem
i i i ser genricos ou especiais.
Os erros e inconsistncias ocorridos na coleta de dados
devem ser corrigidos As amostras de dados devem ser devem ser corrigidos. As amostras de dados devem ser
agrupadas de forma que seu manuseio, visualizao e
compreenso sejam simplificados. compreenso sejam simplificados.
07/08/2008 Bertolo Bertolo 8
Tipos de Variveis
Os dados coletados em uma primeira fase podem ser
d fi id i i lit ti tit ti d definidos como variveis qualitativas ou quantitativas, de
acordo com a seguinte figura:
07/08/2008 Bertolo Bertolo 9
Exemplo
Para uma populao de peas produzidas em um determinado
processo poderamos ter: processo, poderamos ter:
Varivel Tipo
Estado: Perfeita ou defeituosa Estado: Perfeita ou defeituosa
Qualitativa Nominal
Qualidade: 1
a
, 2
a
ou 3
a
categoria Qualitativa Ordinal
N
o
de peas defeituosas Quantitativa Discreta
Dimetro das peas Quantitativa Contnua
07/08/2008 Bertolo Bertolo 10
Agrupamentos de Dados
Quando se vai fazer um levantamento de uma populao, um dos
passos retirar uma amostra desta populao e obter dados relativos p p p
varivel desejada nesta amostra.
Cabe Estatstica sintetizar estes dados na forma de tabelas e
grficos que contenham alm dos valores das variveis o nmero de grficos que contenham, alm dos valores das variveis, o nmero de
elementos correspondentes a cada varivel. A este procedimento est
associado o conceito de:
Dados brutos: o conjunto de dados numricos obtidos e que ainda
no foram organizados.
Rol: o arranjo dos dados brutos em ordem crescente (ou Rol: o arranjo dos dados brutos em ordem crescente (ou
decrescente).
Amplitude (H): a diferena entre o maior e o menor dos valores
observados observados.
06/06/2008 Bertolo & Adriano Bertolo & Adriano 11
Exemplo
Populao = Dimetro de determinada pea (em mm).
Dados brutos: { 168, 164, 164, 163, 165, 168, 165, 164, 168, 168 }
Rol : { 163, 164, 164, 164, 165, 165, 168, 168, 168, 168 }
H = 168 - 163 = 5
Como Fazer isso no Excel?
Abra uma pasta e na Plan1 insira o intervalo dos dados:
A
A i i t l B1 d tt l
1
2
3
4
5
A
DadosBrutos
168
164
164
163
Agora copie o intervalo para B1, re-nomeando o ttulo para
ROL.
A seguir procure classificar os dados em ordem crescente,
usando a guia Incio e o grupo Edio Assim:
5
6
7
8
9
163
165
168
165
164
usando a guia Incio e o grupo Edio. Assim:
10
11
168
168
Clicando no boto teremos um intervalo de dados ordenados do
07/08/2008 Bertolo Bertolo 12
menor para o maior.
Exemplo
Populao = Dimetro de determinada pea (em mm).
Dados brutos: { 168, 164, 164, 163, 165, 168, 165, 164, 168, 168 }
Rol : { 163, 164, 164, 164, 165, 165, 168, 168, 168, 168 }
H = 168 - 163 = 5
C ? Como encontrar a Amplitude no Excel?
D o ttulo H para a clula C1.
Na clula C2 introduza a funo composta
1
2
A B
DadosBrutos Rol
168 163
p
=MXIMO(B2:B11)-MNIMO(B2:B11)
3
4
5
6
7
164 164
164 164
163 164
165 165
168 165
O resultado final de sua planilha ser:
A B C D E F G
7
8
9
10
11
168 165
165 168
164 168
168 168
168 168
1
2
3
4
5
DadosBrutos Rol H
168 163 5 <=MXIMO(B2:B11)MNIMO(B2:B11)
164 164
164 164
163 164
6
7
8
9
10
165 165
168 165
165 168
164 168
168 168
07/08/2008 Bertolo Bertolo 13
11 168 168
Freqncias
Freqncia absoluta ( n
i
): o nmero de vezes que um elemento
aparece na amostra aparece na amostra.
Temos,
n n
k
i
i
=

, onde n o nmero total de dados da amostra e k o nmero de valores


diferentes na amostra.
i
k
Freqncia Relativa (f
i
): e
n
n
f
i
i
=
1 =

k
i
i
f
Freqncia Absoluta Acumulada (N
i
): a soma da freqncia
absoluta do valor da varivel i com todas as freqncias absolutas q
anteriores.
Freqncia Relativa Acumulada (F
i
):
N
N
F
i
i
=
07/08/2008 Bertolo Bertolo 14
N
Exemplo
Populao = Dimetro de determinada pea (em mm).
Dados brutos: { 168, 164, 164, 163, 165, 168, 165, 164, 168, 168 }
Rol : { 163, 164, 164, 164, 165, 165, 168, 168, 168, 168 }
H = 168 - 163 = 5
Como calcular essas freqncias no Excel?
D os ttulos x
i
e freqncia (n
i
) para as clulas D1 e E1
ti t respectivamente.
Com o cursor na clula D2 insira =B2.
P l l l D3 i d f l Pule para a clula D3 e introduza a frmula:
=SE(B3:$B$11<>B2;B3;"")
Arraste pela ala copiando esta frm la at a D11 e a Arraste pela ala, copiando esta frmula at a D11 e a
sua planilha ficar assim:
07/08/2008 Bertolo Bertolo 15
Continuao
A B C D E
1
2
3
DadosBrutos Rol H xi freqncia(ni)
168 163 5 163
164 164 164
4
5
6
164 164
163 164
165 165 165
7
8
9
168 165
165 168 168
164 168
10
11
168 168
168 168
Como juntar os valores em clulas adjacentes? Ajude o Bertolo a fazer isso
e sers recompensado!!! Pesquise kra.... Voc no quer ser cientista?
07/08/2008 Bertolo Bertolo 16
Calculando as freqncias no
Excel Excel
Agora selecione a clula E2 e introduza a funo:
FREQNCIA(B2 B11 D2 D12) d ENTER ! C l !!!! =FREQNCIA(B2:B11;D2:D12) e no d ENTER no!. Calma!!!!
Agora pressione F2 e aps, ao mesmo tempo, CTRL +SHIFT +
ENTER.
O que aconteceu?
Apareceu 1 em E2 e olhando para a barra de frmulas vemos:
{=FREQNCIA(B2:B11;D2:D12)} , a frmula ficou entre chaves. O
que significa isto?
O Excel reconheceu a frmula como uma matriz (array). O Excel reconheceu a frmula como uma matriz (array).
Voc viu que o intervalo foi de D2 at D12. isso mesmo. A
explicao encontra-se no Apndice da apostila.
A coisa agora ficou assim:
07/08/2008 Bertolo Bertolo 17
Calculando as freqncias no
Excel Excel
Agora s arrastar pela ala at D11 e obter:
07/08/2008 Bertolo Bertolo 18
Calculando as freqncias no
Excel Excel
Agora delete os valores
das clulas Es que no
1
2
A B C D E
Agora Rol H xi freqncia(ni)
168 163 5 163 1
q
correspondem a valores
das clulas Ds
3
4
5
6
7
164 164 164 3
164 164 4
163 164 3
165 165 165 2
168 165 5
8
9
10
11
12
165 168 168 4
164 168 0
168 168 0
168 168 0
0
1
2
A B C D E
DadosBrutos Rol H xi freqncia(ni)
168 163 5 163 1
12 0
2
3
4
5
6
168 163 5 163 1
164 164 164 3
164 164
163 164
165 165 165 2 6
7
8
9
10
165 165 165 2
168 165
165 168 168 4
164 168
168 168
Para encontrar o total
introduzimos na clula E12
a funo SOMA:
SOMA(E2 E11)
10
11
12
168 168
168 168
Total 10
=SOMA(E2:E11)
07/08/2008 Bertolo Bertolo 19
Resultado Final
1
A B C D E F G H
DadosBrutos Rol H
X
i
freqncia(n
i
)
fi Ni Fi
2
3
4
168 163 5 163 1 0,1 1 0,1
164 164 164 3 0,3 4 0,4
164 164 165 2 0,2 6 0,6
5
6
7
163 164 168 4 0,4 10 1,0
165 165 0
168 165
A frmula no exemplo precisa ser inserida como uma frmula de
7
8
9
10
168 165
165 168
164 168
168 168
Afrmulanoexemploprecisaserinseridacomoumafrmulade
matriz.SelecioneointervaloE19:E23.PressioneF2,insiraafuno
FREQNCIAe,emseguida,pressioneCTRL+SHIFT+ENTER.Senofor
inseridacomoumafrmuladematriz,haversomenteumresultado
10
11
12
168 168
168 168
Total 10 1
naclulaE19(1).
E a? Quebre a cabea e preencha (calculando no Excel) as colunas F, G e H
07/08/2008 Bertolo Bertolo 20
Classes
A l tif i d d l t dif t d As classes so um artifcio para condensar o nmero de elementos diferentes de
uma amostra. Imagine construir uma tabela para 200 valores diferentes, nos
moldes do problema anterior?
Os principais pr requisitos para uma boa definio de classes em um conjunto Os principais pr-requisitos para uma boa definio de classes em um conjunto
de dados so:
a) As classes devem abranger todas as observaes;
b) O extremo superior de uma classe o extremo inferior da classe subseqente b) O extremo superior de uma classe o extremo inferior da classe subseqente
(simbologia: , intervalo fechado esquerda e aberto direita);
c) Cada valor observado deve enquadrar-se em apenas uma classe;
d) k 25, de um modo geral, sendo k o nmero de classes; d) k 25, de um modo geral, sendo k o nmero de classes;
e) As unidades das classes devem ser as mesmas dos dados.
Clculo de k (opes no rgidas):
Frmula de Sturges: k = 1 + log
2
N = 1 + 3,32 logN = 1 + 1,44 lnN g g
2
, g ,
k
Obs.: N o nmero de elementos diferentes da amostra e em muitas vezes pode
ser considerado N = n
N
Geralmente, temos ainda:
Intervalo da classe (h): h H / k
Ponto mdio da classe ( x
i
): Ponto mdio entre o limite inferior e o limite
07/08/2008 Bertolo Bertolo 21
superior de cada classe .
Exemplo
A tabela seguinte registra uma amostra aleatria de
tamanho vinte e cinco das Vendas dirias em milhares
de uma empresa. Construir a distribuio de
freqncias absolutas.
280 305 320 330 310 340 330 341 369 355 370 360 370
365 280 375 380 400 371 390 400 370 401 420 430
07/08/2008 Bertolo Bertolo 22
Soluo
Abrindo uma pasta para este exerccio, escolhemos Plan1 e introduza
os dados brutos, classifique em ordem crescente e determine o valor q
mximo, mnimo, o tamanho da amostra, o nmero de classes e a
amplitude total. No final a sua planilha dever ficar parecida com esta:
1
A B C D E F G H
Funes Estatsticas 1
2
3
4
5
6
7
8
FunesEstatsticas
DadosBrutos ROL Funes
280 280 Maior Valor 430 <=MXIMO(B4:B28)
365 280 Menor Valor 280 <=MNIMO(B4:B28)
305 305 Tamanho da Amostra 25 <=CONT.VALORES(A4:A28)
280 310 Nmerodeclasses 5 <=RAIZ(D6)
320 320 A lit d T t l 150 MXIMO(B4 B28) MNIMO(B4 B28) 8
9
10
11
12
13
14
320 320 Amplitude Total 150 <=MXIMO(B4:B28)MNIMO(B4:B28)
375 330
330 330
380 340
310 341
400 355
340 360
15
16
17
18
19
20
21
371 365
330 369
390 370
341 370
400 370
369 371
370 375 21
22
23
24
25
26
27
370 375
355 380
401 390
370 400
420 400
360 401
430 420
07/08/2008 Bertolo Bertolo 23
28 370 430
Soluo - Continuao
Agora vamos agrupar os dados em classes e calcular as freqncias de
valores em cada classe. Para isso, coloque os ttulos Classe, Limite
Inferior e Limite Superior respectivamente nas clulas C11 D11 e E11 Inferior e Limite Superior, respectivamente, nas clulas C11, D11 e E11.
A seguir, introduza os rtulos dos intervalos de classe de C12 at C16,
como mostrado na planilha abaixo. Use a sua criatividade e esprito de
pesquisa e encontre uma maneira para o Excel fazer este pesquisa e encontre uma maneira para o Excel fazer este
preenchimento automaticamente. Depois coloque o cursor na clula D12
e introduza a frmula =D5. Na clula D13, introduza a seguinte frmula:
=D12+$D$9 e arraste a ala at D16 Na clula E12 coloque a frmula: =D12+$D$9 e arraste a ala at D16. Na clula E12, coloque a frmula:
=D12+$D$9-0,01. Por que esse tal 0,01? Para o intervalo ficar aberto
direita. Arraste o resultado at E16. Agora arredonde o resultado 429,99
para 430 para tomar esse valor e os outros superiores a ele para 430, para tomar esse valor e os outros superiores a ele.
Agora selecione o intervalo F12 a F16 e introduza a frmula:
=FREQNCIA(B4:B28;E12:E$17). No aperte o ENTER. Calma, t
com pressa? V pescar... Pressione depois a tecla F2 e, ao mesmo
tempo, as teclas CTRL + SHIFT + ENTER, para transformar numa
frmula de matriz. Voc agora obter os resultados da planilha abaixo.
07/08/2008 Bertolo Bertolo 24
Soluo - Continuao
A B C D E F G
1
2
3
4
A B C D E F G
FunesEstatsticas
DadosBrutos ROL Funes
280 280
Maior Valor 430 <=MXIMO(B4:B28)
36 280
5
6
7
8
9
365 280 Menor Valor
280 <=MNIMO(B4:B28)
305 305
Tamanho da Amostra 25 <=CONT.VALORES(A4:A28)
280
310 Nmerodeclasses 5 <=RAIZ(D6)
320 320 Amplitude Total
150 <=MXIMO(B4:B28)MNIMO(B4:B28)
375 330 Amplitude das classes
30 <=D8/D7
10
11
12
13
14
/
330
330
380
340 Classe LimiteInferior LimiteSuperior
310 341 280310 280 309,99 3
400 355 310340 310 339,99 4
340 360 340 370 340 369 99 6 14
15
16
17
18
340 360 340370 340 369,99 6
371
365 370 - 400
370 399,99 7
330 369 400 400 430 5
390 370
341 370
19
20
21
22
23
400 370
369 371
370
375
355
380
401 390
24
25
26
27
28
370 400
420 400
360 401
430 420
370 430
07/08/2008 Bertolo Bertolo 25
28 370 430
Tabelas
uma pequena tbua, ou quadro, composta de linhas e
colunas onde se registram dados de pessoas ou de coisas colunas, onde se registram dados de pessoas ou de coisas.
A construo de uma tabela depende dos dados coletados
que sero resumidos e dispostos em forma tabular, o que q p , q
significa dizer que so colocados em srie e apresentados
em quadros ou tabelas.
T b l di i fi d i d d Tabela a disposio grfica das sries de acordo com uma
determinada ordem de classificao.
As partes principais de uma tabela so: As partes principais de uma tabela so:
Cabealho (com o ttulo);
Corpo (com as informaes organizadas em linhas e Corpo (com as informaes organizadas em linhas e
colunas);
Rodap (com a fonte e eventuais legendas).
07/08/2008 Bertolo Bertolo 26
Exemplos de Tabelas
T b l 1 S i fi i i l j d d di Tabela 1 Srie geogrfica ou territorial, cujos dados so dispostos
em correspondncia com a regio geogrfica, isto , variam com o
local.
Populao brasileira de alguns estados 1970
Estados Nmero de Habitantes Estados Nmero de Habitantes
Bahia 7.583.140
Rio de Janeiro 4.794.578
So Paulo 17.958.693
Paran 6.997.682
07/08/2008 Bertolo Bertolo 27
Exemplos de Tabelas
Tabela 2 Srie especfica ou categrica, cujos dados so dispostos
de acordo com itens especficos ou categorias. p g
ndice de Preos ao Consumidor Semanal (IPC-S), itens com maiores
influncias positivas, vari aes percentuais ao ms
Item
Variao percentual ao ms at
Item
08-05-2004 17-05-2004
Mamo da Amaznia (papaia) 23,64 33,34
Tarifa eltrica residencial 1,58 1,61
Batata - inglesa 20,12 15,42
Manga 15,63 23,14
Leite tipo longa vida 3,25 3,25
3 9 9 6 Tomate -3,97 9,76
Plano e seguro sade 0,72 0,72
Cebola 1,69 8,38
Vasodilatador para presso arterial 2 47 2 63 Vasodilatador para presso arterial 2,47 2,63
Acar cristal 8,68 8,26

07/08/2008 Bertolo Bertolo 28

Exemplos de Tabelas
Tabela 3 Srie categrica.
07/08/2008 Bertolo Bertolo 29
Exemplos de Tabelas
Tabela 4 Srie geogrfica
07/08/2008 Bertolo Bertolo 30
Grficos Estatsticos
Os grficos tambm so uma forma de apresentao dos
d d l t d i O fi i t l dados coletados na pesquisa. O grfico precisa ter clareza,
simplicidade e veracidade.
Existem vrios tipos de grficos: grfico de segmento de Existem vrios tipos de grficos: grfico de segmento, de
setor, de barras e de colunas.
A palavra, grfico, refere-se grafia, ou s artes grficas, ou
ao que delas se ocupa. Um grfico pode ser representado por
desenho ou figuras geomtricas.
Os principais grficos sero sucintamente descritos a seguir Os principais grficos sero sucintamente descritos a seguir.
importante lembrar que os modernos programas
computacionais de Edio de Texto, Planilha Eletrnica e
Banco de Dados facilitam em muito a manipulao com
grficos. Dentre esses programas o destaque o Excel.
07/08/2008 Bertolo Bertolo 31
Grfico de Linha
A tabela seguinte mostra o nmero de alunos evadidos de uma
determinada escola de Ensino Mdio no segundo semestre de 2002
(uma srie temporal cujos dados so dispostos de acordo com o (uma srie temporal, cujos dados so dispostos de acordo com o
tempo).
Meses do 2 semestre Julho Agosto Setembro Outubro Novembro Dezembro
N de alunos evadidos 35 30 40 40 45 50
De acordo com a tabela, construiremos um grfico de segmentos
cujos pares ordenados sero (julho, 35), (agosto, 30), (setembro, 40),
(outubro, 40), (novembro, 45) e (dezembro, 50). ( , ), ( , ) ( , )
50
60
Nmero de
alunos
evadidos
Os grficos de linhas so muito
utilizados para mostrar a
0
10
20
30
40
Meses
p
evoluo durante um certo
perodo (sries temporais).
O grfico permite visualizar O grfico permite visualizar
muito bem o crescimento, o
decrscimo ou a estabilidade do
objeto a ser analisado
07/08/2008 Bertolo Bertolo 32
objeto a ser analisado.
Grfico de Barras
f No geral, usado para comparar as freqncias de mesma
varivel em um determinado momento.
Freqncia o nmero de vezes que cada resposta ou cada Freqncia o nmero de vezes que cada resposta ou cada
intervalo de resposta aparece na tabela do pesquisador, a
qual pode ter sido feita por amostragem.
26
17
24
20
25
30
R$ 383,30 a
mdia do salrio
mnimo
ideal, segundo
os entrevistados
A opinio dos
paulistanos sobre o
15
17
14
10
15
p
salrio mnimo (em
porcentagem)
1
3
0
5
At R$ 136 Mais de R$
136 at R$
200
Mais de R$
200 at R$
250
Mais de R$
250 at R$
300
Mais de R$
300 at R$
500
Mais de R$
500
No sabe
07/08/2008 Bertolo Bertolo 33
200 250 300 500
Grfico de Setores
O grfico de setores tambm muito usado e faz enxergar
melhor as partes do todo (representadas em porcentagens).
Para ser traado necessrio saber que o crculo todo tem Para ser traado, necessrio saber que o crculo todo tem
360, o que corresponde a 100%. De acordo com a pesquisa, o
crculo ser repartido, efetuando-se uma regra de trs simples. g
Para a construo do grfico de setores, so necessrios a
pesquisa, a tabela, a fonte, o compasso, o transferidor e as
cores.
Exemplo - O grfico de setores a seguir foi construdo com os
resultados de uma pesquisa que perguntou a 1 500 pessoas resultados de uma pesquisa que perguntou a 1.500 pessoas
qual jornal dirio elas mais gostam de ler:
6%
A
Declaraes
28% jornal A;
28%
17%
25%
24%
A
B
C
D
E
% j ;
17% jornal B;
25% jornal C;
24% jornal D;
07/08/2008 Bertolo Bertolo 34
E
6% jornal E
6% nenhum.
Grfico de Barras Horizontais
Nmero de acidentes por milho de decolagens
8,8
Royal Jordanian
11,4
China Airlines
15 2
12,5
Air Zimbabwe
16,7
15,2
Cubana
16,7
0 2 4 6 8 10 12 14 16 18
AeroPeru
07/08/2008 Bertolo Bertolo 35
Tarefa para casa
01 Numa pequena empresa com 20 funcionrios a distribuio
dos salrios, em reais, a seguinte:
800 00 800 00 12 000 00 12 000 00 800 00 600 00 800,00, 800,00, 12.000,00, 12.000,00, 800,00, 600,00,
1.300,00, 600,00, 800,00, 1.000,00, 500,00, 600,00, 700,00,
800,00, 700,00,12.000,00, 500,00, 600,00, 800,00 e 500,00.
Coloque os valores em ordem crescente e, em seguida, monte
uma tabela.
S Salrio dos Funcionrios Freqncia
500,00 ??????????
12 000 00 ?????????????????
07/08/2008 Bertolo Bertolo 36
12.000,00 ?????????????????
Cap 02 - Medidas Estatsticas
A reduo dos dados atravs de tabelas de freqncias
e grficos fornece muito mais informaes sobre o
comportamento de uma varivel do que a prpria srie comportamento de uma varivel do que a prpria srie
original de dados. Contudo, muitas vezes queremos
resumir ainda mais esses dados, apresentando um ou resumir ainda mais esses dados, apresentando um ou
alguns valores que sejam representativos da srie toda.
Quando usamos um s valor, obtemos uma reduo
drstica dos dados.
As principais medidas estatsticas (ou simplesmente
t t ti ) f did d i estatsticas) referem-se s medidas de posio
(locao ou tendncia central) ou s medidas de
di ( i bilid d ) disperso (ou variabilidade):
07/08/2008 Bertolo Bertolo 37
2.1 Medidas de Posio (ou
tendncia central) tendncia central)
Mostram o valor representativo em torno do qual
os dados tendem a agrupar-se com maior ou
menor freqncia.
A medida de tendncia central um nmero
que est representando todo o conjunto de q p j
dados; nas pesquisas tal nmero pode ser
encontrado a partir da mdia aritmtica, da p ,
moda ou da mediana, e o uso de cada uma
delas mais conveniente de acordo com o nvel
de mensurao, o aspecto ou forma da
distribuio de dados e o objetivo da pesquisa. j p q
07/08/2008 Bertolo Bertolo 38
2.1.1 Mdia Aritmtica
Simples ( )
x
Simples ( )
x
a medida de centralidade mais comum, porm deve ser usada em dados
representados por intervalos, pois no haveria sentido utiliz-la em uma p p , p
distribuio em que a varivel fosse, por exemplo, time de futebol ou sexo. A
mdia representa, ainda, o ponto de distribuio no qual se equilibram as
discrepncias (diferenas) positivas e negativas de cada dado, ou seja, as
discrepncias positivas somadas se anulam com as negativas somadas.
Definida da seguinte forma:
d t d di idid l d l d a soma de todos os nmeros dividida pelo nmero de parcelas. uma das
medidas de tendncia central de maior emprego.
Usada em dados no agrupados Usada em dados no agrupados.
EX: 4 15 20 20 24 27 30
Ob (20 4) + (20 15) + (20 24) + (20 27) + (20 30) 0
07/08/2008 Bertolo Bertolo 39
Observe que: (20-4) + (20-15) + (20 24) + (20 27) + (20 30) = 0
2.1.2 Mdia Aritmtica
Ponderada ( )
x
Ponderada ( ) p
x
um tipo de mdia aritmtica de vrios valores com pesos diferentes, dada
por: por:
p
i
= peso da amostra x
i
.
Para dados agrupados em classes, temos:
A mdia aritmtica simples pode ser vista como a mdia ponderada com todos
os pesos iguais. Para efeito de nomenclatura sempre trataremos a mdia
aritmtica simples ou ponderada simplesmente por mdia representada por ().
07/08/2008 Bertolo Bertolo 40
Mdia Geomtrica (X
G
)
definida como a raiz de ordem n do
d d produto desses nmeros.
07/08/2008 Bertolo Bertolo 41
Exerccios Modelos
01. Temos um grfico que nos mostra o desempenho dos 5 melhores
classificados em um determinado concurso, no qual a pontuao varia de
zero a cem pontos zero a cem pontos.
a) Qual a soma dos pontos dos candidatos A, B, C, D e E?
b) Determine a mdia aritmtica dos pontos dos candidatos discriminados no
grfico grfico.
c) Mostre qual o candidato que fez mais e o que fez menos pontos.
Resposta: a. 90 +60 + 80 + 70
+ 100 = 400
b 80 pontos b. 80 pontos
c. Mais pontos E e menos
pontos B

07/08/2008 Bertolo Bertolo 42
Exerccio 2
U f d d t i d di i li l Um professor de uma determinada disciplina resolveu que suas
provas bimestrais tero pesos diferentes em cada bimestre e que
seus alunos, s no final do 4 bimestre, recebero a mdia final.
Escolhendo aleatoriamente um aluno desse professor, vamos, de
acordo com suas notas e respectivos pesos, verificar sua mdia
final.
O aluno no primeiro bimestre tirou 6 e a prova tinha peso 2, no 2
bimestre tirou 5 e o peso era 4, no 3 bimestre o aluno tirou 3 e o
peso era 2 e finalmente no 4 bimestre tirou 10 e o peso era 4 peso era 2 e, finalmente, no 4 bimestre tirou 10 e o peso era 4.
Calcule sua mdia final.
Para resolver esse exerccio, desconsidere a mdia ponderada.
mdia final do aluno foi 6,5.
x p= (6 .2+5 .4+3 .2+10 .4)/(2+ 4+2+4)
07/08/2008 Bertolo Bertolo 43
Exerccio 3
A tabela a seguir apresenta a distribuio de freqncias dos salrios
de um grupo de 50 empregados de uma empresa, num certo ms.
Nmero da
classe
Salrio do ms
em reais
Nmero de
empregados
1 1.000 | 2.000 20
2 2000 | 3000 18
O salrio mdio desses
empregados, nesse ms, foi de:
a. R$ 2.637,00
b R$ 2 500 00 2 2.000 | 3.000 18
3 3.000 | 4.000 9
4 4.000 | 5.000 3
b. R$ 2.500,00
c. R$ 2.420,00
d. R$ 2.400,00
Os valores centrais das classes 1, 2, 3 e 4
so, respectivamente, 1.500, 2.500, 3.500 e 4.500
reais reais.
Para determinar o salrio mdio, precisamos encontrar a
mdia aritmtica ponderada (os pesos
sero as freqncias) sero as freqncias).
07/08/2008 Bertolo Bertolo 44
Mdiana ( )
o valor do meio de um conjunto de dados, quando os dados esto dispostos
em ordem crescente ou decrescente, cortando, assim, a distribuio em duas
partes com o mesmo nmero de elementos. p
uma medida separatriz definida e exata, de fcil compreenso. Ela serve para
anlise comparativa e representada por x~
Para dados no agrupados em classes:
Se n mpar : o termo
Se n par o termo
2
) 1
2
(
2
~
termo
n
termo
n
x
+ +
=
2
EX1: Em um colgio, esto matriculados numa determinada classe 21 alunos. Durante o
1 bimestre foi feito um levantamento da freqncia destes alunos e foram observadas as
seguintes faltas: 0, 0, 3, 5, 7, 9, 0, 1, 2, 3, 11, 2, 3, 5, 6, 4, 10, 12, 0, 1, 2. Qual a mediana seguintes faltas: 0, 0, 3, 5, 7, 9, 0, 1, 2, 3, 11, 2, 3, 5, 6, 4, 10, 12, 0, 1, 2. Qual a mediana
das faltas? Resposta: 3
EX2: As idades dos atletas amadores de uma determinada modalidade esportiva so
14, 12, 16, 13, 17, 16 anos. Encontre a mediana da srie. Resposta: 15 anos
07/08/2008 Bertolo Bertolo 45
Percentis
O til d d 0 100 d j t d l di t O percentil de ordem p, 0 p 100, de um conjunto de valores dispostos
em ordem crescente um valor tal que p% das observaes esto nele ou
abaixo dele e (1 - p)% esto nele ou acima dele.
Ex: Para valores de 51 a 100, ordenados crescentemente:
P
25
= 25 deixa 25% dos dados (12,5 = 13 valores) nele ou abaixo dele e
75% dos dados (37,5 = 38 valores) nele ou acima dele. Assim: P
25
= 63.
Similarmente, P
80
deixa 80% dos dados (40 valores) nele ou abaixo dele e
20% dos dados (10 valores) nele ou acima dele. Assim:
90 5
91

90
P 90, 5 =
2

P
80
=
07/08/2008 Bertolo Bertolo 46
Percentis de dados agrupados
Para dados agrupados em classes, os percents podem ser obtidos por
interpolao linear (regra de trs simples).
Ex.: Dada a distribuio de freqncia de uma varivel X qualquer:
X x
i
N
i
N
i

1,810 | 1,822 1,816 7 7
Temos que, para P
50
(50% de 50) ser o 25 elemento,
est na terceira classe Isto porque a segunda classe
1,822 | 1,834 1,828 14 21
1,834 | 1,846 1,840 18 39
1,846 | 1,858 1,852 7 46
1,858 | 1,870 1,864 4 50
est na terceira classe. Isto porque a segunda classe
contm 21 elementos e a terceira, 39 elementos. Logo, o
25 elemento estar na 3

Um outro processo grfico pode ser usado para o clculo
438, 25 = 1. 753/ 4 = 201

/ 4 + 621 + 310 +

621 = x
Um outro processo grfico pode ser usado para o clculo
desses percentis. (Veja Ogiva de Galton). Tal processo
exige rigor no traado e deve-se preferir papel milimetrado.
Obs.: As calculadoras geralmente no fornecem mediana e g
percentis.
07/08/2008 Bertolo Bertolo 47
Moda e Classe Modal
o valor que ocorre com maior freqncia em um conjunto de
observaes individuais. Para dados agrupados temos a classe
modal Em alguns casos pode haver mais de uma moda Assim modal. Em alguns casos pode haver mais de uma moda. Assim
temos uma distribuio bimodal, trimodal, etc...
A moda o valor em torno do qual os dados estatsticos tendem a
t i d t t d t d M estar mais pesadamente concentrados e representada por Mo,
tambm conhecida pelo nome de norma ou modo.
O termo moda foi introduzido por Pearson. p
Exemplos
01 - Em um grupo de pessoas cujas idades so: 3, 2, 5, 2, 6, 2, 4, 4,
2 7 2 d 2 (M 2) P t t d i 2, 7, 2 anos, a moda 2 anos (Mo = 2). Portanto, denomina-se
unimodal.
02 - Algumas pessoas freqentaram a escola por estes nmeros de g p q p
anos: 5, 3, 7, 5, 5, 8, 5, 3, 1, 1, 3, 3, 10, 3, 5. Nesta srie de
nmeros, podem-se ter duas modas: Portanto bimodal
.
07/08/2008 Bertolo Bertolo 48
Mais Exemplos
3. Temos um grupo de pessoas cujas idades so: 3, 2, 5, 2, 6, 2, 4, 4, 2, 7, 2
anos:
Idade 2 3 4 5 6 7
Freqncia 5 1 2 1 1 1
Fica claro que a moda 2 anos.
4. Tempo, em anos, que um grupo de pessoas freqentou a escola.
Tempo de Escolaridade
Tempo em anos de
permanncia na escola
Freqncia
1 2
Nesse exemplo, afirmamos que
h duas modas 3 e 5 portanto
1 2
3 5
5 5
7 1
8 1
10 1
h duas modas, 3 e 5, portanto
o conjunto de dados bimodal.
07/08/2008 Bertolo Bertolo 49
Moda de Dados Agrupados
Nota importante
Quando no houver repetio de nmeros, no haver moda (o conjunto de
dados amodal). )
Quando os dados esto agrupados em classes,
X x
i
=ClasseModal
n
i
10| 20 15 2 10 |20 15 2
20 |30 25 4
30 |40 35 10
40 |50 45 6
50|60 55 2 50 | 60 55 2
Exemplo
Nesta srie 1 7 9 12 17 no h moda pois no h repetio de Nesta srie, 1, 7, 9, 12, 17, no h moda, pois no h repetio de
nmero.
07/08/2008 Bertolo Bertolo 50
Mais Exemplos de Moda
Considere os nmeros 621, 310, 621, 201 e calcule:
a) a mdia aritmtica ();
b) a mdia aritmtica ponderada () com pesos 2 3 1 e 2 respectivamente; b) a mdia aritmtica ponderada (), com pesos 2, 3, 1 e 2, respectivamente;
c) a moda (Mo).
Resposta
Primeiramente monta-se a tabela: Primeiramente, monta-se a tabela:
Nmeros 621 310 201
Freqncia 2 1 1
438 25 1 753/ 4 201

/ 4 + 621 + 310 +

621 438, 25 = 1. 753/ 4 = 201

/ 4 + 621 + 310 +

621 = x
399, 375 = 3. 195/ 8 = 2

+ 1 + 3 + 201. 2

2 + 621. 1 + 310. 3 +

621. 2 = x
Observando a tabela com os dados do exerccio, verificamos que o
nmero 621 aparece 2 vezes. Essa a maior freqncia de acordo
com a tabela portanto Mo = 621 com a tabela, portanto Mo 621.
07/08/2008 Bertolo Bertolo 51
2.2 Medidas de Disperso ou
Variabilidade Variabilidade
Vimos que a moda a mediana e a mdia Vimos que a moda, a mediana e a mdia
aritmtica possuem a funo de representar, a partir
de um nico nmero a seqncia a ser analisada de um nico nmero, a seqncia a ser analisada.
Porm, tal mtodo ainda muito incompleto para que
ns possamos tirar alguma concluso sobre o ns possamos tirar alguma concluso sobre o
trabalho. necessrio que possamos enxergar algo
mais nessa seqncia que estamos analisando mais nessa seqncia que estamos analisando,
como, por exemplo, certa personalidade da
seqncia seqncia.
07/08/2008 Bertolo Bertolo 52
2.2 Medidas de Disperso ou
Variabilidade Cont Variabilidade Cont...
Observe a seguinte situao: quatro turmas, uma de cada um g q ,
dos cursos Cincia da Computao, Matemtica, Cincias
Contbeis e Fisioterapia, fizeram uma prova de estatstica e
quando o professor verificou a mdia das notas de cada
turma, constatou que, em cada uma das quatro turmas, a
mdia dos alunos foi igual a 6 0 E a? Ser que podemos mdia dos alunos foi igual a 6,0. E a? Ser que podemos
concluir que o desempenho das quatro turmas foi o mesmo?
Ser que todos os alunos, de todas as turmas, tiraram nota 6,0 q , , ,
na prova? bvio que, nesse momento, o bom senso fala
mais alto e podemos, no mnimo, desconfiar de que no. Pois
id l lid d d exatamente a que reside a tal personalidade que podemos
atribuir a cada turma em relao ao comportamento das notas.
07/08/2008 Bertolo Bertolo 53
2.2 Medidas de Disperso ou
Variabilidade Cont Variabilidade Cont...
O que quero dizer que, com as medidas de disperso,
seremos capazes de verificar que, por mais que a mdia das
turmas na prova de estatstica tenha sido 6,0, poderemos com
tais medidas determinar as turmas que tiveram um tais medidas determinar as turmas que tiveram um
comportamento homogneo, em que os alunos tiraram notas
prximas de 6,0, como tambm determinar as turmas que prximas de 6,0, como tambm determinar as turmas que
tiveram um comportamento heterogneo em relao nota
6,0, ou seja, por mais que a mdia tenha sido 6,0, as notas
no foram prximas de 6,0. Em outras palavras, torna-se
necessrio estabelecer medidas que indiquem o grau de
disperso em relao ao valor central Algumas medidas de disperso em relao ao valor central. Algumas medidas de
disperso que sintetizam essa variabilidade so:
07/08/2008 Bertolo Bertolo 54
2.2.1 Amplitude (H)
uma medida de disperso muito rpida e, ao mesmo
tempo muito imprecisa pois consiste simplesmente em tempo, muito imprecisa, pois consiste simplesmente em
verificar a diferena entre o maior valor e o menor valor obtido
na coleta de dados. Essa nossa velha conhecida. Mesmo
assim um exemplo
Pessoas Peso(kg)
Agulha 30
Aderbal 15
Cor 55
Renato 52
Na tabela ao lado, temos o peso das pessoas de um
determinado grupo analisado e podemos verificar que a
Renato 52
Guilherme 60
Bruno 53
Bertolo 75
determinado grupo analisado e podemos verificar que a
amplitude total foi de:AT = 75 15 = 60
Alexandre 20
FbioThomz 40

07/08/2008 Bertolo Bertolo 55
2.2.2 Desvio Mdio
Como a palavra desvio est associada diferena, temos
que, no contexto da nossa matria, o desvio deve ser
empregado com a diferena do elemento analisado em
relao mdia, ou seja, o quanto o elemento se afasta da
di d i D i t t b mdia da seqncia. Da importante perceber que essa
diferena deve ser necessariamente trabalhada em
mdulo pois no tem sentido a distncia negativa E o mdulo, pois no tem sentido a distncia negativa. E o
desvio mdio, ento, passa a ser encontrado a partir da
mdia aritmtica de todos os desvios.
Besvio Nuio =
|x
1
- x| + |x
2
- x| +|x
S
- x| ++|x
N
- x|
N
=
|x
i
- x|
N
i=1
N N N
07/08/2008 Bertolo Bertolo 56
Desvio Mdio - Exemplo
Besvio Nuio =
|x
1
- x| + |x
2
- x| +|x
S
- x| ++|x
N
- x|
N
=
|x
i
- x|
N
i=1
N

Com os dados do exerccio anterior, temos:
x
Su +1S + SS +S2 + 6u +SS +7S +2u +4u
44 4 x =
9
= 44,4
Besvio Nuio
|
Su 44 4
| |
1S 44 4
| |
SS 44 4
| |
S2 44 4
| |
6u 44 4
| |
SS 44 4
| |
7S 44 4
| |
2u 44 4
| |
4u 44 4
|
=
|
Su - 44,4
|
+
|
1S - 44,4
|
+
|
SS - 44,4
|
+
|
S2 - 44,4
|
+
|
6u - 44,4
|
+
|
SS - 44,4
|
+
|
7S - 44,4
|
+
|
2u - 44,4
|
+
|
4u - 44,4
|
9
= 16,17
E tambm porque fcil ver que a soma dos desvios, identicamente nula e
que portanto no serve como medida de disperso: que, portanto, no serve como medida de disperso:
07/08/2008 Bertolo Bertolo 57
2.2.2 Varincia
A varincia uma medida de disperso muito parecida com o
desvio mdio, a nica diferena em relao a este que, na
varincia, ao invs de trabalharmos em mdulo as diferenas
entre cada elemento e a mdia, toma-mos os quadrados das
dif I d l f t d l d d diferenas. Isso se d pelo fato de que, elevando cada
diferena ao quadrado, continuamos trabalhando com
nmeros no negativos como tambm pelo fato de que em nmeros no negativos, como tambm pelo fato de que, em
procedimentos estatsticos mais avanados, tal mtodo facilita
futuras manipulaes algbricas.
vaiincia
2
=
(x
1
- x)
2
+ (x
2
- x)
2
+ (x
S
- x)
2
++(x
N
- x)
2
N
=
(x
i
- x)
2 N
i=1
N

07/08/2008 Bertolo Bertolo 58
Varincia - Exemplo
vaiincia
=
(Su - 44,4)
2
+ (1S - 44,4)
2
+ (SS - 44,4)
2
+(S2 - 44,4)
2
+ (6u - 44,4)
2
+ (SS - 44,4)
2
+(7S - 44,4)
2
+ (2u - 44,4)
2
+(4u - 44,4)
2
99
= S4S,S7
07/08/2008 Bertolo Bertolo 59
Desvio Padro
Para entendermos o procedimento para o clculo do desvio-
padro, interessante percebermos que, no clculo da
varincia, tal como vimos no tpico anterior, cometemos um
erro tcnico que ser corrigido pelo desvio-padro, ou seja,
t l d d di no momento em que elevamos ao quadrado as disperses
(diferenas) de cada elemento em relao mdia,
automaticamente alteramos a unidade de trabalho Por automaticamente alteramos a unidade de trabalho. Por
exemplo: se estivermos trabalhando com a coleta das altu-ras,
em metro, das pessoas de uma determinada comunidade, a
unidade da varincia encontrada ser o m
2
(metro quadrado),
que representa reas. E a que entra o desvio-padro, ou
seja extraindo a raiz quadrada da varincia seja, extraindo a raiz quadrada da varincia.
Besvio - pauio = vaiincia
07/08/2008 Bertolo Bertolo 60
Desvio Padro - Exemplo
Ento, se no exemplo do item anterior a varincia
encontrada foi 345,57, temos que o desvio-padro foi de , , q p
S4S,S7 = 18,S8
Observao: O uso do Desvio Mdio pode causar dificuldades quando Observao: O uso do Desvio Mdio pode causar dificuldades quando
comparamos conjuntos de dados com nmeros diferentes de observaes:
Exemplo: Em A = {3,4,5,6,7} temos o Desvio Mdio (DM) como 6/5 = 1,2 e
2
10/5 2
2
= 10/5 = 2
Em D = {3,5,5,7} temos o Desvio Mdio (DM) = 1,0 e
2
= 2
Assim podemos dizer que segundo o Desvio Mdio o grupo D mais Assim, podemos dizer que, segundo o Desvio Mdio, o grupo D mais
homogneo (tem menor disperso) do que A, enquanto que ambos tm a
mesma homogeneidade segundo a varincia. O desvio mdio possui
pequena utilizao em estatstica e em geral vale 0 8 vezes o desvio pequena utilizao em estatstica e em geral vale 0,8 vezes o desvio
padro .
07/08/2008 Bertolo Bertolo 61
2.2.4 Momentos de uma
distribuio de freqncias distribuio de freqncias
Definimos o momento de ordem t de um conjunto de dados como:
N
t
=
(x
i
)
t N
i=1
N

Definimos o momento de ordem t centrado em relao a uma constante
a como
N
t
=
(x
i
- o)
t

N
i=1
N

E i l i t t d t t d l Especial interesse tem o caso do momento centrado em relao a ,
dado por:
( )
t N
m
t
=
(x
i
- x)
t

N
i=1
N

07/08/2008 Bertolo Bertolo 62
Mais Momentos
Conforme j vimos nos casos da mdia e da varincia, as expresses
precedentes podem ser reescritas levando-se em considerao as p p
freqncias dos diferentes valores existentes. Temos ento
respectivamente,
N
N
t
=
(x
i
)
t
.
i

N
i=1
N

N
t
=
(x
i
- o)
t
.
i

N
i=1
N

m
t
=
(x
i
- x)
t
.
i

N
i=1
N

N
fcil ver que M
1
= ; m
1
= 0; m
2
=
2
.
07/08/2008 Bertolo Bertolo 63
2.2.5 Coeficiente de variao (CV)
O coeficiente de variao exprime a variabilidade em termos
relativos. uma medida adimensional e sua grande utilidade g
permitir a comparao das variabilidades em diferentes
conjuntos de dados.
CI =

x

Exemplo: Testes de resistncia trao aplicados a dois tipos diferentes de Exemplo: Testes de resistncia trao, aplicados a dois tipos diferentes de
ao:
x x
(kg/mm
2
)

(kg/mm
2
)
Tipo I 27,45 2,0
TipoII 14700 1725
Cv
I
=227,4S =7,29%
Cv
II
=17,2S14S =11,7S%
Assim, apesar do Tipo I ser menos resistente, ele
mais estvel, mais consistente.
TipoII 147,00 17,25

07/08/2008 Bertolo Bertolo 64