Você está na página 1de 27

GOVERNO DO ESTADO DO

AMAZONAS

CURSO DE QUALIFICAO
PROFISSIONAL

ESTATSTICA BSICA

ALUNO (A): ------------------------------------------------------------------------------------PROFESSOR (A): ----------------------------------------------------------------------------

CETAM

SEPLAN

Centro de Educao Tecnolgica do


Amazonas

Secretaria de Estado de Planejamento e


Desenvolvimento Econmico

SUMARIO
1 INTRODUO......................................................................................................................... 2
2 MTODO ESTATSTICO........................................................................................................ 2
2.1 A ESTATSTICA ............................................................................................................... 2
2.2 FASES DO MTODO ESTATSTICO ............................................................................. 3
3 FERRAMENTAS DE CLCULO PARA O ESTUDO DA ESTATSTICA .......................... 4
3.1 PORCENTAGEM OU PERCENTAGEM ......................................................................... 4
3.2 NDICES OU NOTAO POR NDICES.................................................................... 4
3.3 NOTAO DE SOMATRIO...................................................................................... 4
4 DEFINIES BSICAS DA ESTATSTICA ......................................................................... 5
5 AMOSTRAGEM....................................................................................................................... 6
5.1 AMOSTRAGEM CASUAL OU ALEATRIA SIMPLES:.............................................. 6
5.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA................................................ 6
5.3 AMOSTRAGEM SISTEMTICA .................................................................................... 7
6 SRIES ESTATSTICAS ......................................................................................................... 7
7 GRFICOS ESTATSTICOS ................................................................................................... 8
7.1 Diagramas ........................................................................................................................... 9
7.2 Estereogramas.................................................................................................................. 10
7.3 Cartogramas...................................................................................................................... 11
8 DISTRIBUIO DE FREQUNCIA .................................................................................... 11
9 REPRESENTAO GRFICA DE UMA DISTRIBUIO ............................................... 13
10 MEDIDAS DE POSIO..................................................................................................... 15
10.1 Mdia Aritmtica ............................................................................................................ 15
10.2 MODA ............................................................................................................................ 16
10.3 MEDIANA ..................................................................................................................... 18
11 Disperso ou Variabilidade: .................................................................................................. 22
11.1 DESVIO PADRO .................................................................................................... 22
11.2 VARINCIA.............................................................................................................. 24
11.3 MEDIDAS DE DISPERSO RELATIVA .................................................................... 24
11.3.1 CVP: Coeficiente de Variao de Pearson .............................................................. 24
11.3.2 CVT: Coeficiente de Variao de Thorndike .......................................................... 25
12 MEDIDAS DE ASSIMETRIA.............................................................................................. 25
12.1 Coeficiente de assimetria................................................................................................ 25

1 INTRODUO
ESTATSTICA: ramo da matemtica aplicada.
ANTIGUIDADE: os povos j registravam o nmero de habitantes, nascimentos, bitos. Faziam
"estatsticas".
IDADE MDIA: as informaes eram tabuladas com finalidades tributrias e blicas.
SEC. XVI : surgem as primeiras anlises sistemticas, as primeiras tabelas e os nmeros
relativos.
SEC. XVIII : a estatstica com feio cientfica batizada por GODOFREDO ACHENWALL.
As tabelas ficam mais completas, surgem as primeiras representaes grficas e os clculos de
probabilidades. A estatstica deixa de ser uma simples tabulao de dados numricos para se
tornar " O estudo de como se chegar a concluso sobre uma populao, partindo da observao
de partes dessa populao (amostra)".

2 MTODO ESTATSTICO
MTODO: um meio mais eficaz para atingir determinada meta.
MTODOS CIENTFICOS: destacamos o mtodo experimental e o mtodo estatstico.
MTODO EXPERIMENTAL: consiste em manter constante todas as causas, menos uma, que
sofre variao para se observar seus efeitos, caso existam. Ex: Estudos da Qumica, Fsica, etc.
MTODO ESTATSTICO: diante da impossibilidade de manter as causas constantes(nas
cincias sociais), admitem todas essas causas presentes variando-as, registrando essas variaes
e procurando determinar, no resultado final, que influncias cabem a cada uma delas. Ex: Quais
as causas que definem o preo de uma mercadoria quando a sua oferta diminui?
Seria impossvel, no momento da pesquisa, manter constantes a uniformidade dos salrios, o
gosto dos consumidores, nvel geral de preos de outros produtos, etc.

2.1AESTATSTICA
uma parte da matemtica aplicada que fornece mtodos para coleta, organizao, descrio,
anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises.
A coleta, a organizao, a descrio dos dados, o clculo e a interpretao de coeficientes
pertencem ESTATSTICA DESCRITIVA, enquanto a anlise e a interpretao dos dados,
associado a uma margem de incerteza, ficam a cargo da ESTATSTICA INDUTIVA ou
INFERENCIAL, tambm chamada como a medida da incerteza ou mtodos que se
fundamentam na teoria da probabilidade.

2.2FASESDOMTODOESTATSTICO
1 - DEFINIO DO PROBLEMA : Saber exatamente aquilo que se pretende pesquisar o
mesmo que definir corretamente o problema.
2 - PLANEJAMENTO : Como levantar informaes ? Que dados devero ser obtidos ? Qual
levantamento a ser utilizado ? Censitrio ? Por amostragem ? E o cronograma de atividades ?
Os custos envolvidos ? etc.
3 - COLETA DE DADOS : Fase operacional. o registro sistemtico de dados, com um
objetivo determinado.
Dados primrios: quando so publicados pela prpria pessoa ou organizao que os haja
recolhido. Ex: tabelas do censo demogrfico do IBGE.
Dados secundrios: quando so publicados pro outra organizao. Ex: quando determinado
jornal publica estatsticas referentes ao censo demogrfico extradas do IBGE.
OBS: mais seguro trabalhar com fontes primrias. O uso da fonte secundria traz o grande
risco de erros de transcrio.
Coleta Direta: quando obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa
para saber a preferncia dos consumidores pela sua marca.
A coleta direta pode ser : contnua (registros de nascimento, bitos, casamentos, etc.),
peridica (recenseamento demogrfico, censo industrial) e ocasional (registro de casos de
dengue).
Coleta Indireta: feita por dedues a partir dos elementos conseguidos pela coleta direta, por
analogia, por avaliao,indcios ou proporcionalizao.
4 - APURAO DOS DADOS : Resumo dos dados atravs de sua contagem e agrupamento.
a condensao e tabulao de dados.
5 - APRESENTAO DOS DADOS : H duas formas de apresentao, que no se excluem
mutuamente. A apresentao tabular, ou seja uma apresentao numrica dos dados em
linhas e colunas distribudas de modo ordenado, segundo regras prticas fixadas pelo Conselho
Nacional de Estatstica. A apresentao grfica dos dados numricos constitui uma
apresentao geomtrica permitindo uma viso rpida e clara do fenmeno.
6 - ANLISE E INTERPRETAO DOS DADOS : A ltima fase do trabalho estatstico a
mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes,
cuja finalidade principal descrever o fenmeno (estatstica descritiva). Na estatstica indutiva
a interpretao dos dados se fundamentam na teoria da probabilidade.

3 FERRAMENTAS DE CLCULO PARA O ESTUDO DA ESTATSTICA


Para um melhor aprendizado iremos revisar alguns clculos importantes como, dados
absolutos e dados relativos (porcentagens) que sero de extrema importncia no estudo da
Estatstica.
Os dados estatisticos resultam da coleta direta da fonte, sem outra manipulao seno a
contagem ou medidas, so chamados dados absolutos.
A leitura dos dados absolutos sempre enfadado e inexpressivo, embora esses dados
traduza um resultado exato e fiel, no tem a visrtude de ressaltar de imediato as suas concluses
numricas. Da o uso imprescindvel que faz a Estatstica dos dados relativos.
Dados relaivos so o resultado de comparaes por quocientes (razes) qque se
estabelecem entre dados absolutos e tm por finalidade realar ou facilitar as comparaes
entre quantidades.
Traduz-se os dados relativos, em geral, por meio de percentagens, ndices, coeficientes e
taxas.

3.1PORCENTAGEMOUPERCENTAGEM
Denominamos razes percentuais as razes cujos conseqentes sejam iguais a 100.
Exemplo : 30/100(trinta por cento) ; 20/100 (vinte por cento) 30/100 corresponde a 30% e
20/100 corresponde a 20%.
Exemplo: 1) Em uma classe de 30 alunos , 15 fora aprovados. Qual o percentual de aprovao?
30 - 100
15 - x
30x = 100 X 15 => 30x = 1500 => x = 1500/30 = 50%

3.2NDICESOUNOTAOPORNDICES
O smbolo Xi (l-se X ndice i) representa qualquer um dos n valores, X1, X2,....,Xn, assumidos
pela varivel X, na amostra ou no conjunto de dados.
Exemplo: Seja X a varivel peso de 10 coelhos abatidos com 90 dias:
X1 X2 X3 ..... ..... ..... ..... ..... ..... X10
2,47 2,49 2,56 2,56 2,59 2,61 2,62 2,62 2,62 2,7

3.3NOTAODESOMATRIO
Para designar o somatrio utiliza-se a letra grega sigma maisculo (), que deve ser lido
n

SOMATRIO ou SOMA DE. O smbolo

X
i =1

, usado para representar a soma de todos os


n

valores Xi desde i=1 at i=n, ou seja por definio:

X
i =1

= X1 + X2 +.....+Xn, l-se da seguinte

maneira: somatrio de Xi, com i variando de 1 a n.


Vamos utilizar o exemplo do peso dos coelhos.
4

10

X
i =1

= X1+X2+X3+X4+X5+X6+X7+X8+X9+X10

= 2,47+2,49+2,56+2,56+2,59+2,61+2,62+2,62+2,62+2,7 = 25,84

10

X
i =1

4 DEFINIES BSICAS DA ESTATSTICA


FENMENO ESTATSTICO: qualquer evento que se pretenda analisar, cujo estudo seja
possvel da aplicao do mtodo estatstico.
DADO ESTATSTICO: um dado numrico e considerado a matria-prima sobre a qual
iremos aplicar os mtodos estatsticos.
POPULAO: o conjunto total de elementos portadores de, pelo menos, uma caracterstica
comum.
AMOSTRA: uma parcela representativa da populao que examinada com o propsito de
tirarmos concluses sobre a essa populao.
PARMETROS: So valores singulares que existem na populao e que servem para
caracteriz-la.Para definirmos um parmetro devemos examinar toda a populao.Ex: Os
alunos do 2 ano da SEPLAN tm em mdia 1,70 metros de estatura.
ESTIMATIVA: um valor aproximado do parmetro e calculado com o uso da amostra.
ATRIBUTO: quando os dados estatsticos apresentam um carter qualitativo, o levantamento e
os estudos necessrios ao tratamento desses dados so designados genericamente de estatstica
de atributo.
Exemplo de classificao dicotmica do atributo: A classificao dos alunos da SEPLAN
quanto ao sexo.
atributo: sexo..........................classe: alunos da SEPLAN
dicotomia: duas subclasses ( masculino e feminino)
Exemplo de classificao policotmica do atributo: Alunos da SEPLAN quanto ao estado civil.
atributo: estado civil...............classe: alunos da SEPLAN
dicotomia: mais de duas subclasses ( solteiro, casado, divorciado, vivo, etc.)
VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno.
VARIVEL QUALITATIVA: Quando seu valores so expressos por atributos: sexo, cor da
pele,etc.
VARIVEL QUANTITATIVA: Quando os dados so de carter nitidamente quantitativo, e o
conjunto dos resultados possui uma estrutura numrica, trata-se portanto da estatstica de
varivel e se dividem em :
VARIVEL DISCRETA OU DESCONTNUA: Seus valores so expressos geralmente atravs
de nmeros inteiros no negativos. Resulta normalmente de contagens.
5

Ex: N de alunos presentes s aulas de introduo estatstica econmica no 1 semestre de


1997: mar = 18 , abr = 30 , mai = 35 , jun = 36.
VARIVEL CONTNUA: Resulta normalmente de uma mensurao, e a escala numrica de
seus possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir,
teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura de
seu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio, ao
dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura atual do
seu corpo.

5 AMOSTRAGEM
uma tcnica especial para recolher amostras, que garantem, tanto quanto possvel, o acaso na
escolha.

5.1AMOSTRAGEMCASUALOUALEATRIASIMPLES:
equivalente a um sorteio lotrico. Pode ser realizada numerando-se a populao de 1 a n e
sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, x nmeros dessa
seqncia, os quais correspondero aos elementos pertencentes amostra.
Exemplo: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90
alunos de uma escola:
1 - numeramos os alunos de 1 a 90.
2 - escrevemos os nmeros dos alunos, de 1 a 90, em pedaos iguais de papel, colocamos na
urna e aps mistura retiramos, um a um, nove nmeros que formaro a amostra.
OBS: quando o nmero de elementos da amostra muito grande, esse tipo de sorteio torna-se
muito trabalhoso. Neste caso utiliza-se uma Tabela de nmeros aleatrios, construda de
modo que os algarismos de 0 a 9 so distribudos ao acaso nas linhas e colunas.

5.2AMOSTRAGEMPROPORCIONALESTRATIFICADA
Quando a populao se divide em estratos (subpopulaes), convm que o sorteio dos
elementos da amostra leve em considerao tais estratos, da obtemos os elementos da amostra
proporcional ao nmero de elementos desses estratos.
Exemplo: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior,
supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. So portanto dois estratos
(sexo masculino e sexo feminino). Logo, temos:
SEXO
MASC.
FEMIN.
Total

POPULACO
54
36
90

10 %
5,4
3,6
9,0

AMOSTRA
5
4
9

Numeramos ento os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e


procedemos o sorteio casual com urna ou tabela de nmeros aleatrios.
6

5.3AMOSTRAGEMSISTEMTICA
Quando os elementos da populao j se acham ordenados, no h necessidade de construir o
sistema de referncia. So exemplos os pronturios mdicos de um hospital, os prdios de uma
rua, etc. Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um
sistema imposto pelo pesquisador.Caso contrrio pode-se utilizar um critrio como, a relao
entre populao e amostra.
Exemplo: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra
formada por 50 casas para uma pesquisa de opinio. Podemos, neste caso, usar o seguinte
procedimento: como 900/50 = 18, escolhemos por sorteio casual um nmero de 01 a 18, o qual
indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam
periodicamente considerados de 18 em 18. Assim, suponhamos que o nmero sorteado fosse 4
a amostra seria: 4 casa, 22 casa, 40 casa, 58 casa, 76 casa, etc.

6 SRIES ESTATSTICAS
qualquer tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo
da poca, do local ou da espcie.
TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas e colunas
de maneira sistemtica.
De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar :

um trao horizontal ( - ) quando o valor zero;


trs pontos ( ... ) quando no temos os dados;
zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada;
um ponto de interrogao ( ? ) quando temos dvida quanto exatido de determinado
valor.

Sries Homgradas: so aquelas em que a varivel descrita apresenta variao discreta ou


descontnua. Podem ser do tipo temporal, geogrfica ou especfica.
a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O local e a espcie
(fenmeno) so elementos fixos. Esta srie tambm chamada de histrica ou evolutiva.
ABC VECLULOS LTDA.
Vendas no 1 bimestre de 1996
PERODO
JAN/96
FEV/96
TOTAL

UNIDADES VENDIDAS *
20
10
30

* Em mil unidades
.b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A poca e o fato
(espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao.
7

ABC VECLULOS LTDA.


Vendas no 1 bimestre de 1996
FILIAIS
SO PAULO
RIO DE JANEIRO
TOTAL
* Em mil unidades

UNIDADES VENDIDAS *
13
17
30

c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm chamada de srie
categrica.
ABC VECLULOS LTDA.
Vendas no 1 bimestre de 1996
MARCA
FIAT
GM
TOTAL

UNIDADES VENDIDAS *
18
12
30

* Em mil unidades
SRIES CONJUGADAS: Tambm chamadas de tabelas de dupla entrada. So apropriadas
apresentao de duas ou mais sries de maneira conjugada, havendo duas ordens de
classificao: uma horizontal e outra vertical. O exemplo abaixo de uma srie geogrficatemporal.
ABC VECLULOS LTDA.
Vendas no 1 bimestre de 1996
FILIAIS
SO PAULO
RIO DE JANEIRO
TOTAL

Janeiro/96
10
12
22

Fevereiro/96
3
5
8

* Em mil unidades

7 GRFICOS ESTATSTICOSGGG
So representaes visuais dos dados estatsticos que devem corresponder, mas nunca substituir
as tabelas estatsticas.
Caractersticas:
Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade.
Grficos de informao: So grficos destinados principalmente ao pblico em geral,
objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente expositivos,
8

dispensando comentrios explicativos adicionais. As legendas podem ser omitidas, desde que
as informaes desejadas estejam presentes.
Grficos de anlise: So grficos que prestam-se melhor ao trabalho estatstico, fornecendo
elementos teis fase de anlise dos dados, sem deixar de ser tambm informativos. Os
grficos de anlise freqentemente vm acompanhados de uma tabela estatstica. Inclui-se,
muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principais
revelados pelo grfico.
Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendo analisados,
chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construo de
escalas.
.Classificao dos grficos: Diagramas, Estereogramas e Cartogramas.

7.1Diagramas
So grficos geomtricos dispostos em duas dimenses. So os mais usados na representao
de sries estatsticas. Eles podem ser :
1.1- Grficos em barras horizontais.
1.2- Grficos em barras verticais ( colunas ).
Quando as legendas no so breves usa-se de preferncia os grficos em barras horizontais.
Nesses grficos os retngulos tm a mesma base e as alturas so proporcionais aos respectivos
dados. A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for
geogrfica ou categrica.

1.3- Grficos em barras compostas.


1.4- Grficos em colunas superpostas.

Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de apresentar
cada barra ou coluna segmentada em partes componentes. Servem para representar
comparativamente dois ou mais atributos.
1.5- Grficos em linhas ou lineares.

So freqentemente usados para representao de sries cronolgicas com um grande nmero


de perodos de tempo. As linhas so mais eficientes do que as colunas, quando existem intensas
flutuaes nas sries ou quando h necessidade de se representarem vrias sries em um mesmo
grfico.
Quando representamos, em um mesmo sistema de coordenadas, a variao de dois fenmenos,
a parte interna da figura formada pelos grficos desses fenmeno denominada de rea de
excesso.
1.5- Grficos em setores.
Este grfico construdo com base em um crculo, e empregado sempre que desejamos
ressaltar a participao do dado no total. O total representado pelo crculo, que fica dividido
em tantos setores quantas so as partes. Os setores so tais que suas reas so respectivamente
proporcionais aos dados da srie. O grfico em setores s deve ser empregado quando h, no
mximo, sete dados.
Obs: As sries temporais geralmente no so representadas por este tipo de grfico.

7.2Estereogramas
So grficos geomtricos dispostos em trs dimenses, pois representam volume. So usados
nas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo de grfico
fica difcil de ser interpretado dada a pequena preciso que oferecem.

10

7.3Cartogramas
So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de figurar
os dados estatsticos diretamente relacionados com reas geogrficas ou polticas.

8 DISTRIBUIO DE FREQUNCIA
um tipo de tabela que condensa uma coleo de dados conforme as freqncias (repeties de
seus valores).
Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram
numericamente organizados. difcil formarmos uma idia exata do comportamento do grupo
como um todo, a partir de dados no ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
ROL: a tabela obtida aps a ordenao dos dados (crescente ou decrescente).
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Distribuio de freqncia sem intervalos de classe: a simples condensao dos dados
conforme as repeties de seu valores. Para um ROL de tamanho razovel esta distribuio de
freqncia inconveniente, j que exige muito espao. Veja exemplo abaixo:
11

Dados Freqncia
41
3
42
2
43
1
44
1
45
1
46
2
50
2
51
1
52
1
54
1
57
1
58
2
60
2
Total
20
Distribuio de freqncia com intervalos de classe:Quando o tamanho da amostra elevado
mais racional efetuar o agrupamento dos valores em vrios intervalos de classe.
Classes
Freqncias
41 |------- 45
7
45 |------- 49
3
49 |------- 53
4
53 |------- 57
1
57 |------- 61
5
Total
20
ELEMENTOS DE UMA DISTRIBUIO DE FREQUNCIA (com intervalos de classe):
Neste caso, a construo de tabela de frequncia a soluo o agrupamento dos valores
em vrios intervalos.
So utilizados 3 componentes para a construo dos intervalo de classes:
1. Amplitude Total (AT): a diferena entre o maior e o menor valor do conjunto de dados.
AT = Maior Valor Menor Valor
Ex: na tabela anterior AT = 60 - 41= 19.
2. Nmero de classes (i): o nmero de classes que conter a tabela.

i = 1 + 3,3 * log( n )
CLASSE: so os intervalos de variao da varivel e simbolizada por i e o nmero total de
classes simbolizada por i. Ex: na tabela anterior i=5 e 49 |------- 53 a 3 classe, onde i=3.
12

3.

Amplitude ou Intervalo de Classe (h): geralmente utilizam-se intervalos iguais, obtidos


atravs da frmula:

AT
i

Obs: Na distribuio de freqncia c/ classe o h ser igual em todas as classes.


Outros elementos da tabela:

Li = limite inferior de cada classe;

Ls = limite superior de cada classe;

x = ponto mdio de cada classe

% = percentual

x = (Li + Ls )/2;

Nota: Os intervalos de classe so representados pelo smbolo matemtico


O smbolo (incluso de Li e excluso de Ls) indica incluso na classe do valor
situado sua esquerda e excluso do valor situado sua direita.
O smbolo indica incluso de ambos os limites inferior e superiores.
PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partes
iguais. .......Ex: em 49 |------- 53 o ponto mdio x3 = (53+49)/2 = 51, ou seja x3=(l3+L3)/2.
MTODO PRTICO PARA CONSTRUO DE UMA DIST. DE FREQUNCIAS C/
CLASSE:
1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude total da amostral AT.
3 - Calcule o nmero de classes atravs da Regra de Sturges:
Frmula de Sturges: K = 1 + 3,3 . log10 N
onde: N = Nmero de observaes
Obs: Qualquer regra para determinao do n de classes da tabela no nos levam a uma deciso
final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado
natureza dos dados.

9 REPRESENTAO GRFICA DE UMA DISTRIBUIO


.Histograma, Polgono de freqncia e Polgono de freqncia acumulada
Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados
cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da
varivel e na linha vertical (eixo das ordenadas), as freqncias.
.Histograma: formado por um conjunto de retngulos justapostos, cujas bases se localizam
sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios
13

dos intervalos de classe. A rea de um histograma proporcional soma das freqncias


simples ou absolutas.
freqncias simples ou absolutas: so os valores que realmente representam o nmero de
dados de cada classe. A soma das freqncias simples igual ao nmero total dos dados da
distribuio.
freqncias relativas: so os valores das razes entre as freqncias absolutas de cada classe e
a freqncia total da distribuio. A soma das freqncias relativas igual a 1 (100 %).
.Polgono de freqncia: um grfico em linha, sendo as freqncias marcadas sobre
perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos intervalos de classe.
Para realmente obtermos um polgono (linha fechada), devemos completar a figura, ligando os
extremos da linha obtida aos pontos mdios da classe anterior primeira e da posterior
ltima, da distribuio.
.Polgono de freqncia acumulada: traado marcando-se as freqncias acumuladas sobre
perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites
superiores dos intervalos de classe.
freqncia simples acumulada de uma classe: o total das freqncias de todos os valores
inferiores ao limite superior do intervalo de uma determinada classe.
freqncia relativa acumulada de um classe: a freqncia acumulada da classe, dividida pela
freqncia total da distribuio.
...CLASSE.. ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri.....
50 |-------- 54
4
52
0,100
4
0,100
54 |-------- 58
9
56
0,225
13
0,325
58 |-------- 62 11
60
0,275
24
0,600
62 |-------- 66
8
64
0,200
32
0,800
66 |-------- 70
5
68
0,125
37
0,925
70 |-------- 74
3
72
0,075
40
1,000
Total
40
1,000
Com base na tabela acima: Sendo fi= freq. simples; xi= ponto mdio de classe; fri= freq.
simples acumulada; Fi= freq. relativa e Fri= freq. relativa acumulada. Construa o histograma,
polgono de freqncia e polgono de freq. acumulada:
Obs: uma distribuio de freqncia sem intervalos de classe representada graficamente por
um diagrama onde cada valor da varivel representado por um segmento de reta vertical e de
comprimento proporcional respectiva freqncia.
Com base na tabela anterior, construa o grfico (histograma) e o polgono de frequencia a partir
das freqncias calculadas.

14

10 MEDIDAS DE POSIO
Introduo
So as estatsticas que representam uma srie de dados orientando-nos quanto posio da
distribuio em relao ao eixo horizontal do grfico da curva de freqncia.
As medidas de posies mais importantes so as medidas de tendncia central. (verifica-se
uma tendncia dos dados observados a se agruparem em torno dos valores centrais).
As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana.

10.1MdiaAritmtica
igual ao quociente entre a soma dos valores do conjunto e o nmero total dos valores.
......onde xi so os valores da varivel e n o nmero de valores.
.Dados no-agrupados:
Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de freqncias,
determinamos a mdia aritmtica simples.
Exemplo: Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10, 14,
13, 15, 16, 18 e 12 kilos, temos, para venda mdia diria na semana de:
.= (10+14+13+15+16+18+12) / 7 = 14 kilos
Desvio em relao mdia: a diferena entre cada elemento de um conjunto de valores e a
mdia aritmtica, ou seja:.. di = Xi No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 , ...d3 = 13 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e... d7 = 12 - 14 = - 2.
Dados agrupados: Sem intervalos de classe
Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel o
nmero de filhos do sexo masculino. Calcularemos a quantidade mdia de meninos por famlia:
N de meninos freqncia = fi
0
2
1
6
2
10
3
12
4
4
total
34
15

Como as freqncias so nmeros indicadores da intensidade de cada valor da varivel, elas


funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica
ponderada, dada pela frmula:

..xi. ..fi. ..xi.fi .


0 2
0
1 6
6
2 10 20
3 12 36
4 4
16
total 34 78
onde 78 / 34 = 2,3 meninos por famlia
Dados agrupados: Com intervalos de classe
Neste caso, convencionamos que todos os valores includos em um determinado intervalo de
classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por
meio da frmula:
..onde Xi o ponto mdio da classe.
Exemplo: Calcular a estatura mdia de bebs conforme a tabela abaixo.
Estaturas (cm) freqncia = fi ponto mdio = xi ..xi.fi.
50 |------------ 54
4
52
208
54 |------------ 58
9
56
504
58 |------------ 62
11
60
660
62 |------------ 66
8
64
512
66 |------------ 70
5
68
340
70 |------------ 74
3
72
216
Total
40
2.440
Aplicando a frmula acima temos: 2.440 / 40.= 61. logo...

= 61 cm

10.2MODA
o valor que ocorre com maior freqncia em uma srie de valores.
Mo o smbolo da moda.
Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o
salrio recebido pelo maior nmero de empregdos dessa fbrica.
16

.A Moda quando os dados no esto agrupados

A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor que
mais se repete.

Exemplo: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.

H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais
vezes que outros.

Exemplo: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.

.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento,
que a srie tem dois ou mais valores modais.

Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie


bimodal.
.A Moda quando os dados esto agrupados
a) Sem intervalos de classe
Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar o valor
da varivel de maior freqncia.
Exemplo: Qual a temperatura mais comum medida no ms abaixo:
Temperaturas freqncia
0 C
3
1 C
9
2 C
12
3 C
6
Resp: 2 C a temperatura modal, pois a de maior freqncia.
b) Com intervalos de classe
A classe que apresenta a maior freqncia denominada classe modal. Pela definio,
podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os
limites da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o
ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta.
Mo = ( l* + L* ) / 2
onde l* = limite inferior da classe modal e L*= limite superior da classe modal. Exemplo:
Calcule a estatura modal conforme a tabela abaixo.

17

Classes (em cm) freqncia


54 |------------ 58
9
58 |------------ 62
11
62 |------------ 66
8
66 |------------ 70
5
Resp: a classe modal 58|-------- 62, pois a de maior freqncia. l*=58 e L*=62
Mo = (58+62) / 2 = 60 cm ( este valor estimado, pois no conhecemos o valor real da moda).
.Mtodo mais elaborado pela frmula de CZUBER: Mo = l* + (d1/(d1+d2)) x h*
l*= limite inferior da classe modal..... e..... L*= limite superior da classe modal
d1= freqncia da classe modal - freqncia da classe anterior da classe modal
d2= freqncia da classe modal - freqncia da classe posterior da classe modal
h*= amplitude da classe modal
Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada de posio
ou quando a medida de posio deva ser o valor mais tpico da distribuio. J a mdia
aritmtica a medida de posio que possui a maior estabilidade.

10.3MEDIANA
A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou
decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntos de
mesmo nmero de elementos.
Smbolo da mediana: Md
.A mediana em dados no-agrupados
Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }
De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente
ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9.
Mtodo prtico para o clculo da Mediana
Se a srie dada tiver nmero mpar de termos:
O valor mediano ser o termo de ordem dado pela frmula :
.( n + 1 ) / 2
18

Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 }


1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada ser a
mediana
A mediana ser o 5 elemento = 2
.Se a srie dada tiver nmero par de termos:
O valor mediano ser o termo de ordem dado pela frmula :..
.[( n/2 ) +( n/2+ 1 )] / 2
Obs: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor
correspondente.
Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }
1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2
[( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2
5 termo = 2
6 termo = 3
A mediana ser = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo ser a mdia aritmtica
do 5 e 6 termos da srie.
Notas:

Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da


mediana com um dos elementos da srie.
Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia
da mediana com um dos elementos da srie. A mediana ser sempre a mdia aritmtica
dos 2 elementos centrais da srie.
Em um srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor.
A mediana, depende da posio e no dos valores dos elementos na srie ordenada. Essa
uma da diferenas marcantes entre mediana e mdia ( que se deixa influenciar, e
muito, pelos valores extremos). Vejamos:

Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10


Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10
isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos
valores extremos, ao passo que a mediana permanece a mesma.
.A mediana em dados agrupados
a) Sem intervalos de classe
19

Neste caso, o bastante identificar a freqncia acumulada imediatamente superior metade da


soma das freqncias. A mediana ser aquele valor da varivel que corresponde a tal freqncia
acumulada.
Exemplo conforme tabela abaixo:
Varivel xi freqncia fi freqncia acumulada
0
2
2
1
6
8
2
9
17
3
13
30
4
5
35
total
35
Quando o somatrio das freqncias for mpar o valor mediano ser o termo de ordem dado
pela frmula :.

Como o somatrio das freqncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3....


Quando o somatrio das freqncias for par o valor mediano ser o termo de ordem dado pela
frmula :.

Exemplo - Calcule Mediana da tabela abaixo:


Varivel xi freqncia fi
12
14
15
16
17
20
total

1
2
1
2
1
1
8

Freqncia
acumulada
1
3
4
6
7
8

Aplicando frmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2


= 15,5
b) Com intervalos de classe
20

Devemos seguir os seguintes passos: 1) Determinamos as freqncias acumuladas ; 2)


Calculamos

; 3) Marcamos a classe correspondente freqncia acumulada

imediatamente superior

. Tal classe ser a classe mediana ;

4) Calculamos a Mediana pela seguinte frmula:..... l* + [(

- FAA ) x h*] / f*

l* = o limite inferior da classe mediana.


FAA = a freqncia acumulada da classe anterior classe mediana.
f* = a freqncia simples da classe mediana.
h* = a amplitude do intervalo da classe mediana.
Exemplo:
classes

freqncia = fi

50 |------------ 54
54 |------------ 58
58 |------------ 62
62 |------------ 66
66 |------------ 70
70 |------------ 74
total

4
9
11
8
5
3
40

Freqncia
acumulada
4
13
24
32
37
40

= 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62


l* = 58........... FAA = 13........... f* = 11........... h* = 4
Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 =
60,54
OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio.
Emprego da Mediana

Quando desejamos obter o ponto que divide a distribuio em duas partes iguais.
Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica.
Quando a varivel em estudo salrio.

21

11 Disperso ou Variabilidade:
a maior ou menor diversificao dos valores de uma varivel em torno de um valor de
tendncia central ( mdia ou mediana ) tomado como ponto de comparao.
A mdia - ainda que considerada como um nmero que tem a faculdade de representar uma
srie de valores - no pode, por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compem o conjunto.
Consideremos os seguintes conjuntos de valores das variveis X, Y e Z:
X = { 70, 70, 70, 70, 70 }
Y = { 68, 69, 70 ,71 ,72 }
Z = { 5, 15, 50, 120, 160 }
Observamos ento que os trs conjuntos apresentam a mesma mdia aritmtica = 350/5 = 70
Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que
todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o
conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia
representativa.
Conclumos ento que o conjunto X apresenta disperso nula e que o conjunto Y apresenta
uma disperso menor que o conjunto Z.

11.1DESVIOPADRO
a medida de disperso mais geralmente empregada, pois leva em considerao a totalidade
dos valores da varivel em estudo. um indicador de variabilidade bastante estvel. O desvio
padro baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser
traduzida como : a raiz quadrada da mdia aritmtica dos quadrados dos desvios e
representada por S .

A frmula acima empregada quando tratamos de uma populao de dados no-agrupados.


Exemplo: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5
Xi
- 4 - 0,2
- 3 - 0,2
- 2 - 0,2
3 - 0,2
5 - 0,2

- 3,8
- 2,8
- 1,8
3,2
5,2

E=

14,44
7,84
3,24
10,24
27,04
62,8
22

Sabemos que n = 5 e 62,8 / 5 = 12,56.


A raiz quadrada de 12,56 o desvio padro = 3,54
Obs: Quando nosso interesse no se restringe descrio dos dados mas, partindo da amostra,
visamos tirar inferncias vlidas para a respectiva populao, convm efetuar uma modificao,
que consiste em usar o divisor n - 1 em lugar de n. A frmula ficar ento:

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padro amostral seria a raiz


quadrada de 62,8 / (5 -1) = 3,96
O desvio padro goza de algumas propriedades, dentre as quais destacamos:
1 = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio
padro no se altera.
2 = Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante
(diferente de zero), o desvio padro fica multiplicado ( ou dividido) por essa constante.
Quando os dados esto agrupados (temos a presena de freqncias) a frmula do desvio
padro ficar :

ou quando se trata de uma amostra


Exemplo:
Calcule o desvio padro populacional da tabela abaixo:
Xi
0
1
2
3
4

f i Xi . f i
2
6
12
7
3

0
6
24
21
12

Total 30

63

.fi
2,1
2,1
2,1
2,1
2,1

-2,1
-1,1
-0,1
0,9
1,9

4,41
1,21
0,01
0,81
3,61

8,82
7,26
0,12
5,67
10,83

E=

32,70
23

Sabemos que E fi = 30 e 32,7 / 30 = 1,09.


A raiz quadrada de 1,09 o desvio padro = 1,044
Se considerarmos os dados como sendo de uma amostra o desvio padro seria :
quadrada de 32,7 / (30 -1) = 1,062

a raiz

Obs: Nas tabelas de freqncias com intervalos de classe a frmula a ser utilizada a mesma
do exemplo anterior.

11.2VARINCIA
o desvio padro elevado ao quadrado e simbolizado por S2
A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm
extremamente importante na inferncia estatstica e em combinaes de amostras.

11.3MEDIDASDEDISPERSORELATIVA
11.3.1CVP:CoeficientedeVariaodePearson
Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desvio
padro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio
200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito.
Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu
emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua
disperso ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou
variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada de
CVP: Coeficiente de Variao de Pearson ( a razo entre o desvio padro e a mdia
referentes a dados de uma mesma srie).
A frmula do CVP = (S / ) x 100 ( o resultado neste caso expresso em percentual,
entretanto pode ser expresso tambm atravs de um fator decimal, desprezando assim o valor
100 da frmula).
Exemplo:
Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos:
Discriminao M D I A DESVIO PADRO
ESTATURAS
175 cm
5,0 cm
PESOS
68 kg
2,0 kg
Qual das medidas (Estatura ou Peso) possui maior homogeneidade ?
Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor ser
o de maior homogeneidade ( menor disperso ou variabilidade).
24

CVPestatura = ( 5 / 175 ) x 100 = 2,85 %


CVPpeso = ( 2 / 68 ) x 100 = 2,94 %.
Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os
pesos.

11.3.2CVT:CoeficientedeVariaodeThorndike
igual ao quociente entre o desvio padro e a mediana.
CVT = S / Md

ou

CVT = (S / Md) x 100

quando queremos o resultado em %.

12 MEDIDAS DE ASSIMETRIA
Introduo:
Uma distribuio com classes simtrica quando : Mdia = Mediana = Moda
Uma distribuio com classes :
Assimtrica esquerda ou negativa quando : Mdia < Mediana < Moda
Assimtrica direita ou positiva quando : Mdia > Mediana > Moda
Determine os tipos de assimetria das distribuies abaixo:
Distribuio A
Classes
2 |------------ 6
6 |------------ 10
10|------------ 14
14|------------ 18
18|------------ 22
Total

fi
6
12
24
12
6
60

Distribuio B
Classes
2 |------------ 6
6 |------------ 10
10 |------------ 14
14 |------------ 18
18 |------------ 22
Total

fi
6
12
24
30
6
78

Distribuio C
Classes
2 |------------ 6
6 |------------ 10
10 |------------ 14
14 |------------ 18
18 |------------ 22
Total

fi
6
30
24
12
6
78

12.1Coeficientedeassimetria
A medida anterior, por ser absoluta, apresenta a mesma deficincia do desvio padro, isto ,
no permite a possibilidade de comparao entre as medidas de duas distribuies. Por esse
motivo, daremos preferncia ao coeficiente de assimetria de Person:
As = 3 ( Mdia - Mediana ) / Desvio Padro
Escalas de assimetria:
| AS | < 0,15 => assimetria pequena
0,15 < | AS | < 1 => assimetria moderada
25

| AS | > 1 => assimetria elevada


Obs: Suponhamos AS = - 0,49 => a assimetria considerada moderada e negativa
Suponhamos AS = 0,75 => a assimetria considerada moderada e positiva
Considerando as distribuies anteriores A , B e C , calcule os coeficientes de assimetria e faa
a anlise dos resultados obtidos.

26

Você também pode gostar