Você está na página 1de 458

·E- �TAT(sr!

r
� 11-\I ' I vi-\
""
/\

BAS I CA
Geraldo Luci<1no Toledo
lvo izidoro Ovaile
Ab_ordando os t6picos mais lmportan­
tes da estatlstlca b6slca, este texto con­
tem a materia fundamental para estudos
subsequentes, ja entao no campo da es­
tatistica inferenclal. Seu conteudo limi­
ta-se aos pontos introdut6rios dos estu·
dos estatisticos. Como passo inicial, o
texto cuida de uma lntroclu�o geral a
compreensio da estatfstlca, quando sao
tratados os conceltos de populacao e
amostra, atributo e variavel descontinua
ou discreta e variavel continua, propor­
c;:ao, razao e porcentagem, alem de outros
aspectos fundamentals. Em seguida, o
texto trata de distribulc;:ao de frequen­
cias, focalizando as tabulac;:oes de dados
agrupados e niio agrupados em classes,
bem como os elementos essenciais das
distribuic;:oes e os tipos principals de
frequencias. Em terceiro lugar, o texto
focaliza a apresen� gr6fica, .esclare­
cendo didaticamente como siio construi­
dos e a que fim atendem os principals
tipos de graficos estatisticos. Expoe, por­
menorizadamente, as tecnicas de cons­
truc;:iio dos principals graficos de infor­
mac;:iio e de analise, alertando sobre o
seu uso indevido. Entre os tipos de gra­
ficos cuja construc;:iio e explicada desta­
cam-se: em barras horlzontais, agrupadas
e bidirecionais; em colunas simples e
superpostas; pict6ricos; lineares; em se­
tores; em coordenadas polares; triangu­
lares; e representativos de distribuic;:oes
de frequencia.
Ap6s esses t6picos basicos, o texto
examina as medidas de posl�o - me­
dia, moda,' mediana, quartis, decls e per­
centis. Subsequentemente, aborda as me­
didas de dlspersio absoluta e relativa,
evidenciando o significado d_o� principals
desvlos e coeflclentes de variac;:iio usual­
mente .empregados pelos es�atisticos. As
medidas de asslmetrla e curtose siio a
seguir. abordadas.
A nlvel de estatfstica baslca aplica­
da, siio ainda estudados os numeros-lndl�
ces. Partlndo do concelto fundamental

1co�t!ncc na orelha oosierlorJ


de numeros relativos, o texto explica de­
talhadamente como sao construidos os
principais indices de prec;:os e de quanti·
dades. Entre os numeros-indices estuda­
dos, destacam-se os de Laspeyres, Paas­
che, Fisher, Marshal-Edgeworth, Drobish
e Divisia. Como exemplos extraidos do
sistema brasileiro, sao mostradas as for­
mulas de calculo de indices especiais,
como o PIA, o IGP, o deflator implicito
do PIB, o IPC e o INPC.
Finalmente, sao focalizadas, tambem
a nivel introdut6rio, as tecnicas de cor­
relac;:ao e de regressao, com farta exem­
plificac;:ao e detalhada exposic;:ao dos me­
todos de calculo.
Para facilitar o uso do texto a ni­
vel didatico, ha em. cada capitulo eleva­
·

do numero de exercicios propostos e re­


solvidos.

NOTA SOBRE OS AUTORES

GERALDO LUCIANO TOLEDO e Doutor


em Administrac;:ao de Empresas pela Uni­
versidade de Sao Paulo, na area de Mar­
keting. � professor livre-docente do De­
partamento de Administrac;:ao e do curso
de p6s-graduac;:ao em Administrac;:ao da
FEA-USP. i: ainda professor titular de
Estatistica Aplicada a Administrac;:ao do
Curso Especial de Administrac;:ao da Uni­
versidade Mackenzie. Autor de Marketing
Bancario e co-autor de Estatistica Aplic:a­
da, livros pertencentes ao fundo edito­
rial da Atlas.
IVO IZIDORO OVALLE e graduado em
Economia e p6s-graduado em Economia
Publica pela Universidade de Sao Paulo.
i: professor de Estatistica Basica e Apli­
cada e de Econometria na USP, na Uni­
versidade Cat61ica de Campinas e na
FAAP.

APUCACAO

Pelo seu conteudo abrangente e pela


forma como a materia foi exposta, este
texto de Estatistica Basics foi elaborado
para atender ao ensino fundamental da
estatistica em todos os cursos superiores
em que a materia e minlstrada. A mate­
ria reunida pelos autores e suficientemen­
te ampla e esclarecedora, para .servir de
suporte a estudos subsequentes de esta­
tistica _aplicada.
CIP-Brasi1. Cata1oga�ao-na-Fonte
Camara Brasi1eira do Livro,SP

To1edo, Gera1do Luciano.


T582e Estatlstica basica/por/ Gera1do Luciano Toledo
2.ed. /e/ Ivo Izidoro Ova1le. 2.ed. Sao Paulo : At1as, 19�2.

l.Estatlstica 2.Estatlstica matematica I. Ovale,


Ivo Isidoro: II. Tltulo.

17.e 18.CDD-310
17. -519
77-1221 18. -519.5

indices para cata1ogo sistematico:


lo Estatlstica 310 (17. e -18.)
2. Estatlstica matematica 519 (1i.) 519.5 (18.)

EDITORA ATLAS S.A.


Rua Helvetia, 574/578 -CEiis
Caixa Postal 7186 Tel.: (011) 221-9144
-

01215 Sao Paulo (SP)


BRASIL
Estatfstica
l)Qsica
GERALDO LUCIANO TOLEDO
IVO IZIDORO OVALLE

0�108
ESTATfSTICA BASICA
Geraldo Luciano Toledo
Ivo lzidoro Ovalle

Diagrama�io de
PAVEL GERENCER

Capade
ANDERSON RODRIGUES

Copyright © 1982

EDITORA ATLAS S.A.

TODOS OS DIREITOS RESERV ADOS - Nos termos da Lei que resguarda


os direitos autorais, e proibida a reprodu\:ao total ou parcial, bem como a
produ\:ao de apostilas a partir deste livro, de qualquer forma ou por qualquer
meio - eletronico ou mecanico, inclusive atraves de processos xerograficos,
de fotoc6pia e de grava\:ao - sem permissao, por escrito, do Editor.

2.a EDI<;.AO
2.a tiragem -· 1982

lmpresso no Brasil
Printed in Brazil
Sumario

1 - INTRODUCAO GERAL A COMPREENSAO DA ESTATISTICA, 13

1.1. Consideracoes Gerais, 13


1.2. Estatistica descritiva e estatfstica indutiva, 15
1.2.1. Estatfstica descrltiva, 15
1.2.2. Estatfstica indutiva ou inferencia estatfstica, 15
1.3. 0 estatistico, 16
1.4. Populaciio e amostra, 16
1.4.1. Populaciio ou universo estatistico, 16
1.4.2. Amostra, 17
1.5. Fenamenos estatfsticos, 18
1.5.1. Fenomenos coletivos ou fenomenos de massa, 18
1.5.2. Fenomenos individuais ou particulares, 18
1.5.3. Fenomenos de multidiio, 18
1.6. Atributo e variavel, 19
1.6.1. Presenca ou ausencia de um atributo, 19
1.6.2. Variavel, 19
1.7. Variavel descontinua ou discreta e variavel continua, 20
1.7.1. Variavel discreta ou descontinua, 20
1.7.2. Variavel continua, 20
1.8. Fases do metodo estatistico (Estatistica descritiva), 20
1.8 .1 . Definiciio do problems, 21
1.8. 2. Planejamento, 21
1.8.3. Coleta dos dados, 22
1.8.4. Apuraciio dos dados, 24
1.8. 5. Apresentaciio dos dados, 25
1.8.6. Analise e interpretaciio dos dados, 25
1.9. As series estatisticas, 26
1.9.1. Serie hom6grada, 27
1.9.2. Serie heter6grada, 27
1.9.3. Os quatro tipos de series estatisticas, 27 7
1.9.4. Tabelas de dupla entrada, 31
1.10. Proporc;:iio, raziio e porcentagem, 32

1.10.1. Proporc;:iio, 32
1.10.2. Porcentagem, 34
1.10.3. Razao, 36
1.10.4. Taxa, 36
1.11. Arredondamento de numeros, 37
1. 12. Somat6rio, 39
1.12.1. Propriedades do somat6rlo, 40

2 - DISTRIBUICAO DE FREOOENCIAS, 49

2.1 . Dados brutos, 49


2.2. · Roi, 50
2.3. Tabela de freqiiencias, 51
2.3.1. Dlstribuic;:iio de freqiiencias de dados tabulados niio-agrupados
em classes, 51
2.3.2. Distribuic;:iio de freqiiencias de dados agrupados em classes, 53
2.4. Elementos de uma distribuil;:iio de freqiiencias, 54
2.4.1. Freqiiencia simples absoluta, 54
2.4.2. Amplitude total: A , 54
2.4.3. Classe, 55
2.4.4. Limites de classes, 56
2.4.5. Amplitude do intervalo de classe, 58
2.4.6. Ponto media de classe - x -, 59
2.5. Tipos de freqiiencias, 60
2.5.1. Freqiiencias simples, 60
2.5.2. Freqiiencias acumuladas "abaixo de". 63
2.5.3. Freqiiencias acumuladas "acima qe•, 65
2.6. Roteiro para a elaborac;:iio de uma tabela de freqiiencias com dados
agrupados em classes, 67

3 - APRESENTACAO GRAFICA, 75

3.1. Classificac;:ao dos graficos segundo a forma, 75


3.2. Classificac;:ao dos graficos segundo o objetivo (uso), 76
· 3.2.1. Graficos de lnformac;:iio, 76
3.2.2. Graflcos de analise, 76
3.2.3. Uso indevido dos graflcos, 77
3.2.4. Principais tipos de graficos, 78

4 - MEDIDAS DE POSICAO, 107

4.1. lntroduc;:ao, 107


4.2. Media, 101
4.2.1. Media aritmetica, 108
4.2.2. Media geometrica, 124
8 4.2.3. Media harmonica, 132
4.2.4. Media quadratics, 138
4.3. Moda, 143
4.3.1. Determinac;:iio da moda de valores niio-tabulados, 143
4.3.2. Determinac;:iio da moda para valores tabulados, 144
4.4. Medians, 152
4.4.1. Determinac;:iio da mediana de valores niio-tabulados, 152
4.4.2. Determinac;:iio da mediana de valores tabulados niio-agr.up�os
em classes, 154
4. 4.3. Determinac;:iio da mediana de valores tabulados agrupados 'em
classes, 157
4.5. Considerac;:oes adicionais sobre a media aritmetica, a moda
e a mediana, 164
4.5.1. Relac;:iio empfrica entre a media, a moda e a mediana, 164
4.5.2. Caracterfsticas da media, da medians e da moda, 166
4.6. Ouartis - decis - percentis (ou centis), 169
4.6.1. Ouartis, 169
4.6.2. Decis, 170
4.6.3. Percentis ou centls, 171

5 - MEDIDAS DE DISPERSAO, 181

5.1. lntrodur;iio, 181


5.2. Medidas de dispersiio absoluta, 182
5.2.1. Amplitude total ou intervalo total, 182
5.2.2. Desvio quartil ou amplitude semi-interquartilica, 184
5.2.3. Desvio medio, 183
5.2.4. Desvio-padriio, 191
5.2.5. Variiincia, 210
5.3. Medidas de dispersiio relativa, 219
5.3.1. Desvio quartil reduzido, 219
5.3.2. Coeflciente de variar;io, 220

6 - MEDIDAS DE ASSIMETRIA E CURTOSE, 227

6.1. lntrodur;iio, 227


6.2. Momentos, 227
6.2.1. Momento natural (absoluto) de ordem r, 227
6.2.2. Momento de ordem r em relac;:iio a uma origem qualquer x , 230
6.2.3. Momento centrado na media de ordem r, 232
6.2.4. Relar;iio geral entre os momentos centrados na media e os
momentos naturals, 235
6.2.5. Relac;:iio entre momentos centrados na media e momentos
centrados em uma origem arbitraria, x , 237
6.2.6. Processo breve para o calculo dos momentos, 241
6.2.7. Controle de Charlier e correc;:iio de Sheppard para os
momentos, 246
6. 3. Medidas de assimetria ou de enviesamento, 249
6.3.1. Metodo de comparac;:iio entre medidas de tendencia central, 251
6.3.2. Coeficiente de Pearson, 253 9
6.3.3. Coeficiente quartil de assimetria, 256
6.3.4. Coeficiente de assimetria entre os percentis 10 e 90, 257
6. 3.5. Coeficiente momenta de assimetria, 259
6.4. Medidas de curtose, 260
6.4.1. Coeficiente percentilico de curtose, 261
6.4.2. Coeficiente momenta de curtose, 263

7 - NOMEROS..fNDICES, 311

7.1. lntroducao, 311


7.2. Conceito de relative, :312
7.2.1. Relative (relacao) de preco (p, t), 312
7.2.2. Relative (relacao) de quantidade (q , t), 313
7.2.3. Relative (relai;:oes) de valor (v , t), 316
7. 3. Criterios (testes) de avaliacao de adequai;:ao da f6rmula de um
indice, 317
7.3.1. ldentidade, 317
7.3.2. Reversao (inversao) do tempo, 318
7.3.3. Circular, 319
7 .3.4. Decomposicao das causas (inversao dos fatores), 320
7.4. Elos de relative e relative em cadeia, 321
7.5. Empregos de medias simples e indice agregativo simples, .323
7.5.1. Media aritmetica simples de relatives, 323
7.5.2. Media harmonica simples de relatives, 324
7. 5.3. Media geometrica simples de relatives, 325
7.5. 4. fndice agregativo simples (indice de Bradstreet), 331
7. 5. 5. Restrii;:oes ao emprego de indices simples, 333
7.6. Emprego de indices agregativos ponderados, 342
7.6.1. fndice de laspeyres OU metodo da epoca-basica, 342
7.6.2. fndice de Paasche OU metodo da epoca atual, 344
7.6.3. fndice de Fischer (indice ideal), 345
7.6.4. fndice de Marshall-Edgeworth, 346
7.6.5. fndice de Drobish, 347 ,.

7. 6. 6. fndice de Divisa, 348


7. 6. 7. F6rmulas modificadas, 348
7.7. Construi;:ao de series de numeros-indices - mudani;:a de base, 355
7.7.1 . Base fixa, 356
7. 7. 2. Base m6vel encadeada, 356
7.7.3. Vantagens e desvantagens dos metodos, 358
7.7.4. Mudani;:a de base na pratica - metodo abreviado, 358
7.7.5. Conjugai;:ao de duas ou mais series de numeros-indices
em uma s6, 359
7.8. Conceito de deflater e de poder aquisitivo, 360
7.8.1. Deflater, 360
7. 8.2. Poder aquisitivo, 363
7.9. Taxa real ou taxa deflacionada, 365
7.10. Alguns indices especiais, 366
10 7.10.1. fndice de Preco por Atacado - IPA, 366
7.10.2. Iodice Geral de Precos - I GP, 373
7.10.3. Deflator l mplicito de Preco e Iodice de Quantum, 375
7.10.4. Iodice Relacao de Trocas, 379
7.10.5. Iodice daCapacidade de lmportar, 379
7.10.6. Iodice de Precos aoConsumidor - C
I V - (Iodice do Custo
de Vida), 382
7.10. 7. Iodice de Correcao Monetaria - Obrigacoes Reajustaveis do
Tesauro Nacional, 385
7.11. Exercfcios propostos, 388

8 - CORRELACAO E REGRESSAO, 412


8.1. Relacao entre variaveis, 412
8.2. Correlacao linear simples, 412
8.2.1. Medida de correlacao, 412
8.2.2. Correlacao linear positiva, 413
8.2.3. Correlacao linear perfeita positiva, 413
8.2.4. Correlacao negative, 414
8.2.5. Correlacao perfeita negativa, 414
8.2.6. Correlacao nula, 415
8.2.7. Correlacao espuria, 416
8.2.8. Calculo pratico do coeficiente de correlacao linear, 416
8.2.9. Exercicios propostos, 418
8.2.10. Correlacao ordinal, 419
8.2.11. Exercicios complementares, 423
8.3. Analise de regressao, 424
8.3.1. Regressao linear simples, 424
8.3.2. 0 poder explicativo do modelo, 430
8.3.3. Regressao linear por transformacao, 434
8.3.4. Exercicios complementares, 445
8.3.5. Regressao polinomial - ajuste por parabola, 449
8.3.6. Exercicios propostos, 454

Referinclas Blbllogr6ficas, 459

11
Introdufiio Geral a
Compreensiio da Estatistica

1.1. CONSIDERACOES GERAIS

A utilizayao da Estatistica e cada vez mais acentuada em qualquer ati·


vidade profissional da vida moderna. Nos seus mais diversificados ramos de
atuayao, as pessoas estao freqiientemente expostas a Estatistica, utilizando-a
com maior ou menor intensidade. lsto se deve as multiplas aplicayoes que o
metodo estatistico proporciona aqueles que dele necessitam.

Apesar disso, existem muitas concepyOeS erroneas acerca da natureza


desta disciplina. A ideia que um leigo possa fazer da Estatistica difere em
muito da de um profissional. E comum, por exemplo, as pessoas formai:em
conceitos distorcidos a respeito de um estatistico profissional. Para alguns,
trata-se de um individuo que tern a capacidade de manipular numeros para
demonstrar seus pontos de vista. Alguns estudantes, por outro lado, tendem
a admiti-lo como alguem que, auxiliado por sua calculadora, tern a faculdade
de converter qualquer assunto em um estudo "cientifico". Toda essa aura
criada em torno da disciplina tern provocado, em estudantes e profissionais,
uma dupla atitude: de apreensao, quanta a dificuldade de absoryao de seu
conteudo, e de expectativa, quanto a sua potencialidade como instrumento
auxiliar de resoluyao de problemas. Por essa razao, e extremamente dificil
apresentar uma definiyao de Estatistica, alem do que muitos de seus
conceitos fundamentais nao apresentam uma definiyao explicita, ou, se a
apresentam, esta nao se revela suficientemente clara para dar uma ideia defi­
nitiva de seu significado.
E possivel distinguir duas concepyaes para a palavra ESTAT(STICA:
a) No plural (estat{sticas), indica qualquer cole�o consistente de dados
numericos, reunidos com a finalidade de fornecer informa,.oes acerca de
uma atividade qualquer. Assim, por exemplo, as estat{sticas demogiaficas
referem-se aos dados numerioos sobre nascimentos, falecimentos, matri-
m0nios, desquites etc.. As estatlsticas economicas consistem em dados 13
numericos relacionados com emprego, produ�iio, pre�s, vendas e com
outras atividades ligadas aos varios setores da vida economica.

b) No singular, indica a atividade humana especializada ou um corpo <le


tecnicas, ou ainda uma metodologia desenvolvida para a coleta, a classi­
fica�o, a apresenta�o, a aruilise e a interpreta�o de dados quantitativos
e a utiliza�o desses dados para a tomada de decis0es.

Atraves dessa segunda acep9ao, e possivel vislumbrar o objeto dos


estudos estatisticos. Este reside naqueles fenomenos que se referem .::>rinci­
palmente a um conjunto muito numeroso de individuos, que sao semelhantes
quanto a pelo menos uma caracteristica especifica. Freqiientemente, os
metodos deterministas sao inaplicaveis ao estudo de caracteristicas pr6pria�
de conjuntos muito numerosos de fodividuos, face a extrema complexidade
ou mesmo as condi96es peculiares e a natureza do fenomeno estudado.
Trata-se, em particular, do caso em que o conjunto das ocorrencias rela­
cionadas com o comportamento da caracteristica analisada esta sujeito ao
acaso. Atraves de uma tecnica de sintese, que e uma caracteristica de seus
metodos, a Estatistica torna possivel analisar os padroes de comportamento
da caracteristica em estudo, conseguindo superar a ir.cetermin�9ao que se
manifesta em casos particulares.

Fisher refere-se a Estatistica como o ramo da Matematica Aplicada


dedicado a analise de dados de observa9ao. A despeito das criticas que esta
coP.cep9ao possa merecer, ela evidencia claramente dois aspectos importantes
do metodo estatistico: o tratamento quantitativo a ser aplicado ao fenomeno
e � observa9ao, tomada em seu sentido mais amplo. Assim sendo, qualquer
ciencia experimental nao pode prescindir das tecnicas proporcionadas pela
Estatistica, citando-se, a guisa de exemplo, a Fisica, a Biologia, a Adminis- ·

tra9ao de Empresas, a Economia, a Psicologia, a Agronomia e outras. Todos


esses ramos de· atividade profissional tern necessidade de um instrumental
que se preocupa com o tratamento quantitativo dos fenomenos de massa
ou coletivos, cuja mensura9ao e analise requerem uin conjunto de obser­
va96es de fenomenos individuais ou particulares. Esse mecariismo de amilise
refere-se a um processo de generaliza9ao, a partir de resultados individuais.
Assim, se for observado um certo padrao de regularidade nos resultados de
um experimento qualquer, provavelmente existe uma caracteristica corres­
pondente a uma ampla classe de experiencias. Verificando-se a comprova9ao
dessa caracteristica atraves de testes estatisticos adequados, pode-se fazer a
generaliza9ao da caracteristica para todas as categorias de fenomenos seme­
lhantes.

Para esclarecer e fixar melhor o conceito de Estatistica, sera inte­


ressante dizer-se alguma coisa sobre aquilo que ela nao e.

Em primeiro lugar, a Estatistica nao e, de forma alguma, um metodo


mediante o qual se pode provar tudo aquilo que se deseja. Na realidade, nao
14 ha nada nos metodos estatisticos capaz de evitar que um indivfduo super-
ficial ou inescrupuloso extraia de um estudo estatistico suas pr6prias con­
clus0es, apesar da existencia dos dados numericos. Em segundo lugar, a
EstatiStica nao e simplesmente uma coleyao de dados (estatisticos) nem
constitui um substituto do pensamento abstrato. te6rico ou do exame minu­
dente dos casos excepcianais. Dessa forma, os metodos estatisticos nao se
opoem, de modo algum, a analise qualitativa dos casos particulares. Ambos
OS metodos se completam. Alem disso, nao e correto afirmar-se que a EstJ­
tistica somente seja aplicavel em presenya de um grande numero de caso�
ou que nao possa ser usada em estudos exploiat6rios.

Para estabelecer o ambito dos estudos da disciplina e adotando-se um


esquema pratico de raciocinio, pode-se dizer que a Estatistica compreende
duas funyoes (ou campos) hem amplas. A primeira funyao e descritiva, e a
segunda e indutiva.

1.2. ESTATISTICA DESCRITIVA E ESTATISTICA INDUTIVA


1.2.1. Estatrstica Descritiva
Principalmente em pesquisa social, o analista defronta-se amiude com
a situayao de dispor de tantos dados que se torna dificil absorver completa­
mente a informayliQ que esta procurando investigar. E extremame.rt.ti_ dificil;
captar intuitivamente todas as infomiayoes que os dados contem. Eneces­
sario, portanto, que as informayoes sejam reduzidas ate o ponto em que se
possa interpreta-las mais claramente. Em outras palavras, e indispensavel
resumi-las, atraves do uso de certas medidas-sinteses, mais comumente conhe­
cidas como estatisticas descritivas ou simplesmente estatisticas. Por conse­
guinte, a estatistica descritiva e um numero que sozinho descreve uma
caracteristica de um conjunto de dados. Trata-se, portanto, de um numero­
-resumo que possibilita reduzir os dados a proporyoes mais facilmente inter­
pretaveis. Evidentemente, ao resumir os dados atraves do uso de estatisticas
descritivas, muita informayao ira necessariamente se perder, alem de ser
provavel a obtenyao de resultados distorcidos, a menos que eles sejam inter­
pretados com muita precauyao.

Em um seritido mais amplo, a Estatistica Descritiva pode ser inter­


pretada como uma funyao cujo objetivo e a observayao de fenomenos de
mesma natureza, a coleta de dados numericos referentes a esses fenomenos, a
organizayao e a classificayao <lesses dados observados e a sua apresentayao
atraves de graficos e tabelas, alem do calculo de coeficientes (estatisticas)
. que permitem descrever resumidamente OS fenomenos. Esse livro e dedicado
exclusivamente ao desenvolvimento da Estatistica Descritiva.

1.2.2. Estatlstica lndutiva ou lnferencia Estatrstica


A inferencia estatistica refere-se a um processo de generalizayao, a
partir de resultados particulares. Consiste em obter e generalizar conclilsoes, 15
ou seja, inferir propi:iedades para o todo com base na parte, 110 parl1c11l;ir.
A induyao estatfstica implica, pois, um raciocfnio muito mais complcxo
do que o que preside a Estatfstica Descritiva. Entretanto, bem comprccndida
e utilizada, pode converter-se em um instrumento muito importantc par11 o

desenvolvimento de uma disciplina cientifica.

0 processo de generalizaylio, que e caracteristico do metodo indutivo,


esta associado a uma margem de incerteza. A existencia da incerteza deve-se
ao fato de que a concluslio, que se pretende obter para o conjunto de todos
os individuos analisados quanto a determinadas caracteristicas comuns,
baseia-se em uma parcela do total de observayoes. A medida da incerteza e
tratada mediante tecnicas e metodos que se fundamentam na Teoria da
Probabilidade.

1.3. 0 ESTATISTICO
Ha diferentes acepyoes para a palavra "estatistico". 0 estatistico pode
ser alguma pessoa que desenvolva funcroes oficiais. utilizando-se de dados
oficiais. Por outro lado, 'o estatistico pode ser um analista especializado em
metodologia .estatistica, utilizando-se dela para desenvolver o trabalho de
coleta, analise e tabulacrlio de dados numericos. Finalmente, o termo pode
referir-se a um especialista que utiliza a matematica superior para desen­
volver novas e poderosos metodos de ·anaJ.ise de dados quantitativos, como
base para tomar decisoos. Os estatisticos slio sempre necessarios, qualquer
que seja o nivel em que desempenham suas atividades.

1.4. POPULACAO E AMOSTRA

Dois conceitos utilizados largamente em Estatistica slio populaylio ou


universo estatistico e amostra.

1.4.1. Populac;io ou Universo Estat(stico


0 conjunto da totalidade dos individuos sobre o qual se faz uma
inferencia recebe o nome de populacrlio ou universo. A populaylio congrega
todas as observayoes que sejaril. relevantes para o estudo de uma ou mais
caracterfsticas dos indivfduos, os quais podem ser concebidos tanto como
seres animados ou inanimados. Em linguagem mais formal, a populai;lio e o
conjunto constitufdo por todos os individuos que apresentem pelo menos
uma caracterfstica comum, cujo comportamento interessa analisar (inferir).
Assim sendo, o objetivo das generalizayoes estatisticas (induylio estatistica)
esta em dizer-se algo acerca de diversas caracterfsticas da populai;lio estudada,
com base em fatos conhecidos. Essas caracteristicas da populaylio slio comu­
mente chamadas de parametros, os quais slio valores fixos e ordinariamente
desconhecidos.

Se se quiser realizar um estudo censitario das rendas das famflias,


16 poderia existir uma observaylio para cada famflia no Brasil.
Admitindo-se que cada uma dessas observayoes mede, sem erro, a renda
de uma famflia, nenhuma observayao adicional concebivel esclareceria mais
alguma coisa sobre as rendas das familias. Este conjunto, esta cole�ao de
observayoes, constituiria a populayao, ou seja, representaria todas as observa­
yOeS possiveis relativas ao assunto, que e a caracteristica que se pretende estu­
dar. Poder-se-ia limitar a popula9ao apenas ao Estado de Sao Paulo. Agora, o 1
estudo censitario das rendas das fam11ias abrangeria apenas aquele Estado.
'

E importante ficar bem claro que uma populayaO e estudada em termos


de observa9oes de caracteristicas nos individuos, e nao em termos de pessoas
ou objetos em si. Assim, por exemplo, as alturas dos cidadaos do Brasil cons­
tituem uma popula9ao. Poderia haver uma populayao correspondente aos
pesos desses mesmos cidadaos.

Quanto ao numero de elementos, a populayao pode ser finita ou infi­


nita. A primeira e aquela que apresenta um numero limitado de individuos.
Muitas vezes, entretanto, o numero de observa9oes e infinito. A populayao
sera, entao, infinita. Esta ultima normalmente esta associada a processos.
Assim, se um tecnico de laborat6rio quisesse pesar um certo material, por
maior que fosse o cuidado na experimentayao ele poderia, em cada pesagem,
obter uma leitura de certo modo diferente. Qualquer numero de observa9oes
que ele realizasse nao constituiria uma popula9ao completa, pois os resul­
tados poderiam nao ser uniformes. 0 processo de pesagem poderia, desta
forma, continuar indefinidamente, prevalecendo as condiyoes basicas do
experimento. 0 numero de tais medi9oes (observa9oes) tenderia a ser iilfi­
nito, dando origem a uma popula9ao infinita. Uma popula9ao infinita devera,
entao, ser concebida apenas como um esquema conceitual e te6rico.

1.4.2. Amostra

A amostra pode ser definida como um subconjunto, uma parte sele­


cionada da totalidade de observa9oes abrangidas pela popula9ao, atraves da
qual se faz um juizo ou inferencia sobre as caracteristicas da populayao.
As caracteristicas da amostra sao chamadas de estatisticas (descritivas), sendo
simbolizadas por caracteres latinos, enquanto que os parametros da popu­
la9ao terao como simbolos, via de regra, os caracteres gregos. Nesse texto, a
preocupayao seni, portanto, a de descri9ao da amostra atraves da comumente
chamada Estatistica Descritiva.

Suponha-se, para exemplificar, que se pretenda conhecer o conteudo de


ferro natural a ser exportado por um navio. 0 agregado ou populayao
consiste em todo o minerio de ferro a ser exportado por esse navio. Parte do
minerio e examinada, a fim de determinar seu teor de ferro, com o objetivo
de tirar uma conclusao a respeito do teor de ferro natural do embarque
completo. A parte de mineral selecionado constitui a amostra do embarque.
Uma vez que se fara inferencia sobre todo o minerio embarcado a partir de 17
apenas Utna pOryaO dele, a base do proceSSO e a infonnayao incompleta OU
de amostra.

1.5. FENOMENOS ESTATISTICOS


0 fenomeno em estatistica relaciona-se com qualquer evento que se
pretenda analisar, cujo estudo seja passivel da aplicayao da tecnica estatistica.
A Estatfstica dedica-se ao estudo dos fenomenos de massa, que sao resul­
tantes do concurso de um grande numero de causas, total ou parcialmente
desconhecidas, que serao chamadas de "fenomenos estatisticos".

E possivel nao se conhecerem exatamente as causas subjacentes aos


fenomenos, pois pode-se estuda-los atraves de suas manifestayoes, desco­
brindo-se neles alguns aspectos globais, sem remontar a essas causas. 0 que
caracteriza tais fenomenos (sociais, biol6gicos etc.) e o fato de serem eles
provenientes de um concurso de causas nem sempre totalmente conhecidas
pelo analista.

Os fenomenos classificam-se em tres tipos:

1.5.1. Fenomenos Coletivos ou Fenomenos de M assa


Os fenomenos coletivos sao aqueles que nao podem ser definidos por
uma simples observayao. A natalidade, a mortalidade, a nupcialidade, o preyo
medio de veiculos usados, vendidos diariamente em uma grande cidade,
'
sao fenomenos coletivos.
1.5.2. Feoomenos lndividuais ou Particulares
-OS fenomenos individuais sao aqueles que irao compor os fenomenos .
coletivos. Cada nascimento, cada individuo que morre, cada casamento que
ocorre, cada veiculo usado que se vende diariamente em uma grande cidade,
sao fenomenos individuais.

1.5.3 Fenomenos de Multidio


Os fenomenos de multidao distinguem-se dos fenomenos coletivos pelo
fato de as caracteristicas observadas para a massa nao se verificarem para o
particular, para o individuo isoladamente.

De acordo com a forma como se manifestam, os fenomenos podem ser


classificados sob dois aspectos:

a) Fenomenos Tipicos
Os fenomenos tipicos sao aqueles que se manifestam de forma regular,
revelando um comportamento definido.

b) Fenbmenos Atipicos
Os fenomenos atipicos referem-se aqueles fenomenos cuja manifestayao
se da atraves de um comportamento irregular, nao revelando uma tendencia
18 definida.
1.6. ATRIBUTO E VARIAVEL

Embora na grande maioria dos problemas estatisticos os dados sejam


de natureza quantitativa, isto nem sempre acontece. Os dados muitas vezes
se apresentam sob o aspecto qualitativo. Por essa razao, costumam-se dividir
os dados estatisticos segundo dois aspectos:

1.6.1. Presen(:CI ou Ausencia de um Atributo

0 observador podera limitar-se a notar a presenya ou ausencia de um


atributo em uma serie de individuos, e contar o numero dos que o possuem
e o dos que dele carecem. Seria possivel, por exemplo, classificar individuos
segundo o sexo. Haveria, entlio, duas classes distintas de dados observados:
uma classe representando os individuos de sexo masculino e outra os de sexo
feminino. Ve-se claramente, atraves do exemplo, que a variayao nlio e quanti­
tativa. Costuma-se estabelecer uma correspondencia entre os resultados
possiveis e numeros, de modo a se ter sempre um carater numerico associado
a observayliO estatistica.

Quando os dados estatisticos apresentam um carater qualitativo, o


levantamento e os estudos necessarios ao tratamento desses dados slio
designados genericamente como estatistica de atributo. Considera-se um
carater como qualitativo quando as modalidades que o comp0em formam
um conjunto amorfo, nlio estruturado numericamente, ou seja, quando nlio
ha ligaylio entre essas modalidades, independentemente do fato de consti­
tuirem um conjunto completo.

Os atributos admitem dois tipos de classificaylio:

1. ClassificafiiO Dicotomica ou Dicotomia


Existe uma dicotomia quando cada classe em que o atributo e consi­
derado admite uma subdivislio em apenas duas subclasses. Por exemplo, a
classifica�ao dos individuos de uma localidade quanto ao sexo.

2. Classi[icafiio Mu/tip/a ou Policotomica


Ocorre uma policotomia quando cada classe se subdivide em mais de
duas subclasses. A classificaylio das pessoas segundo o estado civil e uma
policotomia.

1.6.2 Variavel
0 observador podera tambem anotar ou medir a intensidade efetiva de
um carater variavel em cada um dos objetos ou pessoas observadas. Pode, por
exemplo, registrar a idade das pessoas ao morrer, a estatura ou o peso dos indi­
vfduos, o rendimento das fam11ias em uma grande cidade, o numero de empre­
gados dispensados, por mes, em uma grande empresa e assim por diante.
Os resultados das observayoes serlio expressos sempre atraves de valores
numericos. Os dados sao de carater nitidamente quantitativo, e o conjunto 19
dos resultados possui uma estrutura numerica. Dir-se-a, entao, que se trata de
estatistica quantitativa ou estatistica de variavel.

1.7. VARIAVEL DESCONTiNUA OU DISCRETA E


VARIAVEL CONTfNUA
Tratando-se de estatistica de variavel, e possivel distinguir duas cate­
gorias de variavel: discreta, ou descontinua, e continua.

1.7.1. Variavel Discreta ou Oescontinua


Suponha que uma instituis:ao de ensino esteja interessada em saber
qual 0 numero de alunos presentes as aulas de um determinado professor' em
certo periodo da vida escolar. Se X simbolizar esse ntimero, entao X sera
uma variavel que s6 pode assumir valores inteiros, inclusive zero. Mais preci­
samente, diz-se que X sera uma variavel discreta quando a menor diferen9a
nao-nula entre dois valores possiveis dessa variavel for finita.

Deve-se notar que, teoricamente, X pode variar em todo o conjunto de


numeros inteiros racionais, e nao apenas inteiros positivos de zero a infinito.

Normalmente a variavel discreta resulta de contagem, razao pela qual


seus valores sao expressos atraves de nutneros inteiros nao-negativos.

1.7.2. Variavel Continua

Se X representar, por exemplo, o numero de metros percorridos por


um atleta durante certo periodo de tempo em uma pista circular, X nao sera
certamente uma variavel discreta. Agora, X pode assumir o valor de qualquer
numero real positivo, uma vez que para o calculo do comprimento da circun­
ferencia e necessario introduzir 0 numero real rr.

Formalmente, diz-se que X e uma variavel continua quando, ao passar


de um valor real a para outro valor b, assume todos os valores intermediarios
entre a e b. Assim sendo, pode-se dizer que a variavel continua resulta normal­
mente de mensura9ao, e a escala numerica .de seus possiveis valores corres­
ponde ao conjunto R dos numeros reais.

Para se fazer uma ideia concreta da variavel continua, basta pensar em


um filete de mercurio de um termometro com escala centigrada. Ao dilatar-se
o filete da temperatura a da escala para a b, ele passara por todas as tempe­
raturas intermediarias.

1.8. FASES DO METODO ESTATiSTICO (ESTATiSTICA DESCRITIVA)

Quando se pretende empreender um estudo estatistico completo,


existem diversas fases do trabalho que devem ser desenvolvidas para se chegar
aos resultados finais do estudo. Essas etapas ou opera9oes sao chamadas fases
20 do trabalho estatistico e sao de ambito da Estatistica Descritiva.
As fases principais sao as seguintes:
- Defini�ao do Problerna
- Planejamento
- Coleta dos Dados

- Apura�o dos Dados


- Apresenta�o dos Dados
- Analise e Interpreta�o de Dados

1.8.1. Defini�ao do Problema


A primeira fase do trabalho estatfstico consiste em uma defini9ao ou
formula�ao correta do problema a ser estudado. Alem de considerar detida­
mente o problema objeto do estudo, o analista devera examinar outros levan­
tamentos realizados no mesmo campo e analogos, uma vez que parte da
informa�ao de que necessita pode, muitas vezes, ser encontrada . nesses
ultimos. Um fabricante de sabonete, que deseja lan�ar um produto novo no
mercado, poderia estar interessado em um estudo sobre as caracteristicas dos
consumidores atuais. Nao havendo estudos. semelhantes, ele devera formular
o problema com base em sua pr6pria experiencia. Uma lista de fatores rele­
vantes devera resultar dessa investiga�o preliminar: numero de unidades
consumidas por familia em cada ano, numero medio de pessoas que compoe
cada familia, numero de membros adultos da familia, as marcas preferidas
e assim por diante. Saber exatamente aquilo que se pretende pesquisar e o
mesmo que definir corretamente o problema.

1.8.2. Planejamento
0 passo seguinte, ap6s a defini�ao do problema, compreende a fase do
planejamento, que consiste em se determinar o procedimento necessario para
resolver o problema e, em especial, coma levantar informa�oes sabre o
assunto objeto do estudo. Que dados deverao ser obtidos? Como se deve
obte-los? E preciso p/anejar o trabalho a ser realizado, tendo em vista o obje­
tivo que se pretende atingir.

Mais . especificamente, na fase do planejamento a preocupa�ao maior


reside na escolha das perguntas, bem como sua correta formula�ao, qualquer
que seja a modaiidade de coleta dos dados.

E nessa fase que sera escolhido o tipo de levantamento a ser utilizado.


Sob esse aspecto, pode haver dois tipos de levantamento:

1. levantamento censitario, quando a contagem for completa, abrangendo


todo o universo.

2. levantamento por amostragem, quando a contagem for parcial.

Outros elementos importantes que devem. ser tratados nessa mesma


fase sao o cronograma das atividades, atraves do qual sao fixados os prazos
para as varias fases, os custos envolvidos, o exame das informa�oes dispo-
21
niveis, o delineamento da amostra, a forma como serao escolhidos os dados
e assim por diante. Os livros mais especfficos sobre pesquisa de mercado
poderao ser consultados, caso o leitor tenha maior interesse ne�e assunto.

1.8.3. Coleta dos Dados

0 terceiro passo e essencialmente operacional, compreendendo a coleta


das informayoes propriamente ditas. Formalmente, a coleta de dados se refere
a obtenylio, reunilio e registro sistematico de dados, com um objetivo deter­
minado.
Antes de se tecer qualquer outra considerayao sobre esta fase do
metodo estatistico, convem estabelecer uma distinylio entre os dados estatis�
ticos.
Uma empresa, por exemplo, pode valer-se de·diversas fontes ao utilizar
os dados em seus trabalhos estatisticos. Assim, os seus registros contabeis
podem conter muitas informayoes uteis para outros fins, que nao meramente
o da avaliaylio do ativo, do passivo e do patrimonio, e a determinaylio dos
lucros e perdas. Os varios departamentos de uma organizaylio, no curso de
sua atividade normal, mantem igualmente registros de natureza estatistica.
Pode ocorrer, entretanto, que os registros da pr6pria empresa nao propor­
cionem toda a informaylio necessaria para resolver determinado problema.
Por exemplo, para se saber se uma queda nas vendas esta sendo experimen­
tada tambem por outras empresas do mesmo setor industrial em que opera,
a empresa nao ira recorrer simplesmente a seus registros internos. Podera
haver algum organismo especializado que reuna os dados e os distribua em
forma de publicayoes ou de qualquer outra maneira. De qualquer modo, os
registros internos nao serao suficientes nesta situaylio, necessitando a empresa
recorrer a fontes externas para obter as informayoes desejadas. Se a empresa
precisasse saber a opiniao dos consumidores sobre algum aspecto particular
do seu produto, um exame direto sobre eles seria recomendavel. E possivel,
pois, distinguir dois tipos de fontes externas, as quais darao origem a duas
especies de dados: dados primarios e dados secundarios.

Dados Primlirios
Os dados silo primarios quando slio publicados ou comunicados pela
pr6pria pessoa ou organizaylio que os haja recolhido.

Dados Secundirrios
Os dados slio secundarios quando sao publicados ou comunicados por
outra organizaylio.
Um conjunto de dados e, pois, primario ou secundario em relayao a
alguem. As tabelas do Censo Demografico slio fontes primanas. Quando
determinado jornal publica estatisticas extraidas de varias fontes e relacio­
nadas com diversos setores industriais, os dados slio secundarios para quern
22 desejar utilizar-se deles em alguma pesquisa que esteja desenvolvendo. Embora
muitas vezes possa ser conveniente recorrer a fontes secundarias, e mais
seguro trabalhar com fontes primarias, por varias razoes:

1. Uma fonte primana oferece, em geral, inform�ao mais detalhada do que


uma fonte secundaria.

2. E mais provavel que as defini�0es de termos e de unidades figurem somente


nas fontes primarias.

3. 0 uso da fonte secundaria traz o risco adicional 'de erros d� transcri�o.

4, Uma Conte primaria podera vir acompanhada de copias dos impressos


utilizados para coletar as informa�oes, juntamente com o procedi­
ritento adotado na pesquisa, a metodologia seguida e o tipo e tamanho
da amostra.

Essas informa�oos proporcionam ao usuario uma ideia do grau de


garantia que os dados oferecem.

A coleta de dados pode ser realizada de duas maneiras, direta ou indi­


retamente.

Coleta Direta
A coleta e direta quando e obtida diretamente da fonte, como no caso
da empresa que realiza uma pesquisa para saber a preferencia dos consumi­
dores pela sua marca.

Ha tres tipos de coleta direta:

a) Coleta Continua
b) Coleta Periodica
c) Coleta Ocasionill

A coleta de dados e continua quando estes sao obtidos ininterrupta­


meqte, automaticamente e na vigencia de um determinado periodo: um ano,
por exemplo. Os registros de nascimento, de casamento, de 6bito podem ser
considerados como uma forma de coleta direta continua.

A coleta de dados e peri6dica quando e realizada em perfodos curtos,


determinados, de tempos em tempos. 0 recenseamento demografico, a
cada dez anos, e o censo industrial, anualmente, sao exemplos de coleta
peri6dica.

A coleta de dados e ocasional quando os dados forem colhidos espora­


dicamente, atendendo a uma conjuntura qualquer ou a uma emergencia.
A coleta de casos fatais em um surto epidemico e o registro de pedidos de
um determinado artigo que uma grande empresa recebe em um dia de greve
sao fonnas de coleta ocasional.

Coleta Indireta
A Coleta dos dados e indireta quando e inferida a partir dos elementos
conseguidos pela coleta direta, ou atraves do. conhecimento de outros fenO- 23
menos que, de algum modo, estejam relacioriados com o fenomeno em
questao. E feita, portanto, por dedu90es e conjeturas, podendo ser realizada:
a) Por analogia
b) Por proporcionaliza�ao
c) Por indfoios
d) Por avalia�iio

A coleta de dados e feita por analogia quando o conhecimento de um


fenomeno e induzido a partir de outro que com ele guarda rela96es de
casualidade.
A coleta de dados e feita por proporcionaliza9ao, quando o conheci­
mento de um fato se induz das condi96es quantitativas de uma parte dele.

A coleta por indicios se da quando sao escolhidos fenomenos sintoma­


ticos para discutir um aspecto geral da vida social.

A coleta e feita por avaliayao quando, atraves de informa96es fide­


dignas ou estimativas cadastrais, se presume o estado quantitativo de um
fenomeno.

1.8.4. Apura�io dos Dados

Antes de come9ar a analisar os dados, e conveniente que lhes seja dado


algum tratamento previo, a fim de torna-los mais expressivos. A quarta etapa
do processo e, entao, a da apura9ao ou sumariza9ao, que consiste em resumir
os dados, atraves de sua contagem e agrupamento. E um trabalho de conden­
sa9ao e de tabula9ao dos dados, que chegam ao analista de forma desorgani­
zada, tornando impossivel a tarefa de apreender todo o seu significado pela
simples leitura.

Hli varias formas de se fazer a apura9ao, dependendo das necessidades


e dos recursos disponiveis do interessado: manual, mecanica, eletromecanica
ou eletronica.

A apurayao e manual quando nao recorre a qualquer maquina para ser


realizada. Quando a apurayao for feita com o auxilio de maquinas mecdnicas,
como as de somar e de calcular, comuns em qualquer escrit6rio, ela seni
meciinica.

A apurayao eletromecdnica e realizada com maquinas que diferem das


itnteriores pelo fato de suas engrenagens internas serem movidas a energia
eletrica. Finalmente, as maquinas eletronicas dao origem ao Ultimo tipo de
apura9ao. Essas maquinas efetuam as opera96es atraves de impulsos eletricos,
dispensando qualquer tipo de engrenagem, o que lhes confere uma velocidade
infinitamente maior que a das anteriores.

Por conseguinte, atraves da apurayao, tem-se a oportunidade de con­


densar os dados, de modo a obter um conjunto compacto de numeros, o
qual possibilita distinguir melhor o comportamento do fenomeno na sua
24 totalidade.
Entretanto, a contrapartida da melhor aprecia�ao dos dados em seu
conjunto e a perda correspondente de detalhes, uma vez que se trata de um
processo de sintetiza�ao.

1.8.5. Apresenta�iio dos Dados


A apresenta�ao ou exposic;ao dos dados observados constitui a quint�
fase do metodo estatlstico.

Ha duas formas de apresentac;ao, que naci se excluem mutuamente:

1. Apresenta�ao Tabular
A apresentac;ao tabular e uma apresentac;ao numerica dos dados. Con­
siste em dispor os dados em linhas e colunas distribuidas de modo ordenado,
segundo algumas regras praticas adotadas pelos diversos sistemas estatfsticos.
As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de
Estatistica. Tais regras acham-se publicadas e dispoom sobre os elementos
essenciais e complementares da tabela, a especificac;ao dos dados e dos sinais
convencionais, o procedimento correto a ser desenvolvido no preenchimento
da tabela e outros dispositivos importantes. 0 leitor que estiver interessado
podera adquirir essas normas junto a qualquer agencia do IBGE, uma vez que
nlfo e o objetivo desse livro entrar nesses pormenores. As tabelas tern a van­
tagem de conseguir expor, sinteticamente e em um s6 local, os resultados
sobre determinado assunto, de modo a se obter uma vislfo global mais rapida
daquilo que se pretende analisar.

De maneira mais formal, define-se como tabela a disposic;ao escrita que


se obtem, fazencio-se referir uma colec;ao de dados numericos a uma deter­
minada ordem de classificac;ao.

2. Apresenta¢o Grd[ica
A apresentaylfo grafica dos dadosnumericos constitui uma apresentac;ao
geometrica. Embora a apresentac;ao tabular seja de extrema importancia; no
sentido de facilitar a analise numerica dos dados, nlfo permite ao analista
obter uma visao tlfo rapida, facil e clara do fenomeno e sua variac;ao como a
conseguida atraves de um grafico. No Capitulo 3, serlfo desenvolvidos os
diversos tipos de graficos e sua utilizac;ao.

1.8.6. Analise e lnterpreta�lo dos Dados

A ultima fase do trabalho estatistico e a mais importante e tambem a


mais delicada. Nesta etapa, o interesse maior reside em tirar conclusoes que
auxiliem o pesquisador a resolver seu problema. A analise dos dados esta­
tisticos esta ligada essencialmente ao calculo de medidas, cuja finalidade
principale descrever o fenomeno. Assim, o conjunto de dados a ser analisado
pode ser expresso por numeros-resumos, as estatisticas, que evi,denciam 25
caracteristicas particulares desse conjunto. 0 significado exato de cada um
dos valores obtidos atraves do calculo das varias medidas estatisticas dispo­
niveis deve ser hem interpretado. E possivel mesmo, nesta fase, arriscar
algumas generalizar;oes, as quais envolverao, naturalmente, algum grau de
incerteza, porque nao se pode estar seguro de que o que foi constatado para
aquele conjunto de dados (a amostra) se verificara igualmente para a popu­
lar;ao. 0 processo de generalizar;ao, como afirmado anteriormente, esta alein
do escopo deste livro, constituindo um campo mais avanr;ado da Estatistica,
que e 0 da Estatfstica Indutiva OU lnferencia Estatistica.

1.9. AS SERIES ESTATISTICAS

Uma vez coletados OS dados, nao e conveniente apresenta-los para ana­


lise, sob a forma a que se chegou pela simples apurayao. Muitas vezes o con­
junto de valores e extenso e desorganizado, e seu exame requer maior
atenr;ao. Alem disso, com_o ja foi salientado, ha o perigo de se perder a visao
global do fenomeno analisado, quando a lista de dados for extensa e desor­
denada.

Por outro lado, se a lista original de valores puder ser apresentada de


uma forma mais simples· e compacta, havera menor dificuldade em interpretar
os dados e trabalhar com eles. Reunindo, pois, os valor,es em tabelas com­
pactas, consegue-se apresenta-los e descrever-lhes a varutr;ao mais eficiente­
mente. Essa condensayao dos valores permite ainda a utilizar;ao de represen­
tar;ao grafica, que normalmente representa uma forma mais util e elegante
de apresentar;ao da caracteristica analisada. Enfim, qualquer processo de
representar;ao que contribua para proporcionar uma visao mais sintetica do
fenomeno estudado, sem tirar-lhe a precisao primitiva, contribuira igualmente
para facilitar e encaminhar qualquer desses estudos, quer seja o de caracteri­
zayao de um conjunto, o de comparayao com outros semelhantes ou ainda o
de previsao de valores possiveis. E o caso, por exemplo, da serie estatistica.

Uma serie estatistica define-se como toda e qualquer coler;ao de dados


estatisticos referidos a uma mesma ordem de classificayao: quantitativa. No
sentido mais amplo, serie e uma sucessao de numeros referidos a qualquer
variavel. Se OS n\.tmeros expressarem dados estatisticos, a serie sera chamada
de serie estatfstica. Em sentido mais estreito, pode-se dizer que uma serie
estatistica e uma sucessao de dados estatisticos referidos a caracteres quali­
tativos, ao passo que uma sucessao de dados estatisticos referidos a caracteres
quantitativos configurara uma seria�ao. Em outros termos, a palavra serie e
usada normalmente para designar �m conjunto de dados dispostos de acordo
com um carater variavel, residindo a qualidade serial na disposir;ao desses
valores, e nao em uma disposiyao temporal ou espacial de individuos. Para
diferenciar uma serie estatistica de outra, ha que se levar em conta, entao,
26 os tres caracteres presentes na tabela que as apresenta:
- A Epoca (fator temporal ou cronologico) a que se refere o fenomeno analisado.
- 0 Local (fator espacial ou geogr.ifico) onde o fenomeno acontece.
- 0 Fenomeno (especie do fato OU fator especificativo) que e descrito.

As series estatisticas podem ser de quatro tipos, conforme varie um


desses caracteres ou fatores. Embora seja a variayao desses elementos a
caracteristica diferenciadora das series, costuma-se d ividi-las em dois grupos�
0 das series hom6gradas e 0 das heter6gradas.

1.9.1. Serie Homograda

Serie homograda e aquela em que a variavel descrita apresenta variayao


discreta OU descontinua. Sao series hom6gradas a serie temporal, a serie
geografica e a sene especifica.

1.9.2. Serie Heterograda

A serie heterograda e aquela na qual 0 fenomeno OU 0 fato apresenta


gradayoes ou subdivis.Oes. Embora fixo, o fenomeno varia em intensidade.
A distdbuiyiiO de freqiiencias OU seriayiiO e uma sene heterograda.

1.9.3. Os Ouatro Tipos de series Estatfsticas

As series estatisticas, conforme visto, diferenciam-se de acordo com a


variayiiO de um desses tres elementos: epoca, local, fato.

1. Serie Temporal
A Serie temporal, igualmente chamada serie cronol6gica, serie historica,
serie evolutiva ou marcha, identifica-se pelo carater variavel do fator crono­
logico. Assim, deve-se ter:

a) Elemento Variavel: epoca (fator cronol6gico)


b) Elementos Fixos: local (fator geografico)
fenomeno (fator especificativo)

Exemplo: 0 diretor de marketing da empresa G.L.T. S.A., fabricante de


componentes eletronicos, deseja examinar a evolu�iio de suas vendas em
1975, mes a mes. Para tanto, solicitou ao Departamento de Analise de
Mercado a tabela da qua! constam os valores de vendas no perlodo desejado
(Tabela 1.1 ).

Como pode ser observado, o unico carater variavel e o tempo, aqui


representado pelos meses.

Da mesma forma, os valores sucessivos apresentados pelo censo demo­


grafico de uma cidade formariio a marcha da populayiio dessa cidade.

2. Serie Geogrtifica
Tambem denominada serie territorial, sene espacial OU Serie de locali­
zayiiO, a serie geografica apresenta como elemento ou carater variavel
somente o fator geografico. Assim: 27
a) Elemento Variavel: local (fator geognifico)
b) Elemenfos Fixos: epoca (fator cronol6gico)
fenomeno (fa tor especificativo)

TABELA 1.1 - G.L.T. S.A. - I NDUSTRIA DE COMPONENTES ELETRONICOS


Vandas - Mercado lnterno - 1975

Meses Vendas (em mi/hares de cruzeiros)

Janeiro 2300
Fevereiro . . . . . . . . . . . . . . . . . • 1 800
Man;:o . . . . • . . . . . . . . . . . . . . . 2 200
Abril . . • . . . . . . . • . . • . . . . • . . 2 210
Maio . . . . . . . . • • . • . • . . • . . . • 2360
Jun ho . . • • . . . . . . . . • . . . • . . . 2600
Jul ho . . . . . . • . . . • . . • . • . . . . 2690
Agosto ................... . 3 050
Setembro . . . • . . . . . . . . . . . . . . 3 500
Ou tu bro .................. . 344 0
Novembro . • • . . · . . . . . . . . . . . . . 3 100
Dezembro . . . .. . • . • . . . . . . . . . . 2 760

TOTAL ANUAL . . . . . . . . . • . . . . 31.510

Fonte: Departamento de Analise de Mercado.

Se o diretor de marketing da G.L.T. S A desejar saber, agora, o com­


. .

portamento das vendas dessa empresa efetuadas nos varios Estados do Brasil,
durante o exercicio fiscal de 1975, o fator diferenciador das vendas seria o
geografico.

A tabela correspondente ficaria assim:

TABELA 1.2 - G.L.T. S.A. - I NDUSTRIA DE COMPONENTES ELETRONICOS


Vendes por Unidade da Federat;lio - 1975
·

Unidades da Federa�5o Vendas (em mi/hares de cruzeiros)

Minas Gerais . • . •
.
. . . . . . . . • . . • 4.000
Parana . . . . . . . . . . . . . . . . . • . • 2.230
Rio Grande do Sul . . • . • . • • . . • . 6.470
Rio de Janeiro . . • • • • .· • • . • . . . . 8.300
Sio Paulo . • . • • • • • •_ • . • . . . . • . 10.090
Outros • . . . . . . . . . . . . . . . . . . . 420

TOTAL - BRASIL • . . . • • . . . . • • 31.510

28 Fonte: Departamento de Analise de Mercado.


3. Serie Especifica
A serie especffica recebe tambem outras denominay6es: serie cate­
g6rica OU serie por categoria. Agora, 0 carater variavel e 0 fenomeno.
a) Elementu Variavel: fenomeno (fator especificativo)
b) Elementos Fixos: epoca (fator cronologico)
.local (fator geogr3fico)

Suponha que o diretor de marketing esteja agora interessado em.


conhecer o comportamento das vendas de cada um de seus produtos, os
quais foram agrupados em tres categorias ou linhas, dada a grande variedade
de componentes fabricados pela empresa. A tabela contendo essas infor­
mayoes representaria uma serie especifica.

Os dados da Tabela 1.3 revelam que cinquenta por cento do fatura­


mento da empresa G.L.T. S.A. sao representados pelos produtos da linha C.
Esse fato revela a importancia de urna tabela, como forma de apresentayao
sintetica e elegante dos valores representativos de um fenomeno qualquer.

Os tres tipos de serie apresentados constituem exemplos de series


hom6gradas.

TABELA 1.3 - G.L.T. S.A. - INPUSTRIA DE COMPONENTES ELETRONICOS


Vendas por Linha de Produto - 1975

Linha do Produto Vendas (em mi/hares de cruzeiros)

Linha A . . . . . . . . . . . . . . . . . • . 6.450

Linha B . . . . • . • • . • . • . . • . • . • 9.310

Linha C . . . • • • . . . • • • . . . • • . • 15,750

TODOS OS PRODUTOS . . . . . . . . • 31.510

Fonte: Oepartamento de Analise de Mercado.

4. Distribuifffo de Freqilencias - Seriafiio


As distribuiyoes de frequencias OU distribuiyoes por frequencias sao
series heter6gradas. Neste caso, todos OS elementos - epoca, local e fenO­
meno - sao fixos. Embora fixo, o fenomeno ou fator especificativo
apresenta-se agora atraves de grada9oes, isto e, OS dados referentes ao fen(>.
meno que se esta representando sao reunidos de acordo com sua magnitude.
Normalmente, os problemas de tabula9ao sao enquadrados nesse tipo de serie.

Nas distribui9oes de frequencias, os dados estatisticos sao dispostos


ordenadamente em linhas e colunas, de modo a permitir sua leitura nos
sentidos horizontal e vertical. Na tabela resultante desse procedimento, sao
fixos a epoca, o local e o fenomeno, estando os dados agrupados de acordo
com a intensidade ou varia9ao quantitativa do fenomeno. 29
TABELA 1.4

Numero de Empregados das Virias Cla- de Salirios


no Estado de Sio Paulo - 1968

Classes de SaltJrios (Cr$) Numero de Empregados.

At4! 80 . • • . . . . . . . . . • . . . • . . . . . 41 326
De 80 a 119 • . . . • . • . . • . . . . . . . . 123 236

De 120 a 159 . . • . • . . . • . • . • . . . . 428 904


De 160 a 199 324 437

De 200 a 399 787 304

De 400 a 599 266 002

De 600 a 799 102 375

De 800 a 999 56 170

1.000 e mais . . . . • . • . • . • • • • • . • • 103.788

TOTAL . . . • • • . • . • • . . . . . • . • . . 2 233 542

Fonte: Servico de Estatfstica da Previctencia e Trabalho.

Um exemplo de distribuiyao de freqtiencias encontra-se na Tabela 1.4,


que descreve os salarios no Estado de Sao Paulo em 1968, classificados e
distribuidos Conforme O numero de empregados.
Esta tabela apresenta o numero de empregados que percebiam, na
epoca, um salario que estivesse incluido em uma dessas classes ou faixas
salariais. Da mesma forma, seria possivel agrupar as vendas da empresa
G.L.T. S.A. em classes de faturamento e analisar o numero de meses em
que se verificaram os varios faturamentos incluidos nas diferentes classes
(Tabela 1.5).

TABELA 1.5 - G.L.T. S.A. - INDUSTRIA DE EQUIPAMENTOS ELETRONICOS

Numero de Meses Segundo o Faturamento

Vendas (em mi/hares de cruzeiros) Numero de Me1es

De 1.800 a 2.199 . . • • • • • • • • • • • • • • • • • 1

2.200 a 2.599 • • • • . • . • • • • . • • . . • . . 4

2.600 & 2.999 . • • . . . • • • • , . • • • • • . • 3

3.000 a 3.399 • • . • . . • • • • • • • • • . • • . 2

3.400 a 3. 799 . • • . • • • • • • • • • . • . • . • 2

TOTAL DE MESES • . • • • • • • . • • • . . . • . . 12

Fonte: Departamento de Anlilise de Mercado.

0 processo de construyao das tabelas representativas de uma distri-


30 buiirao de freqtiencias sera visto mais adiante.
1.9.4. Tabelas de Dupla Entrada

As tabelas apresentadas ate o presente sao tabelas estat(sticas simples,


as quais siio formadas por uma coluna indicadora (coluna matriz), onde
siio inscritos os valores ou as modalidades. classificadas, e por outra coluna
onde se inserem as ocorrencias ou as intensidades do fenomeno analisado.

E comum, todavia, haver necessidade de apresentar, em uma (mica


tabela, mais do que uma serie. Quando as series aparecerem conjugadas,
tem-se uma tabela de dupla entrada. Essa tabela e apropriada, portanto, a
apresentayiio das distribuiy5es a dois atributos, havendo duas ordens de
classificayiio: uma horizontal (linha) e outra vertical (coluna).A Tabela 1.6
apresenta uma tabela de dupla entrada, onde estiio conjugados dois tipos de
serie: temporal e especffica.

TABELA 1.6
Populai;:io Economicamente Ativa por Setor de Atividade - Brasil

Popula�io (1 000 hab.)


Setor
1940 1950 1960

Primario ................... 8968 10 255 1 2 163


Secundario ...... . . .. ..... . . 1 414 2 34'7 2962
Terciario ..... ... . . . .. ..... 3620 4 516 7 525

Fonte: IPEA.

Cada linha, encabeyada pela designayiio do setor - "primario'', "secun­


dario" e "terciario" -, constitui uma serie temporal. Por outr<? lado, cada
coluna encabeyada pelos anos - 1940, 19 50, 1960 - representa uma serie
especifica.0 resultado e uma serie especifico-temporal.

Ja na Tabela 1. 7 estiio conjugadas as series geografica e temporal,


resultando na serie geografico-temporal.

TABELA 1.7
Produi;:io Brasileira de Borracha

Produ�io
Unidade de Produf6o
1937 1938 1939

Acre .. .. .... .... . .... .... 500 7 4 765 4 7 27


Amazonas .................. 6 858 599 8 5631
Para . . . .... .. . ... . . .... .. 4.945 4 223 4500
Mato Grosso .... ... . .. .. .... 1 327 1 285 1 235
Outros Estados . • . . . . . • . .... .. 333 539 337

Fonte: Anuario Estatfstico do Brasil - IBGE. 31


Finalmente, convem lembrar que nem sempre uma tabela representa
uma serie estatistica. Por vezes, os dados reunidos niio revelam uniformidade,
sendo meramente um aglomerado de informayoes gerais sobre determinado
assunto, as quais, embora uteis, nao apresentam a consistencia nccessaria para
se configurar uma serie estatistica. Veja-se, por exemplo, a Tabela 1.8.

TABELA 1.8
Situ�io dos Espetllculos Cinematogrilficos no Brasil - 1967

Especificaf:fio Dados Numericos

Numero de cinemas 2 488


Lotai;:ao dos cinemas 1722348
Sessoes por dia . ..... .. .... ... .. .... .
. 3 933
Filmes de longa metragem ..... . ..... . ... . 131330488
Meia entrada . .. .... .. ..... .......... 89 581 234

Fonte: Anuario Estatfstico do Brasil - IBGE.

1.10. PROPORCAO, RAZAO E PORCENTAGEM

Apesar de as noyoes de propor9ao, razao e porcentagem serem mais


propriamente alocadas em textos de matematica, sera Util discutir breve­
mente aqui estes termos e a distinyao existente entre eles.Do ponto de vista
estatistico, elas podem ser consideradas como medidas muito simples, mas
que permitem estabelecer comparay6es entre diversos grupos.

1.10.1. Propor�o

Um certo numero de pessoas foi classificado em quatro categorias.


Essas categorias sao, naturalmente, mutuamente exclusivas e exaustivas.
Em outras palavras: uma pessoa s6 podera estar incluida em uma unica
categoria, e todas elas deverao estar classificadas.

Em termos simb6licos, pode-se escrever:


N1 = numero de pessoas incluidas na categoria l
N numero de pessoas incluidas na categoria 2
2
=

N3 = numero de pessoas incluidas na categoria 3


N4 = numero de pessoas incluidas na categoria 4
N = N I + N2 + N 3 + N 4 = numero total de pessoas consideradas.

Neste caso, a proporriio de pessoas pertencentes a primeira categoria


N1
e determinada mediante 0 calculo do seguinte quociente: - ; para as
N
N
2
demais categorias, a determinayao segue o mesmo procedimento: -- ,
N

32
; , ; . Parece 6bvio que o valor de uma proporyao nao pode exceder
N N
a unidade, e que a soma de todas as propor�OeS sera sempre igual a unidade.
Assim,

Ni N2 N� N4 N
+- +-+-=-=1
N N N N N

Dessa forma, a proporriio de individuos em uma dada categoria e •

definida atraves do quociente entre o nfunero de individuos pertencentes a '


essa categoria e o numero total de individuos considerados, devendo as
categorias ser mutuamente exclusivas e exaustivas.

0 emprego das propor�0es sera ilustrado com os valores apresentados


na Tabela 1.9.

TABELA 1.9.
N6mero de Sbcios Praticantes e Nio-Praticantes de Futebol
em Dois Clubes Hipotfrticos

S6cios Club6 1 Clube 2

Praticantes (exclusivamentel de:


Futebol de saliio . . . . . . • . . . . ... 580 680
Futebol de campo . . . . . • . . . . . . . 430 1 369
Niio-Praticantes . . • . . • . . . . . • . . . 4810 10 811

TOTAL . . . . . . . . . . . . . . .. . . . . . 5820 12 860

Nao e tao simples, raciocinando-se em termos absolutos, dizer qual


dos dais clubes conta com maior numero de adeptos de futebol em suas
duas modalidades, porque o numero de associados difere muito de um
clube para outro.Par outro lado, a compara�ao direta pode ser estabelecida
rapidamente, se os dados forem expressos em propor�0es. Veja-se, par
exemplo, a Tabela 1.10.

A propor�ao de praticantes de futebol de salao e, no clube 1, de


580 680
, ou 0,100; no clube 2, de , ou 0,053.Se forem comparados,
5.820 12 860
em tennos relativos, os praticantes de futebol, consideradas as duas moda­
lidades, verificar-se-a que os valores sao muito proximos em ambos os
clubes. Por outro lado, o segundo clube apresenta uma propor�o inferior
de adeptos de futebol de salao e superior de adeptos de futebol de campo
(Tabela 1.11 ).

Se o interesse estivesse em saber a propor�lio de praticantes de futebol


de salao entre os associados adeptos de futebol, o denominador do quo­
ciente que forneceria essa infonna�ao deveria ser igual ao numero total de
praticantes de futebol. 33
TABELA 1.10
Propo�lo de Sbcios Praticantes e Nlo-Praticantes de Futebol
em Dois Clubes Hipot6ticos

S6cios Clube 1 Clube 2

Praticantes (exclusivamentel de:

Futebol de sallo .............. 0,100 0,053


Futebol de campo ............. 0,074 0,106
Nlo-Praticantes .. .. .. . . . . .. .. . 0,826 0,841

TOTAL .. .... . . . ... . . . .. .... 1,000 1,000

TABELA 1.11

Clube 1 Clube 2

Propon;:lo dos praticantes de:

Futebol de salfo ......... , ... 0,100 0,053


Futebol de campo ............ 0,074 0,106

TOTAL .. . . . . .. .. .. . . .. . . ... 0,174 0,159

TABELA 1.12

Clube 1 Clube 2

Praticantes de futebol . . .. . . .. 1 010 2049

de futebol
Propor�o de praticantes
580 680
de salfo .............. . = 0 574
• = 0' 332
1 010 2049

1.10.2. Porcentagem

As porcentagens sao obtidas a partir do calculo das proporyoes, sim·


plesmente multiplicando-se o quociente obtido por 100. 0 raciocinio, em
termos de porcentagem, devera ser conduzido como se se estivesse calcu­
lando o numero de indivfduos que estaria incluido em uma determinada
categoria se o numero total de individuos fosse igual a 100. Porcentagem
significa, portanto, "por cem".A soma das proporyoes e igual a 1, e a soma
das porcentagens e sempre igual a 100, a menos que as categorias nao sejam
mutuamente exclusivas e exaustivas.

As porcentagens sao mais usadas do que as proporyoes para repro­


duzir resultados. Os valores constantes da Tabela 1.10 poderiam perfeita-
34 mente ser expressos em porcentagem.
TABELA 1.13
Porcentagem de Sbcios Praticantes e Nio-Praticantes de Futebol
em Dois Clubes Hipotltticos

Clube 1 Clube 2
S6cios
Numero % Numero %

Praticantes (exclusivamentel de:


Futebol de salao . . . . . . . . . . . . . 580 10,0 680 5,3
Futebol de campo .......... . . 430 7.4 1 369 10,6
Nfo-Praticantes . . . .. . . . . . . . . . . . 4 810 82,6 10 811 84,1

TOTAL . . . . . . . . . . . . .. . . . . . . . 5 820 100,0 12 860 100,0

Normalmente, as porcentagens sao arredondadas ate a primeira casa


decimal, ajustando-se os Ultimos dlgitos, de modo que o total seja igual a
100. 0 emprego de porcentagens requer que o numero total de casos
seja suficientemente grande, evitando assim que sejam cometidas inter­
pretayoes equivocadas.

Ha algumas regras gerais importantes, que orientam o emprego das


porcentagens e das propory6es:

1. Deve-se sempre indicar o numero de casos juntamente com as porcentagens


ou as propor�oes.

2. Nao se deve calcular uma porcentagem a menos que o numero que serve
de base para 0 calculo esteja proximo de so OU mais. Se 0 numero de
casos for muito pequeno, e prefer{vel in�car 0 numero efetivo deles, sem
recorrer as porcentagens.

3. Para determinar 0 numero de indiv{duos pertencentes a uma determinada


categoria a partir do total de indiv{duos, basta multiplicar esse total pela
propor�ao dos indiv{duos na categoria. Assim, se o clube 1 tivesse
8 000 socios e fosse sabido que a propor�iio de praticantes de futebol
de salao e de 0,054, 0 numero desses praticantes seria de 8 000 x 0,054 =

= 432. Empregando·se porcentagem, chegar-se-ia ao mesmo resultado:


Total de s6cios: 8 000
Porcentagem de praticantes de futebol de saliio: 5,4%

Numero de praticantes de futebol de salao:


� � 5•4
8 OO
= 432
O

4. As porcentagens e propor�es tern por finalidade principal, em Estatistica,


estabelecer compara�oes relativas. As vendas de duas emprcsas foram as
seguintes nos dois anos comparados:

TABELA 1.14

Faturamento (1.000 cruzeiros) Aumen to


Aumen to
Empresa relativo
absoluto
1974 1975 (percentual) %

A 2.000 3.000 1.000 50


B 20.000 25.000 5.000 25
35
Em termos absolutos, a empresa B teve um aumento de faturamento
superior ao da empresa A. Entretanto, se a compara-rao for efetuada em
termos relativos, a empresa A apresentara um desempenho hem superior: a
porcentagem de aumento de faturamento da empresa A foi 50%, contra
apenas 25%1 de aumento conseguidos pela empresa B.

1. 10.3. Razao

A razao de um numero A em rela-rao a outro numero B define-se


como A dividido por B. A quantidade precedente e colocada no numerador,
enquanto que a seguinte ira para o denominador.

Atraves de uma enquete realizada em determinada cidade, descobriu-se


que, das pessoas entrevistadas, 300 se manifestaram favoraveis a uma deter­
minada medida adotada pela prefeitura local, 400 ficaram contra a medida e
70 eram indiferentes. Neste caso, a razao dos contrarios para os favoraveis
a medida e de �� ; a dos favoraveis e contra para OS indiferentes e de
(300 + 400)
. D'fi -
1 erentemente da proporyao, - pod e ser supenor a
a razao
· '

70
unidade. Por outro lado, e possfvel reduzir a razao a uma expressao mais
simples, simplificando os fatores comuns do numerador e do denominador.
Assim, por exemplo, a razao dos entrevistados contrarios a medida para os
favoraveis poden1 ser expressa como j, ou, de forma equivalente, 4 : 3.

Em certas ocasioes, e conveniente expressar a razao em termos de um


denominador representado pela unidade. Neste caso, pode-se afirmar que a
razao dos CODtrarios para OS favoraveis e de 1,33 para 1, C a dos favoraveis
e contrarios para OS indiferentes e de I 0 para I.

As propor\:oes, na realidade, representam um tipo particular de razao,


na qual o denominador constitui o numero de casos e o numerador uma
fra-rao daquele. Entretanto, o termo razao e usado, normalmente, quando A
e B representam categorias separadas e distintas.

Se houver apenas duas categorias, sera possfvel calcular a propor-rao


diretamente a partir da razao e vice-versa. Sabendo-se, por exemplo, que a
razao dos homens para as mulheres entre os membros associados de um

clube e de ; , pode-se concluir que em cada cinco associados havera

uma media de 3 homens e duas mulheres. A proporyao dos homens sera,

entao, de � , ou 0,6.
1.10.4. Taxa

Taxa e uma quantidade expressa em rela\:ao a outra quantidade, como


2 cruzeiros por quilograma, 40 quilometros por hora, 3 cruzeiros de ativo
36 por 1 cruzeiro de passivo, 2 por cento de juros. Dessa forma, os quilometros
por hora, por exemplo, sao obtidos dividindo-se o total de quilometros pelo
numero total de horas. Assim, tambem, todos os demais exemplos constituem
razoes. Uma razao, expressa em relayao a 100, e uma porcentagem. Portanto,
uma razao e um caso particular de taxa, uma porcentagem e uma razao
expressa de uma certa forma e uma taxa pode, as vezes, ser uma media.

1.11. ARREDONDAMENTO DE NUMEROS


0 arredondamento de um dado estatistico deve obedecer a algumas
regras:

I . Arredondamento por Falta


Quando 0 primeiro dfgito, aquele situado mais a esquerda entre OS

que irao ser eliminados, for igual ou menor que quatro, nao devera ser
alterado o digito remanescente.

TABELA 1.15

Numero a arredondar Arredondamento para Numero arredondado

12,489 lnteiros 12

20,733 Decimos 20,7

35,992 Centesimos 35,99

2. Arredondamento por Excesso

Quando 0 primeiro digito ap6s .aquele que sera ar.redondado fQr maibr
ou igual a cinco seguido por digitos maiores que zero, o digito remanescente
seni acrescido de uma unidade.

TABELA 1.16

Numero a arredondar Arredondamento para Numero arredondado

15,504 lnteiros 16

16,561 Decimos 16,6

17,578 Centesimos 17,58

3. Arredondamento de Digitos Seguidos do Cinco


Quando 0 digito situado mais a esquerda dos que serao eliminados for
um cinco ou urn cinco seguido somente de zeros, o Ultimo digito remanescente,
se for par, nao se alterara, e se for impar sera aumentado de uma unidade.
(TABELA 1.17)
4. Arredondamento de Soma
Quando se trata de soma, deve-se arredondar primciro o total, e
posteriormente as parcelas. Ha aqui dois casos a considerar:
a) Se a soma das parcelas da seric arrcdondada for superior ao total, deve-sc 37
TABELA 1.17

Numero a arredondar
! Arredondamento para Numero arredondado

215,500 lnteiro 216

216,500 lnteiro 216

216,150 Decimos 216,8

216,705 Centesirnos 216,70

rdomar a se ric original. arredondando-sc, por falta, tantas parcelas quantas


fort·m as unidadcs l'Xcedl·ntes. S er.Io cscolhidas as parcelas antc rior­
mente arredondadas por ex ccsso e cu.ias fra1;oes desprezadas representem
o m e no r e rr o r c lat ivo. ( TABELA 1.18)

TABELA 1.18

Serie original Serie arredondada Serie corrigida

6,51 7 7

7,50 8 8

14,63 15 15

20,10 20 20
.
24.73 25 24

26,52 27 25�

99,99 102 > 100 100

Arredondarnentos refeitos.

b) St• a soma das pan:elas da s cri e arredondada for inf<.'rior ao total,


rd orn ar-s e-a a seri e original, arredondando-se, por cxcesso, tantas parcelas
quantas forem as unidades em falta. Seriio t!scolhidas aquelas parcclas
anteriormcnte a rn· d on d adas por falta c cujas fra1;oes representem o mcnor
erro relativo.

TABELA 1.19

Serie original Serie arredondada serie corrigida

5,34 5 5

7.45 7 7

18,50 18 19*

19,90 20 20

22,37 22 22

26.43 26 27*

99,99 98 < 100 100

38 Arredondarn1>ntos refoitos.
1.12. SOMATORIO
A Matematica fornece ainda outra no�ao de grande utilidade para a
Estatistica: o Somat6rio. 0 operador somat6rio facilita sobremaneira a
indica�ao e a formula�ao de medidas, bem como algumas opera�5es alge­
bricas desenvolvidas pela Estatistica. E por essa razao que o assunto sera
apresentado neste livro como uma especie de apendice ao Capitulo 1.
Para designar somat6rio, utiliza-se a letra grega sigma mahisculo: l:. ,

0 simbolo deve ser lido como "somat6rio de" ou "soma de". Assim, por
exemplo, seja o seguinte conjunto de mimeros:X= {3,6, 9, 12, 15}. A soma
<lesses numeros sera indicada por:
5

I x; = 3 + 6 +9 + 12 + 15 = 45
i=i
5
A expressao L x; deve ser lida da seguinte maneira: "somat6rio
i=i
de x;, i variando de l ate 5".
A letra i que aparece juntamente com ox e um indice, cuja finalidade
e indicar o numero de ordem de cada parcela. A cada parcela devera, entao,
corresponder um mimero de ordem, o qual indica a posi�ao em que ela se
encontra na lista de valores a serem somados.Assim, no exemplo

Xi = 3 porque 3 e 0 primeiro valor da lista

X2 = 6 porque 6 e 0 segundo valor da lista

X3 =9 porque 9 e 0 terceiro valor da lista

X4 = 12 porque 12 e 0 quarto valor da lista

Xs = 15 porque 15 e 0 quinto valor da lista

Define-se, genericamente:
n
L x; =Xi + x2 + x3 + ... + Xn (1)
i=i

0 1 e on indicam, respectivamente, o limite inferior e o superior do soma­


t6rio, representando 0 numero de ordem da primeira e da ultima parcela a
serem somadas.

Em um teste de Matematica, aplicado em uma classe com 20 alunos,


chegou-se aos seguintes resultados:

TABELA 1.20

6 10 9 2 8
3 7 4 6 5
1 9 7 10 8
0 9 6 6 9
39
Calcular:
20

a) I x;= 6 + 10 + 9 + 2 + s + 3 + 1 + 4 + 6 + 5 + 1 +
i=l + 9 + 7 + 10 + 8 + 0 + 9 + 6 + 6 + 9 = 125
5
b) I x; = 6 + 10 + 9 + 2 + 8 = 35
i=l
10

c) I x;·= 3 + 1 + 4 + 6 + 5 = 2s
i=6
18
d) I x;= lo + s + o + 9 + 6 = 33
i=14
5
e) I xl = 62 + 102 + 92 + 22 + 82 = 36 + 100 +
i=l + 81 + 4 + 64 = 285

( t. x �
'
f) = (6 + 10 + 9 + 2 + 8)' = 35' = l 225

Observa?o: A expressao i = {l, 2, 3, .. . , n} indica os valores assumidos


pelo indice i, sendo lida da seguinte forma: "i variando de 1 ate n".
1.12.1. Propriedades dos Somatbrios

Operar com somat6rios requer o conhecimento de alguinas ptoprie­


dades, regras e defini�0es, as quais serao desenvolvidas aqui sob a designa�ao
generica de propriedades dos somat6rios.

1. 0 somat6rio de uma constante e igual ao produto do numero de terrnos


pela constante:

If
. l =1
a=a+a+ ... +a=n•a (2)

Exemplo:
5
I 4 =4+ 4+ 4 + 4+ 4=s x 4 = 20
i=l

2. 0 somat6rio do produto de uma constante por uma variavel que depende


do somat6rio e igual ao produto da constante pelo somatorio da variavel.

n n

Lax;=
.
a L x; (3)
i=l i=l
40
n
L ax; = ax1 + ax2 + .. .+ axn =
i=l n
= a(x1 + x2 + ...+ Xn) = a L x;
i=l
Exemplo:
TABELA 1.21

Ordem do valor, i Valor x;

3
2 6
3 9

4 12

5 15

Ix;=
i=l
45

Seja a = 2.
n s

L ax; = L 2x; = (2X 3) +(2X 6) +(2 X 9) +(2 X 12) +


i=l i=l
+ (2X 15) = 6+12 +18 + 24+30=90

Por outro lado,


s s

L 2x; = 2 L x; = 2 X 45 = 90
j=l i=l

3. Propriedade distributiva do somat6rio em relaft[o a adi�ao algebrica

n n n
L (x; + Y;) = L x; + L Yi (4)
i=l i=l i=l

n
L (x; + Y;) = (xi + yi) +(x2 + Y2) + ...+ (Xn +Yn) =
i=l
= (Xi+X2+ · · · +Xn) + (y1 +Y2+ · · · + Yn) =

n n
= L Xj + L Yi
i=l i=l

Exemplo: 41
TABELA 1.22

Ordem do
valor i Xi Yi Xi+ Yi
1 3 2 5
2 6 4 10

3 9 6 15

4 12 8 .20

5 15 10 25

5 5 5
I Xi= 45 In= 30 L (xi+ Yil = 75
i=I i=l i=l

5
I (x; +Yi) = (3 + 2) + (6 + 4) + (9 + 6) + (12 + s) +
+ (15 + 10) = 5 + 10 + 15 + 20 + 25 = 75
5 5 5
L (x; +Y;) = L x; + L Yi = 45 + 30 = 75
i=I i=I i=I
4. 0 quadrado da soma e diferente da soma dos quadrados

(5 )

:t . . . + 2X1Xn + 2X2X3 + 2X2X4 + ... +

+ 2x2Xn + ... + 2xn_2Xn-I + 2xn_2Xn +


n n
+ 2xn-1Xn) L x: + 2 L x;x1=

i=I i</
i=I
Assim,

n
+ 2 L x;x1 (6)
i </
i=·1

42 Exemplo:.
TABELA 1.23

Ordem i X;

X;

1 4 16
2 6 36
3 8 64
3 3
Ix;= 2 I

1s L x; = 116
i=l i=l

( t. � x '
=
I 8' = 324

3
I x; = 16 + 36 + 64 = 116
i=l
3
2 L x;x; = 2[(4 X 6) + (4 X 8) + (6 X 8)] =

i<j 2 x 104 = 208


i=l =

3 3
= L xi + 2 L x;x; = 116 + 208 =
324
i=l i<j
i=l

5. 0 produto de duas somas e diferente da soma dos produtos

( t. � ( t. � ( t. )
x . y
*
xm (7)

( t. � ( t. �
x y = (x, +x, + ... +x.)(y, +y, + ... +
+ Yn) =
(.X1Y1 +X2Y2 + · · · +XnYn) +
+ (X1Y2 +X1Y3 + · · · +X1Yn +X2Y1 +
+x2y3 + · · · +X2Yn +xn-1Yn-2 +
+ xn-1Yn) =

n n
= L x;y; + L x;y ;
i=l U-j
i=I 43
Exemplo:
TABELA 1.24

Ordem i Xi Yi XiYi

1 3 2 6
2 6 4 24
3 9 6 54
4 12 8 96
5 15 10 150

5 5 5

L Xi= 45 L Yi= 30 L XiYi = 330


i=l i=l i=l

L X;Y; = 330
j=l
5

I x; = 4s
j=l
5

L Yi = 30
i=l

0 mesmo resultado seria obtido fazendo-se:

(t. x) (t. y) t. -
XtYi + ti �iYj
i=l
5

L X;Y; = [(3 x 4)+(3 x 6)+(3 x 8)+(3 x 10)]+[(6 x 2) +


::{ +(6 x 6)+(6 x 8)+(6 x 10)]+[(9 x 2)+(9 x 4) +
+(9 x 8)+ (9 x 10)]+[(12 x 2)+(12 x 4)+
+(12X 6)+(12X 10)]+[(ISX 2)+
+(1SX4)+(1SX6)+(1SX8)] =

= 84 + 156 + 216 + 264 + 300 = 1 020

44
6. Numero de parcelas de um somatorio
n

0 numero k de parcelas OU termos do somat6rio L e dado pela


seguinte expressa-o: i=a

I k= n - a+ (8)

Exemplos:

5
a) L x; = 2 + 4 + 6 + 8 +10 = 30
i=l
k=n-a+l=S-1+1=5

Esta soma comp6e-se, portanto, de cinco parcelas.

b} L Yi = Y3 + Y4 + Ys + Y6 + Y1 + Ys
i=3
k=n-a+ 1 = 8 - 3+1= 6 parcelas.

7. Somatbrios multiplos {dup/os)

0 somat6rio multiplo (duplo) de um produto e igual ao prodtlto dos


somat6rios tomados separadamente. A formula�ao dessa propriedade sera
feita em termos do somat6rio duplo.

(9)

Exemplo: .) TABELA 1.26

x; Yj

Xt = 2 Yl = 1

x2 = 4 Y2 = 3
n = 6
X3 = 6 Y3 = 5
m =4
X4 = 8 Y4 = 7

X5 = 10

5 4
Ix;= 30 L Yi':= 16
i=l j=l
45
. ( ± �)
1=1
x • ( t �')
1=1
Y = 30 X 16 = 480

n m

I I XiYj = (2 x 1) + (2 x 3) + (2 x 5) + (2 x 7) + (4 x 1) +
i= I j= I
+ (4 x 3) + (4 x 5) + (4 x 7) + (6 x 1) +
+ (6 X 3) + (6 X 5) + (6 X 7)+ (8 X 1) +
+ (8 x 3) + (8 x 5) + (8 x 7) + (10 x 1) +
+ (IO X 3) + (10 X 5) + (10 X 7) =
= 32 + 64 + 96 + 128 + 160 = 480

8. Eliminaftio do indice
8.1. Muitas vezes, por motivo de simplifica�o, elimina-se o indice que
acompanha a variavel. Esta pratica, entretanto, s6 devera ser aceita quando
nao houver duvidas a respeito dos valores que serao somados. Isto acon­
tece principalmente em demonstra�fies onde o somat6rio aparece com
muita frequencia, ou na resolu�ao de exercicios.

Assim, por exemplo, utilizando-se os dados da Tabela 1.25, poder-se-ia


escrever:
s

L x; = 30 ou, simplesmente, �x = 30.


i=I

Da mesma forma,
4

L Yj = 16 ou, simplesmente, l:y = 16.


j=I

8.2. Outro procedimento costumeiro e o de substituir o indice pela


pr6pria variavel representativa dos valores que deverao ser somados.

Exemplo:

TABELA 1.26

Va/ores de X x;

4 xi =
4
5 x2 = 5

6 X3 = 6

7 X4 = 7

8 X5 = 8
46
8 5
E igualmente correto escrever Lx 3? OU L Xj 30.
=
=

x=4 i=l

EXERCiCIOS RESOLVIDOS

1.1. Os dados abaixo representam a popula�ao por mil habitantes das


regioes adm inistrativas do Estado.

TABELA 1.27

Populw;io (1 000 hab.)


N9 Regiiies
1970 1975
I Grande Sao Paulo 8 143,2 10 481.4
II Literal 841,5 981,6
111 Vale do Paralba 797,8 883,5
IV Sorocaba 1 110,8 1 164.4
v Campinas 2 114,5 2 336,9
VI Ribeirao Preto 1 427,7 1 459,7
VII Eiauru 554.4 515.4
VIII S. J. do Rio Preto 942,2 905,6
IX Arac;atuba 543,2 553.4
x Presidente Prudente 719,3 661,8
XI Marflia 691,2 633,3
ESTADO 17 885,8 20 577,0

Fonte: Revista de Saude Publica, vol. n9 10, junho de 1976, n9 2.

1.1.l. Expressar os valores da popula�ao em termos relativos percentuais.

1.1.2. Determinar as taxas de crescimento aritmetico 1970/1975.


Solu¢o:
1.1.1. Divide-se a popul�lio de cada regilio pela do Estado em cada
ano, multip licando-se o quociente por 100. Os resultados estao na
Tabela 1. 28.
TABELA 1.28

Populw;io (%)
Regiiies
N'! .i
1970 1975

I Grande Scio Paulo 45,5 50,9


II Litoral 4,7 4,8
Ill Vale d o Pararba 4,5 4,3
IV Sorocaba 6,2 5,7
v Campinas 11,8 11,4
VI Ribeiriio Preto 8,0 7, 1
VII Bauru 3, 1 2,5
VIII S. J. do Rio Prato 5,3 4,4
IX Ar�tuba 3,0 2,7
x Presidente Prudente 4,0 3,2
XI Mar Ilia 3,9 3,1
ESTADO 100,0 100,0
47
1.1.2. Para determinar as taxas de crescimento em 5 anos, dividimos
a popula�ao de 1975 de uma certa regiao pela popula�ao em 1970 da

mesma regiiio. Exemplo: Para a Grande Sao Paulo teremos: �O14:31,;4 =

= 1,287, ou seja, cresceu 28,7% em cinco anos. Para o Estado teremos:


20 577 ,0
1,150, ou seja, cresceu 15%
17 885,8 em cinco anos. As demais
=

estao na Tabela 1.29.


TABELA 1.29

Taxa de crescimento
N'! Regioes
1970-75 (%)

I Grande Slio Paulo 28,7


II Litoral 16,6
Ill Vale do Parafba 10,8
IV Sorocaba 4,8
v Campinas 10,5
VI Ribeiriio Preto 2,2
VII Bauru - 7,1
VIII S. J. do Rio Preto -3,9
IX Arac,atuba 1 ,9
x Presidente Prudente -8,0
XI Mar Ilia -7.4

ESTA DO 15,0%

I. 2. Calcular os seguintes somatorios:


4

1.2.1. L (xi + 2) para x = 2, 3 , 4, 5.


i=l
4

1.2.2. L (xi + 2)2 para x = 1, 2, 3 , 4.


i=l
Soluffo
i :
4 4 4 4

1.2.1. L Xj + L 2 = L Xj + (4 x 2) = L Xj + 8 =

i=l i=l i=l i=l


= 2 + 3 + 4 + 5 + 8 22 =

4 4 4

1.2.2. L (xi + 4xi + 4) = L xl + 4 L X; + 16 =

i=l i=l i=l


= l + 4+ 9 + 16 + 4(1 + 2 + 3 + 4) + 16 =

48 = 34 + 40 + 16 = 90
Distribuifiio de Frequencias

No primeiro capitulo, ao se enunciarem as formas de apresentayiio de


dados numericos, foi mencionada a apresentayiio tabular das series estatis­
ticas. Uma das vantagens das tabelas estatisticas e a de condensar, de forma
consistente, as informay5es necessanas ao estudo desejado. Isto porque,
freqiientemente, o estudo de um determinado fenomeno requer a coleta de
uma grande massa de dados numericos, dificil de ser tratada se esses dados
nao forem organizados e condensados em uma tabela. No caso especifico das
seriayOes, acontece normalmente que, ao coletar os dados referentes ao fenO­
meno objeto de estudo, o analista se defronta com valores que se repetem
algumas vezes, sugerindo sua apresentayiio atraves de tabelas onde somente
apareyam valores distintos uns dos outros. Essa providencia favorece eviden­
temente uma arnilise e interpretayiio mais rapida da natureza e comporta­
mento do fenomeno observado. Neste capitulo sera desenvolvido um tipo
de tabela que condensa uma coleyiio de dados conforme as freqiiencias ou
repetiyoes de seus valores.

2.1. DADOS BRUTOS

Feita a coleta, os dados originais ainda niio se encontram prontos para


anatise, por nao estaren1 numericamente organiZados. Por essa raziio, costu­
ma-se chama-los de dados brutos. Tomando-se, por exemplo, as alturas dos
alunos em uma sala de aula e anotando-se os resultados em uma lista da qual
constem os nomes dos alunos em ordem alfabetica, ninguem garantira que
os valores correspondentes as alturas observarao uma determinada ordem
numerica, crescente OU decrescente. Mais provavel e que estejam desorgani­
zados, uma vez que a ordem das alturas nao corresponde necessariamente a
ordem alfabetica. A lista de alturas e, portanto, uma lista de dados brutos,
que sao aqueles valores a que se chegou pela simples coleta, sem qualquer
preocupayiiO quanto a sua ordenayiiO. 49
Na Tabela 2 .1, estao relacionados os valores correspondentes ao consu­
mo individual de energia eletrica, medido em quilowatts-hora, em um grupo
de 50 usuarios.
TABELA 2.1

Consumo Mensal de Energia Elitrica, por 50 Usuarios Particulares - KWH

58 62 80 57 8 126 136 96 144 19


90 86 38 94 82 75 148 114 131 28
66 95 121 158 64 105 118 73 83 81
50 92 60 52 89 58 10 90 94 74
9 75 72 157 125 76 88 78 84 36

Como pode ser observado, as cifras estao dispostas de forma desorde­


nada. Em razao disso, pouca informayao se consegue obter inspecionando os
dados anotados. Mesmo uma informayao tao simples como a de saber os
consumos maximo e minimo requer um certo exame dos dados da tabela,

2.2. ROL
0 rol e uma lista em que os valores estao dispostos em uma determi­
nada ordem, crescente ou decrescente. Dispondo os dados de acordo com o
consumo, obtem-se uma ordenayao da Tabela 2.1.

TABELA 2.2

Con1umo Mensal de Energia Ellrtrica por 50 Usuarios Particul•es - KWH

3 58 75 89 118

8 58 76 90 121

10 60 78 90 125

19 62 80 92 126
28 64 81 94 131
36 66 82 94 136
38 72 83 95 144
50 73 84 96 148
52 74 86 105 157
57 75 88 114 158

Essa classificayao dos dados proporciona algumas vantagens concretas


com relayao a sua forma original. Em primeiro lugar, ela torna possivel visua­
lizar, de forma bem ampla, as variayoes de consumo, uma vez que os valores
extremos sao percebidos de imediato. Em Segundo lugar, e possivel observar­
-se uma tendencia de concentrayao dos valores na faixa de 50-90 kwh. Apesar
de o rol propiciar ao analista mais informayoes e com menos esforyo de
concentrayao do que os dados brutos, ainda assim persiste o problema de
a analise ter que se basear nas 50 observayoes individuais. 0 problema se
50 agravara quando 0 numero de dados for muito grande.
2.3. TABELA DE FREOUENCIAS

As tabelas de freqiiencias sao representayoes nas quais os valores se


apresentam em correspondencia com suas repetiyoes, evitando-se assim que
eles apare�m mais de uma vez na tabela, como ocorre com o rol.

Uma empresa fabricante de instrumentos de precisao esta interessada


em saber o numero de aparelhos defeituosos rejeitados pela seyao encarregada
do controle de qualidade. As estatisticas, fornecidas por essa seyao, referem-se
ao periodo de1971a1974.
TABELA 2.3 - EMPRESA X
Numero Mensal de Aparelhos Defeituosos

� 0
J F M A M J J A s 0 N D

1971 6 2 5 6 0 8 7 .6 3 4 5 8
1972 10 9 7 6 3 4 6 4 5 4 0 1
1973 3 6 7 9 3 1 4 6 5 3 5 4
1974 7 2 5 8 6 4 2 5 1 6 5 2

Os dados brutos, apresentados na Tabela 2.3, nao informam muita coisa


sobre o fenomeno "numero de aparelhos defeituosos", sendo dificil extrair
deles muitas conclusoes, sem esforyo de concentrayao. Observa-se, entretanto,
que os valores que constam da tabela aparecem repetidos, como o 0 (zero),
por exemplo, que aparece duas vezes. Esse fato ira sugerir, naturalmente, que
se condensem todos os resultados em uma tabela, estabelecendo a correspon­
dencia entre o valor individual e o respectivo numero de vezes que ele foi
observado.
0 nuniero de observayoes ou repetiyoes de um valor ou de uma modali­
dade, em um levantamento qualquer, e chamado freqiiencia desse valor OU
dessa modalidade. Uma tabela de freqiiencias e uma tabela onde se procura
fazer corresponder os valores observados da variavel em estudo e as respectivas
freqiiencias. A tabela de freqiiencias proporciona uma apresentayao estetica­
mente mais vantajosa dos dados, facilitando ainda a verificayao do comporta­
rriento do fenomeno. E possivel, por outro lado, com a utilizayao de uma
tabela de freqiiencias, a obtenyao de estatisticas (medidas) com menos
calculo, e, conseqiientemente, em menos tempo do que se esse trabalho fosse
realizado a partir dos dados brutos.

As tabelas de freqiiencias podem representar tanto valores individuais


como valores agrupados em classes.

2.3.1. Distribui�ao de Frequencias de Dados Tabulados


Niio-Agrupados em Classes

Utilizando OS dados da Tabela 2.3, e possivel construir uma tabela de


freqiiencias de valores nao-agrupados em classe, ou seja, uma tabela onde os 51
valores da variavel aparecem individualmente. Este tipo de apresentayliO e
utilizado para representar uma variavel discreta ou descontinua. 0 exemplo
e dado pela Tabela 2.4.

TABELA 2.4 - EMPRESA X

Numero Mensal de Aparelhos Defeituosos

Numero de
Contagem ou Numero de
j Aparelhos com
Tabula�o Meses ffj)
Defeito fxjJ

I I
1
I
0 r I
2
2 I 1 n I 3
3 I 2 0 I 4
I I
4 I 3 ISi I 5
5 I 4 ISi r I 7
I I
6
I
5 ISi n I
8
7 I 6 ISi 0 I 9
8 I 7 0 I 4
I I
9 I 8 n I 3
10 I 9 r I 2
I I
11
I
10 I I
1

11

I fj = 48
j=I

Na primeira coluna, encabeyad� pelo fndice j, aparecem os numeros


correspondentes a ordem dos valores da variavel. 0 indice j sera utilizado,
neste livro, sempre que se estiver trabalhando com tabelas de frequencias
(dados tabulados). Para operar - com os dados brutos, usar-se-a o indice i.

Na segunda coluna, encabeyada por Xj, sao anotados os valores da


variavel.

A terceira coluna e uma coluna auxiliar, utilizada para que se possa


processar a contagem dos valores repetidos, sem grande esforyo.

A ultima coluna, encabeyada por fj, apresenta as freqiiencias, que sao


os resultados numericos provenientes da contagem. A soma das freqiiencias
e sempre igual ao numero total de valores observados:

� (1)

ke 0 extremo superior do intervalo de valores do indice j.
fj e 0 numero de observayoes de um valor
52 Ne o numero total de valores observados
Normalmente, depois de construida, a tabela apresentara apenas as
colunas encabeyadas por Xj e f;.

2.3.2. Distribui\:io de FrequAncias de Dados Agrupados em Classes

Muitas vezes, mesmo com o risco de se sacrificar algum detalhe mani- .


festado na ordenayao de valores individuais, ha vantagem em resumir os dados
originais em uma distribuiyao de freqiiencias, onde os valores observados nao
mais aparecerao individualmente, mas agrupados em classes.

Quando a variavel objeto do estudo for continua, sera sempre conve­


niente agrupar os valores observados em classes. Se, por outto lado, a variavel
for discreta e o numero de valores representativos dessa variavel for muito
grande, recomenda-se o agrupamento dos dados em classes. Neste ultimo
caso, o procedimento visa a evitar certos inconvenientes, como:

a. grande extensao da tabela, dificultando, tanto quantci os dados brutps, a


leitura e a interpreta�o dos resultados apurados.

b. Aparecimento de diversos valores da variavel com freqiiencia nula.

c. lmpossibilidade ou dificuldade de visualizar;ao do comportamento do


fenomeno como um todo, bem como de sua variar;ao.

Um teste de estatistica, contendo 100 perguntas do tipo certo-errado,


foi aplicado em uma tunna de 500 estudantes. A Tabela 2.5 apresenta os
resultados do teste.

TABELA 2.5

Resultados do Teste de Estatlstica

Classes Freqiiiincias
Notas fj

01--10 5
10.f--20 15
201--30 20
301--40 45
401--50 100
501--60 130
601--70 100
701--80 60
801--90 15
901--100 10
10

I fj = 500
j=l
53
Para a constru9ao dessa tabela, nao ha necessidade de se ordenarem os
valores originais. Pode-se partir diretamente da lista de dados brutos. E facil
ver, por outro lado, que, na distribui9ao de freqilencias de valores agrupados
em classes, nao figuram mais os valores exatos de cada item em particular.
Nao e possivel, da mesma forma, obter diretamente da tabela o valor exato
dos itens mais alto e mais baixo. Apesar disso, a tabela informa, de imediato,
a tendencia de a serie se concentrar em torno de um valor central, alem de
proporcionar uma visao panoramica do comportamento da variavel, o que
seria impossivel de se fazer a partir da lista dos dados brutos.

0 simbolo f--- indica inclusao na classe do valor situado a sua


esquerda e exclusao do valor situado a sua direita. Assim, na Tabela 2.5 a
primeira classe (Ol---10) congrega valores de 0 (zero), inclusive, ate 10,
exclusive.

Ha outros simbolos para representar o intervalo de classe:


0 --l 10: A classe cornpreende valores de 0, exclusive, ate 10, inclusive.

0 -- 10: A classe cornpreende valores de 0, exclusive, ate 10, exclusive.


0 f---i 10: A classe cornpreende valores de 0, inclusive, ate 10, inclusive.

2.4. ELEMENTOS DE UMA DISTRIBUICAO DE FREQUENCIAS

Para construir uma tabela de freqilencias, e necessario conhecer alguns


termos pr6prios e de uso corrente, bem como o procedimento tecnico mais
adequado. Esses termos serao listados a seguir.

2.4.1. Frequencia Simples Absoluta

A freqilencia simples absoluta de uma classe ou de um valor individual


e o numero de o'bserva9oes correspondentes a essa classe ou a esse valor. A
freqilencia simples absoluta, OU simplesmente freqilencia, e sirnbolizada por
fj. Na Tabela 5:
!1 =
5
!2 = 15
f3 = 20

!10 10
2.4.2. Amplitude Total: Ar

A amplitude total OU intervalo total e a diferen9a entre 0 maior e 0

menor valor observado da variavel em estudo. Se, por exemplo, no teste que
deu origem a Tabela 2.5, a maior nota tivesse sido 97 e a menor 1, a ampli­
tude total do conj unto de valores observados seria:

54 Ar = 97 - 1 = 96
A amplitude total do exemplo da Tabela 2.1, por outro lado, sera:
At = 158 - 8 = 150
2.4.3. Classe

Classe de freqiiencia, OU, simplesmente, classe, e cada um dos grupos


de valores em que se subdivide a amplitude total do conjunto de valores
observados da variavel.

Uma determinada classe pode ser identificada por seus extremos ou


pcla ordem em que ela se encontra na tabela (valor do indice j). Na Tabela 2.5:
Classe 0 I--- 10 ou primeira classe (j = 1)
Classe 80 I-- 90 ou nona classe (j = 9)

0 numero de classes, em uma distribuic;:ao de freqiiencias, e represen­


tado por k. E importante que a distribuic;:ao conte com um numero adequado
de classes. Se esse numero for escasso, os dados originais ficarao tao compri­
midos que pouca inforrnac;:ao se podera extrair da tabela. Se, por outro lado,
forem utilizadas muitas classes, havera algumas com freqiiencia nula ou muito
pequena, e 0 resultado sera uma distribuic;:ao irregular e prejudiciat a inter­
pretac;:ao do fenomeno como um todo.

Para determinar o numero de classes ha diversos metodos. A regra de


Sturges, um dos metodos, estabelece que o numero de classes e igual a:

I k= 1+3,3 log10N I (2)


k = numero de classes

N = numero total de observa�0es

Exemplo:
a) Se 0 numero de observac;:oes for 500:
N = 500
k = 1 + 3,3 log 500
log 500 = 2,69897
k = 1 + (3,3 x 2,69897) = 1 + 8,906601
k = 9,906601 ou, arredondando,
k = 10

b) Se N = 50
k = 1 + 3,3 log 50
k = 1 + (3,3 x 1,69897) = 1 + 5,606601 = 6,606601
k .. 7

Esses dois exemplos revelam um dos inconvenientes resultantes da apli­


cac;:ao da formula de Sturges, que e o de propor um numero demasiado de
classes para um numero pequeno de observac;:oes e relativarnente poucas
classes, quando o total de observac;:oes for grande. 55
Truman L. Kelley, em The Grouping Data for Graphic Portrayal, sugere
os seguintes numeros de classes, com base no numero total de observayoes,
para efeito de representayao grafica:

5 10 25 50 100 200 500 1.000

2 4 6 8 10 12 15 15

Mesmo conhecendo esses e outros criterios de determina�ao do numero


de classes, o analista devera ter em mente que a escolha dependera antes da
natureza dos dados e da unidade de medida em que eles forem expressos do
que de regras muitas vezes arbitrarias e pouco flexiveis.
2.4.4. Limites de Classes

a) Limite Superior e Limite Inferior


Os limites de classe sao seus valores extremos. A segunda classe do
exemplo da Tabela 2.5 tern como limites os valores 10 e 20. 0 valor 10 e
denominado limite inferior ou limite minimo de classe, enquanto o valor 20
e den�minado limite superior.
Os valores 0 e 100, por representarem, respectivamente, o limite
inferior da primeira classe e 0 superior da ultima, sao tambem denominados
limite inferior e limite superior da distribui�o.
Para a construyao de uma tabela de freqilencias e muito importante a
escolha dos limites das classes, de forma que seus pontos medios (item 2.4.6)
coincidam, tanto quanto possivel, com a concentra�ao dos valores reais. Alem
disso, e recomendavel que os limites de classe sejam representados por
n(1meros inteiros. Por outro lado, ao estabelecer os limites de classe, deve-se
ter cuidado para evitar interpreta�oes ambiguas. Por exemplo, os limites:
Cruzeiros

30 40
40 50
50 60

Eles nao sao claros, em virtude de nao se saber em que classe devem
ser incluidos os valores 40 e 50. Se os valores originais estiverem arredon­
dados para inteiros, sera correto escrever:

Cruzeiros

30 a 39
40 a 49
50 a 59

56
Entretanto, se os valores originais aparecerem com precisao ate centavos,
esses lirnites nao serao claros. Utilizando essa ultima representa9ao, nao se
teria certeza quanto a em que classe se deveriam incluir valores tais como
39,4, 39,8, 49,7 etc. 0 problema estaria solucionado se os limites fossem
escritos da seguinte rnaneira:

Cruzeiros

30,00 a 39,99
40,00 a 49,99
50,00 a 59,99

Entretanto, esse terceiro tipo de distribui�o nao e muito aceito, em


virtude de problernas de ordem estetica.

Para evitar os inconvenientes apresentados pelas tres formas auteriores


de apresenta9ao de dados em tabelas de freqiiencias, alguns autores sugerem
a seguinte representa�o:

Cruzeiros

30 1----- 40
40 50
50 60

ficando subentendido que na primeira classe devem estar inclufdos os valores


rnaiores ou iguais a 30 ate valores que sejam menores que 40, e assim
sucessivamente.
Se o leitor tiver que trabalhar com uma tabela que ja esteja montada
e onde OS }imites de classe estejam expressos de forma diferente a sugerida
por esse livro, sera conveniente conhecer a no�o de limites reais de classe.

b) Limites Reais de C/asse


Considere a Tabela 2.6, em que se exemplifica urna distribui9ao de
freqiiencias.
TABELA 2.6
Classes fj
2,50 a 2,59 1
2,60 a 2,69 2
2,70 a 2,79 7
2,80 a 2,89 4
2,90 a 2,99 2
16 57
A primeira classe, cujos limites sao 2,50 e 2,59, congregaria, na reali­
dade, valores compreendidos no intervalo de 2,495 a 2,595. Esses limites sao
denominados limites reais de classe. Na pratica, os limites reais sao obtidos
pela media aritmetica entre o limite superior de urna classe e o limite inferior
de classe seguinte. 0 limite superior real da primeira classe sera, entao:
2,59 + 2,60
2,595
2
=

c) Limites niio Definidos


Urna classe com limite indefinido OU aberto e aquela que inclui todos
os valores da variavel menores que um certo limite superior especificado, ou
maiores que um limite inferior especificado.

TABELA 2.7

Acionistas da G.L.T. S.A. - Componentes Eletronicos

Acionistes
Numero de Bfoes
fj (1.000)
1 a 99 20
100 a 499 70
500 a 999 50
1 000 a 9 999 45
10 000 OU ma is 5

TOTAL 190

A utilizac;:ao desse expediente prejudica a representac;:ao e analise dos


dados. Nao se sabe, na realidade, se a media de ac;:oes possuidas pelos 5 000
acionistas com 10.000 ou m ais a90es e um numero muito pr6ximo ou muito
afastado desse limite inferior. Nao e possivel, por conseguinte, utilizar a
tabela po.ra calcul�s em que se requeira grande exatidao, como, por exemplo,
para estirnar a media de ac;:oes por acionista.

2.4.5. Amplitude do lntervalo de Classe

A amplitude do intervalo de classe ou simplesmente intervalo de classe


e o comprimento da classe, sendo geralmente definida como a diferenc;:a entre
seus limites superior e inferior. Essa definic;:ao nlio e evidentemente geral, urna
vez que, se for utilizada para calcular o intervalo de classe, qualquer uma
das formas de representac;:ao das classes anteriormente propostas podera
conduzir a intervalos diferentes.

Para determinar, entao, a amplitude do intervalo de classe, deve-se


tomar a diferenc;:a entre dois limites inferiores ou entre dois limites superiores
sucessivos de classe. Esse procedimento e verdadeiro sempre que as classes
tiverem a mesrna amplitude.

No exemplo da Tabela 2.6, tem-se:


a) Amplitude do intervalo de classe obtida pela diferenl(a entre dois limites
superiores sucessivos:
58 2,69 - 2,59 = 0,10
A amplitude do intervalo da segunda classe e igual a 0,10.

b) Amplitude do intervalo de classe obtida pela diferen�a entre dois limitcs


inferiores sucessivos:
2,70 - 2,60 = 0,10

que e a amplitude do intervalo da segunda classe.


Se a amplitude da segunda classe fosse determinada, para esses limites,'
de acordo com a primeira defini9ao, resultaria em um valor diferente do'
obtido pelo ultimo criterio:

2,69 - 2,60 = 0,09 * 0,10

Se as classes forem representadas como sugerido na Tabela 2.6, a ampli­


tude de classe, estabelecida conforme a primeira defirri9ao, somente coincidira
com a calculada de acordo com a segunda quando sua determina9ao for
efetuada a partir dos limites reais de classe. Assim, a amplitude do intervalo
da segunda classe ficara:

2,695 - 2,595 = 0,10

E recomendavel construir tabelas onde os intervalos de classe sejam


iguais. Evitam-se, assim, equivocos na interpreta9ao da varia9ao do fenomeno.
Entretanto, a adoyao desse procedimento pode, em certas ocasioes, resultar
em uma distribuiyao de freqiiencias muito deformada, o que nao acontece
se as amplitudes forem desiguais. Quando, por um motivo qualquer, tecnico
ou estetico, os intervalos tiverem amplitudes desiguais, a nova amplitude
devera ser um multiplo da primitiva, preferencialmente 0 dobro, 0 quintuplo
e o decuplo.

2.4.6. Ponto Medio de Classe - xi -

0 ponto medio OU valor medio de classe e 0 valor que a representa,


para efeito de calculo de certas medidas. Na distribuiyao de freqiiencias com
valores agrupados em classes, considera-se que os resultados incluidos em
cada classe distribuem-se uniformemente por seu intervalo. Por essa razlio, a
escolha do ponto medio para representar todos OS valores de uma classe e 0

procedimento mais coerente, uma vez que esse ponto, por suas caracteristicas,
deve ser eqiiidistante dos limites de classe.

Para obter o ponto medio de uma classe, basta acrescentar ao seu limite
inferior a metade da amplitude do intervalo de classe. Esse procedimento
podc ser adotado, qualquer que seja a representa9ao tabular escolhida. Assim,
por exemplo, o ponto medio da primeira classe da distribni9ao da Tabela 2.7
sera determinado como segue:

2,50 a 2,59
Primeira classe:
Amplitude do intervalo:0,10
Metade da amplitude: 0,05 59
0 ponto medio da primeira classe seni, entao:

X1 = 2,50 + 0,05 = 2,55

Para obter os pontos medios das classes seguintes, basta acrescentar ao


ponto medio da classe precedente a amplitude do intervalo de classe (se for
constante), como indicamos na Tabela 2.8.

Quando as classes forem representadas conforme aparece na Tabela 2.5,


ou seja, quando o limite superior de uma classe for igual ao inferior da
seguinte, 0 ponto medio podera ser calculado atraves da media aritmetica dos
limites do intervalo. Assim sendo, o ponto medio da primeira classe sera:

Primeira classe: 0 f---10


0 + 10
5
-

Ponto medio:
- -
Xl -
2
TABELA 2.8

Ponto mt!!dio
Classe 'i Xj

2,50 a 2,59 1 2,55


2,60 a 2,69 2 2,55 + 0,10 = 2,65
2,70 a 2,79 7 2,65 + 0,10 = 2,75
2,80 a 2,89 4 2,75 + 0,10 = 2,85
2,90 a 2,99 2 2,85 + 0,10 = 2,95

16

2.5. TIPOS DE FREOUENCIAS


Uma tabela de freqiiencias pode representar e caracterizar um dos

{
seguintes tipos de freqiiencias:

Absoluta
- Freqiiencia Simples

{
Relativa

Absoluta
"Abaixo de"

{
(crescente)
Relativa
-- Freqiiencia Acumulada
Absoluta
"Acima de"
(decrescente)
Relativa

2.5.1. Freqiiencias Simples


a) Freqii.encia Simples Absoluta
60 Simbolo: f;
A freqilencia simples absoluta e o numero de repeti9oes de um valor
individual ou de uma classe de valores da variavel. Trata-se do caso visto ate
o presefite. A soma das freqilencias simples absolutas em uma tabela e
chamada freqilencia total e corresponde ao numero total de observa9oes.

� (3)

Considerem-se os exemplos dados pelas Tabelas 2.9 e 2.10.

TABELA 2.9 - EMPRESA X


Relatorio de lnsp�io. NCimero de Defeitos por P�a

Numero de Defeitos Numero de Per:as


Xj fj

0 5
1 10
2 18
3 12
4 5

Na Tabela 2.9, a freqilencia simples absoluta do valor zero e 5, indicando


que esse numero aparece cinco vezes no levantamento efetuado. Ha, portanto,
cinco pe�s com nenhum defeito.

TABELA 2.10
Notas Obtidas por 500 Alunos em um Teste de Estatlstica

Notas N<J de alunos - fj -


01--10 5
101-- 20 15
201-- 30 20
301--40 45
401--50 100
501-- 60 130
601--7 0 100
701--80 60
801--90 15
901--100 10

10

Il 'i = 500
j= 61
Na Tabela 2.10, a freqiiencia simples absoluta da quarta classe e 45.
Ha 45 alunos cujas notas se situaram no intervalo compreendido pelas notas
de 30, inclusive, a 40, exclusive.

b) Frequencia Simples Relativa


Simbolo: frj
A freqiiencia simples relativa representa a propor�o de observa<;oes de
um valor individual ou de uma classe, em rela<;ao ao numero total de obser­
va<;oes. Trata-se, portanto, de um numero relativo. Para calcular a freqiiencia
relativa, basta dividir a freqiiencia absoluta da classe ou do valor individual
pelo numero total de observa<;oes. Simbolicamente,

fri =

I
/i
t;
=

N
!;
( 4)

j=t

Desejando expressar o resultado em termos percentuais, multiplica-se


o quociente obtido por 100.

I fr; � * . 100 I (5)

Observando essa ultima expressao, ve-se claramente que a freqiiencia


relativa e o resultado de uma regra de tres simples:

{Nf; ----
100%

x%

x% =

N
!; • 100 = fri

A soma das freqiiencias simples relativas de uma tabela de freqiiencias


e sempre igual a 1,00 ou 100%.

k
I tri = 1,00 OU 100% (6 )
j=t

Considere-se o exemplo da Tabela 2.11. Como ali se observa, a


freqiiencia simples relativa do valor 2 e 0,36 OU 36%, indicando que ha trinta
e seis por cento de pe<;as, dentre as cinqiienta, com dois defeitos. De fato,
62 dezoito corresponde a trinta e seis por cento de cinqiienta.
TABELA 2.11 - EMPRESA X
Relat6rio de lns�o. Numero de Defeitos por P�a

Freqiiincias
Numero de /)llfss
Xj frj relativas
fj
percentuais

0 5 5/50 = 0,10 10%


1 10 10/50 = 0,20 20%
2 18 18/50 = 0,36 36%
3 12 12/50 = 0,24 24W.
4 5 5/50 = 0,10 10%
s s s
50
I fj = 50
I.frj = 50 = 1 ,00
I frj = 100%
j=l j=l j=l

2.5.2. Freqiiencias Acumuladas "Abaixo de"

a) Frequencia Absoluta Acumulada


Simbolo: Fj
A freqiiencia absoluta acumulada "abaixo de" uma classe ou de um
valor individual e a soma da freqtiencia simples absoluta dessa classe ou desse
valor com as freqtiencias simples absolutas das classes ou dos valores ante­
riores. A expressao "abaixo de" refere-se ao fato de que as freqtiencias a
serem acumuladas correspondem aos valores menores ou anteriores ao valor
ou a classe cuja freqtiencia acumulada se deseja obter, incluindo no calculo
a frequencia do valor ou da classe. Toda vez que se procura saber quantas
observa¥oes existem ate uma determinada classe ou valor individual, recorre-se
a freqtiencia acumulada "abaixo de".

Considerem-se os exemplos das Tabelas 2.12 e 2.13. Na primeira,


F3 = 33 significa que hli trinta e tres pe¥as que apresentaram ate dois
defeitos, incluindo esse numero; portanto, as pe�s que nao apresentaram
defeitos, as que apresentaram um e as que apresentaram dois defeitos.

TABELA 2.12 - EMPRESA X


Relatorio de lnsp�io. Numero de Defeitos por P�a

Xj
'i Fj

0 5 5

1 10 15

2 18 33
3 12 45

-
4 5 50

I fj = 50

j=l
63
TABELA 2.13
Notas Obtidas por 500 Alunos em um
Teste de Estatlstic:a

Notas Fj
fj
0 I-- 10 5 5
10 I-- 20 15 20
20 I-- 30 20 40
30 I-- 40 45 85
401---- 50 100 185
50 I-- 60 130 315
60 I-- 70 100 415
70 I-- 80 60 475
80 l---9
- 0 15 490
90 1--100 10 500

10

2
j=l
fj = 500

No caso da Tabela 2.13, F5 = 185, por exemplo, indica que houve


185 alunos que obtiveram notas iguais ou inferiores a 50.

b) Frequenda Rekltiva Acumuklda


Simbolo: Fri
A freqtiencia relativa acumulada da classe ou do valor individual j e
igual a soma da freqiiencia simples relativa dessa classe ou desse valor com

TABELA 2.14 - EMPRESA X


Relatbrio de lnsp�o. Numero de Defeitos por P�a

De acordo De acordo
com o item (a) com o item (b)
Xj fj ''i (%) Fj

Frj (%) Frj

0 5 10 5 0+ 10 = 10 5/50= o,fo ou 10%

1 10 20 15 10+20 = 30 15/50 = 0,30 OU 30%

2 18 36 33 30+36= 66 33/50 = 0,66 OU 66%

3 12 24 45 66+24 = 90 45/50 = 0,90 OU 90%

4 5 10 50 90+10=100 50/50 =1,00 OU 100%

500 100
64
TABELA 2.15
Notas Obtidas por 500 Alunos em um Taste de Estatlstica
I
Deacordo Descordo
I
I com o item (a) com o item (b)
Notss fj frj (%) Fj
I
I Frj (%) Frj
I
I
Ol--1 0 5 1 5 1 5/500 = 0,01 ou, 1%
101--20 15 3 20 4 20/500 = 0,04 OU 4%
201-- 30 20 4 40 8 40/500 = 0,08 OU 8%
301--40 45 9 85 17 85/500 = 0,17 OU 17%
401--50 100 20 185 37 185/500 = 0,37 OU 37%
501--6 0 130 26 315 63 315/500 = 0,63 OU 63%
601--70 100 20 415 83 415/500 = 0,83 OU 83%
701---80 60 12 475 95 475/500 = 0,95 OU 95%
801--90 15 3 490 98 490/500 = 0,98 OU 98%
901-- 100 10 2 500 100 500/500 = 1,00 OU 100%
I

500 I 100
I

as freqtiencias simples relativas das classes ou dos valores anteriores. A


obtenyao das freqtiencias relativas acumuladas pode ser feita de duas forrnas:

a) Acumulando as freqiiencias simples relativas de accirdo com a defini�ao


de freqiiencias acumuladas.

b) Calculando as freqiiencias relativas diretamente a partir das freqiiencias



absolutas, de acordo com a defini�o de freqiiencias relativas: Fr; = i: .
Considerem-se os exemplos das Tabelas 2.14 e 2.15.
Na Tabela 2.14, Fr3 = 0,66, por exemplo, indica que sessenta e seis
por cento das peyas examinadas apresentaram ate dois defeitos. Na Tabela
2.15, Fr5 0,37 indica que trinta e sete por cento dos alunos obtiveram
=

50, ou, por outra, que trinta e sete por cento dos
notas iguais ou inferiores a
alunos obtiveram nota compreendida na faixa de 0 a 50.

2.5.3. Frequencias Acumuladas "Acima de"

a) Frequencia Absoluta Acumu/ada


A freqtiencia absoluta acumulada "acima de" uma classe ou de um
valor individual representa o numero de observayoes existentes alem do valor
ou da classe, incluindo no cilculo as observay<>es correspondentes a esse valor
ou a essa classe. Para obter a freqtiencia absoluta acumulada (acima de), basta
somar a freqtiencia simples absoluta da classe ou do valor individual as
freqi.iencias simples absolutas das classes ou dos valores individuais posteriores. 65
TABELA 2.18

Notas Obtidas por 500 Alunos em um Teste de Estatfstica

Fj
Notas fj "Acima de"

01-- 10 5 500
101-- 20 15 495
201-- 30 20 480
301-- 40 45 460
401-- 50 100 415
501-- 60 130 315
601-- 70 100 185
701-- 80 60 85
801-- 90 15 25
901--100 10 10

500

Considere-se o exemplo da Tabela 2.16. 0 valor F5 =415 indica que


houve quatrocentos e quinze alunos com notas iguais ou superiores a 40.

b) Frequencia Relativa Acumulada


A freqiiencia relativa acumulada "acima de" classe ou do valor indi­
vidual j, exemplificada na Tabela 2.17, e igual a soma da freqiiencia simples
relativa dessa classe ou desse valor com as freqiiencias simples relativas das
classes ou dos valores posteriores. Da mesma forma como no caso anterior,
pode-se obter as freqiiencias relativas acumuladas "acima de" a partir:

TABELA 2.17
Notas Obtidas por 500 Alunos em um Teste de Estatlstica
I
I
Descordo Deacordo
I Fj com oitem (a) com oitem (b)
Notas 'i frj (%)
I Aic made
I
Frj (%) Frj
I Aic made Aic made
Of-- 10
101-- 20
5 : 1 500 100 500/500=1 ,00 OU 100%
15 I 3 495 99 495/500 = 0,99 OU 99%
201-- 30 20 I 4 480 96 480/500=0,96 OU 96%
301-- 40 45 I 9 460 92 460/500=0,92 OU 92%
401-- 50 100
I 20 415 83 415/500 = 0,83 OU 83%
I
501-- 60 130 26 315 63 315/500=0,63 63%
I OU

601-- 70 100 I 20 185 37 185/500 = 0,37 OU 37%


701-- 80 60 I 12 85 17 85/500=0,17 OU 17%
801-- 90 15 I 3 25 5 25/500 = 0,05 OU 5%
901--100 10 I 2 10 2 10/500=0,02 OU 2%
I
66 500 I 100
a) da defini�ao de freqilencias acumuladas;

b) da defini�o de freqilencias relativas.

2.6. ROTEIRO PARA A ELABORACAO DE UMA TABELA DE


FREOUENCIAS COM DADOS AGRUPADOS EM CLASSES

Para a constru�o de uma tabela de frequencias, e conveniente adotar-se


um roteiro que, embora baseado em criterios relativamente arbitrarios, facilita
e torna mais operacional o trabalho de quern ira montar a tabela. 0 roteiro
proposto consta dos seguintes passos:
a) Lista de dados brutos que pode ou nio ser transformada em rol.
b) Encontrar a amplitude total do conjunto de valores observados.

Maior valor Menor valor


At= do conjunto do conjunto

c) Escolher o numero de classes (k). Alguns autores prop(iem que se escolha


arbitrariamente entre um minimo de cinco e um maximo de vinte classes, ressaltando,
todavia, que, quanto maior o numero de observa¢es, maior devera ser o numero de
classes e vice-versa. No item 2.4.3 desse cap{tulo Coram apresentados dois criterios mais
objetivos para a determina�iio do numero de classes: a formula de Sturges e a tabela
de Kelley, os quais, eventualmente, poderiio ser utilizados pelo leitor.

d) Determinar a amplitude do intervalo de classe. A amplitude do intervalo


de classe sera igual ao quociente entre a amplitude total da serie e 0 numero de classes
escolhido.

At
Amplitude do Intervalo de Classe =k (7)

Muitas vezes, ao efetuar a divisiio acima, pode-se chegar a um resultado nio


muito conveniente, sob o aspecto de montagem das classes. Neste caso, convem arre­
dondar o nlimero correspondente a amplitude do intervalo de classe a que se chegou
para um numero mais adequado, que facilite os c8lculos (arredondamento arbi­
trario ).
e) Determinar os limites das classes, escolhendo-se, preferencialmente,
numeros inteiros.

O Construir a tabela de freqilencias, conformc sugerido anteriormente.

EXERCiCIOS RESOLVIDOS

2.1. A tabela abaixo representa os salarios pagos a l 00 operarios da empresa


GLT & Cia.
2. l. l . Determinar: F requencias absolu tas acumuladas ( "abaixo de'');
frequencias simples relativas e frequencias relativas acumuladas ("abai­
xo e acima de'').

2.1.2. Quantos operarios ganham ate dois salarios mfnimos? 67


N'! de salarios N<? de operarios
mfnimos (fj)
01--- 2 40
21--- 4 30
41-- 6 10
61--- 8 15
8 1--10 5

Total 100

2.1.3. Quantos operarios ganham ate 6 salarios minimos exclusive ?

2.1.4. Qual a porcentagem de operarios com salario entre 6 e 8 sala­


rios minimos?
2.1.5. Qual a porcentagem de operarios com salario inferior a 4 sala­
rios minimos?

Soluriio
2.1.1.
Frj
Fj
Classes 'i "Abaixo de" frj "Abaixo de" "Acima de"

01-- 2 40 40 0.40 0.40 1,00


21-- 4 30 70 0,30 0,70 0,60
41-- 6 10 80 0,10 0,80 0,30
61-- 8 15 95 0,15 0,95 0,20
81--- ·10 5 100 0,05 1,00 0,05

Com aux11io da tabela construida em resposta a pergunta 2.1.1.,


podemos responder as demais, conforme segue: \

2.1.2. 40 operarios
2.1.3. 80 operarios
2.1.4. 0,15 OU 15%
2.1.5. 0,70 OU 70%
2.2. A tabela de freqiiencias apresenta 4 falhas de constru�ao. Quais sao?

Classes Fj

0---I 2 80

4 --I 6 0

61--- 8 10

8 ---110 10

68 100
Solurao
a) falta a classe 2 --1 4
b) o valor 6 esta inclu{do na scgunda e na terceira classes
c) Fj no lugar de lj
d) 80% das freqilencias c oncentrados na prirneira classe e nenhuma freqilencia
na segunda classc

2.3. Os dados seguintes representam 20 observa\:oes relativas ao fndice


pluviometrico em determinados municipios do Estado:

Milfmetros de chuva

144 152 159 160


160 151 157 146
154 145 141 150
142 146 142 141
141 150 143 158

2.3.l. Determinar o numero de classes pela regra de Sturges.

2.3.2. Construir a tabela de freqilencias absolutas simples.

2.3.3. Determinar as freqilencias absolutas acumuladas ("abaixo de'').

2.3.4. Determinar as frequencias simples relativas.

2.3.5. Determinar as freqilencias relativas acumuladas ("abaixo de'').

Soluriio
2.3.l. k =1 + 3,3 log10 N

N = 20 log k = 1 + 3,3 log 20


k 1 + 3,3 (1,3010)
=

k 5,29 jk � 5j
= OU

A1 =Amplitude total= 160 - 141 = 19


Ar
c = = 19-;- 5 = 3,8 �4
k

2.3.2. Classes
Cont. 'i
Mil. de chuva

140 ----1144 1S1r 7


144 ----1148 n 3
148--H52 0 4
152 ----1156 I 1
156 ---1160 ISi 5

Total 20
69
2.3.3./2.3.4./2.3.5.
Classes fj Fj '' Frj
i

140 ----1144 7 7 0,35 0,35


144 ----1148 3 10 0,15 0,50
148 ----1152 4 14 0,20 0,70
152---1156 1 15 0,05 0,75
156 ----1160 5 20 0,25 1,00
-

20 1,00

2.4. A tabela abaixo representa a distribuic;ao das espessuras de 100 folhas


de tabaco:

2,01 2,08 1,96 3,04 2,01 3,18 1,94 2,19 2,24 2,18
2,59 1,96 2,29 3,18 2,09 1,96 2,06 2,18 2,05 2,04
2,43 1,56 1,94 3,15 2,35 2,08 2,56 2,17 1,96 1,59
2,22 2,34 2,24 1,95 2,01 3,12 3,03 3,12 2,04 1,66
1,87 2.49 3,12 2,24 1,76 3,20 2,38 1,58 1,89 1,98
1,89 1,71 2.42 1,62 1,97 2,18 1,69 3,14 2,18 3,06
2,40 1,96 3,01 2,19 2,25 1.45 1,93 2,06 1,83 1,84
1,91 2,11 1,78 2,36 2,33 3,17 2,03 1,87 3,11 2,17
1,72 1,62 1,99 1,64 1,54 2,26 1,86 2,09 1,74 1,92
2,36 1,82 2,02 2,25 1,75 3,15 3,18 \ 1,99 1,76 2,51

Construir a distribuic;ao de freqiiencias com 9 classes de amplitude 0,2,


sendo que 0 limite inferior da 1 i:i classe e igual a 1,40.
Soluriio
Espessuras Contagem fj

1.40 I-- 1,60 ISi 5


1,60 I-- 1,80 ISllSll 12
1,80 I-- 2,00 ISi ISi ISi ts1 n 23
2,00 I-- 2,20 ts1 ts1 ts1 ts1 n 23
2,20 I-- 2.40 ISi ISi 0 14
2.40 I-- 2,60 ISll 7
2,60 I-- 2,80
2,80 I-- 3,00
3,00 f-- 3,20 ISi ISi ISi I 16

100

EXERCICIOS PROPOSTOS
2.5. Considere a seguinte distribuic;ao de freqiiencias correspondente aos
diferentes prec;os de um determinado produto em vinte lojas pesqui­
70 sadas.
PrlJ(:OS N9 de lojas

50 2
51 5
52 6
53 6
54

Total 20

2.5.1. Quantas lojas apresentaram um pre�o de CrS 52,00?

2.5.2. Construa uma tabela de freqiiencias simples relativas.

2.5.3. Construa uma tabela de freqiiencias absolutas acumuladas.

2.5.4. Quantas lojas apresentaram um pre�o de ate Cr$ 52,00 (inclu-


sive)?

2.5.5. Qual a porcentagem de lojas com pre�o de ate Cr$ 53,00


(inclusive)?
2.5.6. Qual a porcentagem de lojas como pre�o maior do que Cr$
51,00 e menor do que Cr$ 54,00?

2.6. Considere a seguinte tabela:

Classes fj

2, 751-- 2,80 2
2,80 I-- 2,85 3
2,851-- 2,90 10
2,90 I-- 2,95 11
2,951-- 3,00 24
3,00 f-- 3,05 14
3,051-- 3, 10 9
3,10f-- 3, 15 8
3,15 f-- 3,20 6
3,20 f-- 3,25 3

90

Identificar os seguintes elementos da tabela:

2.6.1. Freqiiencia simples absoluta da quinta classe.

2.6.2. Freqiiencia total.

2.6.3. Limite inferior da sexta classe. 71


2.6.4. Limite superior da quarta classe.

2.6.5. Amplitude do intervalo de classe.

2.6.6. Amplitude total.

2.6.7. Ponto media da terceira classe.

2.6.8. Numero total de classe.

2.6.9. Freqiiencia absoluta acumulada alem da sexta classe.

2.6. IO. Porcentagem de valores iguais ou maiores que 3,20.

2.7. Um produto e vendido por apenas tres empresas, em um determinado


mercado. Em determinado ano, para um total de 18 000 unidades
vendidas, tivemos a seguinte distribuis;lio das vendas:

Empresas A 8 c

Vendas 7 200 4 800 6 000

Detenninar a distribuis;ao percentual das vendas.

2.8. Complete o quadro de freqiiencias abaixo:

Classes fj Fj
)
0-----l 2 3 3
2 -----! 4 ? 8
4 -----! 6 8 16
6 -----! 8 10 26
8 -----!1 0 ? 28

2.9. A tabela seguinte representa as alturas (em cm) de 40 alunos de uma


classe.

162 163 148 166 169 154 170 166


164 165 159 175 155 163 171 172
170 157 176 157 157 165 158 158
160 158 163 165 164 178 150 168
166 169 152 170 172 165 162 164

2.9.1. Calcular a amplitude total.


2.9.2. Admitindo-se 6 classes, qual a amplitude do intervalo de
classe?

2.9.3. Construir uma tabela de freqiiencias das alturas dos alunos


admitindo que o limite inferior da H classe seja 148 cm.

2.9.4. Determinar OS pontos medias das classes.

72 2.10. Assinale a alternativa correta:


2.10.1. Popula�ao OU Universo e:
a. Conjunto de pessoas.

b. Conjunto de indiv{duos apresentando uma caracterlstica especial.

c. Conjunto de todos os indiv{duos apresentando uma caracteristica comum


objeto de estudo.

2.10. 2. Os fenomenos de Massa sao:


a. aqueles em que as caracteristicas observadas niio valem para os indiv{duos;

b. aqueles que niio podem ser definidos por uma simples observa«;lio;

c. aqueles que irlio compor os fenomenos coletivos.

2.10.3. A variavel e discreta quando:


a. dados dois valores reais, podemos encontrar pelo menos um valor entre
eles;

b. a menor diferen11a niio nula entre dois valores dados for finita;

c. dados dois valores reais, a diferen1<a entre eles e zero.

2.10.4. As fases principais do metodo estatistico sao:


a. coleta dos dados, amostragem, apresenta111io tabular e apresenta«;iio grafica
e defini\;iio dos problemas;
b. amostragem, apresenta1<1io tabular, apura111io dos dados, interpreta1<lio dos
dados e planejamento;

c. defini1<1io do problema, planejamento, coleta dos dados, apura\;iio, apre­


senta«;lio dos dados, arnilise e interpreta\;ii o dos dados.

2.10.5. A Serie Estatistica e chamada cronol6gica quando:


a. 0 elemento variavel e 0 tempo;

b. 0 elemento variavel e 0 local;

c. nlio tern elemeuto vari.<vel.

2.10.6. Amplitude total e:


a. a diferen«;a entre dois valores quaisquer de um conjunto de valores;

b. a diferen\;a entre o maior e o menor valor observado da variavel dividido


por 2;

c. a diferen«;a entre o maior e o menor valor observado da variavel.

2.10. 7. Para obter o ponto medio de uma classe:


a. soma-se ao seu limite superior metade de sua amplitude;

b. soma-se ao seu limite inferior metade de sua amplitude;

c. soma-se ao seu limite inferior metade de sua amplitude e divide-se o resulta­


do por 2.

2.10.8. Freqiiencia simples absoluta de um valor da variavel e:


a. o numero de repeti1<oes desse valor;

b. a porcentagem de repeti«;oes desse valor;

c. o numero de observa1<oes acumuladas ate esse valor. 73


2.10.9. Freqiiencia total e:
a. o numero de repeti1;oes de um valor da variavel;

b. a soma das freqiiencias simples absolutas;

c. a soma das freqiiencias relativas menos as freqiiencias absolutas.

RESPOST AS DOS EXERCiCIOS PROPOSTOS


2.5.1. 6

2.5.4. 13
2.5.5. 95%

2.5.6. 60%

26.1. 24

2.6.2. 90

2.6.3. 3,00
2.6.4. 2,95
2.6.5. 0,05
2.6.6. 0,5
2.6.7. 2 ,875

2.6.8. K= 10

2.6.9. 26

2.6.10. 3,33%

2. 7. 40%; 26,7%; 33,3%

2.8. 5; 2

2.9.1. 30

, 2.9.2. 5

2.9.3. 3; 6; 6; 13; 9; 3

2.9.4. 150,5; 155,5; 160,5; 165,5; 170,5; 175,5

2.10.1. c
2.10.2. b

2.10.3. b

2.10.4. c
2.10.5. a

2.10.6. c
2.10.7. b

2.10.8. a

74 2.10.9. b
Apresentafiio Grafica

No capitulo anterior fez-se referencia a utilidade das tabelas como


instrumento de anaJ.ise e de apresenta'tlio de dados estatisticos. Afirmou-se
que as tabelas de elassifica'tliO cruzada podem auxiliar no estudo da inter­
-rela'tlio entre duas ou mais variaveis, ressaltando-se sua utilidade geral como
dispositivo para a apresenta'tlio sistematica de dados estatisticos.

A apresenta'tliO grafica e um complemento importante da apresenta'tliO


tabular. A principal vantagem de um grafico sobre a tabela prende-se ao fato
de que ele permite conseguir uma visualiza'tlio imediata da distribui'tlio dos
valores observados. Propiciam os graficos uma ideia preliminar mais satis­
fat6ria da concentra'tlio e dispersao dos valores, uma vez que atraves deles
os dados estatisticos se apresentam em termos de grandezas visualmente
interpretaveis. Por outro lado, os fatos essenciais e as rela1,:0es que poderiam
ser dificeis de reconhecer em massas de dados estatisticos podem ser obser­
vados mais claramente atraves dos graficos.

3.1. CLASSIFICACAO DOS GRAFICOS SEGUNDO A FORMA

Ha tres tipos de graficos, classificados quanto ao criterio da forma:


a) Diagramas
Os. diagramas sio graficos geometricos dispostos em duas dimens0es. Os
diagramas sao os graficos mais usados na representa�ao de series esta­
tlsticas e se apresentam atraves de uma grande variedade de tipos.

b) Cartogramas
Os cartogramas sio ilustra�es relativas a cartas geograficas, Jargamente
difundidas em Geografia, Historia e Demografia.

c) Estereogramas
Os estereogramas representam volumes e sio apresentados em tres
dimens0es. Muitas vezes sao confeccionados em cartolina ou madeira,
quando nao desenhados em perspectiva. 75
3.2. CLASSI Fl CACAO DOS GRAFICOS SEGUNDO 0 OBJETIVO (USO)

E possivel distinguir, de certo modo arbitrariamente, dois objetivos


que justificariam o emprego de graficos. Os graficos sao usados para apre­
sentar visualmente dados numericos, proporcionando maior facilidade e
rapidez de compreensao dos mcsmos, ou, entao, para apresentar conclusoes
ou resultados de uma analisc. Ha, portanto, dois tipos de graficos, conforme
o objetivo ou uso a que se destinam: graficos de informa<yao e graficos de
analise.

3.2.1. Graficos de I nformai;ao

Sao graficos destinados principalmente ao publico em geral, objeti­


vando proporcionar uma visualiza<yao rapida e clara da intensidade das moda­
lidades e dos valores rclativos ao fenomeno observado. Sao graficos tipica­
mente expositivos, devendo, por conseguinte, ser o mais completo possivel,
dispensando comentarios explicativos adicionais. Nos graficos de informaiyao
nao se dcve prescindir dos titulos, escritos em letra de forma. Ja as legendas
podem ser omitidas, desde que as informa<yoes desejadas estejam presentes,
possibilitando a completa interpretaiyao do grafico.

A figura seguinte mostra como podem os dados estatisticos ser apre­


sentados atraves de um grafico de informa<yao, �e forma a facilitar sua
avalia<yao. Os dados sobre a exporta<yao acumulada mensal de um artigo sao
apresentados juntamente com um padrao (exporta<yao prevista), de modo que
a exporta9ao efetiva possa ser facilmente comparada com aquele padrao.
No Grafico 3.1, a gerencia tern rapidamente a noiyao comparativa sobre a
exporta<yao efetiva e a planejada, bem como a no<yao sobre as flutuaiyoes
mensais.
0 Grafico 3.1 e tipico dentre aqueles destinados a auxiliar a adminis­
traiyao a avaliar e controlar opera<yoes. Graficos dessa modalidade permitem
que se comparem as variaveis, cujo comportamento interessa estudar, com
certos padroes, que se faiyam prediyoes ou se chegue a outros objetivos quanti­
tativamente definidos, para determinar se as opera<yoes efetivas estao atin­
gindo as metas propostas. Mediante uma revisao peri6dica, a gerencia obtem
um quadro explicativo rapido das operaiyoes.

3.2.2. Graficos de Analise

Os graficos de analise prestam-se melhor ao trabalho estatistico, forne­


cendo elementos uteis a fase de analise dos dados, sem deixar de ser tambem
informativos.

Quando se usam graficos para apresentar os resultados de uma analise,


esses freqiientemente vem acompanhados de uma tabela. lnclui-se, muitas
vezes, um texto dissertativo, chamando a aten<yao do leitor para os pontos
76 principais revelados pclo grafico ou pela tabela. Muitos relat6rios adminis-
GRAFICO 3.1 - EXPORTACAO DO ARTIGO X

Exportai;:ao �------�

/
60 000 /
/
60 000
/
/
Exportai;:ao prevista /
/

50 000 (acumulada) / 50 001


>----
40 000 40 000
Exportai;:ao efetiva
30 000 (acumulada) 30 000

20 000 20 000

10 000 10 000

0 0
J F M A M J J A S O N D

trativos, economicos ou de qualquer outra natureza combinam as tres formas


de apresentayao de dados. lsto porque, na pratica, poucas pessoas tern habi­
lidade com mimeros, e as que tern dificuldade consultarao, via de regra,
apenas o grafico. Por outro !ado, a maior parte das pessoas nunca examinara
as tabelas estatfsticas, preferindo analisar os graficos e eventualmente
procurar no texto a informayao adicional necessaria.

3.2.3. Uso lndevido dos Graficos

Muitas vezes, o uso indevido dos graficos pode trazer uma ideia falsa
dos dados que estao sendo analisados, chegando mesmo a confundir o leitor.
Vej amos, atraves de um exemplo, como esse fato pode ocorrer. Os tres
graficos apresentados a seguir representam o mesmo fenomeno atraves do
mesmo grupo de dados. A primeira impressao e a de que OS tres graficos
representam dados nitidamente diferentes.

No Grafico 3.2, as flutua96es das vendas parecem ser moderadas; j a no


Grafico 3.4, tem-se a impressao de que a flutuayao das vendas nao manifesta
praticamente tendencia alguma, exceto leve flutuayao. Trata-se, na realidade,
de um problema de construyao de escalas. Enquanto o Grafico 3.2 se apre­
senta com uma escala mais ou menos convencional, os demais revelam pro­
pory6es consideravelmente diferentes para as escalas em que foram divididos
os dois eixos.

Examinando superficialmente os tres graficos e nao prestando muita


atenyao as escalas e a outros detalhes tecnicos, o leitor certamente recebera
impressoes diferentes sobre a flutuayao das vendas. 77
GRAFICO 3.2 - VENDAS DO ARTIGO Y GRAFICO 3.3 VEN DAS DO ARTI GO Y

3,0

2,9
4

..
.. 2,8
e e
·;;; ·a;
N
3 N

2 2 2,7
"
"
..
.. "O
"O 2 ..
..
..
..
>O 2,6
>O .J:.
.J:.

:E :E
2,5

0 2,4
J F M A M J J A S O
1975

J M M J S
/ 1975

GRAFICO 3.4 - VENDAS DO ARTIGO Y

..
e 4
·a;
N

2
" 3
Cl)
"O
.. 2
"'
>O
.J::.

:E
0
J F M A M J J A s 0

1975

3.2.4. Principais Tipos de Graficos

3.2.4.1. Graficos em Barras (horizontais)


Os graficos em barras tern por finalidade comparar grandezas, por meio
de retiingulos de igual largura e alturas proporcionais as respectivas grandezas.
Cada barra (ou coluna) representa a intensidade de uma modalidade do
78 atributo. 0 Grafico 3.5, em barras, representa as vendas efetuadas pela
empresa VASIGLASS S.A., fabricante de vasilhas de vidro, conforme os
diferentes tipos desses recipientes, expressando-se as vendas de cada tipo
como percentagem das vendas totais.

As magnitudes das barras sao representadas pelos respectivos compri­


mentos e seu trayado e feito tendo-se como referenda uma escala horizontal.
Em geral, as divisoes da escala se prolongam em trayos verticais por todo o
grafico, facilitando assim a leitura do comprimento de cada barra. A identi­
ficayao da barra e inscrita a esquerda do grafico.

GRAFICO 3.5 - VASIGLASS S.A.


VENDAS DE VASILHAS, POR TIPO, EXPRESSAS COMO PERCENTAGEM
DAS VENDAS TOTAIS, 1972

TIPOS DE VASILHAS 0 5 10 15 20 25 30 35 40%

Para al imentos (boca Iarga)

Farm6cia e cosm8ticos

Utilidade geral

Garrafas de cerveja

Lieores

Alimentos (boca estreita)

Garrafas de refrigerantes

Vasilhas caseiras

0 5 10 15 20 25 30 35 40%

Ha quatro orientayoes gerais a sercm observadas na construyao de um


grafico em barras horizontais:

a) As barras so diferem em comprimento, e nio em largura, a qual e


arbitraria.

b) As barras devem vir separadas umas das outras pelo mesmo espac;o, o qua!
deve ser suficicnte para que as inscric;oes que identificam as diferentes
barras nao tragam confusiio ao leitor. Como regra pratica pode-se tomar
o espac;o entrc as barras com·o aproxirnadamente a metadc ou dois terc;os
de suas larguras.

c) As barras dcvem ser desenhadas observando sua ordem de grandeza,


para facilitar a leitura e analise comparativa dos valores. Normalmente, a
ordem e decrcscente, a barra superior representando o maior valor. Cate­
gorias gerais que costumam vir com inscric;oes do tipo "outros", "demais"
etc. aparecerao representadas na barra inferior, mesmo que seu compri­
mento exceda o de alguma outra, uma vez que ela representa o agrupa­
rnento de classes relativamente pouco importantes.

d) Um grafico, construldo para mostrar grandezas absolutas, devera ter uma


linha zero claramente definida e uma escala de quantidades ininterrupta, 79
caso contnirio a leitura e a interpretar;iio do gr:ifico poderiio ficar
distorcidas.

Existem outros tipos mais elaborados de graficos em barras. Entre eles


destacam-se tres: o grafico de barras compostas, o grafico <le barras agrupadas
e o grafico de barras bidirecionais.

Grrifico de Barras Compostas


0 grafico de barras compostas difere do grafico de barras convencional
apenas pelo fato de apresentar cada barra segmentada em partes compo­
nentes.

GRAFICO 3.6 IMPORTACAO BRASILEIRA DE VINHO E CHAMPAGNE


-

PROVENIENTES DE VARIAS ORIGENS, 1972 - 1100 dolaresl


PAISES 0 50 100 150 200 250 300 350 400

Fran�a

Portugal Vinho

Italia

Espanha Champagne

Chile

Argentina

(Dados fictlcios) 0 50 100 150 200 250 300 350 400

Atravcs dcssc grafico e possivel comparar visualmente a importancia


rclativa <las importayoes provenientes dos seis paises, as importay6es totais
por pais, bem como as importa96es provenientes de cada uma <las origens,
por produto.

Grdfico de Ba"as Agrupadas


Sc for mais importante estabelecer a compara9iio entre as importa96es
de cada um dos paises, para cada produto e entre categorias de produto,
poder-se-a construir o grafico de barras agrupadas (Grafico 3. 7).
Nesse caso, os dados de importa9ao correspondentes a cada origem
sao apresentados separadamente, para facilitar a compara9iio. Esse grafico
niio permite, contudo, comparar, com facilidade, as importa96es totais de
cada produto.

Graficos de Barras Bidirecionais

Quando se deseja representar, graficamente, quantidades positivas e


negativas, como, por exemplo, perdas e ganhos, mudan9as de percentagens
em periodos de tempo sucessivos e desvios positivos ou negativos em torno
80 de um valor padrao, o grafico de barras bidirecionais e muito mais indicado.
GRAFICO 3.7 - IMPORTACAO BRASILEIRA DE V.INHO E CHAMPAGNE
PROVENIENTES DE VARIAS ORIGENS, 1972 - (1.000 dolares)

PA[SES 0 50 100 150 200 250

Fran�a

- Vinho

Portugal � Champagne

Italia

Espanha

Chile

Argentina

(Dados fictfciosl 0 50 100 l50 200 250

Para a constru�ao desse tipo de grafico, tra�am-se as barras a esquerda


e a direita de uma linha vertical, tambem chamada linha zero. As barras que
representam quantidades positivas devem ser dispostas em ordem descen­
dente; as que representam quantidades negativas, em ordem ascendente.

GRAFICO 3.8 - EVOLUCAO DAS VENDAS DA CIA. X ENTRE OS ANOS DE 1971 E 1972

UNHA DE PROOUTOS -50 -40 -30 -20 -10 0 10 20 30 40 50 (%)

Liquidificadores

Batedeiras de Bolo

Refrigeradores

Exaustores

Maquinas de Lavar Roupa

Aquecedores E l�tricos

(Dados fictlcios) -50 -40 -30 -20 -10 0 10 20 30 40 50 (%)

Se uma empresa, por exemplo, exporta uma linha de produtos eletro­


domesticos, poderia estudar comparativamente a situa�o de cada um deles
em termos de sua evolu�o percentual de um periodo a outro, como
mostra o Grafico 3.8. 81
3.2.4.2. Graficos em Colunas
Os graficos em colunas OU graficos em barras verticais prestam-se a
mesma finalidade que os graficos em barras horizontais, sendo, entretanto,
preferiveis a esses ultimos quando as legendas a se inscreverem sob os retan­
gulos forem breves. Caso contrario, o emprego do grafico em barras e mais
adequado. Entao, a 11nica diferenc;:a entre os graficos em barras horizontais e
os :':m colunas reside na direc;:ao dos retangulos, agora verticais. Todas as
demais observayaes apresentadas anteriormente sao extensiveis a esse ultimo
caso.

Os graficos em colunas prestam-se em especial a representayao, analise e


interpretac;:ao de dados relacionados com series de tempo, como, por
exemplo, as vendas de um produto em periodos sucessivos. Se11do assim, as
colunas deverao estar dispostas em ordem cronol6gica. Por outro lado, em
casos como esses, em que os valores podem descrever uma variayao continua,
as barras ou colunas podem ser apresentadas contiguas umas as outras.
TABELA 3.1

PRODUCAO MEDIA MENSAL DE CARVAO BETUMINOSO


PELO PAIS X NO PERIODO DE 1965 A 1972

Quantidade /
Anos
(mil toneladas)

1965 45
1966 50
1967 70
1968 80
1969 130
1970 150
1971 200
1972 210
Fonte: (dados fict(cios).

GRAFICO 3.9 - PRODUCAO MEDIA MENSAL DE CARVAO BETUMINOSO NO


PAIS X 1965 A 1972 hi
-

25(} 250

200 200

150 150

100 100

50 50

0 0
1965 1966 1967 1968 1969 1970 1971 1972
82
Muitas vezes, costuma-se colocar no topo ou no interior de cada coluna
o valor correspondente a sua altura. Esse procedimento permite eliminar a
escala.
A Tabela 3.1 apresenta a produyao media mensal de carvao betumi­
noso efetuada por um certo pafs, no periodo de1965 a 1972.
Atraves do Grillc o 3.9 podemos ver como a Tabela 3.1 ficara reprer
·sentada.
Os graficos em colunas podem aparecer de diversas maneiras, dentre as
quais se destacam tres: graficos em colunas superpostas, graficos de porcen­
tagens complementares e graficos em colunas remontadas.

Grtificos em Co/unas Superpostas


0 grafico em colunas superpostas corresponde ao grafico de barras
compostas. Tanto um quanta o outro servem para representar compara­
tivamente dois ou mais atributos. 0 Grafico 3.10 apresenta a produ�o de
televisores portateis e de televisores com mais de 20 polegadas da E mpresa Y.

GR,\FICO 3.10 - PRODUCAO DE TELEVISORES - EMPRESA Y 1970-1973

3500 3 500
3000 3000
� Mai
sde20
� Polegadas
2 500 2 500
2 000 2 000

1 500 1 500
llllllD Portatei
s
1 000 1 000

500 500

0 0
1970 1971 1972 1973

Grdficos de Porcentagens Complementares


0 mesmo fato representado pelo grafico de colunas superpostas pode
ser visto tambem em termos de participa�o percentual de cada tipo de
televisor no total produzido.
Cada coluna do grafico corresponde a 100%, e suas partes componentes
sao obtidas por meio de uma regra de tres simples. Para exemplificar: a
produ�o total de televisores em 1970, cujo valor e igual a altura da primeira
coluna do Grafico 3.10, corresponde a 100%; entao, a produyao de televisores
portateis correspondera, em 1970, a x por cento. Esquematicamente,

2 500 ----- 100%


2000 ----- x

2000 x 100
800!.
=

x 10
2 500 83
=
GRAFICO 3.11 - EMPRESA Y - PRODUCAO DE TELEVISORES 1970-1973

% %
100 100

80 80 Mais de 20
Polegadas

60 60

40 40 lllllll Portateis

20 20

0 0
1970 1971 1972 1973

Obtem-se a porcentagem do complemento por diferen9a: porcentagem


de televisores com mais de 20 polegadas: 100 - 80 = 20%. E assim se
procede sucessivamente, ate completar o grafico. /

Grdfico em Colu�s Remontadas


0 grafico em colunas remontadas presta-se aos mesmos prop6sitos que
o grafico em barras agrupadas. Ela permite que as compara9oes entre as
grandezas dos atributos sejam feitas mais facilmente. No Grafico 3.12 estao
representadas as vendas da empresa Y, discriminadas de acordo com o fato de
as vendas serem destinadas ao mercado externo ou ao interno.

GRAFICO 3.12 - VENDAS DA EMPRESA Y


VENDAS INTERNAS X VENDAS PARA 0 EXTERIOR - 1968-1972

Vendas Vendas
(1.000 cruzeiros) (1.000 cruzeiros)
700 700

600 600

500 500 Vendas


lnternas
400 400

300 300
Vendas ao
200 200
lllllll Exterior
100 100

0 0
1969 1970 1971 1972
84
3.2.4.3. Graficos Pict6ricos (Pictogramas)
Os graficos pict6ricos ou pictogramas sao construi'dos a partir de fi­
guras ou conjunto de figuras representativas da intensidade ou <las modali­
dades do fenomeno. Sao graficos muito freqiientes em jornais e revistas, tendo
como principal vantagem o fato de despertar a aten9iio do publico leigo.

GRAFICO 3.13 - CAMINHOES EXPORTADOS PELO BRASIL - 1970-1972

1970

= 1 000 caminh6es

1971
11/i
1972

No Grafico 3.13, cada figura representa 1 000 caminhoes.
Existem algumas regras basicas que regem a constru9ao de pictogramas:
a) Os simbolos devem ser auto-explicativos.

b) As diferentes quantidades devem expressar-se mediante maior ou menor


niimero de simbolos, e niio mediante um aumento ou diminui1<iio do
tamanho do simbolo basico.

c) Os g r:ificos deyem proporcionar uma visiio geral do fenomeno, e niio


detalhes minuciosos.

d) Os pictogramas estabelecem compara1<oes gerais, devendo ser evitados,


conseqiientemente, para interpretar afirma1<oes ou dados isolados.

3.2.4.4. Graficos em Linhas ou Graficos Lineares


Os graficos lineares siio freqiientemente usados para a representayiio de
series de tempo (quando um dos fatores for 0 tempo), isto porque quando
a serie cobre um grande numero de periodos de tempo, a representayao dos
valores atraves de colunas pode conduzir a uma excessiva concentra9ao de
dados. Como os movimentos siio indicados pelas alturas das colunas, estas
podem ser substitufdas por uma linha que siga os movimentos de suas partes
superiores. As linhas siio particularmente mais eficientes do que as colunas,
quando existem intensas flutua96es nas series ou quando ha necessidade de
se representarem varias series em um mesmo grafico.

Para construir o grafico em linhas, basta marcar os pontos correspon­


dentes aos valores observados em cada periodo e uni-los por meio de um tra90
continuo. 85
Os graficos em linhas podem aparecer como um conjunto de segmentos
de retas contiguos ou apresentarem-se "polidos". 0 Ultimo caso ocorre
quando 0 desenhista procura suavizar OS angulos que irao aparecer no
encontro de dois segmentos.

0 Grafico 3.14 representa a evoluyao das vendas de tratores de esteira


produzidos pela empresa Z, no periodo de 1965 a 1972.

GRAFICO 3.14 - VENDAS DE TRATORES DE ESTEIRA - EMPRESA Z 1965-1972


Numero de Tratores

700

600

600

400

300
200

100

0 L-_.___L_J.._-L..--L--'---'--
65 66 67 68 69 70 71 72 Anos

Observa�ao: Grafico com escala interrompida.

Frequentemente, em virtude da magnitude dos valores a serem repre­


sentados, pode ocorrer um espa�o inutil entre a linha do grafico e um dos
eixos . Sendo assim, costuma-se desenhar, junto a origem do eixo desejado,
uma linha em ziguezague, ou simplesmente interromper a escala no inicio ··

do mesmo.
GRAFICO 3.16 - COM�RCIO EXTERIOR DO BRASIL
I MPORTACAO (C.l.F.I
- 1963-1969 -

lmpcrtacao
Bilh5es de D61ares

1.400

2.200

2.000 /

1.800

1.600

1.400

1.200

1.000

800

63 64 65 66 67 66 69 Anos

86 Fonte: C.l.E.F.
No Grafico 3.15, ve-se claramente que o menor valor o bservado e signi­
ficativamente maior que zero. A representaylio dos valores sem a linha em
ziguezague provocaria um espayo inutil entre a linha do grafico e o eixo hori­
zontal, devido a extenslio da escala no eixo vertical.
0 uso de uma escala interrompida, entretanto, deve ser feito com
cautela, uma vez que ela distorce parcialmente a perspectiva do grafico. Assim,
uma pequena variaylio na intensidade do fenomeno pode parecer de grandes
proporyoes quando a escala for interrompida, urna vez que a atenylio do
leitor se concentrara apenas nos pontos da escala realmente significativos.

3.2.4.5. Graficos em Faixas

Os graficos em faixas slio graficos lineares, equivalentes em uso aos


graficos em barras compostas. Esse tipo de grafico sera apresentado em suas
diferentes modalidades, atraves de um exemplo.

TABELA 3.2
PRODUCAO BRASILEIRA DE CAMINHOES PESADOS - PERIODO 1962-1968

Anos
Segmento Exporta(:io
1962 1963 1964 1965 1966

Do ano 28992 15 928 16 169 15 716 21 029


Gasolina
Acumulada 28992 44920 61 089 76 805 9 7 834

Diesel Do ano 10678 8096 8 357 9 243 14022


(inclusive
onibus) Acumulada 10678 1 8774 27 1 31 36 374 5 0 396

(Dados Fict(cios)

A leitura na escala do grafico(Grafico3.16)corresponde aproduylio con­


junta dos segmentos Diesel e Gasolina. Assim, em 1962 a produylio de ca­
minhoos pesados foi da ordem de 39.67 9 unidades, valor que sera lido na esca­
la vertical. 0 segmento diesel foi responsavel por 10.678 unidades. Podemos
calcular a produylio de caminhoes a gasolina por diferenya:

39 670 - 10 678 = 28 992

Os graficos em faixas podem tambem ser um instrumento util para a


apresentaylio da produylio acumulada de caminhoes pesados. A representaylio
dos valores acumulados constantes da Tabela 3.2 sera feita conforme o
Grafico 3.1 7.

Os gnificos em faixas podem ainda ser utilizados para representar percen­


tagens complementares, da mesma fotma como acontece com os graficos em
colunas. Com os elementos da Tabela 3.2, constr6i-se outra, expressando os
valores de cada segmento como percentagens do total, trayando-se o grafico 87
GRAFICO 3.16 - PRODUCAO BRASILEIRA OE CAMINH0ES PESADOS
PERiODO 1962-1966

30 000

20 000

10 000

0
1962 1963 1964 1965 �966

GRAFICO 3.17 - PRODUCAO ACUMULADA DE CAMINHCES PESADOS


BRASIL 1962-1966
-

140

120

100

80

60

40

20

1962 1963 1964 1965 1966


88
correspondente a partir dai. A largura das faixas de cada segmento fornecera
a respectiva participac;ao percentual na producrao de caminhoes.

Para esclarecer melhor o calculo das porcentagens (participas;ao percen-


tual de cada segmento ), e apresentado a seguir 0 calculo da participas;ao

GRAFICO 3.18 - PRODUCAO BRASILEIRA DE CAMINHOES PESADOS


PARTICIPACAO PERCENTUAL DE CADA SEGMENTO - 1962-1966
%

80

60

40

20

0
1962 1963 1964 1965 1966

percentual do segmento Diesel na producrao de caminhoes pesados no


ano de 1963:

Produ\(ao do ano (segmento Diesel). . . . . . . . . . . . . . . . . . 8096


.

Produ\(ao do ano (segmento Gasolina). . . .... .


. . . . . 15 928
. . . .

Produ¢o total do ano (gasolina mais Diesel) .. . . . 24 024 . . . . . .

A participacrao percentual do segmento Diesel e determinada por meio


de urna regra de tres simples, lembrando que a producrao total do ano
representara 100%. 0 clilculo ficara:
24 024 ----- 100% 8096 x 100
x = = 33'73
8096 ----- x 24 024

Portanto, a participas;ao percentual do segmento Diesel na producrao


do ano de 1963 foi da ordem de 33,7%. A participac;ao percentual do
segmento gasolina podera ser obtida por diferen\:a: 100,0%- 33,7% = 66,3%.
Da mesrna forma procede-se para os outros anos., ate completar a tabela. 89
3.2.4.6. Graficos em Setores

Os gnificos em setores ou setogramas sao usados para representar


valores absolutos ou porcentagens complementares. Desta forma, a repre­
senta?o de porcentagens complementares pode ser feita atraves de diferentes
tipos de giaficos:
a) Graficos em Setores
b) Grwcos em Barras Compostas
c) Grwcos em Colunas (porcentagens complementares)
d) Grwcos em Faixas Complementares

0 grafico em setores tambem e conhecido coma gr:ifico circular ou


cartograma em setores. Para construi-lo, parte-se do fato de que o nfunero
total cie graus de um area de circunferencia e360. Assim, o riumero total
de valores analisados(100%, se quisermos representar as porcentagens com­
°
plementares) correspondera a 360 . Cada uma das parcelas componentes do
total dos valores podera, entao, ser expressa em graus, e a correspondencia
se fara atraves de uma regra de tres simples. Exemplificando:

TABELA 3.3
PRODUCAO AGRICOLA DO ESTADO A - ALGUNS PRODUTOS
1972
������� /
Produtos Ousntidade (t)

Caf6 ............ . 400 000


A�ucar ........... . 200 000
Milho . . . . . . • . . . . . • 100 000
Feijao ........... . 20 000

Total ........ . 720 000

Fonte: X (dados fictfcios)

Constr6i-se preliminarmente uma nova tabela (como a de numero 3.4),


da qual constem os elementos necessarios a constru�iio dos graficos, ou seja,
OS angulos representatiVOS dos valores (OU porcentagens) individuais de cada
produto.

0 calculo dos angulos oorrespondentes as quantidades exportadas e


desenvolvido a partir da informa�lio relativa a exporta?o total, 720 000
toneladas, a qual devera representar 360°:
Cdlculo do Setor Co"espondente ao Cafe

720 000 ---- 360°


0
90 400 000 ---- x
TABELA 3.4

Produtos Quantidade ft) Angulos correspondentes (Graus) %

Caf� . . . . ... . . . .
- 400 000 200 55,5
Ac,:ucar . . . . . . . . . . 200 000 100 27,8
Milho . . . . . . . . . . . 100 000 50 13,9
Feijao........... 20 000 10 2,8

Total . . . . . . . . . . . 720 000 360 ° 100,0

400 000 x 360


x = 2000
720 000
=

Calculo do Setor Correspondente ao Af!Lcar

720 000 ----- 360°


�o
200 000 ----

200 000 x 360


x = 1000
720 000
=

Calculo do Setor Correspondente ao Mi/ho

720 000 ---- 360°

100 000 ----


x0

100 000 x 360 = 500


x =
720 000

C<ilculo do Setor Correspondente ao Feijiio

720 000 ----- 360°

20 000 ----- Xo

20 000 x 360 = 100


x =
720 000

Resta agora a construs:ao do grafico. Com o auxilio de um transferidor,


faz-se a marca�o dos iingulos correspondentes as quantidades, partindo de
um ponto qualquer da circunferencia e seguindo o sentido dos ponteiros
do rel6gio:

A legenda poderia ser dispensada inscrevendo-se no interior de cada


setor a porcentagem ou a quantidade correspondente de cada um.

91
GRAFICO 3.19 - PRODUC::AO AGRiCOLA DO ESTADO A ALGUNS PRODUTOS - 1972

Legend a

fptff§ffl CAFIO

CTI ACUCAR

f!lllllll}J MILHO

1111 FEIJAO

GRAFICO 3.20 - PRODUCAO AGRiCOLA DO ESTADO A iALGUNS PRODUTOS - 1972

Cat� 55,5%

U bserva{:iiO:

Para a constru¢o de graficos em setores, nao e indispensavel a utili­


za9ao de um cfrculo de circunferencia (360°). 0 gnifico pode ser feito
tambem a partir de um semicfrculo (180°) ou de um quadrante (90°), con­
forme se utilize o semicfrculo ou o quadrante para a representa 9ao completa
do fenomeno.

3.2.4.7. Graficos em Coordenadas Po/ares

Os graficos em coordenadas polares sao construfdos sobre uma circun­


ferencia, dividida em um deterrninado numero de partes iguais, dependendo
do numero de valores a serem representados.

Para representar, por exemplo, a varia9ao de um determinado fenomeno,


temperatura media mensal, nos doze meses do ano, divide-se a circunferencia
em doze partes iguais, que figurarao como as doze dire96es radiais. Em seguida,
92 adota-se a media dos valores observados como o valor do raio do circulo.
Os dados da Tabela 3.5 referem-se a temperatura media mensal regis­
trada em uma determinada regiao, mes a mes. Essa tabela fornecera OS ele­
mentos necessarios a constru�o do grafico polar.

Inicialmente, toma-se como raio do circulo a media <las temperaturas


registradas na tabela, bastando, para isso, somar os valores constantes da

segunda coluna da Tabela 3.5 e dividir o total por doze: 2i�0 = 23°

TABELA 3.5
TEMPERATURAS MEDIAS MENSAIS REGISTRADAS NA REGIAO X - 1969

MeS6s Temperatura mklia mensal (°C)

Janeiro
Fevereiro
Mar�
Abril
Maio
Junho
Jul ho
Agosto
Setembro
Outubro
Novembro
Dezembro

276°

GRAFICO 3.21 - TEMPERATURAS MEDIAS MENSAIS REGISTRADAS


NA REGIAO X 1969
-

J
93
Desta forma, cada dire9ao radial funcionara como uma escala de valores
e cortara a circunferencia no valor 23. Ao longo das doze dire9oes radiais
serao assinaladas as temperaturas observadas, tomando uma dire¢o para cada
mes. Posteriormente, unir-se-ao os pontos assinalados e o grafico estara
concluido.

Os giaficos polares podem ser usados tambem para o registro de preci­


pita¢o pluviometrica ao longo do ano, arrecada9ao de irnposto mes a mes,
importa9oes e exporta9oes de um pals mes a mes etc.
3.2.4.8. Estereogramas

Usam-se os estereogramas para a representa¢o grafica de tabelas de


dupla entrada. Tais tipos de graficos sao pouco usados, dada a pequena

GRAFICO 3.22

precisao que oferecem e a dificuldade de o leitor apreciar com fidelidade as


varia96es do fenomeno, ja que os valores sao proporcionais a um volume.
As varia96es lineares sao mais faceis de interpreta¢o ao olho humano. A
titulo ilustrativo, apresentamos um estereograma na pagina anterior.

3.2.4.9. Graficos Triangulares

Usam-se os graficos triangulares quando se pretende representar tres


atributos simultaneamente. Os atributos deverao estar inter-relacionados, e
suas intensidades podem ser apresentadas em termos percentuais, que e o
caso mais comum.

Parte-se de um triangulo equilatero de altura igual a 100%. Ao tomar


um ponto qualquer no interior do triangulo, deve-se ler os valores corres­
pondentes as intensidades dos atributos, em tres escalas. Essas sao cons­
truidas sobre as medianas dos triangulos, devendo ser lidas no sentido dos
vertices. Desta forma, em cada vertice do triangulo, tem-se 100% de um dos
atributos e zero por cento dos outros dois.

Para estudar, por exemplo, o custo de produ¢o de um artigo como a


soma dos seguintes custos parciais: materia-prima, mao-de-obra e diversos, o
94 grafico triangular e muito util.
100

GRAFICO 3.23

Ao tomar o ponto A no interior do triangulo, por exemplo, e necessario


que sua leitura seja feita nas tres escalas: as escalas que fornecerao a partici­
pai;:lio percentual nos custos de produi;:ao, da materia-prima, da mlio-de-obra
e de diversos. A partir do ponto em questao, trayam-se paralelas aos eixos
das escalas ate o lado oposto aos vertices (linhas continuas). Para determinar
a participaylio percentual de cada atributo, bastara efetuar a leitura do
comprimento dessas paralelas, na escala correspondente.

3.2.4.10. Graficos Representativos de Distribui9oes de Frequencias

Os graficos usados para a representayao de distribuiy6es de freqiiencias


simples e acumuladas slio graficos tipicamente de analise. A representaylio
das freqiiencias simples e feita atraves do histograma OU do polfgono de.
freqiiencias, enquanto as freqiiencias acumuladas slio representadas pelo poli­
gono de freqiiencias acumuladas ou ogiva de Galton.

a) Histogramas

0 histograma e um grafico formado por um conjunto de retangulos


justapostos, de forma que a area de cada retangulo seja proporcional a
freqiiencia da classe que ele representa. Assim sendo, a soma dos valores
correspondentes as areas dos retangulos sera sempre igual a freqiiencia total.

0 histograma e construido tomando-se como referencia dois eixos


coordenados. No eixo horizontal, ou eixo das abscissas, slio anotados os. 95
valores individuais da variavel em estudo, ou os limites das classes. Por
conseguintc, a dimensao horizontal de cada retiingulo representara a classe.
No eixo vertical, ou eixo das ordenadas, sera construida a escala onde serao
lidos os valores relativos ao numero de observa�es ou freqiiencias da classe.
A area de cada retiingulo do histograma corresponde a freqiiencia da classe
que o retiingulo representa. Para determinar a altura do retangulo, basta
tomar a formula de calculo da area de um retiingulo:

I S=bX h I (1)

onde: b = base do retiingulo = amplitude do intervalo de classe


h = altura do retiingulo
s = area do retiingulo = freqiiencia da classe

Para tra9<lr o grafico deve-se calcular as alturas dos retiingulos.


Estas alturas sao tiradas da rela\:ao (1)

I h =

! I
A altura de cada retiingulo do histograma sera dada, entao, pelo
(2)

quociente entre a area (freqiieI1cia) deste retiingulo e a,tlmplitude do intervalo


de classe, que, em geraJ, e Constante.

Exemplo: Construir o histograma da serie a seguir:

TABELA 3.6
DISTRIBUICAO DAS EXPORTACOES DE 65 EMPRESAS FABRICANTES DE
COMPONENTES ELETRONICOS 1972 -

Numero de empresas
Volume exportado US$
Frequencias - fj -

50.0001--- 60.000 8
60.0001--- 70.000 10
70.000 1--- 80.000 16
80.0001--- 90.000 14
90.0001---100.000 10
100.0001---110.000 5
110.0001---120.000 2

Total 65

(Dados Ficticios)

Para calcular as alturas, acrescenta-se uma coluna a mais na tabela original,


como indicamos na Tabela 3.7.

Quando a base for unitaria, as alturas serao numericamente iguais as


96 freqiiencias.
TABELA 3.7

Volume exportado US$ Freqiiencias (fj) Alt. = (freq.) + (base)

50.000 !------ 60.000 8 8+10= 0,8


60.000 !------ 70.000 10 10+10=1,0
70.000 !------ 80.000 16 16+10=1,6
80.000 f----- 90.000 14 14+10= 1,4
90 .000 1-----100.000 10 10+10=1,0
100.0001-----110.000 5 5+10=0,5
110.0001---1
-- 20.000 2 2+10=0,2

Como pode ser visto na Tabela 3.7, as alturas sao proporcionais as


freqilencias. Para construir o histograma, adota-se o eixo perpendicular como
o das alturas. Posteriormente, elc sera substitufdo por um eixo de freqilencias,
}embrando, todavia, que OS valores lidos em ta} eixo se referem as areas dos
diferentes retangulos, e nao as suas alturas.

Na pratica, costuma-se construir o histograma utilizando diretamente o


eixo de freqilencias, ressalvando-se, evidentemente, o que foi dito no para­
grafo anterior.

0 histograma correspondente a tabela anterior ficara:

GRAFICO 3.24 - DISTRIBUl<;:AO DAS EXPORTA<;:OES DE 65 EMPRESAS


FABRICANTES DE COMPONENTES ELETRONICOS - 1972

Numero de Empresas
fj 16

14

12

10

2
0
50 60 70 80 90 100 110 120 Valor Exportado
(em milhares US$)

Assim como foi feito para representar graycamente as freqilencias


absolutas, e possfvel utilizar 0 histograma para representar as freqilencias
relativas. A figura do histograma sera a mesma. Havera apenas uma diferen�
em termos dos valores que comporao a escala do eixo vertical.

0 grafico correspondente ficara:


97
iRAFICO 3.25 - DISTRIBUICAO PERCENTUAL OAS EXPORTACOES
DE EMPRESAS FABRICANTES DE COMPONENTES ELETRONICOS - 1972

Porcentagem
de Empresas
(%)

50 60 70 80 90 100 110 120 Valor Exportado


(em milhares US$)

iRAFICO 3.26 - DISTRIBUICAO DAS EXPORTACOES DE


65 EMPRESAS FABRICANTES DE COMPONENTES ELETRQNICOS - 1972

16 )

14

12

10

0
50 60 70 80 90 100 110 120 Valor Exportado
(em milhares US$)

E comum utilizar no mesmo histograma dois eixos verticais, um a


8 direita e outro a esquerda. 0 ultimo representara as freqtiencias absolutas.
Tal procedimento apresenta a vantagem de possibilitar a representa<;:ao dos
dois tipos de freqiiencias simples utilizando apenas um grafico·.

b) Poligonal Caracteristica
A poligonal caracteristica e a representa<;:ao do contomo do histogra­
ma (Grafico 3.26).

c) Poligono de Freqiiencias

Unindo por linhas rctas OS pontos medios das bases superiores dos
retangulos do histograma, obtem-se outra reprcsenta<;:ao dos dados, deno­
minada Poligono de Freqiiencias.

0 poligono de freqiiencias pode referir-se as freqiiencias absolutas OU


as freqiiencias relativas, conforme a escala utilizada no eixo vertical. As
escalas podem aparecer simultaneamente.

GRAFICO 3.27 - DISTRIBUICAO DAS EXPORTACOES DE 65 EMPRESAS


FABRICANTES DE COMPONENTES ELETRONICOS 1972 -

16
Polfgono de Freqiiencias

14

12

10

50 60 70 80 90 100 110 120 Valor Exportado


(em milhares US$)

d) Poligono de Frequencias Acumuladas - Ogiva de Ga/ton

A Ogiva de Galton ou Poligono de Freqiiencias Acumuladas tern por


finalidade a representa<;:ao grafica das tabelas de freqiiencias acumuladas. 99
Esse tipo de grafico pode ser utilizado para representar as freqticncias acu­
muladas "abaixo de" e "acima de".

Quando o poligono de freqtiencias acumuladas se refere as freqiiencias


relativas, usa-se a denomina\:ao ogiva percentual ou poligono de freqiiencias
relativas acumuladas. Como ja observado, a representa\:ao das freqiiencias
relativas pode ser feita utilizando-se o mesmo grafico das freqiiencias abso­
lutas, alterando-se apenas a escala de leitura. Pode-se ainda apresentar a
escala das freqiiencias relativas a direita do grafico.

A Tabela 3.8 apresenta as freqiiencias acumuladas "abaixo de" e


"acima de", referentes ao problema das empresas fabricantes de compo­
nentes eletronicos.
TABELA 3.8

Volume exportado Numero de


Fj "Abaixo de" Fj "Acima de"
US$ empresas fj

50.000 t--- 60.000 8 8 65


60.000 t--- 70.000 10 18 57
70.000 t--- 80.000 16 34 47
80.000 t--- 90.000 14 48 31
90.000 t--- 100.000 10 58 I 17
100.0001-- 110.000 5 63 7
110.000 t---120.000 2 65 2

I fj = 65
j�1

GRAFICO 3.28 - REPRESENTACAO DAS FREQU�NCIAS ACUMULAOAS ."ABAIXO DE"

Freqiiencias Fj Frj
Freqiiencias
Acumuladas Relativas
"Abaixo de" 70
100 Acumuladas
60 90 (%)
80
50
70
40 60
34._ ....... 48.5
50
-- - - -- -

30
40
20 30
20
10 Volume
10
0 Exportado
0
50 60 70 80 90 100 110 120 (US$ 1.000)
100
Desejando-se saber, por exemplo, o numero de empresas com um
volume exportado de ate 80.000 d6lares, basta verificar, na escala das
freqiiencias absolutas acumulaclas, o numero correspondente a esse valor,
qual seja 34. Conclui-se que ha 34 empresas com um volume exportado de
ate 80.000 d6lares. Se o interesse recair na porcentagem de empresas com
ate 80.000 d6lares exportado, a leitura se fara na escala das freqiiencia�
relativas acumuladas. 0 resultado sera 48,5%.

GRAFICO 3.29 - REPRESENTACAO DAS FREQU�NCIAS ACUMULADAS "ACIMA DE"

70
100
60 90

50 80
70
40
60

30 50

40
20 lQ- 26%
17 --- 20
10
10
Volume
0 .L._.,_....L_--L_---1. __,1
_ __ ;;; _.J.+. 0
L__J..__-=:::;.i.. Exportado
50 60 70 80 90 100 110 120 (US$ 1000)

Para saber, por exemplo, o numero (ou a porcentagem) de empresas


com volume de exportayao superior a 90.000 d6lares, basta fazer, no
grafico, a correspondencia entre essa quantia e a freqiiencia acumulada,
absoluta ou relativa. Os valores correspondentes serao:

Fj = 17: ha dezessete empresas com um volume de exportayao igual ou


superior a 90.000 d6lares.
Fr
i
= 0,26 ou 26%: vinte e seis por .cento das empresas analisadas (dentre
as 65) apresentaram um volume de exportayao igual ou superior a
90.000 d6lares.
e) Grafico em Hastes (Bastiio)
Muitas vezes, o interesse recai na representayao grafica de dados nao
agrupados em classes, o que acontece quando os valores da variavel em
estudo aparecem individualmente. A representayao grafica, neste caso, difere
um pouco daquilo que foi visto ate o presente. 101
Na inspeylio de um lote com 1 000 peyas de precisao, produzidas por
uma empresa fabricante de instrumentos 6ticos, encontraram-se os resul­
tados reproduzidos na Tabela 3.9.

TABELA 3.9

NtJmero de PBfBS - fj -
Numero de defeitos
(Freqiiencia do numero de defeitos)

0 40
1 120
2 340
3 290
4 160
5 30

Total 1 000

A representaylio grillc a do fenomeno acima podera ser feita atraves


do grafico em hastes ou grafico em bastoes (Grafico 3.30). Poderia, altero
nativamente, ser feita a representaylio atraves de um histograma com bases
unitarias. Neste ultimo caso, as freqiiencias serao numericamente iguais as
alturas dos retangulos do histograma. A f6rmula S = b Xh sera aplicada,
agora, da seguinte maneira:

Freqiiencia (S)= Base (J)X Altura (h)

S=JXh=h

s=h I
GRAFICO 3.30

Numero de Pe�as fj frj Porcentagem das


Pe�s
360 36
-

300 -- 30

240 24

180 18
--

120 -- 12

60 6

0 .T
.
T Nl'.lmero de
0 1 2 3 4 5 Defeitos

102.
GRAFICO 3.31

Numero de P�as frj (%) Porcentagem


fj das Pei;:as

360 . 36

300 30

240 24

180 18

120 12

60 6

Numero de
Defeitos
0 2 3 4 5

Para estabelecer as bases dos retangulos, a partir dos valores da variavel


(numero de defeitos, no caso), procede-se da seguinte maileira:

1
Seja x; um valor qualquer da variavel. Fazendo-se ix; � 21' teremos

o limite inferior da base do retangulo. Para obter o limite superior basta

somar � a x;: ix; +�I· Procede-se da mesma maneira para todos os valores,

cujas freqiiencias se deseja representar atraves de retangulos.

Observa(:io: Nern sempre as bases dos retangulos serao unitarias.

f) Graficos em Escada
A representa�ao das freqiiencias acumuladas para valores individuais e
feita mediante o uso de um grafico em escada, conforme a figura do Grafico
3.32. A representa�ao das freqiiencias acumuladas com o recurso do poligono
de freqiiencias acumuladas, embora encontrada, nao e rigorosa, raziio por que
nao sera exemplificada.
Os dados que deram origem ao Grafico 3.32 siio os constantes da
Tabela 3.10. 103
GRAFICO 3.32

Numero de Pec;:as
Fj Frj (%)

1 000 100
I
900 I 90
I
___J
800 I 80
I
700 I
70
I
I
600 I 60
I
,------,
500 I I
50
I I
400 I I 40
I I
I I
300 I I 30
I I
200 I I 20
r--1 I
I I I
100 I I I 10
I I
-
.
� I I I I
Numero de
Defeitos
0 2 3 4 5

TABELA 3.10

Freqiiincias acumuladas
Numero de defeitos
Fj Frj (%)

0 40 4
1 180 18
2 520 52
3 810 81
4 970 97
5 1 000 100

g) Exemplos de Curvas de Frequencias


As curvas de frequencias (poligono de frequencias polido), em geral,
apresentam um formato, de certo modo, caracteristico, assemelhando-se ao
contorno de um sino, evidenciando uma forte concentra«;ao dos valores em
104 torno do centro da distribui«;ao.
Mesmo que a semelhan9a com um sino seja muito grande, e bem pro­
vavel que, na pratica, a curva apresente uma certa deforma9ao (distor9ao)
para a esquerda ou para a direita. Quanto a esse aspecto, e possivel distinguir
tres configura96es (Veja o Capitulo 6) para as curvas em forma de sino:

GRAFICO 3.33

1. C.ur:va sem Oeform�lo 2. Curva com Deform� 3. Curva com Oeforma(f:io


(Simdtrica> ii Direita 8 Esquerda

x 0

Outros formatos de curvas de freqiiencias podem scr cncontrados.


Sao apresentados a seguir alguns exemplos:

GRAFICO 3.34

1. Curva em Form• de U 2. Curva em Form1 de J 3. Curva em Forma de J


(Antimodall (Amodal) lnvertido (Amodall

0 x 0 x 0

h) A Curva de Lorenz·

A curva de Lorenz e um tipo de grafico usado para representar con­


ccntra9lio ou desigualdade de renda de receita, de riquezas etc. Na Tabela
3.11 estao registradas as informa96es relativas ao numero de depositantes de
um banco pequeno, agrupados segundo o volume de dep6sitos e o total
depositado em cada classe: 105
TABELA 3.11
NOMERO DE DEPOSITANTES E VOLUME DE DEPOSITOS DO BANCO X
(VALORES ACUMULADOSI

Va/ores percentuais
Numero de Volume de
Dep6sitos Depositantes Dep6sitos na classe
Depositantes Dep6sitos
(acumulado) (acumulado)
% %

Menos de 500 770 102.100 54,6 3.4


Menos de 1 000 980 255.100 69,5 8,6
Menos de 1 500 1 090 388.400 77,3 13,1
Menos de 2 000 1 160 505.100 82,3 17,0
Menos de 2 500 1 200 609.000 85,1 20,5
Menos de 5 000 1 310 1.002.800 92,9 33,7
Menos de 10 000 1 380 1.465.000 97,9 49,2
Acima de 10 000 1 410 2.976.200 100,0 100,0

Como pode ser observado na tabela acima, 1 310 depositantes foram


responsaveis por um volume de dep6sitos inferiores a 5.000 cruzeiros, com
um volume total de dinheiro depositado da ordem de 1.002.800. Em termos
percentuais, pode-se afirmar que 92,9% dos depositantes foram responsaveis
por apenas 33,7% do volume total depositado. 0 Grafico 3.35 representa
todas as rela�oes percentuais entre o numero de depositantes e o volume
total depositado.

A linha diagonal do gnifico representa completa igualdade. Quanto


mais a curva de Lorenz se afasta da diagonal, maior sera a desigualdade.
Assim, por exemplo, pode-se ler que 54,6 por cento dos depositantes sao
responsaveis por apenas 3,4 por cento dos dep6sitos.

GRAFICO 3.36 - CONCENTRACAO DE DEPOSITOS A VISTA


BANCO X CURVA DE LORENZ
-

Porcentagem de
Dep6s;tos 100 �-----

90

80

70

60

60

40

30

20

10

0 IL-.....-....==;::=;::::;=---�-_j
10 20 30 40 60 60 70 80 90 100

P o r__
106�--�------- ----- c �• a ge m_d_e_D��e-•-io _�
.:..._ n "
t .:..._
_....1
Medidas de Posifiio

4.1. INTRODU<;:Ao
Vimos, nos capftulos precedentes, que atraves de uma distribuiyiio
de freqiiencias se estabelece um sistema de classificai;ao que descreve o
padrao de variai;ao de um determinado fenomeno estatistico. Ocorre, toda­
via, que poderia ser muito dificil trabalhar com a distribuiyao de freqiiencias
completa, razao pela qual costuma-se lan�ar mao de determinadas medidas.
Essas medidas sumarizam certas caracterfsticas importantes da distribuiyao
de freqiiencias. Ha diversas medidas que possibilitam condensar as infor­
mai;oes dentro da fase analitica da Estatistica Descritiva. Concentraremos
·

nossa ateni;ao, de forma mais enfatica, em dois tipos mais importantes:


as medidas de posii;ao, especialmente as de tendencia central e as medidas
de dispersiio ou. de heterogeneidade. Os demais tipos siio as medidas de assi­
metria e as medidas de curtose.
As medidas de posiyiio, que seriio objeto desse capitulo, podem-se
apresentar de varias formas, dependendo daquilo que se pretende conhecer
a respeito dos dados estatisticos. As mais importantes sao as medidas de
tendencia central ou promedias; as quais sao assim denominadas, em virtude
da tendencia de os dados observados se agruparem em torno desses valores
centrais. A moda, a media aritmetica e a mediana sao as tres medidas de
tendencia central ou promedios mais utilizados para resumir o conjunto de va­
lores representativos do fenomeno que se deseja estudar. Outros promedios
menos usados sao a media geometrica, harmonica, quadratica, cilbica e
biquadratica.

4.2.M�DIA
A medida de tendencia central mais comumente usada para descrever
resumidamente uma distribuii;ao de freqiiencias e a media, ou mais propria-
mente, a media aritmetica. Ha varios tipos de medias, os quais serao exami- 107
nados a seguir: media aritmetica, media geometrica, media harmonica, media
quadratica, media cubica, media biquadratica. 0 leitor ccrtamente devera
estar mais familiarizado com a media aritmetica, devido a freqiiencia com
que dela se utiliza.

4.2.1. Media Aritmetica

Simbolo: x (le-se "x trayo" ou "x barra").

A media aritmetica de um conjunto de numeros pode ser de dois


tipos: simples ou ponderada.

a) Media Aritmetica Simples


A media aritmetica simples de um conjunto de numeros e igual ao
quociente entre a som� dos valores do conjunto e o numero total de valores.

Suponha que em um escrit6rio de consultoria a empresar ha cinco


·

contfnuos que recebem os seguintes salarios mensais: Cr$ 800,00, Cr$ 780,00,
CrS 820,00, Cr$ 810,00 e Cr$ 790,00. A media aritmetica dos salarios
ou o salario medio mensal dos contfnuos desse escrit6rio sera de 800 cruzei­
ros, de acordo com a definiyao.
800 + 780 + 820 + 810 + 790 4.000
x = = = 800
5 5
Genericamente, podemos escrever:

(1)

onde
x; = valor genenco da observaylio
n = numero de observay0es

A media aritmetica simples sera calculada sempre que os valores nao


estiverem tabulados, ou seja, quando aparecerem representados individual­
mente, como e o caso, por exemplo, dos dados brutos. No exemplo acima,
a variavel x representa os salarios dos contfnuos. Conseqiientemente;

Xi = 800
Xz = 780 i = {l , 2, 3, 4, 5}
X3 = 820 n = 5
X4 = 810
X5 = 790 5

I x;
i=l
5
108
b) Media Aritmetica Ponderada
A media aritmetica e considerada ponderada quando os valores do
conjunto tiverem pesos diferentes. Tratando-se de media simples, todos OS
valores apresentam igual peso. Obtem-se uma media aritmetica ponderada
atraves do quociente entre o produto dos valores da variavel pelos respectivos
pesos e a soma dos pesos.

Assim, por exemplo, um professor pode realizar quatro provas por


1, 2, 3, 4 .
ano em sua materia, atribuindo a cada uma delas os seguintes pesos:
. Se um aluno tiver recebido as notas 8, 7; 9 e 9, nessa ordem, sua nota
final sera a media aritmetica ponderada 8,5, obtida da seguinte maneira:

(8 X 1)+ (7 X 2)+(9 X 3)+(9 X 4)


.
_ _

cla F.mal
M"d.
1 +2+3+4
- -

8+ 14 +27+36 85
= ------ 8,5
10 10=
O mesmo resultado seria obtido se fossem adotados pesos relativos,
como indicamos na Tabela 4.1.
TABELA 4.1

Provas Pesos relativos Notas Produtos

1
1� - = 0,1 8 0,8
10
2
2� - = 0,2 7 1.4
10

3
3� = 0,3 9 2,7
10
4
4� -= 0.4 9 3,6
10

Soma dos pesos relatives: 1,0 Media ponderada = 8,G


Soma dos produtos

Quando se usam pesos relativos, o denominador sera sempre igual a


unidade, e a media aritmetica ponderada seni igual a soma dos produtos
dos valores da varravel pelos respectivos pesos relativos. Assim sendo, a
media aritmetica ponderada sera igual a soma dos valores constantes da
ultima coluna da Tabela 4.1.
No exemplo apresentado, os pesos dos valores da variavel sao fixados
previamente, para efeito de calculo. Tratando-se, todavia, de distribuiyoes de
freqiiencias, os pesos dos valores da variavel nao sao atribuidos arbitraria­
mente, mas correspondem ao numero de vezes que cada valor ocorrer.

Assim, por exemplo, admitamos que as notas atribuidas a vinte alunos


em um teste de estatistica sejam as seguintes, dispostas em o.rdem crescente: 109
4, 5, 5, 5, 5;
5, 6, 6, 6, 6;
6, 6, 7, 7, 7;
7, 7, 8, 8, 8.
A nota media obtida mediante a utiliza�ao da formula (I) seni:
n 20

L X; L Xj
i=l i=l
x =--- = --- =
n 20
=
4+5+5+5+5+5+6+6+6+6+6+6+7+7+7+7+7+8+8+8
=
20
124 =
= 6'2
20
Portanto, a media aritmetica simples das notas e �.2. Como os valores
da variavel aparecem repetidos, e possfvel adotar 0 numero de observa�oes
ou freqilencia de cada um deles como peso ou fator de pondera�ao. Assim,
por exemplo, a nota sete aparece cinco vezes. E indifercnte, portant<>,
para efeito de calculo da media SOmar 0 numero sete cinco vezes OU
multiplicar esse valor por cinco.
7 + 7 + 7 + 7 + 7 = 5 x 7 35
=

E possivel proceder da mesma fonna para os demais valores de


variavel, como se observa no desenvolvimento seguinte:

x
4+5+5+5+5+5+6+6+6+6+6+6+7+7+7+7+7+8+8+8
= ------�
20
OU
- - (4 x 1) + (5 x 5) + (6 x 6) + (7 x 5) + (8 x 3)
x-
1 + 5 + 6 + 5 +3
0 numerador da primeira expressao representa a opera�ao necessaria
para 0 calculo da media aritmetica simples, de acordo com a formula (1).
0 denominador e 0 numero total de observa�OeS.

Ja o numerador da segunda expressao apresenta o procedimento para


0 calculo da media ponderada, onde cada valor da variavel e multiplicado
pela respectiva freqiiencia. 0 numero quatro apareceu uma vez, o cinco e o
sete apareceram cinco vezes, o seis apareceu seis vezes e o oito tres vezes.
Ao inves de considerar cada nota do aluno individualmente, como e feito
para 0 calculo da media aritmetica simples, toma-se 0 valor tantas vezes
quantas ele tiver ocorrido. 0 denominador da segunda expressao e calculado
pela soma das freqilencias de cada valor da variavel, o que equivale a
freqiiencia total, ou numero total de valores observados. Retomando os
calculos:
(4 x 1) + (5 x 5) + (6 x 6) + (7 x 5) + (8 x 3)
X = =

110 1 + 5 + 6 + 5 +3
4 + 25 + 36 + 35 + 24 124
= = 6 '2
=

20 20
Esse resultado e o mesmo que o obtido pelo emprego da formula (1 ),
porque 0 principio dos metodos e 0 mesmo, diferindo apenas a forma
de calculo.
Genericamente, se os valores xi. x2, . .. , Xk ocorreremfi. [2 , fk • . . .

vezes, respectivamente, a media aritmetica do conjunto sera calculada por: i'

k
I x;fi
/= 1
x = _,:__ ___
(2)
k

I Ii
j=l

Xj = valores da varravel, OU pontos mediOS. de classe


k
L Ji = n = mimero total de observa�oes
j=l
k = numero de classes ou de valores individuais diferentes da variavel
Na Tabela 4.2, condensamos os resultados do exemplo.

TABELA 4.2

Xj 'i Xjfj

4 1 4 x 1 =4
5 5 5X5=25
k=5
6 6 6X6=36
n= 20
7 5 7 x 5 =35
8 3 8X3=24

5 5

I fj= 20=n L Xjfj= 124


j=l j=l

Normalmente, para o clilculo da media aritmetica ponderada recorre-se


a uma tabela desse tipo, o que possibilita maior rapidez de opera�ao e
organiza�o dos valores.

Quando os valores estao agrupados em classes, a tabela requer mais


uma coluna, necessaria para dispor os pontos medios de classes, como
indicamos na Tabela 4 3.
.
111
TABELA 4.3

Classes
'i Xj Xjfj

101--20 5 15 75
201--30 10 25 250
301--40 15 35 525
401--50 10 45 450
501--60 5 55 275

5 5

I'j=45=n I Xjfj = 1 575


j=l j=l

I Xjfj
x = _,_i_=_i __
=
j=l \= 1575
35
n 45 45
c) Propriedades da Media Aritmetica
I) Primeira Pr opriedade
A soma algebrica dos desvios de um conjunto de numeros tomados
em rela�ao a media aritmetica e zero. Simbolicamente:
n

I d; = 1: (x; - x) =
o
i=l
(3)
k
= =
I difj 1:(xi - x)fj o
j.=1

on de,
�l = x; - x e i =
{ 1, 2, ... , n} para dados brutos
= =
dj Xj - X e j {l, 2, . . . , k} para dados tabulados
A comprova�ao dessa propriedade e simples:

Para Dados Brutos


n n n
= =
I d; I (x; - x) I x; -
i =l i=l i =l

Como xe uma constante, para um dado conjunto de valores,


n

Ix= nx
112 i=l
Mas,
n n

Ll x;
L x;
i= i=l n

x =---
n
e, assim, nx = n
n
=
L x;
i=l
Entao,
n n n n n

L d; =
L x; -

L x =
L x; -

L x; = 0
i=l i=l i=l i=l i=l
Para Dados Tabuhdos
k k k k

L di
L (Xj x)fj L Xjfj
=
L xfi
=
-

j=l j=l j=l j=l


Mas, k

L Xjfj
k k k
j=l
I xfi = x I Ii = nx = n =

L Xjfj
n
j=l j=l j=l
Portanto,
k k k k k

I dj =

I X jfj -

L xfi L Xjfj -

L Xjfj = 0
j=l j=l j=l j=l j=l
Exemplo 1:
Consideremos os salarios recebidos pelos cinco continuos.
x = {780, 790, 800, 810, 820}

A media dos salarios e x = 800, e a soma dos desvios sera zero,


como na Tabela 4.4.
TABELA 4.4
x; d; = Xj-X

780 780 - 800= -20


790 790 -800= -10
800 800-800= 0
810 810 - 800= 10
820 820-800= 20

5 5 n

I d; :=
I (x; - soo1= o >
L d;= o
i=l i=l i=l

Exemplo 2:
Com os dados da Tabela 4.5, comprovar a primeira propriedade
da media. 113
TABELA 4.5

Notas Numero de alunos


Xj fj
4 1
5 5
6 6
7 5
8 3
n= 20

A media aritmetica das notas e = 6,2, conforme visto anterior­


x
mente. A Tabela 4.6 pennite operar mais rapidamente
TABELA 4.6

Xj fj Xjfj dj = Xj - 6,2 djfj= (Xj - 6,2) fj,

4 1 4 4:..... 6,2 = -2,2 (-2,21 x 1 =-2,2


5 5 25 5 -6,2=-1,2 (-1,21 x 5=-6,0
6 6 36 5·_ 6,2 = -0,2 (-0,21 x 6=-1,2
7 5 35 7 -6,2 =0,8 (0,81 x 5 =4,0
8 3 24 8 -6,2= 1,8 (1,81 x 3 =5,4

5 s

n= 20 L Xjfj=124
I djfj=o
j=I j=I

II) Segunda Propriedade


A soma dos quadrados dos desvios tomados em rela�o a media
aritmetica e um mfnimo.

Para dados brutos

n n

L (x; - x)2 <


I (x; - Xo)2 (4)
i=I i=I

Para dados tabulados

k k
L (x1 - x)2f; <
I (x1 - xo)2/; (5)
/=I / =l

onde Xo e um valor arbitrario quatquer, muitas vezes chamado de media


arbitniria. Neste caso, x0 =F x.
A comprova�ao da propriedade sera feita apenas para a formula (4).
"
Devemos ter
S1 = I:(x; - x)2 I:(x: x2 - 2x;X) I:x: nx2 - 2I:x;x
= + = + =

114 I:x: nx2 - 2 (I:x;) (I::;) �


= + =
= r.x; + nx2 - 2nx2= r.xl - nx2

S2 = '1:.(x;-x0)2= '1:.(xl + x� - 2x;xo ) =

= r.x; + n-x� - 2x0 '1:.x;=


+ -
= '1:.x2
; nx2
0 - 2x0nx
Mas
S2 - S1 = (r.xl + nx� - 2x0nx) - ('1:.xl - nx2) =
= n(x� - 2x0x + .X2) = n(x0 - x)2

Como n > 0 e (x0 - x)2 > 0 => n(x0 - .X)2 > 0.


Assim sendo, a diferen�a

(S2 - Si)= n(x0 -- x)2


C sempre positiva, para Xo i= X, OU seja,

S2 -- S1 > 0
Daf tiramos
S1 < S2 OU r, (x; - x)2 < L (x ; - Xo)2
Exemplo 3:
Considere o conj unto de numeros X = { 3, 5, 7, 9, 10}. A media
aritmetica do conjunto e
5

I Xj

= _i_=_I _ 3 + 5 + 7 + 9 + 10 � 6g
X = = = '
5 5 5
Considere agora os seguintes valores arbitranos para x0 : 7 e 5. Os
calculos das somas dos quadrados dos desvios serao feitos com recurso da Tabela
auxiliar 4. 7.

TABELA 4.7

(Kj-X) = Xo =l Xo =5
Xj (x;-6,8)2 (x; - 7)2 (x;-5)2
(x;- 6,8) (x;- 7) x;-5

3 .3-6.,8=-3S
. (-3,li)2=14 4
, 4 3-7=-4 (-4 )2=16 3-6 =-2 (-2)2=4
6 6-6S
. =-1,8 (-1 ,8)2=3,24 6-7=-2 (-2)2=4 6-6=0 (0)2 =O
7 7 -6,8=0,2 (0 2
, )2 =0,04 7-7=0 (0)2 =O 7-6=2 (2)2 =4
9 9-6,8=2,2 (2,2)2 =4,84 9-7=2 (2)2 =4 9-6=4 (4)2 =16
10 10-6,8 =3,2 (3,2)2 =10,24 10- 7 =3 (3)2 =9 10 -6=6 (6)2 =26

I (x; -6,8)2=
5 5
I (x;-7)2=
5
I !x;-6) 2
=
i=I i=I i=I
=32,8 =33 =46
115
Como pode ser observado,
'i;(x; - 6,8)2 < 'i;(x; - 7)2 < 'i;(x; - 5)2
,!. + +
32,8 < 33 < 45
para x = 6,8.
Exemplo 4:
Comprovar a segunda propriedade da media, usando os dados cons­
tantes da Tabela 4.3, adotando para x0 os vafores 30 e 36.
A comprova�ao e feita com o auxflio da Tabela 4.8.
TABELA 4.8

Classes Xj Ix; - 36J2f;

2 2 2
10 1-- 20 15 75 115 - 351 5 = 2 000 115 - 301 5 = 1 125 115-361 5 = 2 205

201-- 30 10
I 25 I 250 1 i 2
125 - 35 10= 1 ooo
2
125 - 301 10 = 250 1 2
12� - 361 10· = 1 210

301- -40 1 35 1
15 525 1 135-351215=0 135
2
301 15 = 375
-· i 135- 361215 15 =

401- -50
I 10 1 45 1 450 1 145 351' 10= 1 ooo
·-
2
145 - 301 10= 2 250 1 145 -- 361210 810=

50 l--60
I1-----�I 55 >--
1 275
2
I 155- 351 5 ,, 2 ooo 2
I 155- 36125= 1 805

155 - 301 5 = 3125

I± / I±
s
f;=45 = n x; f=
; l 575
2
lx;-35J f;=6 000 L Ix;-3012 f;=7 125 L Ix;-36J2f;=6 045
.r• I J-'J t j··i j�1
. J
_ _

L:x;f;
j=l
x = -=----
1 575 = 35
n 45
Como se observa,
s 5 s

L (x; - 35)2!; < L (x; - 36)2!; < L (-c; -30)2f;


j=l -l- j=l -l- j=l -l-
6 000 6 045 7 125
para x = 35.

III) Terceira Propriedade


Media Aritmetica Ponderada de Todas as Medias. Se n 1 numeros
tern media x1 , n2 numeros tern media .X2 , • • • , nk numeros tern media Xk,
a media do conjunto formado por todos OS numeros e dada pela expressao:

X"1n1 + "X2n2 + ... + Xknk


x =
n1 + n2 + ... + nk

I x; n;
j=l
x (6)
k

I n;
j=l
116
A comprova9ao dessa propriedade e imediata e sera feita apenas para
o caso de dados nao-tabulados.Fa9amos inicialmente
n,
X ii
i=I
I
=

ni
n,
IX2i
=
i i =

n2

nk

I Xki
i=i
Xk =

nk
k
n =

I ni
j=i
Assim sendo,
n, n, nk
I X ii +
i=I
I X 2i + ... +
I
i=I
Xki
i=i
x = =

n, + n2 + . . + nk
.

n, n, nk
n,
I X ii n2
I X2; nk
I Xki
i=i i=I i=I
+ + ... +
ni n2 nk
+
= =

n, n2 + . .. + nk
k

n 1x1 n2x2 + .. + nkxk


I
=
+ .
=
j=I
n1 + n2 + ... + nk k
I
i" 1
Exemplo 5:
Considere os seguintes conjuntos de numeros:
x, =
{10, 40, 70, 80}
X2 =
{5, 15, 20, 30, 40}
X3 =
{l, 2, 3, 10, 12, 20} 117
Devemos ter:
=
i 4
Xi = 10 + 40 + 70 + 80 = 200 = SO � =
4 4 {Xi 50
x
2 �
= 5 + 15 + 2 + 30 + 40 = I;0 = 22 2 = 5
:2 =
{X 22
3
:X3 = 1 + 2 + 3 + 10 + 12 + 20 = ��= =6

= 1, 2, 3
6 6
8
{�
X
3
=8
j 3

L Xjnj
- j=i = (50 x 4) + (22 x 5) + (8 x 6) =
x =�-3 - -
4 + 5 +6
I n1
/=i
= 200 + 110 + 48 = 358 =
23 '87
15 15
Supondo agora que as tres series de numeros constituam uma unica
Serie, teriamos, ordenando OS valores:
l, 2, 3, 5, 10, 10, 12, 15, 20, 20, 30, 40, 40, 70, 80
Dai, calculamos
1+2+3+5+10+10+12+15+20+20+30+40+40+70+80 =
x=
15
= 358 = 23 87
15 '
IV) Quarta Propriedade
Somando-se (ou subtraindo-se) um valor constante e arbitrario a cada
um dos elementos de um conjunto de numeros, a media aritmetica flea so­
mada ( ou subtrafda) por essa constante.
Seja X = {xi, x2, • • • , Xn} e seja X0 uma constante escolhida
arbitrariamente.

Fa�amos Y
= X - X0
Assim sendo,
n
x
I ;
i=i
x=--­
n
n n n n
L Yi I (x; - xo) I ;
x
L Xo
= i=i = i=i i=i i=i _ nx0
x--­
118 y n n n n n
(7)

Como pode ser observado, x, a media de X, ficou subtrafda pela


constante x0, ao subtrair cada um dos valores de X por essa constante.
Da mesma forma, poderia ser demonstrado que para Y X + X0 terfamos: =

(8).

V) Quinta Propriedade
Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de
numeros por um valor constante e arbitrario, a media flea multiplicada (ou
dividida) por essa constante.

Sejam, X = {xi, x2, • • • , Xn} e e uma constante arbitraria. Fa�a­


mos y =ex.
Devemos ter
n n
I eXj I Xj
i=l i=l i=l
= --- = e = ex
y n n n
---
----

(9)

De igual modo, poderia ser demonstrado que, para Y = ; , teriamos

I y
=
-f I (10)

Exemplo 6:

�.
Comprovar a quinta propriedade, com os dados da Tabela 4.3, fazendo
e= 5 e Y = A comprova�ao e feita com o auxflio da Tabela 4.10.
TABELA 4.10

Classes fj Xj Xjfj Yj'i':= �


x· x·
Yjfj
10f--20 5 15 75 �5 =3 3 x 5=15
20f--30 10 25 250 25 =5 5 x 10=50
5
30f--40 15 35 525 35 =7 7X15=105
5
40f--50 10 45 450 45 =9 9X10=90
5
501--60 5 55 275 55 =11 11X5=55
5
s 5 s

I j=45 I Xjfj=1 575 Irjfj=315


j=I ' j=l j=l 119
5

L Xjf;
__ j ct
x -�-4- - = 1 575 = 35
5 45
De acordo com a quinta propriedade, devemos ter

-
y= x 35
7=-5-=7
A media dos valores da variavel transformada Y e, segundo a defini�ao,
k

L Yjfj
= j=l 3 15
7
y �--­
n 45
=

onde 7 e igual a media aritmetica dos valores de Xo dividida pela CO'llStante


arbitraria 5.

d) Processo Breve para o Cdlculo da Media Aritmetica


Com o recurso das duas ultimas propriedades da media aritmetica e
possivel desenvolver um processo breve de calculo da media, menos direto
que o anterior, mas que proporciona o mesmo resultado. Neste caso, faz-se
uso de uma variavel transformada, denominada variavel reduzida, cuja
expressao e a seguinte:

Dados Brutos:

, X; - Xo
I d·1 -
_

--- (11)
c
Dados Tabulados:

Xj
-'- - Xo
I
,
(12)
_

.
di - ---
c

onde x0 e c sao constantes arbitrarias.

Das formulas (11) e (12) deduzimos facilmente as express5es da


media aritmetica simples e ponderada, com a utiliza�o da variavel redu­
zida d'.
Para o caso da media aritmetica simples, fazemos

d;
, =x; - x0
--­
c
x; = x0 + c dj
Conforme a defini�ao da media aritmetica simples, podemos escrever
n

Ix; i=l
x = i=l = ------

120 n n
A ultima expressao pode ser desenvolvida como segue:
n II n

I (xo +cdj) I Xo + I cdj


i=l i= 1 i=l
x= = =
n n
n n n

I Xo cz: dj I dj
i=l i=l X:Xo
n
+ n
= --
K
+ c i=ln
Portanto,

I di
i=l
X= Xo +c ---
n
(13)

Da mesma forma chegaremos a expressao da media aritmetica pon-


derada:
-" . _ Xj - Xo
Uj -
c
Xj = x0 +cdj
k k
L Xjfi L (xo +c<I'j)Jj
j=l j=l
n n
k k k k
L Xofj c L dj fj x0 L Jj L djfj
j=l j=l j=l j=l
= -'------
n
+ ----
n
= - --
---'-
n
-- +c ----
n
=

Jl(xo
I difi
j=l
)'( + c --­
=--

n
Assim,

(14)

Genericamente, podemos escrever:

I x= xo + cd' I (15)
onde d' e a media aritmetica simples ou ponderada dos valores dos desvios
reduzidos, conforme o caso.
121
Observariio: Quando a media aritmetica tiver que ser calculada a partir
de uma tabela de freqiiencias onde os dados estiverem agrupados em classes,
costuma-se adotar os seguinte criterios:
I) 0 valor da Constante Xo sera igual ao ponto medio da classe de maior
freqiiencia, se o numero de classes (k) for par, ou o ponto m6dio da
classe intermediaria, se 0 numero de classes for i'mpar.
II) 0 valor da constante c sera igual a amplitude do intervalo de classe.

Exemplo 7:
Na Tabela 4.15 figuram os dados correspondentes ao consumo de
eletricidade de 80 usuarios. Calcular a media aritmetica do consumo, pelos
processos longo e breve.

TABELA 4.16
Consumo Numero de usuarios
kwh fj
51-- 25 4
251-- 45 6
451-- 65 14
651-- 85 26
851-- 105 14
1051-- 125 8
1251-- 145 6
1451-- 165 2
80

Soluriio:
Para o calculo da media pelos dois processos recorremos a Tabela
auxiliar 4.16.
TABELA 4.16

Proceuo Longo Procll$$0 Brsvtt

Classes f; Xj Xjfj dj= Xj;075 df'j

5f--25 4 15 60 15 75 =-3 (-3)x4=-12


;
25 f-- 45 6 35 210 35 75 =-2 (-21x6=-12
;
45f--65 14 55 75 =-1
55 770 ;0 (-l)X 14=-14
65f--85 26 75 1950 75;075 =O 0X 26 =O
85f--105 14 95 1 330 95-75 =1 1x14= 14

105f--125 8 115 920 11� 75=2 2X 8=16
;;;
125f--145 6 135 810 135 75 = 3 3 X 6=18
2�
145f--165 155 310 155 75 =4 4X 2=8
2�
8 8 8

2:• �=80 Lxjfj=6 360 z: df';=18


i= j=l 1�1
122
Qilculo da Media pelo Processo Longo

De acordo com a formula (2), teremos:


k
Xj/j
L
i 1 6 360
x = = = 79'5
=

n 80
Dessa forma, o consumo medio por usuario e de 79,5 kwh.

Oilculo da Media pelo Processo Breve

Neste caso, fa9amos

x0 = 75 � ponto medio da classe de maior freqiiencia (k = 8)


c = 20 = amplitude do intervalo de classe

Aplicamos, agora, a formula (14):


k
fj
I d/
j=l
x = xo + c vira
11

x = 75 + 20 �� = 75 + 4,5 = 79,5

Exemplo 8:
Calcular a media aritmetica dos dados da Tabela 4.17, pelos processos
longo e breve.

TABELA 4.17

2 10
4 15
6 20
8 16
10 9

Construamos inicialmente uma tabela de calculo auxiliar (Tabela 4.18).

Qilculo da Media pelo Processo Longo

k
fj fj
s

L Xj
j=l
L Xj
j=l 418
I -x = 5,9714 I
x = = = 5,9714
n 70 70 123
TABELA 4.18

Processo Longo Processo Breve

Xj fj Xjfj dj, =
Xj -- 6
- -

2
df'j
2 10 20 -2 -20
4 15 60 -1 -15
6 20 120 0 0
8 16 128 1 16
10 9 90 2 18

s s s

I 'i 10 L Xjfj 418


I df'j -1
j=I j=I j=I
= = =

Ctilculo da Media pelo Processo Breve


Fayamos primeiramente

Xo =6 pois X3 =6 e 0 valor intermediario da tabela

c = 2 pois 2 e a diferenya entre dais valores sucessivos quaisquer


k

I d/fi
·-
1
. __ _
X = Xo + C _/_-
n
Entao
l 2 ,
x=6+2 - =6 - =6 - 0,0286 = 5,9714
70 70

I :x = 5,9714

4.2.2. Media Geometrica

Simbolo xg.

A media geometrica de n valores e definida, genericamente, coma a


raiz n-esima do produto de todos eles. A media geometrica pode ser simples
ou ponderada, conforme se utilize ou nao em seu calculo uma tabela de
freqilcncias.

a) Media Geometrica Simples


Dados n valores X1, X2, . • . ' Xn, a media geometrica desses valores
Sera

124
OU

Xg= n
�� x
/�1 ;
(16)

Observariio: A letra grega rr (pi) e o simbolo utilizado para indicar o


produto dos valores da variavel.

Exemplo 9:
Calcular a media geometrica dos seguintes conjuntos de numeros:
x= po, 60, 360}
y= { 2, 2, 2, 2}
No primeiro caso temos:
Xi =10 n =3
X2 =60
X3 = 360

��
n =
i�l Ai
= -;,; 10 x 60 x 360 = -;,; 216 000 = 60
Para o segundo conjunto, temos:

Y1 =Y 2 =Y3 =Y4 = 2 e n=4


4 4r-;4 4
Yg = v Y1 X Y2 X y3 X Y4 = 'f 2 X 2 X 2 X 2=v 2 =2
Muitas vezes recorremos a logaritmos para o calculo da media geo­
metrica.
De acordo com a formula (16),

Xg= � X1 X X2 X X3 X ... X Xn
Aplicando log a ambos os membros da expressao, vira

logxg=log �X1 x X2 x X3 x ... x Xn OU

logx1 + logx2 + logx3 + .. . + logxn


Iogxg=-------­
_

n
Para determinar xg, calculamos o antilogaritmo do valor correspon­
dente ao segundo membro da expressao.

[
J
. logx1 + logx2 + logx3 + ... + logxn
Xg=antllog
_

Exemplo 10:
Calcular a media geometrica simples do conjunto X = t 1, 4, 16, 64}. 125
Xg = 4 r;-:: x; = V' 1 X 4 X 16 X 64 = V' 4 096
:/ i �1
log Xg = log V' 4 096 =
log
!096 =
;
3•61 360
= 0,903090
Entlio,
xg = antilog 0,903090 = 8

b) Media Geometrica Ponderada

A media geometrica pondernilll de um conjunto de numeros dispostos


em uma tabela de freqiiencias e calculada por intermedio da seguinte
expresslio:

OU

(17)

k
onde n =
L Ji.
/=1
Exemplo 11:

Calcular a media geometrica dos·valores constantes da seguinte tabela:

TABELA 4.19

Xj

1 2
3 4
9 2
27

Primeiro Metodo
4
k 4
/1 71
=

Xg = 9
Jr = ':,/ 12 x 34 x 92 x 2 =

I n=9
126 /=1
= {/ 1 x 81 x 81 x 27 = {/ 177 147

logxg =log {/177 147 =


log 177 147
=
9
5 24 335
= • ! = 0,5831483

Xg = antilog0,5831483 = 3,829554
I Xg = 3,829554

Para comprovar esse resultado, basta fazer:


(Xg)n = (3,829554)9 = 177 147

Segundo Metodo
A expressio 17 nos da

n 1 1•
x
g = v xl X x122
X ... X xkfk
Aplicando o operador logaritmo a ambos os membros da expressao,

/1 +!2 logx1
+ .. + fk logx, . logxk
logxg
_

=-------n------ (18)

Substituindo os simbolos pelos dados do problema,


logxg = 2 log 1 + 4 log 3 +92 log 9 + 1 log 27
_

Mas,
log 1 = 0
log 3 = 0,477121
log 9 = 0,954243
log 27 = 1,431364

Assim,
logxg = (2X 0)+(4X 0,477121)+(2X 0,954243)+(1x1,431364) =
9
- 0 + 1,908486 + 1,908486 + 1,431364 - 5,248336
- - =
9 9
= 0,5831483

Conseqilentemen te,
.Xg = antilog 0,5831483 = 3,829554 Xg = 3,829554

c) Propriedades da Media Geometrica


I) Primeira Proprie�de
0 produto dos quocientes de cada valor de um conjunto de numeros
pela media geometrica do conjunto e igual a um. 127
Xi X
-x---2 x ... X
Xn -= l (19)
Xg Xg Xg

A comprova�ao dessa propriedade e simples:

Xi
- X
X2
- X
Xn
... X - Xi xX2 x ...x Xn
Xg 'Xg Xg (.Xg)n
Extraindo a raiz n-esima:

V'xi X X2 X ... X Xn Xg
xg
=

V (xg)n
Exemplo 12:
Comprovar a primeira propriedade da media geometrica com os dados
do exemplo 9 (primeiro problema).

Soluffio:
Os valores da variavel X sao 10, 60 e 360, e sua media geometrica
e igua} a 60, OU seja:
X = {IO, 60, 360}
xg = ti IO X 60 X 360 = 60
Dividindo os valores da variavel X por sua media geometrica, e
multiplicando os quocientes assim obtidos, teremos:
Xi x � x � = 1
Xg Xg Xg
ou seja,
10 60 360 216 000 l
60
X 60
X
60
=

216 000
=

Observafiio: Conforme pode ser observado, enquanto que a soma dos


desvios em rela�ao a media aritmetica x e igual a zero, 0 produto dos
quocientes dos itens pela media geometrica e um. Utilizando OS dados do
exemplo acima,
3

:L x;
i=i IO+ 60+ 360 430
x 143,333...
3 3
=--- = = =

± d; = (10 - ; ) (60 - 4;0) + (360 - 4;0)


4 0
+ = 0
1=i
II) Segunda Propriedade
Series que apresentam o mesmo m1mero de elementos com a mesma
128 soma total tern a mesma media aritmetica, enquanto series que apresentam
o mesmo numero de elementos com o mesmo produto tern a mesma media
geometrica.

Exemplo 13:
Comprovar a segunda propriedade da media geometrica tomando
X = {8, 12, 5} e Y = {2, 50}.
Calculando as medias geometricas,

Xg = y8 X 12,5 = y'100 =· 10
Yg = v2 x 50 = v'10Q = 10

Assim, Xg = Jg.
III) Terceira Propriedade
A media geometrica e menor OU igual a media aritmetica.

I xg �x I (20)

A desigualdade Xg < x sempre se verifica, quando os valores da serie


forem positivos e nem todos iguais. Se entre eles houver um ou mais zeros,
a media geometrica sera nula.

A igualdade Xg = x so ocorrera quando todos OS valores da serie


forem iguais.
Para comprovar essa propriedade, consideraremos uma serie com
dois valores apenas:
2 >
(xi - X2) ;;;. 0 Xi. X2 0
Desenvolvendo o primeiro membro
x� + x� - 2xix2 ;;;. 0

Somando e subtraindo a quantidade 2xix2 ao primeiro membro da


desigualdade, teremos

x� +x� + 2xiX2 - 2XiX2 - 2X1X2;;;. 0


OU

(Xi + X2)2 - 4XiX2 > 0 e

Dai tiramos
2
(Xi + X2)
;;;. X1X2
4
OU

( X1 +
2
X2 )2 ;;;. X1X2
Extraindo a raiz quadrada
Xi + X2
2
;;;. vx;x:;, 129
o que equivale a x ;;;i: Xg uma vez que
X1 + X2 __: -V� -
= X e X 1 X2 = Xg
2
A generalizayao para n valores pode ser conseguida da mesma forma.

IV) Quarta Propriedade


Quanto maior a diferenya entre os valores ongma1s maior sera a
diferenya entre as medias aritmetica e geometrica.

Exemplo 14:
Consideremos os seguintes conjuntos de numeros:
x = {2, 2}
y = {14, 16}
w = {8, 12}
z = {2, 50}
As medias aritmetica e geometrica de cada um dos conjuntos sao
as indicadas na Tabela 4.20.
TABELA 4.20

Media aritmltica MtJdia geomltrica


Conjunto
x xg

x = {2, 2 } 2 2
y = {14 , 16 } 15 14,97
w = {8, 12 } 10 9,80
z = {2, 50} 26 10

Examinando a Tabela 4.20, percebe-se claramente que as diferenyas


entre as duas medias acentuam-se a medida que os valores originais da
variavel se diferenciarn.

d) Aplicafoes da Media Geometrica


Serao apresentadas, a tftulo de ilustrayao, tres aplicayoes da media
geometrica:

- Media de Relafoes
Consideremos os dados da Tabela 4.21.
TABELA 4.21

Capital Re/Bflo Relar;io


Empress Dfvida
lfquido capital/dfvida dfvida/capital

A 2. 500 1.000 2,5 0,4


B 1.000 2.000 0,5 2,0

130 3. 500 3.000


Calculando a media aritmetica das duas relai;:aes, teremos:

= 2,5+ 0,5 =
Relai;:ao capital/divida: :X1 1,5
2

= 0,4+ 2,0 =
Relai;:ao divida/capital: :X2 1,2
2
Como essas relai;:oos sao o inverso uma da outra, poderia parecer um
contra-senso que o produto de suas medias nao seja igual a um, o que rear.
mente acontece:
-
I.-- (-1.-5 I
x -1.-2)_>_1.....,

Entretanto, esse aparente absurdo decorre do fato de nao havermos


atribuido as relai;:oos seus pesos corretos antes de calcular a media. Teriamos
o seguinte resultado, se os pesos houvessem sido considerados:

(2,5 x 1 000) + (0,5 x 2 000) =


1 ' 1667
1000+2 000
0 numerador dessa expressao corresponde ao capital liquido total
(3.500), enquanto que 0 denominador e igual a divida total (3.000). 0 re­
sultado l ,i 667 deve ser interpretado como a relai;:ao media entre capital
e divida, entre as duas empresas consideradas.

Analogamente, determinamos a media das relai;:0es da divida versus


capital Iiquido:

(0,4 x 2 500) + (2,0 x 1 000)


= 0,8571
2 500+1 000
ou, com o emprego dos totais

. 3 000
= 0,8571
3 500

Multiplicando as duas medias, obtemos:

1 1.1667 x o,8571 = 1 I
Conforme se pode verificar, nesses calculos os pesos atribufdos as
relay6es nao sao iguais. Caso se deseje que isso ocorra, pode-se recorrer a
media geometrica. Assim,
= =
Relai;:ao capital/dfvida: Xg1 y 2,5 X 0,5 v'T,25 = 1,1180
= =
Relayao dfvida/capital: Xg2 = y 0,4 X 2,0 � 0,8944

=
0 produto dessas medias sera igual a um: 1,1180 x 0,8944 1.

A escolha dentre as medidas dependeni, nesse e em outros casos, do


fim que se persiga. Se, para uma determinada empresa, se deseja estabelecer
uma relai;:ao do tipo capital/dfvida que seja independente da dfvida ou do
capital das diferentes empresas envolvidas, e recomendavel o uso da media 131
geometrica. Se o que se deseja saber e a relayao capital liquido/divida de
um certo numero de empresas, ap6s a consolidayao, a cifra correta sera
obtida atraves da media aritmetica, ou achando a relayao pelos totais.

II - Media em Distribuiroes Assimetricas

Uma distribuiyao de freqiiencias pode encontrar-se deformada a direita


(assimetrica). Contudo, se usarmos os logaritmos dos valores da variavel,
com um intervalo de classe constante para os logaritmos, a curva se trans­
formara em simetrica. Neste caso, a media geometrica revela-se mais apro­
priada que a aritmetica.

III - Media de Taxas de Variariio

A media geometrica e usada em certas ocas1oes, para determinar


taxas medias. Assim, por exemplo, suponhamos que um individuo tenha
investido um capital de Cr$ 500,00 em 1973. Ap6s um ano de aplicayao,
essa importancia ascendeu a Cr$ 650,00. Reaplicando essa ultima quantia,
ao final de mais um ano seu montante situava-se em torno de Cr$ 910,00.
A taxa media de aumento de capital sera obtida mediante o Cl:\lculo de urria
media geometrica.

Calculemos, inicialmente, as taxas de aumento de capital, periodo a


periodo:

Perfodo Taxa

650
1973-1974 = 1,3
500
-

910
1974-1975 = 1,4
650
-

Taxa media: .,/ 1,3 X 1,4 = 1,3491

A taxa media de aumento do capital investido no perfodo de dois


anos foi de 34,91%.
4.2.3. Media Harmonica
Simbolo: Xh·

Definiriio: A media harmonica de um conjunto de valores x; e o


inverso da media aritmetica dos inversos.

De acordo com ess:l definiyao, pode-se afirmar que o valor Xk e a


media harmonica de um conjunto de valores, se a operayao que iguala os
dois conjuntos for a adiyao dos inversos. Para um conjunto den valores da
variavel, podemos escrever
1 1 1 1
+ +- -+...+-l
-= +-l
-+ ... +--
132 Xh Xh Xh Xh Xi X2 Xn
-n
=
I
n
(x.1 ) OU
Xh i=l I

I
=
x;
i=l
n
xh

Daf se conclui que o inverso da media harmonica e a media aritmetica


dos inversos dos valores da variavel.

a) Media HarmfJnica Simples - (Dados Brutos)

Dado o conjunto de n valores x 1, x2, , Xn , a media harmonica do

.--- ---.
• • •

conjunto sera

1
+ _1 + ... +-
1
Xi X2 Xn
n

OU

n
=--­ (21)
Xh
n n
1 1
I x. ? Xj
i= 1 I I =1
.
n

Exemplo 15:

Calcular a media harmonica simples dos seguintes corijuntos de nu­


meros:
x = { 10, 60, 360}
y = {2, 2, 2, 2}

xh = ----
1
:
n
n 3
------- =
1 + 1 + 1
3 x360
43
= 25,12

Ix. w 60 36o
i=l I

Yh
n
--- = -------
n
1
4
.!.+.!.+..!.+..!_
4
--
x
4
2
= 2

� Yi
2 2 2 2

b) Media Harmonica Ponderada

A media harmonica ponderada de um conjunto de numeros, dispostos


em uma tabela de freqiiencias, e dada pela seguinte expressao: 133
k

It; n
;=1 (22)
Xh =

k
=

k
k 1 1 I;
L X·f; I -!;
x; I x;
j=1 I ;=1 =1
;
k

It;
;=1

Exemplo 16:
Uma pessoa adquiriu quatro camisas ao preyo unitario de trinta
cruzeiros e duas camisas a cinqiienta cruzeiros cada uma. Para calcular o
preyO medio pago por camisa, hli duas formas de procedimento:
I) Cdlculo pela Media Harm0nica
Os dados do problema poderiarn ser expressos da seguinte forma:
A pessoa gastou 120 cruzeiros em camisas de 30 cruzeiros e 100 cruzeiros
em camisas de 50 cruzeiros a unidade. Neste caso, os valores da variavel sao
os preyos por camisa, e seus pesos as quantidades gastas em camisas. Portanto,

xh =
(...!.).. 1
(...!.\.. =
220
4+2
= 36,67
120 3 0 +100
_ _ _so)_
120+100
II) Cdlculo pela Media Aritmetica
Os valores da variavel sao os preyos por camisa, mas agora os pesos
sao o numero de camisas compradas. Por conseguinte,

- (4 x 30)+(2 x 50) 220 36 '67


x =
=
=

4+2 6
Os princfpios dos dois metodos sao simples. Estamos calculando
media de taxas, ou seja, cruzeiros por camisa. 0 numerador de ambas as
expressoes representa a quantia total gasta com camisas (220 cruzeiros),
enquanto 0 denominador e igual ao numero de camisas adquiridas. Quando
sao empregados os pesos do denominador, aplica-se a media aritmetica
(pesos 4 e 2); quando se empregam os pesos do numerador, usa-se a media
harmonica (120 e 100).
Outro exemplo onde se pode empregar indiferentemente qualquer
uma das medias e o da obtenyao da velocidade media de um veiculo
(quilometros por hora). Sendo os pesos os quilometros percorridos, utiliza-se
a media harmonica·, e se OS pesos forem horas invertidas O calculo e feito
134 atraves da media aritmetica.
Exemplo 17:
Calcular a media harmonica dos dados constantes da Tabela 4.22.

TABELA 4.22

1 fj
Classes fj Xj
Xj Xj
- -

11--- 3 1 2 .
2 2 1= 1,00
2
1 4
31--- 5 4 4
4 4= 1,00
-

1
51--- 7 8 6 �= 133
6 6

1 4
71---- 9 4 8
8 5= 0,50
1 2
91---11 2 10 10 = 0,20
10
k
5 f;
I 'i=20=n I _L =403

'
j=l j=l I

Devemos ter
- n
Xh =

k I
I x:ii
j=t I

Xh = _1Q_ = · 4'96
4,03

c) Propriedade da Media Harmonica

A media harmonica e menor OU igual a media geometrica para


valores da varilivel diferentes de zero.

(23)

Por extensao de raciocinio e de acordo com a terceira propriedade


da media geometrica, podemos escrever

I Xh,;;;; X ,;;;; x
g I (24)

Genericamente, podemos enunciar: A media harmonica de um con-


junto de numerOS positiVOS e menor OU igua} a media geometrica, e esta,
por sua vez, e menor OU igual a media aritmetica.
Verifiquemos a desigualdade Xh < X , a qual ocorre quando os
g
valores da serie forem positivos e nem todos iguais. Segundo a expressao (20),
podemos fazer yg < y ou 135
n

L: Yi
i=t
/[:
1=1
<
n

Fayamos Yi = -
Xi e substituindo na expressao acima teremos

n
I
L:I x-
< i= l

n n

0 primeiro membro da desigualdade pode tambem ser escrito como:

I I
�/XI1 XIn - jX1
-
n •

X2 • .

; -

X2 • . • Xn -

= --;:=:======--
...; X1
n • X2 . • • X

Assim sendo,
n

L:
----- <
I i=I xi

n

Xi
� i �I
n

Dai tiramos

n
I OU
L:I x-
i= I

Se todos OS valores da variavel forem igua�s. a media harmonica sera


igual a media geometrica e a media aritmetica. Consideremos OS valores
da variavel constantes e iguais a x0. Devemos ter. entlio,

Xo
n n n
Xh = = = -- - =
I
.
n
I n
n-
Xo
L:I Xi-
L: X
i=I o
-
i=
Xg � Xi = n � Xo = '{/ x0 x0 ... x0
� i �I � i �I
= n • =
'------v--"
vx:- n fatores

136 = Xo
n n

x;
I L Xo
n x0
i=l i=l
x = = ---
= Xo
n n n

Observafiio: Quando os valores da variavel nao'forem muito diferentes,


verifica-se aproxiinadamente a seguinte rela�ao:

(25)

Exemplo 18:
Calcular as medias aritmetica, geometrica e harmonica dos seguintes
conjuntos de numeros:

x = {2, 4, 6, 8, 10}
y = {10, 10, 10}
z = {10,1, 10,l, 10,2, 10,4, 10,5}

Solufiio:
18.1) x = {2, 4, 6, 8, 10}
n

x;
I
i=l 2+4+6+8+10 30
= = = = 6
n 5 5

� = V 2X4X6X8X10 V 3 840 = 5,21

n 5 5
= - --- -- -- - -- = = 4•38
n 1 1 1 1 1 1,1417
' 1 2+4+15+-g+10
LX.
i=l
I

Como pode ser notado atraves deste exemplo,

x > Xg > xh
6 > 5,21 > 4,38
18.2) Y = po, 10, IO}
n

I Yi
i=l 10 + 10 + 10.
.

30
= = = = 10
n 3 3

Yg � = '!../ 10 x 10 x 10 = � = 10
137
n 3 3
Yh = n
1 1 + 1 + 1 =-3-= 10
- 10 10 10 10
I Xj
i=l

Como todos OS valores da serie sao iguais, y =Yg=Yh.


18.3) z= {10,1, 10,1, 10,2, 10,4, 10,5}
z =
10,1+10,1+10,2+10,4+10,5 = 51,3 =10 2600
5 5 '
zg = ;_; 10,1 X 10,1 X 10,2 X 10,4 X 10,5 =

= ;,; 113 622,8184 = 10,2587


Zh =--=
5 --- 5 =
l l l 0,4874508
--�-

+ l l
_
+ +
10,1 10,1 10,2 10,4 10,5
_ __
+ __ __ __

= 10,2574
Conforme a relaylfo (25)
x+Xh
g=
X 2
para valores pouco diferentes da variavel. Assim, fayamos
z+Zh 10,2600+10,2574
2 = 2
= 10,2587 = zg
4.2.4. Media Ouadratica
Simbolo: Xq·
Definifao: A media quadratica de um conjunto de n valores x; e
a raiz quadrada da media aritmetica dos quadrados. Podemos dizer, entao,
que Xq e a media quadratica de um conjunto de valores Xj se a opera�o
que igualar os dois conjuntos for a adi�o dos quadrados.

(xq)2 +(xq)2 + . . .+ (Xq)2 = x� + x � +...+x!


n n

I (xq)2 =I x :
i=l i=l
n

n I x:
i=1
n(xq)2 = L x t OU (xq)2 = (26)
n
i=1

a) Media Quadrdtica Simples


Para o conjunto de n valores x1, x2, • • • , Xn, a media quadratica
simples sera calculada atraves da seguinte expressao, obtida a partir da
138 (26), mediante a extrayao >de raiz quadrada.
(27)

Ex emplo 19:
Calcular a media quadratica dos conjuntos

x = {2, 2, 2}
y = (2, 3, 4, 5}
Solu�iio:
19.1)

+ 22 + 22 = /IF = 2
3
19.2)

� j 12 32 42 52
��
+
+ +
-

Yq = =

'
4
=

= ..;/54--:
4 = y'13,5 = 3,67

b) Media Quadrdtica Ponderada


Quando os valores da variavel estiverem dispostos em uma tabela
de freqiiencias, a media quadratica sera determinada pela seguinte expressao:

k k

I
j=l
/ fj
x I1 f Jj
x
[=
Xq = = (28)
k n
I fj
j=l

Exemplo 20:
Calcular a media quadratica dos valores constantes da Tabela 4.23
k

I xj fj
Xq =
j l
=
n
= /2298
../� = ·I
v 54'7143
= 7 '40
139
TABELA 4.23

Classes fj Xj2
Xj Xj2 fj Xjfj
21--- 4 5 3 9 45 15
41--- 6 10 5 25 250 50
61--- 8 12 7 49 588 84
81--- 10 10 9 81 810 90
101--- 12 5 11 121 605 55
5 k
n = 42 I xffj= 2 298 L Xjfj=294
j=l j=1
A media aritmetica desse conjunto e igual a 7' OU seja,
k

I x11;
j= 1 29 4
x = = = 7
n 42

c) Propriedades da Media Quadrtitica


I) Primeira Propriedade
A media quadratica de uma constante e igual a Constante.

Xq
=

Para x 1 = x2 = . . . = ·x0, teremos

x20
n

L... «
1
fl
"\'
i=
= = = Xo OU
n n

I Xq
= x0 I para x; = X o. (29)

0 exemplo 19 confirma numericamente essa propriedade.


II) Segunda Propriedade
Multiplicando ou dividindo todos os valores de um conjunto de
numeros por um valor constante e arbitrario, a media quadratica flea
multiplicada ou dividida por essa constante.

140 Fa�amos c a constante e Yi = ex;. Entao,


2 2
n n

I (cx;) I c x� I

Yq= fl;[= = i=l


n
i=l
n =
n
2
I X;
= = JI:_ c2 i= 1n c 1

n CXq

I =Yq = CXq para Yi ex;. (30)

III) Terceira Propriedade


Sempre que OS valores de x forem positivos e valida a relac;ao.

I Xq ;;;;. x ;;;;. Xg ;;;;. Xh I (31)

A igualdade se verifica quando os valores da variiivel forem iguais


(constantes). Assim e que, para X1 = X2 = . .. = Xo.

Xq� = j�
4-- = Xo

conforme a expressao (29).


== =
Da mesma forma, Xq x Xg Xh para x1 =x2 =... = x0•
Ocorrera a desigualdade para valores de variavel nem todos iguais.
Para comprovar a desigualdade, mostraremos que Xq > x. Para isso, parti­
remos da seguinte relac;ao:

L (x; - x)2
n

> o,
i=l
uma vez que se trata de soma de quadrados de valores diferentes.

Desenvolvendo o primeiro membro da desigualdade,

(x; - x)2 x2
n n

I
i=I
=I i=l
(x l + - 2x;x) =
" n
2 n

= I x� Ix =
- 2x
I
+
I
i=t
Xj
i=1 i=l
n

I X;
nx2 - 2Xn n =
n
i=l
=
I x� I
+
141
i=I
n n

I x�
2 2 nx2 >O
Xj + nx - 2nx2
= I
j=I
=
i=I
l
-

Assim, se

I x: - nx 2 >O,
i=I

segue-se que
n
n 2
I
2
Xj > nx2 OU I Xj
i=I
i=I > x2
n
Mas
n

I xt
i=i
n
x . : :
Entlio, x > x2 e, finalmente, I Xq
.
> x I
.

0 exemplo 20 comprova essa propriedade.

0bserv(lfi5es:

I) A media quadratica e largamente utilizada em Estatistica, principal­


mente quando se pretende calcular a media de desvios (x - x), em vez de
a media dos valores originais. Neste caso, a media quadratica e denominada
desvio-padrlio, que e uma importante medida de dispersao, objeto do pr6ximo
capftulo.
II) Outras medias menos usadas em Estatistica slio a media cubica e
a media biquadratica, as quais sao calculadas respectivamente atraves das
seguintes expressoes:

a) Media CUbica

X e= 3
para a Media Cubica Simples (32)
n

I xJ t;
=1
;
Xe= 3
para a Media Cubica Ponderada (33)
n

b) Media Biquadrdtica

jf":7
142 Xbq = J � para a Media Biquadrtitica Simples (34)
k

'L xi lj
1�1
_;_
___
para a Media Biquadrdtica Ponderada (35)
n

4.3. MODA

/\
Simbolo: M0 ou X

A moda e outra medida de tendencia central, havendo outras deno­


mina�oes para designa-la: norma, valor dominante, valor tipico. Generica­
mente, pode-se definir a moda como o valor mais freqiiente, quando
comparada sua freqiiencia com. a dos valores contiguos de um conjunto
ordenado. Quando afirmamos que o salario modal de uma empresa e igual
a dois mil cruzeiros, queremos dizer que esse e o salano percebido pelo
maior n6mero de pessoas dessa empresa. 0 termo moda foi utilizado prirneira­
mente por Karl Pearson em 1895, talvez como uma associa�ao a sua
concep¢o na linguagem comum.

4.3.1. Determina�o da Moda de Valores Nio-Tabulados

Considerando um conjunto ordenado de valores, a moda sera o valor


predominante, o valor mais freqiiente desse conjunto. Evidentemente, um
conjunto de valores pode nao apresentar moda, sendo, entao, denominado
conjunto amodal, caso em que todos os valores da varravel em estudo
ocorreram com a mesma intensidade (freqiiencia). Por outro lado, po­
demos ter conjuntos plurimodais, quando houver mais de um valor predo­
minante.

Exemplo 21:
Calcular a moda dos seguintes conjuntos de valores:

x = {4, 5, 5, 6, 6, 6, 7, 7, 8 , 8}
y = {4, 4, 5, 5, 6, 6}
z = {l, 2, 2, 2, 3, 3;4, 5, 5, 5, 6, 6}
w = { l, 2, 3, 4, 5}
A moda de cada um dos conjuntos sera:
Moda de X: M0 = 6. 0 valor 6 e o mais freqilente (3 ocorrencias).
Moda de Y: Esse conjunto e amodal, pois seus tres valores apareceram duas
vezes cada um. Nao ha, portanto, predominancia de nenhum
valor do conjunto sobre os outros.

Moda de Z: M0 = 2 e M0 = 5. Trata-se de um conjunto bimodal, uma


1
vez que tanto o2valor 3 como o S apresentaram o maior numero
de observa,.oes.

Moda de W: Esse e outro conjunto amodal. 143


4.3.2. Determina�o da Moda para Valores Tabulados
Os valores da variavel dispostos em uma tabela de freqiiencias podem
apresentar-se individualmente ou agrupados em classes. No primeiro caso, a
determina�ao da moda e imediata, bastando, para isso, consultar a tabela,
localizando o valor que apresenta a maior freqiiencia. Esse valor seni a
moda do conjunto. Assim, por exemplo, a moda do conjunto apresentado
na Tabela 4.24 e M0 = 3. Esse resultado indica que a rejei�ao de 3 pe�as
defeituosas por mes foi o resultado mais observado.
TABELA 4.24 - EMPRESA X
Numero de P�as de Precisiio Defeituosas Devolvidas Mensalmente pelo
Controle de Qualidade

Numero de pe�as com defeito Numero de meses


Xj 'i

0 2
1 4
2 6
3 8
4 4
5 2
6 1
7

I 'i = 21
j=l

Tratando-se de uma tabela de freqiiencias com valores tabulados e


agrupados em classes, o procedimento n:io e imediato, sendo disponfveis
alguns metodos de calculo distintos. Qualquer que seja 0 metodo adotado,
0 primeiro passo para determinar a moda e localizar a classe que apresenta
a maior freqiiencia, comumente chamada de classe modal.

a) Moda Bruta
0 metodo mais rudimentar de calculo da moda em tabelas de fre­
qiiencias com valores agrupados em classes consiste em tomar o ponto
medio da classe modal. Esse valor recebe o nome de moda bruta. Exami­
nando os dados da Tabela 4.25, por exemplo, podemos dizer que a terceira
cla�se e a classe modal e a moda bruta seni seu ponto medio: M0 = 35.
Os dois metodos que apresentaremos a seguir sao mais elaborados e
baseiam-se nao apenas na freqiiencia da classe modal, mas tambem nas
freqiiencias das classes adjacentes.

b) Metodo de King
O metodo de King, para o calculo da moda elaborada, baseia-se na
influencia das freqiiencias das classes adjacentes sobre a classe modal.
Considerando essas freqiiencias, esta-se admitindo implicitamente que a
144 moda se desloca dentro do intervalo de classe para um determinado ponto
TABELA 4.25

Classes

101--20 3
201--30 5
Classe Modal: 301--40
301--4 0 7
Moda Bruta: 35
401--50 6
501-- 60

n = 22

(valor), de tal sorte que as distancias desse ponto aos lirnites de classe
sejam inversamente proporcionais as freqiiencias das respectivas classes
adjacentes. Assim e que, quanto maior for a freqiiencia da classe adjacente,
menor seni a distancia do ponto a essa classe.

Para comprovar o que dissemos, fa�amos:

l; = limite inferior da classe modal;


ls = limite superior da classe modal;
di = distancia do ponto (moda) ao limite inferior;
d2 = distancia do ponto (moda) ao limite superior;
!ant = freqiiencia simples da classe adjacente anterior a classe modal;
fpost = frequencia simples da classe posterior a classe modal.

Como di e d2 sao inversamente proporcionais as freqiiencias das


classes adjacentes, podemos escrever:

d2 fant
=
di !post

A propriedade das propor�aes permite-nos escrever:

d2 +di fant +/post


�-
= ---

di !post

0 numerador do primeiro membro da expressao equivale a amplitude


do intervalo de classe: d2 +di = c. Assirn,

fant +/post C • /post


=
_

e
- /post fant + fpost

Para determinar a moda, basta acrescentar a distancia di ao lirnite


inferior da classe modal.

!post
M0 = I + di = I +c (36)
fant +[post
145
Como pode ser notado, o metodo de King nlio leva em consi<lcrayao
a freqtiencia da classe modal, o que revela sua limitaylio. Sc essa fre­
qtiencia, por exemplo, for muito maior do que as das classes adj accntes,
por esse metodo estaremos atribuindo uma importincia exageradamente
grande a elas.
Exemplo 22:

Calcular, pelo metodo de King, a moda dos. valores constantes da


Tabela 4.26.
TABELA 4.26

Classes fj
101--20 2
201--30 4
301--40 8
401--50 5
501--60

n = 20

Solufiio:
A classe modal e a terceira: 301---40. A moda, segundo a formula
de King, seni:

[post + 10 s
M0 I + c fant fpost. = 30 4 + 5 =
+
=

= 30 + �
s = 30 + 5,556 = 35,556 Mo = 35,556 I
A moda bruta desses valores e ligeiramente menor: M0 = 35.
b.1 ) Determinafiio Grdfica de Moda pelo Metodo de King
Para determinar graficamente a moda pelo metodo de King, parti­
remos do histograma. Por simplificayao, construiremos apenas a parte do
histograma rclativa ao calculo da moda (C.rafico 4.1 ) .

A ---

GRAFICO 4.1'
0 x

,
..,,

146
Para a detennina¢o da moda , marca-se inicialmente o ponto A na
perpendicular ao limite inferior da classe modal, de modo que sua ordenada
seja igual a freqiiencia da classe posterior. lgualmente marca-se o ponto
B na perpendicular ao lirnite superior, mas no lado oposto, de sorte
que sua ordenada seja igual a freqiiencia da classe anterior. 0 segmento
AB determina no segmento I ls o ponto P, que corresponde a moda.
�=M
0 procedimento acirna justifica-se em virtude da semelhan? dos
A IP e BlsP. Assim, J?odemos escrever
triangulos

lsP Bis

Fazendo

lsP = d2 Bis = fant

I P= di Al =/post
Assim
d2 fant
=
di /post
e, pela propriedade das propor�fies,

d2 + di _ fant +/post
di - /post
e, finalmente, fazendo d2 + di = c = amplitude do intervalo de classe,

f,�p_os_t -
di =c .,- -
fant +/post
Somando di ao limite inferior da classe modal, teremos a f6rmula
de King:
,,f"_
post
Mo =I +c
fant +/post

Exemplo 23:
Determinar graficamente a moda, conforme a f6rmula de King, dos
dados1 da Tabela 4.27.
TABELA 4.27

· Classes
101--20 2
201--3 0 3
301--- 40 10 Classe Modal: 30f-- 40
401--50 9
501---60 4
n = 28 147
Solu�iio:
Pela f6rmula 36, teremos
fpost
Mo = I + c
fant + /post
9 90
M0 = 30 + 10
3 + 9 = 30 +
U
I M0 =
37,5

Graficamente

10
A -- -

6
GRAFICO 4.2
4

0 50 60 x

c) Metodo de Czuber
0 metodo de Czuber, para o calculo da moda elaborada, leva em
consi dera�ao nao apenas as freqiiencias das classes adjacentes, mas tambem
a freqiiencia da classe modal. 0 ponto que corresponde a moda divide o
intervalo da classe modal em duas partes, as quais sao proporcionais as
diferen�as entre a freqiiencia da classe modal e as das respectivas classes
adjacentes.
Fa�mos, entao,

t.i = Imo - lant = (frequencia da classe modal) -


(freqiiencia da classe
anterior);
62 =Imo - fpost= (freqiiencia da classe modal) -
(freqiiencia da classe
posterior);
= limite inferior da classe modal;
ls = limite superior da classe modal;
di = distancia da moda ao. limite inferior da classe modal;
d2 = distancia da moda ao limite superior da classe modal.

Segundo o princfpio do metodo de Czuber,


d2 /J.2
148 di t:,.1
Recorrendo novamente a propriedade das propor�oes,

d2 + di b.2 + b.i
=

Lembrando que d2 + di = c, amplitude do intervalo de classe, e


colocando di em evidencia,

[:, i
di = c
b.2 + !:;,.l
Como d1 e a distancia entre o limite inferior da classe modal e a
moda, essa seni determinada por

!:;,.l
M0 =I+ d 1 =I+ c --­ (37)
t::,.2 + ll1

OU

fmo - !ant
M0 =I+ c
2/mo - Uant +/post)
-------

Exemplo 24:
Determinar a moda, pelo metodo de Czuber, usando os dados do
exemplo 23.
De acordo com a formula 37,
= 30
c = lO

b. 1 = fmo - /ant = lO - 3 = 7

62 =/mo -/post= 10 - 9 = l

b.1
M0 =I+ c ----

1::,.1 + b.2
7
= 30 + lo m = 30 + 8,75 = 38,75

I M0 = 38,75 1
c. l) Determinariio Grdfica da Moda pelo Metodo de Czuber
Para determinar graficamente a moda, Segundo 0 metodo de Czuber,
partiremos de um histograma. Por simplifica�ao, construiremos apenas os tres
retangulos correspondentes as classes de interesse. 149
s T

GRAFICO 4.3

0 1, x
P=Mo

Temos que:
At =Imo - /ant;
L'.2 =Imo - /post;
I = limite inferior da classe modal;
ls = limite superior da classe modal;
c = amplitude do intervalo de classe (constante).

Consideremos os seguintes triangulos semelhantes QRS e QTU. Em


virtude da propriedade dos triangulos semelhantes, podemos escrever a
seguinte proporyao:

CQ QD
=
SR TU
Mas,
CQ = M0 - l QD =ls - Mo
SR = t:.1 TU = t:.2
Assim sendo:
M0 - l
A1
A determina¢o de M0 e feita a partir dessa ultima relayao:
(M0 - I )t:.2 =Os - Mo)A1

M0A2 -- l b.2 =lsA1 -- M0A1

M0t:.2 + M0A1 = I A2 + l5A1

150 I t:.2 + lsA1


Mo =
A1 + A2
----­
Como 18 =I + c, o denominador da expreSSfo ficar4:

I f:i.2 + lsA1 =I A2 + (I + c)f:i.1 =I f:i.2 + / A1 + cA1 =


=I (f:i.1 + A2) + cA1
Portanto,

I (A1 + A2) + c f:i.1 f:i. 1


Mo = = 1 + c '
f:i.1 + f:i.2 f:i.1 + A2
-------­

conforme a expressio (37).


Examinando a Figura 4.3, podemos afirmar, entao, que a moda
corresponde a abscissa P = M0 do ponto de interse�o Q das linhas
RT e SU.
Observ0f6es:
I) 0 leitor que estiver familiarizado com os conhecimentos de catculo
podera encontrar a formula de Czuber atraves de uma parabola construida
de modo a passar pelos pontos medios da classe modal e das classes contfguas
a ela. Desse modo, a parabola Y =ax2 + bx + c passara pelas extremidades
das tres ordenadas: fant. fmo e [post·
Em seguida deverao ser determinados os parametros da parabola, a, b,
c, atraves de um sistema de tres equa�aes a tres inc6gnitas, com a origem
no ponto medio da classe modal, chegando-se a seguinte expressao:

fant + fpost -- 2 fmo 2 fant + fpost


y = 2 x + I'
x + Jmo
2c 2
� '--v--1 ·
a b c
0 maximo de y (freqilencia) e obtido por deriva�o. 0 valor de x,
correspondente ao valor maxima de y' sera dado por

fant - fpost
x = X __£__
!ant + fpost - 2[mo 2
Mudando a origem para o limite inferior da classe modal, obtem-se:

, cifmo - fant) A1
x = =c ----
2fmo - ifant + fpost) A1 + A2
Assim,

I
_
M0 =I + x' =I + c __

f:i.
f:i._l _
1 + A2

2) Seria possivel obter outras formulas da moda considerando outros


criterios, como, por exemplo, utilizando as freqilencias de todas as classes.
Entretanto, todo esse rigor nao se justifica, em virtude do pouco uso
dessa medida. 151
4.4. MEDIANA
Simbolo: Md OU x.
A mediana e a terceira medida de tendencia central e pode ser defi·
nida como o valor que divide uma serie ordenada de tal forma que pelo
menos a metade ou cinqilenta por cento dos itens sejam iguais ou maiores
do que ela, e que haja pelo menos outra metade ou cinqilenta por cento de
itens maiores do que ela. A mediana e considerada uma separatriz, por ser
um promedio que divide a distribui9ao ou conjunto de dados em partes
iguais. Trata-se de uma medida muito utilizada na amilise de dados estatis­
ticos, especialmente quando se atribui pouca importancia aos valores extremos
da varili vel.

Elemento Mediano
Por ser uma separatriz, isto e, em virtude de a mediana se constituir
em um valor que separa a distribui¢o em partes de tal sorte que uma fra¢o
(0,5 ou 1/2) de valores lhe seja inferior e os restantes superiores, podemos
concluir que essa medida apresenta um numero de ordem. Assim e que,
ordenando os valores da serie, a mediana e um valor que ocupa uma deter­
minada ordem ou posi9ao na serie ordenada. 0 numero que indica a ordem
em que se encontra o valor correspondente a mediana e denominado ele­
mento mediano, cujo simbolo e EMd·

4.4.1. Determina�o da Mediana de Valores Nio-Tabulados

A determina9ao da mediana de valores nao-tabulados processa-se a


partir de um rol ou lista ordenada dos dados. Podem ocorrer duas hipoteses
com rela9ao ao numero de observa96es n: que ele seja impar ou par. Veremos
os dois casos.
a) 0 Numero de Observaroes e fmpar
0 procedimento para o calculo da mediana quando a lista de valores
contiver um nilmero fmpar de observa9oes requer, em primeiro lugar, que
se determine a ordem em que se encontra a mediana na serie. Deve-se,
entao, encontrar o valor do elemento mediano, o que e feito da seguinte
forma:

I EMd= � I (38)

O passo seguinte sera localizar a mediana na lista de valores, de


acordo com o resultado obtido no calculo do elemento mediano.

Exemplo 25:
Calcular a mediana do seguinte conjunto de numeros:
152 x = {2, 3, 6, 12, 15, 23, 30}
Solurao:
A primeira providencia a ser adotada seria a de ordenar os valores.
Neste exemplo, os valores da serie ja se encontram ordenados.

Em seguida, determinaremos o valor do elemento mediano, utilizando


a formula (38), uma vez que o numero de observay5es e impar (n = 7).

E Md -�
-

2 - 2-±_J_
- 2
-- 4
Ressalte-se o fato de que o valor 4 e um numero ordinal. Assim,
EMd =4 indica que a mediana e o valor que se en contra na quarta posiyao
da lista ordenada de valores, e 0 quarto numero da serie.
Finalmente, procuraremos no conjunto qual o valor que se encontra
no quarto lugar da lista. Esse numero c;orrespondera a mediana do conjunto.
No exemplo:

�, M.-d-=-12--.,
Observe que existem tres valores menores do que doze (2, 3 e 6) e
tres valores maiores (15, 23 e 30), o que corresponde a cinqilenta por
cento (ou metade) de itens maiores e menores do que a mediana.

b) 0 Num ero de Observafoes e Par


0 procedimento para calcular a mediana de ·um numero par de obser­
vay5es e ligeiramente diferente do adotado para 0 caso em que n e impar.
Assim e que 0 elemento mediano Sera determinado, agora, atraves da
seguinte expressao:

I E Md = ; I (39)

· Exemplo 26:

Calcular a mediana do conjunto:

x = (3, 6, 9, 12, 14, 15, 17, 20}.


So/ufiio:

Como vemos, n = 8.
0 elemento mediano sera, de acordo com a formula (39),
n 8
EMd = = =4
1 2
Seguindo a mesma linha de raciocinio do exemplo anterior, identifi­
carfamos a mediana coma 0 quarto elemento da lista, OU seja, Md= 12.

Entretanto, esse procedimento de identificayao resultaria em um valor da


mcdiana que contrariaria a defini\:ao, uma vez que nao teriamos a mesma
propor9ao de valores menores e maiores do que o valor doze. Haveria, 153
entiio, tres valores menores do que doze (3, 6 e 9) e quatro maiores
(14, 15, 17 e 20).
Toda vez que houver um numero par de observa�oos a lista apresen­
tara dois valores centrais e a mediana sera determinada calculando a media
aritmetica deles. No exemplo, teriamos:

12 14
Md = + = 13
2
Percebe-se, agora, a ocorrencia de igual numero de valores maiores
(14, 15, 17 e 20) e menores (3, 6, 9, 12) do que a mediana.

4.4.2. Determina\:iO da Mediana de Valores Tabulados


nio Agrupados em Classes

Quando os valores da variavel estiverem ja tabulados, o procedimento


a ser adotado sera praticamente identico ao anterior.

Em primeiro lugar, deve-se verificar se o numero de observa�oes e


impar ou par e, conforme o caso, aplicar as formulas (38) ou (39), para o
calculo do elemento mediano.

Em seguida, acrescentamos uma coluna a tabela de freqiiencias original,


onde serao determinadas as freqiiencias acumuladas. Comparando o resultado
obtido no calculo do elemento mediano com os valores constantes dessa
coluna, determinaremos a mediana.

Exemplo 27:
Calcular a mediana dos valores apresentados nas Tabelas 4.28 e
4.29.
TABELA 4.28 TABELA 4.29

Va/ores FrsqiilJncias Valor• Fmqiilncias


Xj fj Xj fj

2 5 3 3
3 10 4 6
4 15 5 9
5 12 6 8
6 5 7 6
7 3 8 3

n = 50 n = 35

Solufao:
a) 0 numero de observa�OeS da variavel, conforme a Tabela 4.28, e
154 n = 50. Assim sendo, fazemos:
EMd
50 = 25
=1= 2
n

A mediana devera ser o vtges1mo quinto elemento, se levarmos em

3, 3, 3,
considera\:li'O os valores do conjunto ordenados, ou seja:

{2, 2, 2, 2, 2, . ' 7, 7, 7}

4.30.
. .

0 passo seguinte sera o calculo das freqilencias acumuladas, o que


sera feito com o recurso da tabela auxiliar
TABELA 4.30

Xj fj Fj

2 5 5
3 10 15
4 15 30
5 12 42
6 5 47
7 3 50

n = 50

Examinando a coluna das freqilencias acumuladas verificaremos que


ate o valor dois, inclusive, existem cinco observa\:oes, o que equivale a
dizer que o quinto elemento da lista e igual a dois. Portanto, a mediana
nao pode ser dois, uma vez que ela equivale ao vigesimo quinto valor, e
ate dois temos apenas cinco observa\:OeS. Assim, iremos percorrendo a
coluna ate encontrar um valor (freqilencia acumulada) igual ou maior que
o elemento mediano. A freqilencia acumulada seguinte e quinze, que, por
ser inferior a vinte e cinco, indica que tres nao e a mediana. Ja a freqilencia
acumulada ate o valor quatro da variavel e superior a vinte e cinco. Portanto,

I Md=41
a mediana desse conjunto e

Observ()fiio: Em virtude de o numero de observa\:OeS ser par, teremos


dois valores centrais, que no caso sao iguais. Assim,

1Md=�=41
b) 0 conjunto de observa\:oes, neste caso, e fmpar: n = 35.
35
0 elemento mediano sera:

+ 1 18

4.31
EMd - � -
2 2
- -

A mediana sera o decimo oitavo valor da lista. A Tabela mostra


que ate cinco, inclusive, temos dezoito observa�es. Conseqilentemente, 155
TABELA 4.31

Xj fj Fj

3 3 3
4 6 9
5 9 18
6 8 26
7 6 32
8 3 35

n = 35

Se tivessemos os valores dispostos individualmente, teriamos a seguinte


lista:
/1 =3 /2 =6 fs = 6 !6 =3
� ,.....--...

3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,6,6,6,6,6,6,6,6,7,7,7,7,7,7,8,8,8
i
Md= 5 ou 189 elemento da lista
Exemplo 28:
Calcular a mediana dos valores constantes da Tabela 4.32.
TABELA 4.32

Xj fj Fj

3 3 3
4 6 9
5 9 18
6 8 26
7 6 32
8 4 36

n = 36

Solu�iio:

Temos n = 36 � n e par. Entao,

n 36
EMd =1=2 = 18
A mediana e o decimo oitavo elemento, numero esse que coincide
com o valor da freqilencia acumulada ate cinco: F3 = 18. Mas como quando
n for par a mediana seni igual a media aritmetica dos dais valores centrais,
156 teremos:
Md=�=55
'
2

4.4.3. Determina�o da Mediana de Valores Tabulados


Agrupados em Classes
Quando os valores da variavel estiverem agrupados em classes, o
calculo da mediana seni realizado por interpola�ao. Tratando-se de dados
agrupados, admite-se que os valores da variavel na distribui�ao de freqiiencias
distribuam-se continuamente. A mediana seni, neste caso, o valor da variavel,

para o qual metade ou cinqiienta por cento da freqiiencia total ( �) flea

situada abaixo e outra metade acima dele. Geometricamente, isso equivale


a dizer que a mediana e 0 valor de x (eixo das abscissas) que corresponde a
perpendicular que divide o histograma em duas partes que apresentam
areas iguais.

No Grafico 4.4, o histograma apresenta-se dividido pela linha tracejada


OP em duas partes exatamente iguais quanto as suas areas.

GRAFICO 4.4

45
0
40 E

35 I
I
30
I
25 101 30
I
20 I
35 I
15
I
10 20 I 40
25
I
5 10 15
I
A 8
0 10 20 30 40 \;so 60 70 80 x

Md=42,5

A mediana sera, entao, a abscissa correspondente a linha OP, a qual


divide o histograma em duas partes iguais. Em virtude de as areas dos
retangulos do histograma corresponderem as freqiiencias das respectivas
classes, OP seni tal que a soma das areas situadas a sua esquerda OU a sua
direita seni sempre igual a metade da freqiiencia total, ou seja, igual ao
elemento mediano. Examinando o Grafico 4.4, podemos ver que
n = 10 + 20 + 35 + 40 + 25 + 15 + 5 = 150,
e que

157
Dessa forma, podemos afirmac que a linha OP devera dividir o histograma
em duas partes, sendo a area de cada uma delas igual a 75. Observando
novamente a figura verificaremos que as areas APOD e PBEO correspondem
respectivamente as freqiiencias e 30. Portanto, ate chegar a linha OP, a
10
area total sera igual a 75, incluindo APOD:

APOD
t
01 + 20 + 35 + 10 = 75
Considerando a area a direita da linha OP, teremos igualmente uma
area numericamente igual a 75, incluindo PBEO.
PBEO
t
30 + 25 + 15 + 5 = 75
Para encontrar a mediana, basta verificar qual o valor da variavel
(eixo das abscissas) que divide o histograma em duas partes iguais. 0 proce­
dimento e simples. Se somarmos as freqiiencias das tres primeiras classes,
chegaremos a 65 observayoos, que correspondem ao valor numerico da
soma das areas dos respectivos retangulos do histograma. Podemos dizer,
entao, que ate o valor 40 da variavel (abscissa) houve 65 observayoos.
Como precisamos de 75 observayOeS (E Md =
;01 = 75 ) para chegar a
mediana, ha n cessidade de consideram
� �os �ais dez valores (observ �goos)
da classe segumte. Em termos proporC1ona1s, devemos considerar de
40
valores da classe mediana. Uma vez que a amplitude do intervalo de classe
e igual a dez, para chegar a mediana iremos considerar apenas uma fra9ao

dessa amplitude, ou seja: �. Simbolicamente:

AP = 4010 • AB !Q_
=

40
01 • = 25
'

Assim, a mediana sera igual a:


Md = 40 + 2,5 = 42,� I Md = 42,5 I
0 mesmo resultado seria obtido a partir do poligono de freqiiencias
acumuladas. Consideremos irlicialmente a Tabela 4.33, que recomp0e os
dados do problema anterior.

TABELA 4.33

Classes Fj
'i
10 f-- 20 10 10
20 f-- 30 20 30
30 f--40 35 65
Classe Mediana- 40 f--5 0 40 105 EMd = 75
50 f--6 0 25 130
60 f-- 70 15 145
70 f-- 80 5 150
150
158
Fj Frj(%)

160

140
Loo
120 80

100
60 GRAFICO 4.5
80
EMd=75- ·-·-·-
-50%
60 40

40
20
20

0
0 10 20 30 40 "' 50 60 70 80 x

Md=42,5

Examinando o poligono de freqiiencias acumuladas representado no


Gnifico 4.5, podemos ver que a mediana ea abscissa do ponto P do poligono
de freqiiencias acumuladas, cuja ordenada e o elemento mediano (EMa = 7 5),
no caso de freqiiencias absolutas, e cinqiienta por cento, no caso de freqiien­
cias relativas. Para calcular o valor da mediana, recorremos aos triangulos
semelhantes, RQP e RST, que gozam da propriedade:
RQ PQ
=
RS ST
Para determinar a mediana, teremos que fazer:
Md=I + RQ
onde I = limite inferior da classe mediana.
PQ
RQ =RS ·
ST
Mas
RS = c = amplitude do intervalo de classe
PQ = EMd - Fant
Fant = freqiiencia acumulada atea classe anterior a classe mediana
ST = freqiiencia simples da classe mediana = fMd
En tao,
F,,.
I
.
Md =I + c
EMd
[Md
-

(40)

No exemplo, teremos:

Md= 40 + 10
.
75 - 65 = 40 100
= 42,5 Md= 42,5
+ 159
40 40
Observaroes:

1) Tratando-se da distribuiyao de freqiiencias de dados tabulados

agrupados em classes, o elemento mediano seni sempre igual a EMd =


� ,

nao se fazendo distinyfo entre numero par OU fmpar de observay6es.

2) 0 calculo da mediana pode ser feito a partir das freqiiencias


relativas. Neste caso,

0,50 - Frant
Md= I+ c ----­
(41)
frMd

F rant = frequencia reiativa acumulada ate a classe anterior a med1ana

frMd =
freqiiencia simples relativa da classe mediana

No exemplo acima:
65 75 - 65
0•50 -
150 150
Md= 40 + 10 = 40 + 10----

40 40
150 150

= 40 + 10 � =
·
42 5
,

Exemplo 29:

Calcular o consumo mediano de eletricidade (kw/hora) dos 80 uswirios,


utilizando os dados do exemplo 7.
a) Por formula.
b) Por interpola"iio.
c) Graficamcnte.
Solu�iio:
A Tabela 4.34 apresenta os dados do problema.
"TABELA 4.34

Consumo Numero de
Fj
kwh usuarios: fj

5 i:-- 25 4 4
251--- 45 6 10
451--- 65 14 24
651--- 85 26 50
85 f---105 14 64
105 f---125 8 72
125 1--145 6 78
145 1--165 2 80

80
160
a) Primeiro Metodo: Resolurao porFormula

Para aplicayao da f6nnula, precisamos dos seguintes dados:

n 80
EMd =1=2= 40

Classe mediana: 6Sf---85, uma vez que, ate85, temos cinqiienta


-
observayaes, e ate 65 apenas 24.

/. = limite inferior da classe mediana = 65


c = amplitude do intervalo de classe = 20
fMd = freqilencia simples da classe mediana = 26
Fant = freqilencia acumulada ate a classe anterior a classe mediana = 24

Conforme a formula (40), devemos ter:

EMd
Md=! +c ----
Fant - = 65 +20
40
- 24
=
fMd 26
320
= 65 +
26
= 65 +12 ' 31 I Md= 77,31 I
0 consumo mediano, por conseguinte, e de 77,31 kwh.

b) Segu.ndo Metodo: PorIntrp


e olarao

Admite-se que o consumo se distribui continuamente e o consumo


80 valores lhe seja inferior e metade
mediano e o valor tal que metade dos
superior. Para obter a mediana, devemos localizar o quadragesimo elemento,
ja. que EMd = 40. Percorrendo a Tabela 4.34 na coluna de freqiiencias
acumuladas, verificaremos que o quadragesimo elemento encontra-se na
quarta classe: 65f----
85. Como ate a terceira classe, inclusive, acumulamos
24 observaiyoes, precisamos de mais 16 para completar as 40 necessarias.
Assim sendo, se tomarmos todo o intervalo da quarta classe, estaremos
considerando todas as observaiyaes dessa classe (26). Entretanto, interessam­
-nos apenas 16 observayoes para atingir o ponto que corresponde a mediana.
Para saber que parcela. do intervalo da classe mediana (c = 2 0) devemos
levar em consideraiyao, faremos a seguinte regra de tres simples:

{26 ---- 20
x =
20
;
6
16
= 12,31
16 ----- x
Acrescentando-se esse valor ao limite inferior da classe mediana,
chegaremos a

,
.... M_d_=_65_ +
- 1
- 2- ,-31 _=_ 7 _ 7-, 31 I
- --.

valor igual conseguido com o uso da f6rmula (40). Na realidade, esse ultimo
e apenas o resultado de interpolaiyao. Assim, de acordo com o que vimos
acima, 161
20 x 16
x= = 20 �
26 26
onde
20 =c
16 = 40 - 24 = EMd - Fant
26 =[ Md

Substituindo os numeros pelos simbolos que os representam, temos

EMd Fant
x=c
-

fMd
que, somado ao limite inferior da classe mediana (/ ), reproduz a formula (40).
EMd Fant
Md =I+ c
-

----

[Md
c) Terceiro Metodo: Determinariio Grtifica da Mediana
Inicialmente construiremos o poligono de freqtiencias acumuladas
(ogiva).

N(lmerode Pon:entagem de
Usu6rios Usudrios
Fj Fri(%}

80 100

70

60 76

60
GRAFICO 4.6
EMd =40 - -- - - -- 60

30

20 26
10

O 5 25 45 66 \ss 106 126 146 166 Consumo kwh

Md= 77,31

A partir do eixo das ordenadas na altura correspondente ao elemento


mediano (40), no caso de freqtiencias absolutas, ou a cinqtienta por cento,
no caso de freqtiencias relativas, tra�amos uma paralela (linha interrompida)
ao eixo das abscissas, ate encontrar o ponto P na ogiva. ·nesse ponto,
baixamos uma perpendicular ao eixo das abscissas, encontrando nesse o
valor da variavel representativo da mediana Md = 77 ,31. E natural que
a leitura da mediana no grafico s6 pode ser realizada aproximadamente.
0 valor exato so se consegue mediante a aplica�ao da formula (40), ou
162 pelo metodo de interpola�ao, que lhe e equivalente.
Exemplo 30:

Calcular a mediana do problema do exemplo 29:


a) Utilizando a formula das freqiiencias relativas; e
b) Graficamente, atraves do histograma.
Solufiio:
a) Primeiro Metodo: Por Fonnu/a
A Tabela auxiliar 4.35 fornece OS dados necessarios para 0 calculo
da mediana.
TABELA 4.36

Consumo Numerode Porcentagemde


Fr
kwh usu6rios: fj usuarios: ' 'i (%) i

5l--2 5 4 5,0 6,0


251--45 6 7,5 12,5
451--6 5 14 17,5 30,0
Classe Mediana 651--85 26 ''Md 32,5 62,5
851--105 14 17,5 80,0
1051--125 8 10,0 90,0
1251--145 6 7,5 97,5
1451--165 2 2,6 100,0

n = 80 100,0

0 elemento mediano, como vimos, e


n 80
EMd =1=1= 40.

Em termos porceqtuais, o elemento mediano corresponde a cinqiienta


por cento da distribuiyao. Com esse valor, localizamos -a classe mediana
(65f--85). Assim sendo; teremos, de acordo com a formula (41),
0,50 - F rant 0,50 - 0,30
Md= I + c = 65 + 20 =
frMd 0,325

= 65 +
0 25 '
: = 65 + 12,31 I Md= 77,31 I
b) Segundo Metodo: Por Grtifico
Observando o Grafico 4.7, podemos notar que ate a ierceira classe
(45 f--65), inclusive, houve 24 observayoos (4 + 6 + 14). Como o elemento
mediano e igual a 40, precisamos ainda tomar 16 _observayoos das 26 da
classe seguinte (40 ___:___ 24). Em termos proporcionais, precisamos de ;� c,
onde c e a amplitude do intervalo de classe.
16 �������
20= 12,31 Md= 65 + 12,31= 77,31
26 X 163
NUmero de
usuarios
'i
10
28
-c-

24 I
I
I
20 I
I = 80

16
I
I
EMd= -!!J! =40 GRAFICO 4.7
I Classe Med;ana: 65 I-- 85
12 I = 20
16 �
I
8 I
I
14 I 14
4
2,311

0 6 26 45 66 \85 105 126 146 165


Consumo �h
MU= 77,31

4.5. CONSIDERACOES ADICIONAIS SOBRE A MEDIA


ARITMETICA, A MODA E .A MEDIANA

Dentre as varias medidas de tendencia central, seguramente a media


aritmetica e a mais utilizada. Entretanto, existem casos que justificam o
emprego de outra medida. Antes de entrarmos nesses pormenores, vejamos
como podem ser relacionadas as tres principais medidas de tendencia central:
media (aritmetica), moda e mediana.

4.5.1. Rela�o Empfrica entre a M6dia, a Moda e a Mediana


Karl Pearson desenvolveu uma f6rmula empirica de relaylio entre a
media, a moda e a mediana. Existem algumas condiyoos a serem satisfeitas
para que a relaylio proposta por Pearson se verifique com maior aproximaylio:

a) A distribuiQiio (curva) de freqiiencias deve ser unimodal.


b) A distribui9ao de freqiiencias deve ser fracamente assimetrica.
c) 0 numero de observaQoes deve ser suficientemente grande e · pequena
a escala de unidades que divide a distribuiQiio.

A relayliO de Pearson e a seguinte:

I x -M0 = 3(x - Md) I (42)

Se quisermos calcular cada medida a partir dessa relaya'o, teremos:

3Md -Mo
x
2
-

M0 = 3Md - 2x (43)

2x +Mo
Md=
164 3
Exemplo 31:
Utilizando os dados dos exemplos 7 29,e calcular a media, a moda
(Czuber) e a mediana e comparar os resultados com os da relayao empirica
de Pearson.

Solu(iio:
lnicialmente, reproduziremos na Tabela
resoluc;ao do problema.
4.36 OS dados necessarios a

TABELA 4.36

Consumo Numerode Xj Xjfj Fj


kwh usufJrios: fj

51---- 25 4 15 60 4 n = 80
251---- 45 6 35 210 10 k = 8
451---- 65 14 55 770 24
Classe Modal
651---- 85 26 75 1 950 50
Classe Medians
851----105 14 95 1 330 '64
1051---- 125 8 115 920 72
1251---- 145 6 135 810 78
1451---- 165 2 155 310 80

n = 80 6 360

Devemos ter:
k

L
j=l
Xjfi
6 80360 = 79'5 = 79,5 x

= 65 20 (26 -14)(26 - (26l4)


n

Mo= I + c --­
b.1

t::..1 + t::.2. 14)


= 75 +
+ -

I M0 = 75 l
Md= EM�:aFant = 65 20 402� 24 = 77,31 IMd= 77,311
l + c +

Pela relac;ao empfrica


Mo= 3Md 2.X= (3 X 77,31) - (2 X 79,5)= M0= 73
-

= 231,93 - 159,0= 72,93 73 £:

Md= 2.X 3 Mo= (2 X 79,5)


+
3 75 78 I Md= 78 I +

-- 3Md - Mo - (3 X 77,31) - 75 78,465 ::::: 78,5 I = 78,5


2 2 . x
165
Como pode ser visto, nao ha uma discordancia acentuada entre as
medidas calculadas pelos dois processos.

4.5.2. Caracterrsticas da Media, da Mediana e da Moda

Uma forma util de comparar as medidas de tendencia central e


atraves da utilizayao de um diagrama. Devemos, entretanto, lembrar, antes
de qualquer considerayao, que tais medidas se baseiam em conceitos distintos.
Assim e que a media aritmetica e a soma dos valores observados dividida
pelo numero total deles; a mediana e 0 valor que divide a serie em duas
partes iguais quanta ao numero de valores de cada parte e a moda e o
valor em cuj a vizinhanya tendem a se concentrar os valores da serie.

a) Conceitos Fisicos das Medidas de Tendencia Central


Conforme dito anteriormente, o conceito de media aritmetica corres­
ponde ao de centro de gravidade estudado em Ffsica. Esse fato nos revela
que essa medida e afetada de maneira acentuada pelos valores extremos da
serie, o que nao acontece com a moda e a mediana. Assim, por exemplo,

Numero de
Observat;:6es 30

25

20
GRAFICO 4.8
15

10 .( Empregado B
5 '
......
......
............

0 2 x =2 3 Minutos

Os tempos obtidos por B revelam sua menor eficiencia em relat;:ao a A.

duas series podem apresentar a mesma media mas suas distribuiyOeS serem
diferentes. Suponhamos que dois empregados executem uma determinada
tarefa, em media, em dais minutos, sendo esse resultado calculado a partir
de um certo numero de observayCies realizadas. Alguem poderia estar
tentado a concluir, com base nessa informayao, que ambos os empregados
apresentaram a mesma eficiencia. Um exame mais acurado da distribuiyao
dos tempos de execu\:aO da tarefa pode, entretanto, revelar resultados
discrepantes para essas pessoas, conforme pode ser notado no Grafico 4.8,
na pagina anterior.

Outro Grafico muito ilustrativo da influencia dos valores extremos


166 sobrc a media e 0 4.9.
GRAFICO 4.9

A
c52lEJ��

l Mo

El �jB El
cS 2l 2l 2l El

Md

As disposi\!OeS A e B, embora revelem a mesma media aritmetica,


nao podem ser eonsideradas iguais. Em A, OS oito itens situados a esquerda
da media estlio compensados por apenas um que se encontra muito a sua
direita, de modo que o centro de equilfbrio esteja em x. Em B, os mesmos
oito itens a esquerda da media sao compensados por seis a sua direita. Nessa
dispoSi\!lIO, e pOSSlVel ainda vislumbrar 0 posicionamento tipiCO das medidas
de tendencia central em distribui�es ligeiramente assimetricas a direita.
Em termos de uma curva de freqiiencia, percebe-se melhor esse posiciona­
mento (Gnifico 4.10).
GRAFICO 4.10

MoMd 'i"
SitN$1o de nttdi9 arhmttiA.. d• ,.....,. • • mead! .,. um• diltribuil;lo com _.....,.. ii diNIU

No exemplo 30, tivemos os seguin tes result ados, que confirmam o


que acabamos de dizer no que se refere a disposi�ao <las medidas de tendencia
central quando a distribui\!lIO e ligeiramente assimetrica a direita:

Mo= 75
Md= 77,31
x = 79,S
Neste caso

Mo<Md<x
b) Possibilidades de Calculo Algebrico
A media aritmetica e uma medida mais estavel do que a mediana ou a
moda. Alem disso, para o calculo posterior de outras medidas estatfsticas, 167
como, por exemplo, algumas medidas de dispersao, a media aritmetica e
muito mais conveniente. Assim e que, se conhecemos duas quaisquer das
tres quantidades 1:x, N ou X, a terceira pode ser calculada imediatamente.
Ou entao, desejando-se determinar a. media das medias aritmeticas de
diferentes series, basta atribuir o peso apropriado a cada uma delas e
em seguida calcular a media ponderada das medias. 0 resultado representa
a media de distribUiyiIO constitufda pelos valores de todas as series Originais.
Tais recursos algebricos nao existem para a mediana nem para a moda.

c) Outras Caracteristicas das Medidas de Tendencia Central

A media aritmetica e preferfvel as demais medidas, para estimar a


tend
_ encia central, quando se trata de muitas classes de populay6es, por
haver menos variabilidade entre as medias aritmeticas calculadas a partir de
varias amostras aleat6rias do que entre as medianas e as modas.

A media aritmetica pode ser calculada a partir dos dados brutos, sem
recorrer a qualquer agrupamento ou ordenayao de valores originais, o que
nao ocorre com a mediana e a moda.

Ja para a determinayao da mediana e da moda, em distribuiy6es de


frequencias onde ocorram classes com limites indefinidos ("menos de ... "
ou "mais de ... "), nao M dificuldade alguma. Em casos como este, todavia,
o. valor de x nao pode ser determinado com exatidao para a serie, a menos
que figure na tabela o valor total dos itens na classe ou classes que tenham
algum extremo (limite superior ou inferior) aberto.

A mediana e preferfvel a media quando se esta interessado em conhecer


exatamente o ponto medio da distribuiyao, aquele valor que a divide em
duas partes exatamente iguais. E preferivel, ainda, quando os resultados
extremos sao tais que podem afetar sensivelmente o valor da media.

A moda e utilizada essencialmente quando pretendemos apenas uma


medida rapida e aproximada da tendencia central.

d) Conc/usoes

I - Um promedio pode atuar como medida de tendencia central


somente se existir uma quantidade consideravel de concentrayao
na distribuiyao de frequencias, isto e, se a variabilidade nao for
muito grande. Apenas o valor do promedio nao descreve, por
si .s6, o grau de variaylio na distribuiyiio de frequencias, nao
nos garantindo, conseq\ientemente, que ele seja uma medida
significativa de tendencia central.

II - Um promedio serve como uma medida util de localizayao_ para


comparar duas ou mais distribuiy0es de frequencias somente se
essas tern aproximadamente a mesma forma.
168
III - Um promedio nao deve ser usado como um resumo da distri­
buiyao de freqiiencias completa, quando o interesse estivcr
concentrado na distribuiyao completa.

4.6. QUARTIS - DECIS - PERCENTIS (OU CENTIS)


Ha uma serie de medidas de posiyao semelhantes na sua conce�ao a
mediana, embora nao sejam medidas de tendencia central. Como se sabe, a
mediana divide a distribuiyao em duas partes iguais quanto ao numero de
elementos de cada parte. Ja os quartis permitem dividir a distribui�ao em
quatro partes iguais quanto ao numero de elementos de cada uma; os decis
em dez partes e os centis em cem partes iguais.

Para simbolizar cada uma dessas medidas separatrizes, faremos:


Q; = quartis i = I, 2, 3
D; = decis i = I, 2, 3, ... , 9

C; = centis i = I, 2, 3, . . . , 99
Assim, para dividir uma serie ordenada de valores em quatro partes
iguais, precisamos de tres separatrizes (quartis); para dividi-la em dez, iremos
recorrer a nove separatrizes (decis); em cem, recorremos a noventa e nove
separatrizes (centis). 0 grafico a seguir ilustra melhor o que acabamos de
dizer em relayao aos quartis e decis:

A B
Oi 02 03
Primeiro Segundo Terceiro
Ouartil Quartil Quartil
I

02 = Ds =Md

A B
Di D2 03 04 Ds 06 D1 Ds 09

4.6.1. Quartis
a) Primeiro Quartil
Simbolo: Qi

Definiriio: Dado um conjunto ordenado (ordem crescente) de valores,


0 primeiro quartil,Qi' e 0 valor que divide 0 conjunto em duas partes tais
que um quarto ou vinte e cinco por cento dos valores sejam menores do
que ele e tres quartos ou setenta e cinco por cento dos restantes sejam
maiotes. 0 elemento que indica a ordem OU posiyao do primeiro quartil e
determinado, para dados agrupados em classes, pela seguinte expressao:
n
EQ, = 4'
onde n e o numero de valores do conjwi.to, ou n(lmero de observa�oos. 169
b) Segundo Quartil
Simbolo: Q2 ou Md
Definifiio: Dado um conjunto ordenado de valores, o segundo quartil
OU mediana e 0 valor que 0 divide em duas partes iguais quanto ao numero
de elementos, isto e, cinqilenta por cento ou dois quartos dos valores
do conjunto sao menores, e os dois quartos restantes sao maiores do que ele.
O elemento mediano e calculado, como veremos, atraves da seguinte expressao:
2n n
EMd = E , = 4
Q - 2

c) Terceiro Quartil
Simbolo: Q3
DefinifiiO: Dado um conjunto ordenado (ordem crescente) de valores,
0 terceiro quartil e 0 valor que divide 0 conjunto em duas partes tais que
setenta e cinco por cento ou tres quartos dos valores sejam menores e
vinte e cinco por cento ou um quarto sejam maiores do que ele. 0 elemento
que indica a ordem em que n encontra o terceiro quartil e calculad0, para
dados tabulados, como segue:
3n
EQ =
• 4 '
oride n e 0 nilmero de valores observados�
Genericamen te, para determinar a ordem ou posi�ao do quartil a
ser calculado, usaremos a seguinte expressao:

� (44)
�.
onde:
i = numero do quartil a ser calculado
n = m'.imero de observa�0es.
4.6.2. Decis

Sfmbolo: D; i = l, 2, . . . ' 9

A defini�ao dos decis obedece ao mesmo principio da dos quartis,


com a modifica�ao da porcentagem de valores que ficam aquem e alem do
decil que se pretenda calcular. Assim, por exemplo:

a) Primeiro Decil: D1
0 primeiro decil de um conjunto ordenado (ordem crescente) de valores
e o valor que divide um conjunto em duas partes tais que dez por cento ou
um decimo dos valores sejam menores e nove decimos ou noventa por cento
sejam maiores do que ele. 0 elemento que indica a posi�ao do segundo decil
.
e calculado pela seguinte expressao:
n
170 ED =-
1 10
b) Segundo Decil: D2
Trata-se do valor que divide o conjunto em duas partes, tais que vinte
por cento ou dois decimos dos valores sejam menores e oitenta por cento
ou o ito decimos dos valores sejam maiores; para saber a ordem do segundo

2n
ED= -
decil, usamos a expressao:

2 10

De especial interesse e o quinto decil, que divide o conjunto em duas


partes, tais que cinco decimos ou cinquenta por cento dos valores sejam
menores e cinco decimos ou cinquenta por cento dos valores restantes
maiores do que ele. Assim sendo, o quinto decil e igual ao segundo quartil,
que por sua vez e igual a mediana. 0 elemento que indica a ordem do quinto

ED,=Sn = !:2 = 2n4


decil e igual ao elemento mediano, ou seja:

10 .

I Md=Ds = Q2 I
Podemos, entao, afirmar que

De uma forma geral, para calcular os decis, recorreremos a seguinte


expressao que define a ordem em que o decil se encontra:

(45)

n=
onde

=
numero de valores observados
i numero que identifica o decil a ser calculado

= 2,
4.6.3. Percentis ou Centis
Sfmbolo: C; i 1, 3, . . . ' 99
Neste caso; cada parte em que foram subdivididos os valores do
conjunto, atraves dos novcnta e nove centis, contara com um centesimo
ou um por cento dos valores do conjunto.

0 elemento que definira a ordem do centil, em uma distribui�ao de


frequencias de valores tabulados agrupados em classes, sera encontrado
pelo emprego da expressao:

=
1� �1

onde
=
n=
i numero identificador do centil
nilmero total de observa�oos 171
E oportuno lembrar que os centis englobam todos os decis e quartis.
Assim, por exemplo:

a) Decimo Centi/: C10

0 decimo centil dividira o conjunto ordenado (ordem crescente) de


valores em duas partes, tais que dez por cento ou dez centesimos dos
valores do conjunto sejam menores e noventa por cento ou noventa cente­
simos sejam maiores do que ele. Teremos, entao:
10 X n n
Ec,o = = 1Q = O,ln OU
100
I X n n
ED i = = = O,ln
10 IO

b) Vigesimo Centi/: C20

O vigesimo centil e igual ao segundo decil, porque

20 X n 2n
Ec20 = 100 , n = ED, =lo = 0,2n
= 02

25n n
Ee 25 = 100 = -
-

4
= 0'25n
}
c) 0 vigesimo quinto centil e igual ao primeiro quartil, porque

Ec,s = EQ,
In
EQ I = - = 025n
'
4

Esquematicamente, indicamos na Tabela 4.37 as equivalencias entre


centis, decis e quartis.
A formula de caiculo dos centis sera:
·
Ee; - Fant
C;= l+c r (47)
JC;

Exemplo 32:
Utilizando os dados do problema 29, calcular as seguintes medidas
(p. 160):
a) Trigesimo centil: C30
b) Quinquagesimo centil: C50
c) Septuagesimo quinto centil: C75
d) Decimo quinto .centil: C15
e) Vigesimo quinto centil: C2s
O Nono decil: D9
172
TABELA 4.37

Justificativa pelo
Centi/ Decii auartil
E
e;
10n 1n
- Ec = 0 1n
C10 D1
•o 100 = ,
E
01 = 10 =0,1n
- 20n 2n
C2 0 0-z E
c20 = 100 =0,2n Eo
2=10 =
0,2n

C 2s - E
25n n ' 1n n
a1
c,s =100 =0,25n=4 E
a1 =4=4=0,25n

JOn Jn
C30 D3 E Eo =1
e» = 1 00 = O,Jn
-

3 0 = O,Jn

- E 40n 4n
C40 D4
e"' = 100 = 0,4n E 0 n
D4 = 10 = ' 4

{ ""
E 0,5n;
05 = 10 =
50n
Cso al=Md E
cso = 100 = 0,5n
Ds
n 2n
E
Md=2= 4 =0,5n
60n 6n
c60 06 - E -
_

0,6n E
06 = 10 =
_

c(/J 100 - 0,6n

70n 7n
C70 07 -
Ec = 0,7n E o = 10 =0,7n
10 100 = ,
- 75n Jn Jn
C1s a3 Ec 0,75n= E 2= 0,75n
,s = 100 = 4 a 4=

- 80n 8n
C so Ds E
cao = 100 =o,an E
08=10 =
O,Sn

- 90n 9n
- 0,9n
_

C90 D9 E Eo 10 =0,9n
_

C90 100
-
, =

Solu�iio:
a) Trigesimo Centi/: C30
a. I) Elemento que define a ordem ou posi�ao do trigesimo centil:
i. n
E e; =
100
conforme a expressao (46).

Neste caso, i = 30 e n = 80. Assim,

30 X 80 = 2 400 = 24
E
_

C,o - 100 100


Portanto, o trigesimo centil sera o vigesimo quarto elemento do con­
junto ordenado de valores.

a.2) Localiza�ao da classe onde se encontra o trigesimo centil.

Percorrendo a coluna das freqiiencias acumuladas, verificaremos que o


vigesimo quarto elemento da lista se encontra na terceira classe:
451---6
-- 5. Como esse valor coincide com a freqiiencia acumulada
ate a terceira classe, deduziremos, de imediato, que C30 = 65. 173
a.3) Aplica1tlio da formula.

Para comprovar que C30 = 65, apliquemos a f6rmula{47):


Eci - Fant
Ci = I + c ----­

lei
Neste caso,
l = limite inferior de classe onde se encontra o trigesimo centil:
45
c = amplitude do intervalo de classe: 20

Eci = elemento indicativo da ordem ou posil(lio do trigesimo centil:


30 X 80
EC30 = 240
=

.
100
Fant freqiiencia acumulada ate a classe anterior a classe onde se
encontra o trigesimo centil: 10

lei = lc30 = freqiiencia simples de classe onde se encontra o


trigesimo centil: 14

Assim,
24 10
C30 = 45 + 20 - = 45 + 20 = 65 C30 = 65
14
Interpreta1tlio: Trinta por cento (30%) dos usuarios apresentaram um
consumo de ate 65 kwh, enquanto. que setenta por cento apresentaram
um consumo superior a 65 kwh.
Graficamen te,

N<unerode
Usu6rios
Fj

80

GRAFICO 4.11

30
Ec.,=24 --
20

Ecu=12 -- 0
1

0 6 25 45 85 115 � 125 145 185

C15=47,86 Cso=77,31 \ C90=D�=125


Consumokwh

c ., =85 c.,,=89.29

:E flicil perceber que o trigesimo centil e igual ao terceiro decil.


i X n
174 EDi =

10
3 x 80
Mas, i = 3 e n = 80. Assim,
ED 3 = 249
10

Como vimos,

Ec,0 = 249

Portanto, ED = Ee = 249 Tanto o terceiro decil como o trigesimo


3 30

centil sao o mesmo valor: D3 = C30 = 65

b) Quinquagesimo Centi/: C50

b.l) Ordem ou posiyiio do C50:

50 x 80 -
Ecs o -
- - 40.0
100
0 qiiinquagesimo centile ig ual a mediana e ao quinto decil, uma vez que

5 x 80 2 x 80
EDs 400
. EMd Ea2 409
'10 4
= = = = =
·

b.2) A classe onde se executa o qiiinquage simo centile a quarta classe:


65f--85

b.3) Calculo da medida pela formula (47).

40 24
C50 65 + 20 77,31 Cso Ds Q2 77,31

= Md =
26
= = = =

c) Septuagesimo Quinto Centi/: C1s

c. l) Ordem ou posiyiio do C ,5
I

75 x 80
Ec7S = .
600
100
=

Da mesma forma, o terceiro quartile o sexagesimo elemento:

3 x 80
Ea 609
4
=

3
=

c.2) Classe do septuagesimo quinto centil ou terceiro quartil: 851---105


ou quinta classe.

c.3) Calculo
60 - 50
C75 85 + 20 85 + 14,29 = 99,29
14
= =

I C,s = Q3 = 99,29

d) Decimo Quinto Centi/: C 1s

d.l) Ordem ou posiylio do C 15

15 X 80
Ee IS = 120
100 175
= •
d .2 ) Localizayao de medida: terceira classe: 451--65.
d.3) Calculo.
12 - 1O
C15 =
45 + 20 =
45 + 2 ' 86 = 4 7 86
14 '

e) Vigesimo Quinto Centi/: C2s

e. l ) Ordem ou posiylio do C25


25 X 80
ECis
_ =
- 209
100
Da mesma forma,
Q l X 80
E
= =
209
I
4
Q1•
=
Concluimos, entlio, que C25

e.2) Classe onde se encontra o vigesimo quinto centil: 451----65.

e.3) Calculo do vigesimo _quinto centil.

= 20 - 10 =
C25 45 + 20 = 45 + 14,29 59,29
14

I C::is =
Q1 =
59,29

f) Nono Decil: D9

f.1) Ordem ou posiylio do D9

9 X 80
D9
_
-
=
72 9
IO
De igual modo,

90 x 80
C90 = =
729
lOO

Entao, C90 =
D9.

f.2) Classe onde se encontra o nono decil: 1051--125.

f.3) Calculo do nono decil

72 - 64 D9 C90
=
125
D9 = 105 + 20 = 125 =

Esse resultado ja era previsto, uma vez que 72 e um valor que coincide
176 com o encontrado na coluna de freqiiencias acumuladas.
Exemplo 33:

lnterpretar os seguintes resultados do problema 32.

a) C30 = 65

b) C25 = 59,29

c) D9 = 125

Soluriio:
a) C30 = 65

0 valor 65 refere-se ao consumo de energia em kwh. Como esse valor


corresponde ao trigesimo centil, podemos afirmar que trinta por cento dos
oitenta usuarios consumjram ate 65 kwh, ensiuanto que setenta por cento
consumiram mais de 65 kwh. Em termos da onlem ou posiyao que o trigesimo
centil ocupa na distribuiyao do consumo pelos usuarios, temos, conforme
foi visto: Ec30 24° . =

b) C25 = 59,29

Neste caso, podemos dizer que um quarto ou vinte e cinco por cento
dos usuarios consumiram ate 59,29 kwh. Conseqtientemente, tres quartos ou
setenta e cinco por cento dos oitenta usuarios consumiram mais de 59,29 kwh.
Notar que
_ 25 X 80 _ 80
E E
C2s - 100 - Q1 =
4

c) D9 = 125

0 nono decil corresponde ao nonagesimo centil. Assim, podemos dizer


que nove decimos ou noventa por cento dos usuarios apresentaram um
consumo de energia igual ou inferior a 125 kwh, e dez por cento um
consumo superior.

EXERCfCIOS PROPOSTOS
4.1.- A tabela abaixo representa os salarios pagos a 100 operanos da empresa
GLT &Cia.

N9 de sa/srios N<J de operllrios


mfnimos
fj
01---2
- 40
2 !---4
- 30
4t--6 10
61----8 15
8 1---1
- 0 5

100
171
Deteminar:
Sal3rio mCdio;
Sallirio modal (Czuber);
Sallirio mediano.

4.2. Com os dados do exercicio 2.4 do Capftulo 2, determinar a media e a


mediana, o 19 e 39 quartis.

4.3. A tabela abaixo apresenta os resultados de 25 analises de uma subs­


tancia qufrnica em porcentagens. Determinar a media e a mediana
da distribui�o.

% fj

Ot--1 6 3
16 t--32 3
321--4 8 6
481--64 8
641--8 0 4
801-- 96

TOTAL 25

4.4. Seja a distribuiyao das estaturas de 100 alunos de uma classe.

Estaturas Numero de
fm) alunos

1.401-- 1,50 5
1,501-- 1,60 10
1,601--1,70 30
1,701--1,80 40
1,801-- 1,90 10
1,901-- 2,00 5

TOTAL 100

Determinar:

4.4.1. A estatura media.


°
4.4.2. A estatura modal (Czuber ).

4.4.3. A estatura mais freqilente (King).

4.4.4. A estatura mediana.

4.4.5. Os limites onde estao compreendidos 50% das estaturas (19 e


178 39 quartis ).
4.5. Os desvios tomados em rela�ao a media arbitraria X0 9 de um
=

conjunto de nfuneros sil'o: {-4; -1; 2; O; 3; -3; 5; l}. A media


aritmetica do conjunto sera:

a) 0,375 d) 15,275
b) 9,375 e) 10,275
c) 11,375

4.6. Dados os conjuntos de numeros: A { 100; 101; 102; 103; 104; 105}
=

e B {O, 1, 2, 3, 4, 5}, podemos afirmar que:


=

a) a media de A e igual a de B multiplicada por 100;


b) a media de A e igual a media de B;
c) a media de A e igual a media de B dividida por 100;
d) a media de A e igual a media de B mais a constante 100;
e) nenhuma das respostas acima.
-

4.7. Um comerciante atacadista vende determinado produto em sacas que


deveriam canter 16,50 kg. A pesagem de 40 sacas revelou os resultados
representados na tabela abaixo:

Pesos N9 de sscas

14,551-- 15,05 1
15,051--15,55 3
15,551-- 16,05 8
16,051-- 16,55 9
16,551--17,05 10
17,051--17,55 6
17,551-- 18,05 3

TOTAL 40

Pede-se:

4.7.1. A media da distribui�ao.


4.7.2. A mediana.
4.7.3. A moda (Czuber).
4.7.4. 0 septuagesimo quinto centil.
4.7.5. 0 terceiro decil.
4.7.6. A porcentagem de sacas entre a mediana e o 759 centil.

4.8. A tabela abaixo apresenta a distribui¢o das exporta�oes de empresas


eletronicas em 1972. 179
Volume exportado N<J de
$ empresa&

50.0001--- 60.000 5
60.000 I-- 70.000 10
70.000 I-- 80.000 20
80.000 I-- 90.000 10
90.000 t-- 100.000 5

TOTAL 50

Pede-se:

4.8.1. A media. 4.8.5. 39 quartil.

4.8.2. A mo<la. 4.8.6. 59 decil.

4.8.3. A mediana. 4.8.7. 759 centil.

4.8.4. I 9 quartil.

RESPOSTAS DOS EXERCiCIOS PROPOSTOS

4.1. 3,30; 1,60; 2,67

4.2. 2,192; 2,087; 1,870; 2,371

4.3. 46,40; 49

4.4. 4.4.l. 1,705 m

4.4.2. 1,725 m

4.4.3. I ,725 m

4.4.4. 1,713 m

4.4.5. 1,633 e l,775m

4.5. b
4.6. d

4.7. 4.7.L 16,475 4.8. 4.8.1. 75.000

4.7.2. 16,494 4.8.2. 75.000

4.7.3. 16,650 4.8.3. 75.000

4.7.4. 17,000 4.8.4. 67.500

4.7.5. 16,050 4.8.5. 82.500

4.7.6. 25% 4.8.6. 75.000

4.8.7. 82.500

180
Medidas de Dispersiio

5.1. INTRODUCAO
Como se sabe, os fenomenos em cuja amilise intervem o metodo
estatistico, bem como os dados estatisticos a eles referentes, caracterizam-se
tanto pela sua semelhanya quanto pela sua variabilidade. Assim e que o
calculo de um promedio s6 se justifrca em razlio dessa variabilidade presente
na natureza. Nao ha razao alguma para se calcular a m6dia de um conjunto
de dados onde nao haja variayao desses elementos. Ocorre, todavia, que, se a
variabilidade dos dados for muito grande, sua media tera um grau de
confiabilidade tao pequeno que sera inutil calcula-la.

E importante ressaltar nessa altura que a analise completa dos dados


requer nao apenas sua apresentayao, atraves de graficos e tabelas, ou o
calculo de promedios OU outras medidas de posiyao. Caracterizar um conjunto
de valores apenas atraves de uma media, por ex'emplo, e descreve-lo inade­
quadamente, uma vez que os dados diferem entre si, em maior ou menor grau.
Assim, suponhamos que se deseja comparar a performance de dois empre­
gados, com base na seguinte produyao diaria de determinada peya:

Empregado A: 70, 71, 69, 70, 70


Empregado B: 60, 80, 70, 62, 83

De acordo com os resultados da produ\:ao diaria em cinco dias, verifi­


camos que a performance meilia do empregado A e de 70 peyas produzidas
diariamente, enquanto que a do empregadoB e de 71 peyas. Por conseguinte,
baseados riestes Unicos resultados (xA = 70 e XB = 71), rUriamos que a
performance de B e melhor do que a de A. Se nos fixarmos mais detida­
mente nos dados, entretanto, perceberemos que a produyao de A varia
apenas de 69 a 71 peyas, ao passo que a de B varia de 60 a 83 peyas, o
que revela que a performance de A e bem mais uniforme do que a de B.
Ocorre, por outro lado, que um alto grau de uniformidade ou pequena 181
dispersao costurna ser considerado como algo de qualidade desejavel em
um processo produtivo. Qualquer produ�tro em serie seria antieconomica
se houvesse muita variabilidade nos materiais ou pe�as fabricadas.

Se determinado teste de estatfstica fosse aplicado em uma classe


dividida em dois grupos de afonos segundo um criterio qualquer, poderia
ocorrer que ambos os grupos houvessem obtido a mesma media, digamos
x = 6. Se o grupo A fosse extremamente homogeneo a ponto de todos os
alunos tirarem a mesma nota 6, ter!amos, logicamente: XA = 6. Ja no grupo
B poderiamos encontrar notas desde 0 ate 10, e a media xa = 6. Baseados
apenas na media dos grupos, ir!amos concluir que ambos revelaram o mesmo
nivel de conhecimento. Entretanto, esse valor nao nos informaria nada a
respeito da homogeneidade ou heterogeneidade de conhecimento dentro de
cada grupo. Assim e que o grupo A revelou completa homogeneidade de
conhecimento, uma vez nio houve variabilidade ou dispersao das notas,
todas iguais a 6. Ja o grupo B apresentou notas dentro de um intervalo de
0 a 10, revelando, conseqiientemente, rnaior heterogeneidade de conheci­
mentos. Para avaliar o grau de variabilidade ou dispersao dos valores de um
conjunto de numeros, lan�aremos rnio das estatfsticas denominadas medidas
de dispersao. Essas nos proporcionarao um conhecimento mais completo
do fenomeno a ser analisado, permitindo estabelecer compara�aes entre
·

fenomenos de mesma natureza e mostrando ate que ponto os valores se


distribuern acima ou abaixo da tendencia central.

Iremos tratar de dois tipos de medidas de dispersao:

I) Medidas de Dispersiio Absoluta


a) Amplitude total;
b) Amplitude serni-interquartt1ica;
c) Desvio rnedio;
d) Variincia e desvio-padrao.

II) Medidas de Dispersiio Re/ativa


a) Desvio quartil reduzido;
b) Coeficiente de varia,.S:o de Pearson;
c) Coeficiente de varia�ao de Thorndike;
d) Coeficiente do intervalo quartiL

5.2. MEDIDAS DE DISPERSAO ABSOLUTA

5.2.1. Amplitude Total ou lntervalo Total

Simbolo: At
DefinifiiO: A amplitude total de um conjunto de numeros e a diferen�a
entre os valores extremos do conjunto.
Exemplo I:
182 Calcular a amplitude total dos seguintes conjuntos de numeros:
A= {10, 12, 13, 20, 25, 34, 45}
B= {17, 18, 19, 20, 21, 22, 23}
c= {-4, -3, -2, 3, 5}
Solu¢o:
Para o conjunto A, temos: At = 35 - 3 = 32
Para o conjunto B, temos: At = 23 - 17 = 6
Para o conjunto C, temos: At = 5 - (-4) = 9

Se os dados vierem dispostos em uma tabela de freqtiencias, com os


valores agrupados em classes, ha duas formas de se definir a amplitude t otal:

Primeiro Metodo: At = Ponto m�dio da ultima classe - ponto medio


da primeira classe.
Segundo Metodo: At = Limite superior da ultima classe - limite
inferior da primeira classe.

Exemplo 2:
Calcular a amplitude total dos valores dispostos na Tabela 5.1.

TABELA 5.1

Classes fj Xj

101-20 5 15
201-30 12 25
301-40 20 35
401-50 14 45
501-60 10 55
601-70 4 65

n = 65

Solu¢o:
Pelo primeiro metodo: At= 65 - 15 = 50.

I At= 50 I
Nesse metodo OS valores extremos sao eliminados.
Pelo segundo metodo: At = 70 - 10 = 60.
Restriflies ao Uso da Amplitude Total
Embora a amplitude total seja a mais simples das medidas de dispersao,
ha uma forte restri?o ao seu uso em virtude de sua grande instabilidade,
uma vez que ela leva em conta apenas os valores extremos da serie. Compa-
remos os conjuntos A e B do exemplo I : 183
Mlidia Amplitude
Conjun to
x total: At

A= {10, 12, J3, 15, 20, 25, 45} XA = 20 At = 35


A
8= {17, 18, 19, 20, 21, 22, 23} xs = 20 Ats= 6

A media aritmetica de cada um <lesses conjuntos e igual a 20. Por­


tanto, no que diz respeito a uma medida de posiyao, ambos os conjuntos
podem ser considerados identicos. Ao calcularmos a amplitude total verifi­
caremos que os valores do conjunto A apresentam maior dispersao. Todavia,
no calculo da amplitude total nao sao levados em considerayao os valores da
serie que se encontram entre os extremos, o que poderia conduzir o analista
a interpretayoes equivocadas. Muitas vezes, um valor particularmente anor­
mal podera afetar de maneira acentuada a medida. 0 conjunto A, por
exemplo, apresenta o ultimo valor (45) sensivelmente distante do penultimo
(25), fato que talvez tenha provocado uma amplitude total de tal magni­
tude (35).
Alem da insensibilidade aos valores entre os extremos e pela impor­
tancia, no calculo da medida, de um possfvel valor extremo anormal, a
amplitude total e sensivel ao tamanho de amostra. Ao aumentar essa ultima,
a. amplitude total tende a aumentar, ainda que nao proporcionalmente.
Finalmente, a amplitude total apresenta muita variayao de uma amostra
para outra, mesmo que ambas sejam extraidas da mesma populayao.

Apesar dos inconvenientes dessa medida, os quais nao justificam, na


maioria das vezes, seu uso, ha situayoes especiais em que ela resulta satisfa­
t6ria. E o caso, por exemplo, da amplitude da temperatura em um dia ou
no ano. Outra situayao seria aquela em que os dados sao raros ou demasiada­
mente esparsos para justificar o emprego de uma medida mais precisa.

E importante acrescentar que, ao descrever uma serie por uma medida


de posiyaO (media, por exemplo) e de dispersao, Se essa ultima for a ampli­
tude total, e recomendavel que se indiquem os valores extremos da serie.

5.2.2. Desvio Quartil ou Amplitude Semi-interquartnica

Sfmbolo: Dq

0 desvio quartil e uma medida de dispersao baseada nos quartis e


calculada como a media aritmetica das diferenyas entre a mediana e os dois
quartis, sendo, todavia, determinado mais facilmente como segue:

Dq = Q3 ; Qi (1)
onde

184
Q3 = terceiro quartil e Qi = primeiro quartil
Exemplo 3:
Calcular a amplitude semi-interquarttlica dos dados apresentados na
Tabela 5.2.
TABELA 5.2

Classes fj Fj

101-- 20 4 4
201--30 12 16
301--40 15 31
401--50 20 51
501--60 15 66
601-- 70 11 77
701-- BO 3 BO

BO

3 x 80
= = 60<?
4

In 1 x 80
EQ, = = = 20<?
4 4
De acordo com a expresslio (1), devemos ter:

60 - 51
Q3 = 50 + 10 = 56
15

Ql = 30 + 10
20 - 16
= 32 '67
15

56 - 32,67 23,33
= = 11,665
2 2

I Dq :== 11,665 I
Uma caracteristica do desvio quartil e o fato de que no intervalo
definido pelos limites (Md - Dq ) e (/tfd + Dq) encontram-se cinqilenta
por cento dos itens, aproximadamente. Essa porcentagem sera exata sempre
quc a distribui�lio for simetrica. No exemplo acirna, temos:

Q3 = 56 Dq = 11,665

31
Qi = 32,67 Md= 40 + 10 40 - = 44,5
20

Calculando os limites do intervalo:

Md - D q = 44,5 - 11,665 = 32,835

Md+ D q = 44,5 + 11,665 = 56,165 185


Esses valores sao bem pr6ximos daqueles correspondentes aos quartis
primeiro e terceiro, uma vez que a distribuiyao e fracamente assimetrica.
Consideremos, agora, a distribuiyao de freqiiencias simetricas expressa na
Tabela 5.3.
TABELA 5.3

Classes fj Fj

101--20 5 5
201--30 10 15
01 > 301--40 15 30
Md==> 401--50 20 50
03 ==> 501--60 15 65
601--70 10 75
701--80 5 80

80

80
EQ - �
. -4
= 4 = 200.

EMd =
:
2 X 80
2
= 409
=
4
3n 3 X 80
EQ3 = 4 =
4
= 609
De acordo com esses dados, calcularemos:
20 - 15
Q 1 = 30 + 10 = 33 '33
15
40 - 30
Q2 = Md = 40 + IO -w-- = 45

60 - 50
Q3 = 50 + IO = 56,67
15
56 67
; 33 33

{
Dq = , , = l l ,67
Md - Dq = 45 - 11,67 = 33,33 = Q1
Md+ Dq = 45 + 11,67 = 56,67 = Q3
Como a distribuiyao e simetrica, OS limites do intervalo Md ± Dq
coincidem com os quartis primeiro e terceiro, o que equivale a dizer que
esse intervalo compreende cinquenta por cento das observay6es (40 obser­
vay6es) .

ObservQfoes:
1. 0 desvio quartil apresenta como vantagem o fato de ser uma medida
facil de calcular e de interpretar. Alem do mais, nllo e afetado pelos
186 valores extremos, grandes ou pequenos, sendo recomendado, por conse-
guinte, quando entre os dados figurem valores extremos que nao se
consideram representativos.

2. 0 desvio quartil devera ser usado preferencialmente quando ·a medida de


tendencia central for a mediana.

3. Trata-se de uma medida insensfvel a distribuiyao dos itens menores que


Qi, entre Qi e Q3, e maiores que Q3•

5.2.3. Oesvio M6dio

Sfmbolo: Dm
0 desvio medio OU media dos desvios e igua) a media aritmetica dos
valores absolutos dos desvios tomados em relayao a uma das seguintes
medidas de tendencia central: media ou mediana.

a) Desvio Medio para Dados Brutos


Quanda os valores nao vierem dispostos em uma tabela de freqiiencias,
o desvio medio sera calculado, de acordo com a definiyao, atraves do emprego
de uma das seguintes f6rmulas:
n

L Ix; - xi
i=i
Dm= (2 )
n
----­

onde d;= (x; - x)= desvio em relayao a media aritmetica.


n

L Ix; -Mdl
i=i
Dm= (3)
n
-----­

onde d;= x; - Md= desvio em relayao a mediana.

As barras verticais indicam que silo tomados os valores absolutos,


prescindindo do sinal dos desvios. Pode um dos n desvios ser tornado como
se fosse positivo.

Exemplo 4:
Calcular o desvio medio dos con1untos de nfuneros apresentados no
exemplo 1:
A= {10, 12, 13, 20, 25, 34, 45}
B = {17, 18, 19, 20, 21, 22, 23}
c = {-4, -3, -2, 3, 5}
Os dados necessarios para 0 calculo do desvio medio silo:
10 + 12 + 13 + 20 + 25 + 34 + 45 15 9
XA = =1
=
22,714
7
MdA = 20
17 + 18 + 19 + 20 + 21 + 22 + 23 = 140
XB = =
20
7 7
MdB = 20 187
4 - 2 5 -1
Xc=(- )+( 3)+(- )+3+ = =-0,2
5 5
Mdc=-2
Desvio Media do Conjunto A

TABELA 5.5

Xj Xj-X x
l i-xl Xj-Md lxi-Mdl

10 10-22,714= -12,714 12,714 10 -20= -10 10


12 12-22,714= -10,714 10,714 12-20=-8 8
13 13 -22,714 =-9,714 9,714 13-20=-7 7
20 20-22,714= -2,714 2,714 20-20=0 0
25 25-22,714= 2,286 2,286 25-20=5 5
34 34- 22,714 = 11,286 11,286 34-20=14 14
45 45-22,714= 22,286 22,286 45-20= 25 25

Llxi - xl = o Lx
l i-x=
l 11.714 l i-Mdl=69
Lx

x= 22,714
Md= 20

Usando as formulas (2 e ( , chegaremos a:


) 3)
Pela Media
7

L Ix;- 22,7141

Dm =
i=l �
71 14
=10,245 Dm = 10,245
-----
7
Pela Mediana
7

L: 1x;- 201
9
Dm =_i=_i 6 =9 '857 Dm = 9,857
7 7
_____

Desvio Media do Conjunto B


TABELA 5.6

Xj Xj-X l i-xl
x x;-Md lxj-Mdl

17 17 -20=-3 3 17-20= -3 3
18 18-20=-2 2 18-20=-2 2
19 19 -20=-1 1 19 -20=-1 1
20 20-20= 0 0 20-20= 0 0
21 21 -20= 1 1 21-20= 1 1
22 22 -20= 2 2 22-20= 2 2
23 23-20 = 3 3 23-20= 3 3

L(Xj-X)= 0 Llxi-xl= 12 Llx;-Mdl= 12


188 �
Neste caso, o desvio medio e igual, tanto quando calculado a partir
da media como da mediana, uma vez que x =Md= 20.
Pela Media
7

I Ix; - 201
i=l 12
Dm = 1,714
Dm = -= 1,714
7 7
Pela Mediana
7

I Ix; - 201
i=l 12
Dm = -= 1,714
7 7
Desvio Medio do Conjunto C
TABELA 5.7

Xj x;-x lx;-xl x;-Md lx;-Mdl


-4 (-4) -(-0,2)= -3,8 3,8 -4-(-2)=-2 2
-3 (-3) -(-0,2)=-2,8 2,8 -3-(-2)=-1 1
-2 (-2) -(-02, )=-18, 1,8 -2 :-(-2)=0 0
3 3 -(-02 , )= 32, 3,2 3-(-2)=5 5
5 5 -(-0,2)= 5,2 5,2 5-(-2)=7 7

�lx;-xl=16,8 �lx;-Mdl=15

x= -0,2
Md=-2

Como ocorreu para o primeiro conjunto, o desvio medio neste caso


e menor quando tornado em relayliO a mediana do que em relayliO a
media.
Pela Media
�Ix; - (-0,2)1 16 8
Dm
S :::: 3,36
Dm 3,360
= =
5 =

Pela Mediana
·� Ix; - (-2)1 15
Dm = = =
3 Dm
3
5 s =

b) Desvio Medio para Dados Tabulados


Se os valores vierem dispostos em uma tabela de frequencias, agrupados
ou na:o em classes, sera:o usadas as seguintes f6rmulas:

Cdlculo pela Media


k•
L lx1 - xl fj
j=t
(4)
n

onde x1 representa um valor individual ou um ponto medio da classe.


189
Cdlculo pela Mediana
k
I lxj - Mdlfj
= j=l
Dm (5)
n
Exemplo5:
Calcular o desvio medio dos valores representativos do consumo de
energia eletrica (em kwh) de 80 usuarios (exemplo 7 do Capftulo 4).
TABELA 6.B
I(= 79,5 Md= 77.31

NUmero de

I
Consumo Usu,rios x; "i'i Xj-X lx;-xlf; Xj-Md lx;-Mdlf; F;
f;

5f-25 4 15 60 -64.5 64.6 x 4 =258 -62.31 62.31 x 4 =249.24 4

I
25f-45 6 35 210 -44.5 44.5 x 6 = 267 -42.31 42.31 x 6 =253.86 10

1:
45f-65 14 55 770 -24.5 24.5 x 14= 343 -·22.31 22.31 x 14= 312.34

65f-85 26 75 1 960 -4.5 4.5X26=117 -2.31 2.31 x 26 =60.06

85f-105 14 95 1 330
I 15.5 15,5 x 14=217 17,69 17,69 x 14= 247,66

105f-125 8 115 920


I 35,5 35,5 x 8 = 284 37,69 37,69 x 8=301,52 72

125f-145 6 135 810 55.6 55,5 x 6 =333 57,69 57,69 x 6=346,14 78

145f-165 2 155 310 75,5 75.5X2=151 77,69 77,69 x 2=155.38 80

I 80 "i:x;f;= 6 380 "i:lx1-xlf1= 1 970 °i:lx1-Mdlf;= 1 926,2

A media aritmetica fo1 calculada no exemplo 7 (x 79,5), e a


=

mediana no exemplo 29 (Md 77 ,31) do capftulo precedente. Teremos,


=

entao:
Cdlculo pela Media
8

I lxi - 79,5 lfj


_,_i_=_ l ----- = 1 970 =
24'625
80 80
Ctilculo pela Mediana
8

I IXj - 77,31 lfj


.._i_= l _____ l 926,2
24,078
= =

80 80
Temos novamente neste exemplo o desvio medio, calculado com base
na mediana, menor que o calculado com base na media aritnietica.
Observ(lfoes:
1. 0 desvio medio resulta mais vantajoso que as medidas de dispersao
precedentes, principalmente pelo fato de, em seu calculo, levar em consi­
derayao todos os valores da distribuiyao.
2. 0 desvio medio, calculado levando-se em considerayao os desvios em
torno da mediana, e minimo, OU seja, e menor do que qualquer desvio
medio calculado com base em qualquer outra medida de tendencia central.

3. Apesar de o desvio medio expressar aceitavelmente a dispersao de uma


190 amostra, nao e tao frequentemente empregado como o desvio-padrao, o
qual sera descrito mais adiante, pois este se adapta melhor a uma ampla
gama de aplica�0es. Alem disso, 0 desvio medio despreza 0 fato de
alguns desvios serem negativos e outros positivos, pois essa medida os
trata como se fossem todos positivos. Todavia sera preferido o uso do
desvio medio em lugar do desvio-padrio, quando esse for indevidamente
influenciado pelos desvios extremos.

5.2.4. Desvio-padrio

Simbolo: S
0 desvio-padrio e a medida de dispersio mais usada, tendo em
comum com o desvio medio o fato de em ambos serem considerados os
desvios com rela�ao a x. S6 que, no calculo do desvio-padrio, em lugar de
serem usados os valores absolutos das discrepancias ou desvios calculam-se
os quadrados desses.

No capitulo anterior vimos que a media quadratica de um conjunto


de nfuneros (item 2.4) e a raiz quadrada da media aritmetica dos quadrados
dos valores desse conjunto. Pois bem, o desvio-padrao nao e seniio uma
media quadratica dos desvios em rela�o a media aritmetica de um conjunto
de nfuneros, ou seja, e a raiz quadrada da media aritmetica dos quadrados
dos desvios, estes tomados a partir da media aritmetica.

a) Desvio-padr(fo de Dados Brutos


Seja o seguinte conjunto de nfuneros: X= {x1, X , , Xn}. 0 desvio­
2
• • •

-padrio OU a media quadratica dos desvios OU afastamentos em rela�ii'O a


media aritmetica desse conjunto Sera definido por:

M
(x; - x)2
S= = (6)
n n
onde d; = (x; - x).
Se desenvolvermos o numerador da expressao sob o radical, chegaremos
a f6rmula desenvolvida do desvio-padrao:
I:(x; - x)2 = I:(xJ + x2 - 2x;x) = I:xf + I:x2 - 2I:x; x =
I:xJ nx2 - 2xI:x; =
( )
= +

I:x; 2 2(I:x;) (I:x;) _

= I:x2
1 + n -- -
n
·

n
n(I:x;)2 2 (I:x;)2 (I:x;)2
= I:x2
1 + = I:x;2 -
n 2 n n
Dessa forma, podemos escrever:

S= _!_ [ I:x?
1 -
(I:x;)2 ] (7)
n n 191
Observafao:
Quando o desvio-padrao representar uma descriyao da amostra e nao
da popula�o, caso mais freqiiente em estatistica, o denominador das
expressoes 6 e 7 seni igual an -1, em vez den. A razao desse procedimento
reside no fato de que, utilizando o divisor (n - 1), obtem-se uma estimativa
melhor do parametro de populayao. Alem do mais, apenas (n -1) das
discrepancias (x ; x)
- do independentes, uma vez que essas (n - 1) dis­
crepancias determinam automaticamente a n-6sima. Para valores grandes
de n(n > 30) nao M grande diferenya entre os resultados proporcionados
pela utiliza�o de qualquer dos dois divisores, n ou n - 1. Entretanto,
daremos preferencia para a formula que proporciona uma estimativa mais
justa do desvio-padrao da popula�o, ou seja

S= =

n
1
= L. xt (8)
i=l

Exemplo 6:
Calcular o desvio-padrao de cada um dos conjuntos de numeros do
exemplo 1.

Desvio-padriio do conjunto A = {IO, 12, 13, 20, 25, 34, 45}.


TABELA 5.9

F6rmula Original F6rmula Desenvolvida


2 . 2 2
Xi Xi-X di = lxi-xl xi

10 - 12,714 161,646 100


12 -10,714 114,790 144
13 - 9,714 94,362 169
20 - 2,714 7,366 400
25 2,286 5,226 625
34 11,286 127,374 1 156
45 22,286 496,666 2 025
2 2
�xi= 159 �lxi-xl = 1 007.430 �xi = 4 619

Resolvendo pela f6rmula original, devemos ter:

s = f___!_
.J;, -1 f
?-
d�
1
=

.Jti -
f
/_J_1 L.. (x; - x)2
1=1 ;�1

192 onde n = 7 e x = 22,714.


s
R i=l± (Xi 1
- 22,714)2 = A x 1.007,430 =

..; 167,905 = 12,958 SA = 12,958


UI ilizando a f6rmula desenvolvida:

S= !.� [ };xf �] -

s = J� [ - �] j} [ 4.619 = 4.619 _
; ]
25 81
=

= )! j �
(4.619 - 3.611,571) =
l.00 ·429
=

= ..; 167,905 = 12,958 I SA = 12,958

Como pode ser observado, as duas expressi5es para o calculo do


desvio-padrlio slio equivalentes.

Desvio-padrao do conjunto B = {17, 18, 19, 20, 21, 22, 23}.


Teremos, neste caso,
x = 20
n = 7
Pela Formula Original
Sa= /_J_ �(x; -XJ2 ..jL..!.
.Jn-I ? -1
._
= �(x; - 20)2 =

t [01-20)2 + (18-20)2 + (19 -20)2 + (20-20)2 + (21-20)2 + (22-20)2 + (23 -20)2 ] =

= Jt [ 9 + 4 + I+ 0 +I + 4 + 9 ] = j'i[ = .j 4,667 = 2,160 Sa= 2,160

Pela Formula Desenvolvida

Temos:
S =
Jn 1 --[
/�1 };x-� _- (};-xi)-2
n I
]
};xi = 172 + 182 + 192 + 202 + 212 + 222 + 232 ,=

= 289 + 324 + 361 + 400 + 441 + 484 + 529 = 2.828


(};xi)2 -_ (17 + 18 + 19 + 20 + 21 + 22 + 23)2
7 7
=

=

(1 )2
=
;
19 00
= 2.800
193
j} [2.828 - 2.800]
s= = .v/28
6 = v4,667 = 2,160
I 2,160 I
s8 =

Desvio-padrllo do conjunto C = {-4, -3, -2, 3, 5}.


A m6dia do conjunto e x= -0,2 e n = 5
Pela Formula Original
S=
1
s=T 2
1-4-(-0,2)12 +1-3-(-0,2))2 +1-2-(-0,2)1 +13-(-0,2)1 +15-(-0,2))
2 2
2 2 2
+ (-l,8)2 + (-2,8)2 + (-1,8) + (3,2) + (5,2) =

= j-} (14,44 + 7,84 + 3,24 + 10,24 + 27,04) = jt x 62,8 = ..fTS,'i = 3,962 Sc = 3,962

Pela Formula Desenvolvida


Os dados do problema sllo:
n= 5
T.xf = (-4)2 + (-'3)2 + (-2)2 + 32 + 52 =
= 16 + 9 + 4 + 9 + 25 63 ==

(T.x;)2 ((-4) + (-3) + (-2) + 3 + 5]2 (-1)2


=
=
= 0'2

}. - 1 [T.x� - (T.x;)2 ] Js �
n 5 5

S= _J_
n ' n
= l ( 63 - 0,2] =

= v/62,8' lJ,t = 3 '962


� = -�'157 Sc= 3,962
Observa�oes:
1. Notar que 0 desvio-padrao e maior do que 0 desvio medio para OS tres
conjuntos, conforme pode ser visto confrontando-se os resultados ora
conseguidos com os do exemplo 4.
TABELA5.10.

Conjunto Desvio-padrao Dnvio m«Jio


A 12,958 10,245 SA> DmA
8 2,160 1,714 Ss > Dms
c 3,962 3,360 sc > Dmc

2. Se calcularmos o desvio-padrao utilizando as f6rmulas (6) e (7), ou


seja, adotando o divisor n, e possivel chegar aos mesmos resultados
que os conseguidos atraves das f6rmulas (8), mediante o emprego do
194 fator
Ji5
Esse fator e conhecido como fator de corre�ao de Bessel. Assim,
(9)

·�
·

S=
j l;(x; -
·
x )2
X
n
-- =

-
n n - 1

=
�1:(x;
�(n
x)2
-1) =
j l;(xi -
n
No exemplo anterior, retomamos o calculo do desvio-padrao do
- 1
x )2

conjunto B, utilizando o divisor n =. 7. Devemos ter, de acordo com a

j1 0077•430 = - ' 143 919 = 11 997


f6rmula (6):
s
=
j l;(x; - x)2
= v ' '
n
Aplicando a corr�ao de Bessel:

�= c:c:= . tr=1080
.j n::i ..;� ./6 '
Ss = 1,080 X 11,997 :::: 12,958 Ss = 12,958
b) Desvio-padriio de Dados Tabulados
Quando os valores vierem dispostos em uma tabela de freqiiencias, o
calculo do desvio-padrao se fara atraves de uma das seguintes f6rmulas:
k k
L djf; L (x1 - x)2f;
/=1 �1_=
· _1
S= n
= _____

n
(10)
ou, pela f6rmula desenvolvida,

( f y,f,\ 2 )
S= _!__
n
k
""' Xj f,.

/=1
I
2
- � n
(11)
onde
d1 = x1 - x = desvio em tomo da media;

Xj = valor isolado da variavel, OU ponto medio da classe, se OS


valores vierem agrupados em classe.

ao divisor n
bulados.
-
Pelos mesmos motivos expostos anteriormente, sera dada preferencia
l, em vez de n, no caJ.culo do desvio-padrao para dados ta­

(Xj - X)2f;
S= n -1 (12) 195
OU

S=

I =1
utilizando a formula desenvolvida.
[± x/lj
n

Essa ultima e facilmente deduzida a partir da (12). Tomemos apenas


(13)

a expressao do numerador de (12): ·


k
I (xi - x)2f;
j=l

n
Assim,

S=

Exemplo 7:
Com os dados do exemplo 5, calcular o desvio-padrao da distribui9ao
de freqiiencias do consumo de energia eletrica (kwh):

TABELA 5.11

Numero de 79,5
Consumo U1ulrios "i "i1i (Xj-X) (Xj-xJ2 '"i - x:J21i xf 1i
'1

S f--- 25 4 16 60 -64,6 4 160,26 16 641,0 900


25 f--- 45 6 36 210 -44,6 1 980,26 11881,6 7 360
46f--- 65 14 55 770 -24,5 600,25 8 403,5 42 350
65 f--- 85 26 75 1 950 -4,5 20,25 526,5 146 250
85f---105 14 96 1 330 15,5 240,26 3 363,5 126 360
105f---125 8 116 920 35,5 1 260,25 10 082,0 105 800
1251---145 6 135 810 55,5 3 080,25 18 481,5 1o9360
1451--- 165 2 155 310 75,5 5 700,25 11 400,6 48 050

°'£fj= 80 °'£xj'J=6 360 °'£(Xj- X)2j


f = 80 780 "£xj 'i = 586 400

196
A media aritmetica do consumo ja foi calculada· anteriormente:
x "'£x;fj 6.360
= = =
79 '5
n 80
Cdlculo do Desvio-padrtio pela Formula Original (12)

(x; - 79 5
, )2/j
S
-1
=

n 80 -1
=
j 80 7 80 =. 1
v 1022 532
'
=
31977 s 31,977
79
=
'

0 desvio-padrao do consumo de energia eletrica e 31,977 kwh. Recorde­


-se qu� o desvio medio, calculado no exemplo 5, resultou em Dm =

[
24 6, 25 kwh.
Pela f6rmula (13)

k
(I )k
xIJ
;
2
l_ ' � ;=1
s2 xf,
_ _
=

-1
=

n L... I i n
j=l

40 449 600]
=
6_
../79
[586 400 -
80
=

= /80780
..; �
=
-
v'1022
. '532 =
31'977 s =
31,977
c) Propriedades do Desvio-padrtio
I -Primeira Propriedade
Somando ou ( subtraindo) um valor constante e arbitrario, x0, a cada
elemento de um conjunto de numeros, o desvio-padrao nao se altera.

Essa propriedade e valida tanto para dados brutos como para dados
tabulados. Verificaremos essa propriedade para dados brutos por uma
questao de simplicidade, mas sem perda da generalidade.

Fa�amos x0 igual a constante arbitr<iria e consideremos a f6rmula 8( )


do desvio-padrao:

= jr-'"'i:,(x
- ;
- -
- x
-)
--2-
S
n -I
Suponhamos que a cada valor x;
da variavel fosse somada a constante
arbitraria x0• De acordo com a quarta propriedade da media, pode-se 197
afirmar que, ao somar o
X a todos OS valores Xi de um conjunto de m'.imeros,
a media aritme.tica, x, ficara somada por essa constante. Assim, a expressao
acima ficara:

S
;,,. j�[(x; +x0) -(.X +Xo)]2
n-1
Tirando-se os parenteses,

S =
j,...1:.- [-x,-·
-
+ -
� o- -
- x
- -
-,
--
o-
)-2
=
j�(x; -x)2
n-1 n-1
que e a formula primitiva (8).

Se houvessemos subtraido a constante x0, o resultado seria o mesmo:

S= ji:(x; -x)2
n-1
=
jE[(x; -x0) (x -x0)]2
n-1
-

=
·

=
jl:[x; -io -� +lol2
n-1
=
jl:(x; -x)2
n-1
Exemplo 8:
Comprovar a primeira propriedade do desvio-padrao, utilizando os
seguintes dados:
x ={17, 18, 19, 20, 21, 22, 23}
Xo=19
Devemos ter:
- l:x; 17+18+19 +20+21+22+23 140
x = = = =20
-n 7 7

�-
_ jl:(x; 20)2
-

-
_ j
9+4+1+0+1+4+9 _

n-1 6
-

6 =2,'160
=.J(28 I Sx =2,160 I
Subtrairemos, agora, a constante
e teremos o novo conjunto:
x0 =19 de cada valor do conjunto

y ={(17-19), ( 18-19), (19-19), (20-19), (21 - 19),


(22-19), (23-19)}
y ={-2, -1, 0, 1, 2, 3, 4} ==> y =-1 =
l:y·
n
.

-2-1+0+1+2+3+4 7
= = =1
7 1

198
s·Y = j (y;-y)
n -1
2
=
2 2
(-2 -1) + (-1 -1)2 + (0 -1) + (2 -1) + (3 -1)2 + (4 -1)2
7-1
2 =
= j9 +4+ 1 +1 +4+9
6
= ../fi8
6 = 2' 160 Sy= 2,160

Por conseguinte,

I Sx=Sy I
onde
Yi =Xi - x0 =Xi -
19
0 leitor podera resolver o mesmo exercicio utilizando as f6rmulas
desenvolvidas

Sx=!.� [T,xl-�]
Sy = j. � [T-y{ -(T-�i)2] 1

Exemplo 9:
Considerando os mesmos dados do exemplo 8, adicionando a constante
x0
arbitrana =2 a cada elemento do conjunto, comprovar a primeira pro­
priedade do desvio-padrio. Utilizar af6rmula desenvolvida(8).

Temos:
x = {17, 18, 19, 20, 21, 22, 23}

X0 = 2 = e n 7
Daf, tiramos

ja que
y = {19, 20, 21, 22, 23, 24, 25}

Yi =Xf x0 =Xi
Assim sendo,
+ + 2

Sx= ['T,x�-(T-xi)2] = J� [
_1 _
n-1 1 n 7 - 1
.
2 828
.

·
- (140)2
7
]=
= }! [ � ] = }! [
2 828 -
19 00
2 828 - 2 800 ]

= Jfi8 = 6 = Sx=
../4,667 2,160 � 2,160

s
- ['T,y�-('T-Y1)2] =J�· [
y =Jn0_ 1 I n 7 - 1
3 416 - (
154)2
7
]=
199
= )! [3 416 - 23;16 ] )! [ 3 416 - 3 388] = =

= JI[- y 4,667 2,160


= 2,160
= � Sy =

TABELA 5.12
2 2
Xj Xj Yi =x; + 2 Y;
17 289 19 361
18 324 20 400
19 361 21 441
20 400 22 484
21
22
23
441
484
529
23
24
25
I
I
529
576
625
"I:.2 2
"I:.x;= 140 x; =2 828 "I:.y;=154 LY; =3 416
('I:.x;)2 =19 600 (.l:y;)2 = 23.716

Dessa forma, podemos dizer que os conjuntos abaixo possuem o


mesmo desvio-padrao S = 2,160.
x = {17, 18, 19, 20, 21, 22, 23}
Y = {19,
20, 21, 22, 23, 24, 25} onde Yi =Xi + 2
Z = {l,
2, 3, 4, 5, 6, 7} onde Zi =Xi 16 -

W = {- 2, - 1, 0, 1, 2, 3, 4} onde Wi =Xi - 19
P = {l 001, 1 002, 1 003, 1 004, 1 005, 1 006, 1 007} onde
Pi =Xi + 984
S = {l 017, 1 018, 1 019, 1 020, 1 021, 1 022, 1 023} onde
Si =Xi + 1 000

Exemplo 10:
Com os dados do exemplo 7, comprovar, por subtra9ao, a primeira
propriedade do desvio-padrao, fazendo x 0 = 75.

TABELA 5.13

NfJmerode
Conwmo Usulrios
"i "i 'i ]
x t; Yj "ljfj ]
y fj
'
i

5 I--- 25 4 15 60 900 15-75= -60 -240 14 400


251--- 45 6 36 210 7 360 36-75 =-40 -240 9 600
451--- 66 14 65 770 42 360 56-75=-20 -280 5 600
651--- 85 26 75 1 960 146 260 75-75 = 0 0 0
851---106 14 95 1 330 126 360 95-75= 20 280 5 600
1051---125 8 115 920 105 800 115 - 75= 40 320 12 800
1251---145 6 135' 810 109 360 135-75= 60 360 21 600
1451---166 2 155 310 48 060 165-75= 80 160 12800

l:fi= sci l:xjfj = 6 360 l:x} 'i = 586 400 l:yjfj= 360 J
l:y
'i = 82 400

200
No exemplo 7, ja foi calculado o desvio-padrao de X. Assim, pela
formula (13):

s= _l_ �x?f'.
n -1 I Jj
[ . (�x;fi)2] =jj_(586 - 505
_

n 79
400 620)=

= �=31,977 Sx=31,977

0 desvio-padrao de y sera dado por

� [82 400 - (3.8600)2 ]=


?[,. - ( Y;/j)2 = / 1_
S = _l - �Y11 [ ]
y'80 - l
__

n-1 n

=
. j_ (82 400 1 40) =
ji79 [82 400 - 12980600 J = J 6 -
· 79

= � =31,977 Sy=31,977' I

on de
Yi=x; - 7 5
II - Segunda Propriedade
Multiplicando (ou dividindo) por um valor constante e arbitrario, c,
cada elemento de um conjunto de m'.uneros, o desvio-padrao flea multi­
plicado (ou dividido) pela constante.

Da mesma forma que a primeira propriedade, a segunda e valida tanto


para o calculo com dados brutos como com dados tabulados, agrupados ou
nao em classes.
Assim, consideremos os seguintes conjuntos de m'.uneros:
x={X1, Xz, X3, . • . , Xn}
Y = {yi, Yz , y3, · · · , Y n}
onde
Xi
Yi =c
0 desvio-padrlro de X sera dado pela formula original 8.
-
sx-
j�(x; - x)2
n-1
e o deYporl
- j}:;(yj - y)2
Sy -
n- 1
De acordo com a quinta propriedade da media, se multiplicarmos
(ou dividirmos) todos os elementos de um conjunto de numeros por uma
constante arbitraria, a media do conjunto ficara multiplicada (ou dividida)
por essa constante. Assim sendo 201
Xi -= x
y

Yi=7
.
c-
Podemos escrever, entlo,

"T,(yi - Y'f -
Sy - j n - 1
- Xi
T- (c
x 2
- c)
�l2 l
T- [--C(Xi-x)
=
n-1 n-1
-

=
n- 1

��
� � quando (14)

Da mesma forma, podedamos mostrar que, se Y = cX, segue-se que

I Sy= cSx I (15)

sy-
- j"T.(yi - y)2 =JT,(cxin-1- cx)2= T, [c(Xi - x)l2
=
n-1 n-1
-----

T.c2(Xi - x)2 c2T-(Xi - x)2


=) n-1 =j =
n-1

=c
jT-(xi - x)2 = cS x Sy= cSx
n -1
Exemplo 11:
Dados os conjuntos de nfuneros
X= {l, 2, 3, 4, 5} e
y = {10, 20, 30, 40, 50},
comprovar a segunda propriedade do desvio-padrao.

X= {l, 2, 3, 4, 5} -
Temos, neste caso,

Yi� CXi lOxi


Y = {10, 20, 30, 40, SO}

c = 10
=

De acordo com a segunda propriedade do desvio-padrlo, devemos ter:

Yi= cx1 => Sy = cSx = lOSx


Pela f6rmula original (8),

Sx =
jT-(Xi-x)2 . - "T.Xi 1 + 2 + 3 + 4 + 5 �
onde x= = = =3
202 n - l n - 5 5
J;(y; - y)2
Sy = j n
_ 1
onde
- = J;y;
y n- = -

=
10 + 20 + 30 + 40 + 50
=
150
= 30
5 5
Entio,

J;(x; - 3)2
Sx j 5-1 .
-
_
-
_

- 3)2 - 3)2 3 - 3)2 +


(4 - 3)2 +
(5 - 3)2 =

- j- (2 (l + +(
4
- j4 1 0 1
- + + + + 4 =
.J(10 .,,) = 1 '581
4 = v'25.
4
e

Sy =
jI:(y; = - 30)2
5-1 .

=
(10 - 30)2 + (20 - 30)2 + (30 - 30)2 + (40 - 30)2 + (50- 30)2 =

400 + 100 + � + 100 + 400 = JI¥- = ./250 = 15,81


=
J
Assim,
Sy = c •
Sx
.J. .J. .J.
15,81 = 10 x 1,581
Utilizando agora a f6rmula desenvolvida, conforme dados da Tabela
auxiliar 5.14,
TABELA 5.14

x; JC;
2 Yi Y;2
1 1 10 100
2 4 20 400
3 9 30 900
4 16 40 1 600
5 25 50 2.500
I:x; = 15 I:x;2 = 55 I:y; = 150 I:y;2 = 5 500
(I:x;l2 = 225 (I:Y;l2 = 22 500

Sx = /_J_
../ n - 1
[ J;x? -
I
(J;x;)2
n
] ../56_1 [55 - 2255 ]
=
-
=

= )! (55 - 45) � = = ....rr:s = 1,581


203
Sy =
Jn 6_
- 1 [� x�
.I
_
(�Y;)
n
2
J = ./ii [
J4 s 500 _
22 500
5
] =

=
js.soo -4 4 soo = ..j{lOoO
- - =
� v so
. rycn
... = 15,81
4
Exemplo 12:

Consideremos os dados do exemplo 10 e fayamos Yi = -f .


Neste caso, c = 5.
TABELA 5.15

Numero de
Consumo 2
Energia
Usuarios
'i
Xj Yj =
� Yjfj Yj fj

51-- 25 4 15 15/5=3 12 36
251-- 45 6 35 35/5=7 42 294
451-- 65 14 55 55/5=11 154 1 694
651-- 85 26 75 75/5= 15 390 5 850
85 I---- 105 14 95 95/5=19 266 5 054 .
105 I---- 125 8 115 115/5=23 184 4 232
125 I---- 145 6 135 135/5=27 162 4 374
1451-- 165 2 155 155/5=31 62 1 922

.'i:Jj=80 �Yjfj=1 272 � Vj2fj=23.456

Do exemplo 1 0, tiramos
Sx = 3 1,977
0 desvio-padrao de Y = ; devera ser igual a 6,3954, ou seja,

31,977
Sy = = 6'3954
5
Aplicando a formula desenvolvida,

Sy =
1
n-=1
[�""'YjJj2,. - (�Yjfj)2 ]-
n
-

=
7 9
[
_1 23 456 - (1 7
2 2)2
80 J =

6__ [
23 456 -
1 617 984 ] =
../ 7 9 80

)* (23 456 - 20 224,8) � = =

204
= .J 40,90126 = 6,3954
Sx = 31,977 } Y= ...K_
5
Sx
e c=5

Sx
Sy= 6,3954 � S y= 7= -

5
-

III - Terceira Propriedade


0 desvio-padrao e maior que 0 desvio medio.
Essa propriedade pode ser comprovada numericamente, atraves dos
resultados dos exemplos 4 e 6 para dados brutos e 5 e 7 para dados
tabulados.
No exemplo 4, foram apresentados os seguintes conjuntos:

A = {10, 12, 13, 20, 25, 34, 45};


B = {17, 18, 19, 20, 21, 22, 23}; e

c = {-4; -3; -2; 3; 5},


cujos desvios medios e desvios-padrao sao (Veja Tabela 5.10):
SA = 12,950 DmA = 10,249

S8 = 2,160 Dm8 = 1,714

Sc= 3,962 Dmc = 3,360

Os resultados dos exemplos 5 e 7 fornecem-nos:


S = 31,977 kwh e Dm = 24,625 kwh.

d) Processo Breve para o Ca/culo do Desvio-{Xldriio


0 desvio-padrao pode ser calculado com o recurso de formulas simpli­
ficadoras, as quais tornam mais rapida a solu¢o dessa medida. Tais formulas
derivam diretamente das duas primeiras propriedades do desvio-padrao.
A variavel a ser utilizada e chamada, como vimos no caso da media (Cap. 4,
4.2.1, item d), de variavel reduzida:
Xi - Xo
d = j ---

c
para dados brutos

Xj - Xo
d = �- --
j c
para dados tabulados

Utilizando essas variaveis em lugar das originais, podemos obter o


desvio-padrao dessas ultimas atraves das seguintes formulas:

Para dados brutos:

n
I <di - d')2
i=l
Sx= -- (16)
n --1- =
c c
- n

.i .i
formula original formula desenvolvida 205
[
Para dados tabulados:

(± )
2
djlj
k
_1_ ' :21,. _,_,_
,=
· _1_:._
n-l L... dJJ
Sy= c (17)
n
/= 1
.j,
formula original formula desenvolvida
Faremos a prova apenas da formula (16), sem perda de generalidade.
Para tanto, temos:
, x; - Xo
d; = ---- e Xi= x0 + cdj
c
x = x0 + cd',
conforme expressa-o (15) do capftulo anterior. Dai tiramos:
X - Xo
d'= --- (18)
c
Assim,

Sx = j� �(x; - x)2 =
= / _1 1.
� [(x0 + cdj) - (xo + cd')P
=
.../ n '--y-J �
Xj

= )6 ��+ cdj -�- cd')2 =

= L!_�[c(d'! - d')f = ��c2(d!' - d')2 =


...; 1z -
1 ...; ri -
1

�(dj - d')2
,I
n- 1

conforme expressio (16).

�(d�' - J')2
Como a expressao representa o desvio-padrao da
n- 1
variavel d', podemos escrever genericamente que, se

Xi - Xo , Xj - Xo
d1 = dj =
1
OU
c C

S x--­
= cSD' (19)
206
Exemplo 13:
Calcular o desvio-padrio do conjunto X = {10, 20, 30, 40, SO, 60},
fazendo x0 = 30 e c= 10.
Calculando inicialmente o desvio-padrio atrav6s da f6rmula original (8),
.
��=
(i

Ix;
- i=t 10 + 20 + 30 + 40 + so + 60 10 -
= = - 26 -
- 3S
x --
n 6

Sx-
- j'£(x; n -
-

1
xl -
-

(10 - 3S)2 + (20 - 3S)2 +(30 - 3S)2 + (40 - 3S)2 +(SO - 35)2 + (60 - 35)2
=
6 - 1

=
J
625 + 225 + 25 ; 25 + 22S + 625 .; jiifff- = .,fEO = 18, 708

I sx= 18,708 I
Para calcular o desvio-padrio usando a f6rmula 16, recorreremos a
uma tabela auxiliar, sabendo que x0 = 30 e c= 10. Assim:

TABEl.A 5. 16

, x;- 30
Xj d= ldj-Ci'I (d�-d'l2 d�2
; -1-0- I I

10 -30
10 =-2 (-2 -0,51=-2,5 6,25 4
_10 _ _ ·
20 -30
20 =-1 (-1 - 0,5)=-1,5 2,25 1
10
30 -30
30 = (0 - 0,5)= -0,5 0,25 0
_10 _ _ O
40-30
40 _ 10 =1 (1 - 0,5)= 0,5 0,25 1
_ _
50-30
50 =2 (2 -0,5)= 1,5 2,25 4
-10 - -
60-30
60 _1_0_ =3 (3 -0,5)=2,5 6,25 9

L. dr= 3
i=t l:: {dj -d')2=17,50 l::dj2 == 19

(l::djl2= 9

Calculemos inicialmente d':


n

L,d;
3 207
d'=� =-=OS
'
n 6
(16) nos da:
A f6rmula original

L(dj-d')2
Sx =c
n- I
=lOV�
-y-5- - =10�=
=IO X 1,8708 =18,708
Sx = IO X I,8708 =18,708
.j, .j,
c SD'
0 mesmo resuitado seria alcanyado usando a formula desenvolvida:

Sx =c n I
-
[ Ld )2
_I_ Ld'.2 - ( j
n1
] =IO

= IO jf 09 - 1,5) =IO JIJf =10 X I,8708 = I8,708


Exemplo 14:
Calcular o desvio-padrao do consumo de energia eletrica, usando os
I2.
·
·

dados do problema
Para calcular o desvio-padra:o pelo processo breve, escolheremos x0 e
c usando os mesmos criterios que os a presentados para o calculo da media
aritmetica pelo processo breve, quais sejam:
I. Xo =ponto medio da classe de rnaior freqiiencia, se k (numero de classes)
for par, ou ponto medio de uma classe intermediaria, se k for fmpar.
2. c =amplitude do intervalo de classe ou diferenya entre dois valores conse­
cutivos (para tabelas de freqiiencias com valores isolados ) .

TABELA 5.17

, Xj -75
Classes fj Xj d = - df j dj2fj
i -w '
15 -75
5 1--- 25 4 15 =-3 -3X 4=-12 (-3) (-121=36
20
35-75
251-- 45 6 35 =-2 -2x 6=-12 (-2) (-12)=24
20
55 -75
45 1-- 65 14 55 = -1 -1x 14=-14 (-111-14) =14
20
75 -75
651-- 85 26 75 =0 0x26= 0 ox O=O
20
95-75
85 1-- 105 14 95 =1 1x 14=14 1x14=14
20
115 - 75
105 f-- 125 8 115 =2 2X 8=16 2X16=32
20
135 -75
125 1-- 145 6 135 =3 3X 6=18 3X18=54
20
155-75
145 f--- 165 2 155 =4 4X 2=8 4X 8=32
20
k= 8 (par) 'f,djfj= 18
Lfj=80 'f,dj2fj=206
x0 =76ec=20
('f,d f fj12 =324
208
Como sabemos, o desvio-padrao do consumo de energia eletrica pelos
80 usuarios e Sx = 31,977 kwh.
A formula desenvolvida permite chegar ao mesmo resultado com
muito menos trabalho e numeros bem menores:

=c _ 1_ d '. 1,. - ('f-djt/ =


[ ]
1 'f- I 2 I
Sx
n - n

= 20 )80-1--1 (106- 18082) = 2o ji_fio6 324


79 ,. - 80 ) =
= 20 )206 - 4,o5 = 20 fiOfJ5 = 20../2 '5563 =
79 ..; �
= 20 x 1,5988 = 31,977
-1- -1- Sx = 31,977 I I
c X S
D
Evidentemente, o mesmo resultado seria obtido se escolhessemos
qualquer outro valor para x0 e para c. 0 leitor podera comprovar isso
fazendo, por exemplo, x0 = 95 e c = 10.
e) /nterpreta�iio do Desvio-padriio
0 desvio-padrao nao tern uma interpretayao fisica, como ocorre com
a media, mediana, moda e OS quantis. Contudo, e possivel interpreta-lo de
fortna analitica. Consideremos, por exemplo, que dois estudantes tenharn
obtido os seguintes resultados em 5 provas de Estatistica, realizadas ao longo
do ano letivo:
Estudante A : 40 50 60 70 80
Estudante B: 20 40 60 80 100
Ambos os estudantes foram aprovados na disciplina, pois suas medias
foram iguais a 60:
xA
= 50 + 60 + 70 + 80 = 300 = 60
40 +
5 5
0
= _2 + 40 + 60 + 80 + 100
= 300
Xo
D
5 5 = 60
Entretanto, a variayao das notas em torno das respectivas medias
difere do alunoA para o aluno B, esse ultimo apresentando maior dispersao
do que aquele. E possivel perceber ainda que a diferenya entre pares
sucessivos de notas do aluno B e igual a duas vezes a do aluno A, que a
amplitude total das notas de B e igual ao dobro da de A. Assim sendo,
podemos afirmar que o aluno B apresentou resultados com uma variayao
media igual ao dobro da do aluno B. 0 desvio-padrao das notas permite
comprovar o que foi dito: 209
j'E(x;- x)2 =
n -1 .
(40 - 60)2 + (SO -60)2 + (60 -60)2 + (70 -60)2 + (80 -60)2 =
=
s -1

=
j400 + 100 + � + 100 + 400 = '1250 = s ../TO

=
(20 - 60)2 + (40 -60)2 + (60 - 60)2 + (80 - 60)2 + (100 -60)2 =
SB S -1

=
jJ.600 + 400 + � + 400 + 1 600 = .jTOOO = 10 ../TO'

I SB
=
2SA I
Por ai se depreende que o desvio-padrao e realmente uma medida
satisfat6ria de dispersao, embora nao se possa afumar muita coisa quanto i
sua magnitude.
5.2.5. VariAncia

S2
Sfmbolo:
a) Defini¢o da Vari4ncia
Conforme se pode perceber pelo sfmbolo, a varrancia e o quadrado
do desvio-padrio, OU, se se preferir, 0 desvio-padrllo e a raiz quadrada da
variancia. Dessa forma, pode-se dizer que a formula da variincia e igual i
eJ;tpressao do desvio-padrllo, sem o sinal do radical. Adiantamos que as
defini�oes que se seguem aparecem com a corre�ao de Bessel, isto e, com o
divisor n - 1.
Varidncia de Dados Brutos
Processo longo
n
L (x;-x)2 Xt )']
1
s2 = _;=
_ 1___ _
n-1
4-
= _
n-1
[f
L..
i=l
x?
1


_ (t. n
(20)

f6rmula original f6rmula desenvolvida

Processo breve

c2
n
I <di -a'>2
[ (nI )
i=1
d'
I
2 ]
s2 _= 1 ____
; _ � � d'.2 -
n-1 L..
= __ = (21)
n-1 1 n
i=l

210
Varidncia de Dados Tabulados
Processo longo
k
I (x; - x)2f;
�;_=1 1
k
(± x f;)2
;=1
;
s2= L x;f;-
___
_
_
- 2
(22)
n-1 - n-1 n
j=l

[-
Processo breve

I (dj - a')2t;
c2
8 2= -�-----
;=1
k

k
'. .
· ( ± djfj)2
n -1
_
n
1_ '
l L..
d 1 2f,1 - _1_· =1_ -�

n
(23)
/=1
Exemplo 15:
Calcular a variincia dos seguintes conjuntos de numeros:

A = {10, 12, 13, 20, 25, 34, 45}


B = {17 , 18, 19, 20, 21, 22, 23}
c = {-4; -3; -2; 3; 5}
No exemplo 6, ja foi calculado o desvio-padrllo de cada conjunto.
Os dados para a determinayao de variancia foram extraidos desse exemplo.
Sabemos que
xA = 22,714
xs = 20
xc = -0,2
Entao,
�(x; - 22,714)2
s� = ------ = 167 ,905
7 -1
�(x; - 20)2
s'B2 = = 4,667
7 -1
-
�[x; (-0,2)]2
5-1
= 15,7
Exemplo 16: .
Calcular a variincia do consumo de energiil eletrica de 80 uswirios,
com os dados do exemplo 7.
k 8
I <x1 - x)2f; I (Xj- 7 9,5)2[;
s2 = .._1=_1 n -1
____
/=1 80 7 80 = 1 022,532
80 - 1 79
S2 = 1 022,532 (kwh)2
Como pode ser observado, a variancia expressa a unidade de medida
sempre ao quadrado, ao contrario do desvio-padrao. 211
Propriedades de Vari4ncia
I - Primeira Propriedade
Somando (ou subtraindo) um valor constante e arbitrario, x0, a cada
elemento de um conjunto de numeros, a variancia na:o se altera.
Essa propriedade e equivalente a primeira propriedade do desvio­
-padrao.
Assim, se fizermos
2 2
Y = X + Xo Sy= Sx (24)
OU
2 2
Y = X - Xo > Sy= Sx

II - Segunda Propriedade
Multiplicando (ou dividindo) por um valor constante e arbitrario, c,
cada elemento de um conjunto de numeros, a variancia flea multiplicada
(ou dividida) pelo quadrado da constante..

Para

=EIJ
x
y=­ (25)
c
OU

2 2
y=ex > Sy= c2sx (26)

III - Terceira Propriedade


Consideremos dois conjuntos de n1 e n2 valores, respectivamente,
sen do
S � = variancia (parcial) do primeiro conjunto.
sJ = variancia (parcial) do segundo conjunto.

x1 = media (parcial) do primeiro conjunto.


x2 = media (parcial) do segundo conjunto.

x = media geral, incluindo os valores dos dois conjuntos.

A variancia combinada das duas distribuiyoos sera dada por

2 2 - 2 - - 2
s2 =
(n1 - 1 )S1 + (n2 -
-------�--,---
-
l)S2
--=---------�
+(n1 - l)(x- - x1) + (n2 - l)(x - x2)
i
n + n2 - 2
(27)

Examinando a primeira expressa:o, pode-se dizer que a variancia combi­


212 nada consta de duas parcelas:
- Media aritmetica ponderada das variancias parciais

(n1 - l)s: + (n2 - l)Si (primeira parcela)


ni + n2 - 2

2 - Variancia (ponderada) das medias parciais

(n1 - l)(.X 2
.X1) + - (n2 - l)(.X
.X2)
2
-

Exemplo 17:
A estatura media de um grupo de 50 rapazes e de 172 cm, com
variancia de 36,69 cm2 , e a de um grupo de 40 moyas e de 161 cm, com
variancia de 27,04 cm2 • Qual a media, a variancia e o desvio-padrao das
estaturas dos dois grupos reunidos?

Cdlculo da Media Geral


Para calcular a media do conjunto formado por todas as estaturas,
tanto as dos rapazes como as das moyas, recorreremos a terceira proprie­
dade da media aritmetica (expressao 6 do capitulo anterior).
k

L1 x n1
1
XJ = medias parciais
/=
on de
n 1= numero de elementos do conjunto j

/=1
Neste caso,
j =1,2 e k=2
.X1 =172 n1 =50
X2 =161 n2 =40
(172 x 50) + (161 x 40) 8 600 + 6 440 15 040
=
x= 40
-
=
50 + -
90 90

=167,11 x=167,11 cm

Cdlculo de Varidncia Combinada

Temos s: =36,69 e s; =27,04


2 2 - - 2 - - 2
2 (ni - l)s1 + (n2 - 1)s2 + (n1 - 1) (x - xi) + (n2 - 1)
• • (x - x2)
s = =

ni + n2 - 2
2 2
- (49 x 36,69) + (39 x 27,04) + 49(167,11 - 172) + 39(167,11 - 161)
- =

so + 40 - 2
2 2
1.797,81 + 1 054,56 + 49 x 4,89 + 39 x 6,11
= =

88

1 797,81 + 1. 054,56 + 1 171,69 + 1 455,95


213
=

88
Cdlculo do Desvio-padriio Combinado
Basta extrair a raiz quadrada do resultado anterior.

S = vfsl = J62,27 = 7 ,89 cm.

A justifica tiva te6rica da terceira propriedade da variancia e bem


simples. Consideremos para tanto as seguintes variaveis:

X1 com media .X1, variancia S� e n1 valores

X2 com media .X2 , variancia s; e n2 valores

Tomemos ainda

x = media geral e s2 = varrancia geral.

A variancia geral sera calculada somando todos os quadrados dos


desvios tanto dos valores de X1 como de X 2 em torno da media geral .X, e
dividindo o resultado por (n1 + n2 - 2) ou por (n1 + n2), dependendo
de como se toma o denominador. Faremos a demonstraylio para esse ultimo
caso por questao de simplicidade. Partiremos entJo da seguinte expressao
de variancia conjunta:
n1 n2
-2
� (X1 - X) -2
� (X2 - X)
2 ._ + ._
S =
n1 + n2
OU
n1 n2
2 2
1; <x 1 ::_ x> + 1; (x2 -x> =
Enti'o,

(n1 + n2)S2 n1S� + n'ls; = + n1 (x - xif + n2 (x - x2)2


OU
n1S� + n'ls; + n1 (x - xif + n2 (x - x2)2
S2 =

n1 + n2 (28)

Se em lugar de n1 e n2 tivessemos usado (n1 - 1) e (n2 - 1), chega­


rfamos a expressi'o 27.
No caso particular de as tres medias coincidirem, x1 = x2 c: x, a
expressi'o (28) ficara reduzida a uma media ponderada das variincias:

+ n1S� n 2Si
s2 = �����- (29)
+ n1 n2
c) Controle de Charlier
A prova de Charlier e utilizada para averiguar a exatidi'o do calculo
da media e da variancia (e conseqiientemente do desvio-padri'o) principal­
mente quando utilizamos o processo breve de calculo dessas medidas em
uma tabela de freqiiencias. Essa prova baseia-se na seguinte equa?o:

(30)

Para comprovar essa igualdade, tomemos inicialmente


(d] + 1 )2 = dj2 + 2dj + 1

Multiplicando ambos os membros por fi,


(dj +
2
1 ) fi = dj2/j + 2dj/j + fi
Aplicando o operador sornat6rio

I;(dj + 1 )2fi = I;dj2/j + 2I;dj/j + "i:.fi


Exemplo 18:
Utilizar o controle de Charlier para a variancia e a media usando os
dados do exemplo 14.
No exemplo 14, fizemos x0 = 75 e c = 20.

TABELA 6.18

C/8#81 'i x; d'


1 djf; dj'f; dj+ 1 (dj + 112 (dj + 1i2f1 (dj +1)f

5 f--- 25 4 15 -3 -12 36 -2 4 16 -8
25 f--- 45 6 35 -2 -12 24 -1 1 6 -6
45 f--- 65 14 56 -1 -14 14 0 0 0 0
65 f--- 85 26 75 0 0 0 1 1 26 26

85 f--- 105 14 95 1 14 14 2 4 56 28 I

105 f--- 125 8 116 2 16 32 3 9 72 24


125 f--- 145 6 135 3 18 64 4 16 96 24

145 f--- 165 2 155 4 8 32 5 25 50 10

l:f; = 80 l:df'; = 18 l:dj2f; = 206 :!:ldj+1)2f1=322 :!:ldj+tlf;=98


. 215
Os dados necessarios para a prova de Chartier sao OS seguintes:

L(dj + 1)2/j 322 =

Ldj2f; 206 =

2Ldjf; 2 X 18 36 e Lfj n 80
= = = =

Ld}2f; + 2Ldjf; + Lf; 206 + 36 + 80 322 = = = L(dj + 1)2/j


0 que garante a exatidao dos calculos.

Para comprovar a exatidao do calculo de media pelo processo breve,


devemos partir da igualdade
L(dj + l)f; = Ldjf; + L/j (31)
facilmente demonstravel
(dj + l)f; = djf; + f;
Aplicando L
L(dj + l)fj = Ldjf; + Lf; .

A Tabela 18 nos fornece os valores necessarios:


L(dj + l)f; = 98
Ldjf; = 18 - > Ldjfj + Lf; 18 + 80
= = 98 =

Lf; = 80 =L(dj + l )fj


d) Cor:re¢o de Sheppard para a Varidncia
Normalmente, quando os dados estiverem agrupados em classes,
ocorrem erros resultantes desse agrupamento, no calculo da variancia e do
desvio-padrao. Isto porque admitimos, ao agrupar os dados em classes, que
esses se distribuem simetricamente dentro de cada classe, razao pela qual
foi adotado o ponto medio de classe no cfilculo de medidas como a media
e a variancia. Ocorre, porem, que os dados nem sempre se distribuem
simetricamente em torno do ponto medio. Em conseqiiencia, o erro
de agrupamento aumenta o desvio-padrao e com grau tanto maior quanto
mais extensos forem os intervalos e menor o numero total de obser­
vay6es.
Para corrigir o erro de agrupamento, usa-se um termo corretivo pro­
posto por Sheppard, o qual e subtrativo em virtude de o agrupamento em
geral aumentar o valor da variancia e do desvio-padrao.

Nao existe um consenso entre os autores quanto a utilidade da


correyii'o de Sheppard. Isto porque, muitas vezes, ela tende a supercorrigir a
variiincia quando nao substitui erros anteriores por novos.

Neste livro apresentamos esse t6pico apenas por compromisso com a


literatura. Nao vemos, por outro lado, razoes que justifiquem seu emprego

216 na pratica.
Formula de Sheppard:
Consideremos S2 a variancia de um conjunto de valores dispostos em
uma tabela de freqiiencias. Tomemos ainda
c =amplitude do intervalo de classe

s; =variancia corrigida

I Si �
s' -
-r;- I (32)

Exemplo 19:
Aplicar a correyiio de Sheppard para a variancia e desvio-padrao do
consumo de energia eletrica, usando os dados dos exemplos 7 e 16.

Os valores de que precisamos slro os seguintes:


s2 =1 022,532 (kwh)2
s =31,977
c =20 > c2 =400
Aplicando .a correyiio de Sheppard,

c2 =1 022,532 400
S c2 = 2 S -
IT -
l2
=98 9,199

Sc = js - �2 = y989,199 =31,452

e) Relaroes Empiricas entre as Medidas de Dispersfio

Quando as distribuiyOeS se apresentarem fracamente assimetricas (pe­


queno enviesamento), podemos usar algumas relayoes empfricas para deter­
minar certas medidas de dispersao a partir de outras. Tais relayoes slio:

Dm =±s (33)
5

(34)

Exemplo 20:
Comprovar a relayiO empirica entre 0 desvio quarti1ico, desvio medio
e desvio-padrao para o problema do consumo de energia eletrica por
80 usuarios.
Os resultados correspondentes ao desvio medio e ao desvio-padrlro ja
foram obtidos anteriormente:
Dm =24,625 (exemplo 5)

S =31,977.(exemplo 7 ) 217
Usaremos uma tabela auxiliar para proceder ao catculo do desvio
quartil.
TABELA 5.19

Numero de
·consumo Usullrios Fj
fj

Sf--- 25 4 4
25f--- 45 6 10
45f--- 65 14 24
651---- 85 26 50
851---1
- 05 14 64
105f---125 8 72
125f---145 6 78
145f---165 2 80

n = 80

A f6rmula1 nos fornece:


Q3 Qi
Dq - -
1
-

E . = n = 80 20o
Q 4 4 __

Q3 = terceiro quartil
onde
Qi = primeiro quartil

� - 3 X 80 600
- =
_ _

EQ,
4 4
n
4- Fant 20 - 10
Qi =I + c !. = 45 + 20 = 45 + 14,286 =
Q, 14

= 59,286
3n
4 - Fant 60 - 50
Q 3 =I + c f. = 85 + 20 85 + 14,286
14
= =

Q,
= 99,286
Q3 - Qi 99,286 - 59,286 Dq = 20
D = = = 20
q 2 2
Se usarmos as rela�0es empfricas, teremos:
4 4
Dm = 5S = 5 X 31,977 = 25,582
2 2
218 D = -S = X 31 977 21 318
q 3 3 ' '
- =
Como pode ser observado, as f6rmulas empiricas slio validas para este
problema, nlio havendo grande discrepancia entre os valores determinados
empiricamente e os caiculados atraves das f6rmulas de definiylio das respec­
tivas medidas.

Por outro lado,


Dm Desvio Medio 4
= =-= 080
'
S Desvio-padrlio 5
Dq Desvio Quartil 2
= =-= 0667
'
S Desvio-padrlio 3
Neste problema temos:
Dm 24,625
= = O'77
s 31,977
Dq 20
= = 0•63
s 31,977
5.3. MEDIDAS DE DISPERSAO RELATIVA
Para determinadas classes de problemas, as medidas de variabilidade ou
disperslio relativa em uma distribuiylio de freqiiencias proporcionam uma
avaliayao mais apropriada do grau de dispersao da variavel do que as de
disperslio absoluta. A disperslio relativa permite ainda comparar duas ou mais
distribuiyOes, mesmo que essas se refiram a diferentes fenomenos e sejam
expressas em unidades de medida distintas. As medidas de disperslio resultam,
em geral, de comparayao entre uma medida de dispersao absoluta e um
promedio, sendo seu resultado expresso em termos percentuais.

5.3.1. Desvio Quartil Reduzido


Simbolo: D q
,
0 desvio quartil e uma medida de disperslio relativa resultante do
quociente entre o desvio quartil reduzido e a mediana. Simbolicamente,

Q3 - Q;
Dq 2
Dq = (35)
_ _

, - Md - --M-'d--
1---o
---� u-------1
Q3 - Qi
Dq X 100
, 2Md
=

Exemplo 21:

Retomemos os dados do exemplo 20 e calculemos o desvio quartil


reduzido:
Temos: Dq = 20
219
n
--Ft an
�-24
2 2
Md= I + c Ji 65 + 20 =
Md 26
320
= 65 + 26 = 65 + 12,31= 77,31 Md= 77,31

Dq 20
Dq , = X 100 = X 100= 25,87% Dq,= 25,87%
Md 77 31'

5.3.2. Coeficiente de Varia�o

0 coeficiente de variayao ou coeficiente de varia�o relativa e uma


porcentagem cujo calculo resulta da comparayiio entre o desvio-padrao ou o
desvio medio e a media ou a mediana. Definiremos os seguintes coeficientes
de variayiio:

a) Coeficiente de Variariio de Pearson

Simbolo: CVp

0 coeficiente de varia�o de Pearson e igual ao quociente entre o


desvio-padrao e a media aritmetica.

s
CVp=--=­
x
ou-----1 (36)
s
CVp=--=--· 100
x

Exemplo 22:

Para exemplificar o conceito de CVp, suponhamos que uma empresa


fabricante de pneumaticos tivesse desenvolvido um novo produto com um
cordel que proporcionasse maior resistencia as flexoes repetidas e maior
resistencia a tra9ao do que o original. Tendo submetido esse componente a
prova, chegou-se a conclusao de que a resistencia as flexoos repetidas,
testada em um aparelho de dobrar cordeis, foi, em media, de 139 minutos
com desvio-padrao de 15 minutos contra a media de 88 minutos e desvio­
·padrao de 14 minutos do cordel comum. Comparando os valores dos
desvios-padroes, parece nao haver diferenya significativa quanto a dispersao
dos tempos de resistencia a flexiio. Entretanto, deve-se ter presente que o
desvio-padrao para o novo cordel se refere a uma maior resistencia media as
flex0es repetidas, e e neste aspecto que se baseia o conceito de dispersao
relativa refletido pelo resultado do indice CVp. Calculemos, entao, o CVp
para os dois casos.
220
Para o novo cordel:

I CVp = -& = 0,108 OU 10,8%

Para o cordel antigo:

I CVp = * = 0,159 OU 15,9%

Comparando os resultados, ve-se que a variayao relativa e muito menor


para o novo cordel do que para o antigo.

Suponhamos agora que o novo cordel tenha sido submetido a um


teste de resistencia a trayao, tendo sido obtidos os seguintes resultados:
·
Resistencia media a trayao : 18 libras
Desvio-padrao: 0,73 libras
O coeficiente de variacao de Pearson sera igual a

CVp = �;;
'
= 0,03989 OU 3,99%

Exemplo 23:
Poderfamos estar interessados em saber se o novo cordel apresenta
maior dispersao de resistencia a trayao ou a flexoes repetidas. Neste caso,
nao e possfvel comparar as dispersoes absolutas, uma vez que as unidades de
medida e os fenomenos sao distintos. Estarfamos comparando, se assim
procedessemos, minutos (unidade de tempo) com libras (unidade de peso).
Por essa razao, a (mica comparayao compatfvel com a natureza dos dados e a
proporcionada pela dispersao relativa. Dessa forma, terfamos:

TABELA 5.20

ResisttJncia Dispersao Re/ativa (%)

As Flexoes Repetidas CVp = 10,8 � 11


Tra.;lfo CVp = 3,99 � 4

Muitas vezes e util considerar o coeficiente de variayao de Pearson


como o desvio-padrao das porcentagens dos valores em relayao a media,
conforme pode ser esclarecido no exemplo seguinte:

Exemplo 24:
Tomemos o seguinte conjunto de numeros: X = {2, 3, 7} e calculemos
o CVp. 221
TABELA 5.21

(xj-X) 2
Xj (Xj-X)

2 -2 4
3 -1 1
7 3 9

"E.Xj = 12 "E.lxi-x12 = 14

�Xi = 12 =
x= 4
-n 3
_

(x - x)2
2= � i
Sx = _!± = 7
n-1 2

Sx= ft= 2,6458

CVp= 8! = 2•646 =0 ,66 OU 66% CVp = 66


x 4
Consideremos agora o conjunto Y, formado pela razao entre os valores
de x e a media X, OU seja,

lremos verificar que o desvio-padrao de Y, Sy, sera igual ao coeficiente


de varia�o de Pearson, calculado anteriormente:

TABELA 5.22

Xj
(%) Yi= x • 100 n- ¥ (yj- y)l

2
4. 100 = 50 -50 2.500

3
4. 100 = 75 -25 625

7
4. 100 = 175 75 5.625

"E.Yj =
300 "£ (Yj - ¥12 = 8.800

y
= �Yi= 300 =
3
lOO
n

222
s:= � i_- f -8· 00 = 4.400 => Sy= v' 4.400
� t � 2!: 66%
Por conseguinte,

I CVp =Sy
Em resumo, quando comparamos dispersaes, podem ocorrer tres tipos
de situay0es:

1. As series vem expressas na mesma unidade de medida, e suas medias sao


iguais OU muito pr6ximas. Neste caso, e valido comparar OS valores de s,
nao se obtendo informayao adicional significativa com o uso do CVp.
Exemplo 25:
Um teste de estatistica aplicado a dois grupos de SO alunos apresentou
os seguintes resultados:

TABELA 5.23

Grupo Midis das Notas Desvio-padrlio das Notas

A 6 2
B 6,2 1,5

Nao ha necessidade de muito esforyo de raciocinio para concluir que


o grupo B apresentou menos dispersao, tanto absoluta como relativa. Apenas
para confirmar:
TABELA 5.24

Grupo CVp

2
6 = 0,33
A

B �=0'25
6

2. As series podem apresentar-se expressas nas mesmas unidades de medidas,


mas as medias aritmeticas sao significativamente diferentes. As comparay5es
podem ser feitas atraves da dispersao absoluta (desvio-padrao). Entretanto,
nestas circunstiincias, poder-se-a obter uma comparayao mais reveladora,
utilizando medidas de dispersao relativa, como o coeficiente de Pearson.

Trata-se do caso apresentado no exemplo 22, quando comparamos a

resistencia media dos cordeis as flexoes repetidas. Como se recorda, as medias


para os dois tipos de cordel eram bem diferentes (139 contra 88).

3. As series podem vir expressas em unidades de medida diferentes. Neste


caso, e totalmente inviavel estabelecer comparayao a partir do desvio-padrao
(dispersao absoluta), sendo plenamente justificavel o exemplo do coeficiente
de variac;:ao de Pearson. 223
0 exemplo 23 visa exatamente a esclarecer esse aspecto do uso do
coeficiente de variayao de Pearson.

b) Coeficiente de Variarao de Thorndike


Sfmbolo: CVT
·
0 coeficiente de varia�o de Thorndike e igual ao quociente entre o
desvio-padrao e a mediana.

s
CVr =
Md
OU (37)

CVr= 100
s
Md

Exemplo 26:
Calcular o coeficiente de Thorndike com os dados do exemplo relativo
ao consumo de energia eletrica de 80 usuarios comerciais.

Os dados para resolver o problema ja sao conhecidos:


s = 31,977
Md= 77,31
31•977
CV.T= 100= 41,36%
77,31

O coeficiente de Pearson para o mesmo problema e

31•977
CVp= 100 = 40,22%
79,

5
c) Coeficiente Quart([ico de Variarao
Sfmbolo: CVQ
Esse coeficiente e definido pela seguinte expressao:

OU (38)

Exemplo 27:
Calcular o coeficiente quartflico de variayao para o consumo de energia
224 eletrica por 80 usuarios, usando os dados do exemplo 20.
No exemplo 20, foram calculados o primeiro e terceiro quartis, cujos
valores sao:
Q3 = 99,286
Qi = 59,286

CV. 99,286 - 59,286 40


Q
= =
0,252 OU 25,2%
158,572
---

99,286 - 59,286
CV 25,2%
Q =

EXERCiCIOS PROPOSTOS
5.1. Com os dados do exercicio 4.1 do Capftulo 4, determinar:
5.1.1. Desvio Quartil.

5.1.2. Desvio Medio.

5.1.3. Desvio-padrao.

5.2. Com os dados do exercfcio 2.4 do Capftulo 2, determinar:


5.2.1. A variancia da distribui9ao.

5.2.2. 0 desvio-padrao.
5.2.3. 0 coeficiente de varia9ao de Pearson.
5.2.4. 0 desvio quartil.

5.3. Dados os conjuntos de numeros A { 1.000, 1.001, 1.002, 1.003,


=

1.004, 1.005} e B = {0, 1, 2, 3, 4, S} podemos afirmar que:


a) o desvio-padrao A e igual a 1.000 vezes o desvio-padrao de B; -
'

b) o desvio-padrao de A e igual ao desvio-padrao de B;


c) o desvio-padrao de A e igual ao desvio-padrao de B multiplicado
pelo quadrado de 1.000;
d) o desvio-padrao de A e igual ao desvio-padrao de B dividido por
1.000;
e) o desvio-padrao de A e igual ao quadrado do desvio-padrao de B.

SA. Realizou-se uma prova de estatfstica para duas turmas, cujos resultados
foram os seguintes:
Turma A: x =
5 e S =
2,5
Turma B: x = 4 e S = 2

Esses resultados permitem afirmar que:

a) a turma B apresenta maior dispersao absoluta;


b) a dispersao absoluta e igual para ambas as turmas;

c) a dispersao relativa e igual a dispersao absoluta; 225


d) a dispersao relativa e a absoluta para a turma B sao iguais;

e) a dispersao relativa da turma A e igual a da turma B.

5.5. A tabela abaixo representa a vida util de postes telefonicos de madeira:

N9 de Postes
Anos
Substitufdos

0,5---; 2,5 11
2,5---; 4,5 47
4,5---; 6,5 87
6,5---; 8,5 134
8,5 ----110,5 200
10,5 ----1 12,5 198
12,5 ----114,5 164
14,5 ----116,5 102
16,5---; 18,5 48
18,5 ---i20,5 6
20,5 ----122,5 3

Pede-se:

5.5.1. o desvio-padrlro.

5.5.2. o coeficiente de varia�lfo.

RESPOSTAS DOS EXERCfCIOS PROPOSTOS


5.1. 5.1.1. 1,88
5.1.2. 2,02
5.1.3. 2,48

5.2. 5.2.l. 0,2169


5.2.2. 0,4657
5.2.3. 21,2%
5.2.4. 0,2509

5.3. b

5.4. e

5.5. 5.5.1. 3,767


5.5.2. 0,353 OU 35,3%
226
Medidasde
Assimetria e Curtose

6.1. INTRODUCAO

As medidas de assimetria e curtose sao as que restam para completarmos


o quadro das estatisticas descritivas, que proporcionam, juntamente com
as medidas de posiyao e de dispersao, a descriyao e compreensao completas
da distribuiyao de freqilencias estudada.

Como ja foi dito anteriormente, as distribuiyoes de freqilencias nao


diferem apenas quanto ao valor medio e a variabilidade, como tambem
quanto a sua forma. Do ponto de vista desse ultimo aspecto, as caracteristicas
mais importantes sao o grau de defonnayao ou assimetria e o grau de
achatamento ou afilamento da curva de freqilencias ou do histograma. Para
estudar as medidas de assimetria e curtose, e necessario o conhecimenfo
de certas quantidades conhecidas como momentos.

6.2. MOMENTOS
Os momentos podem ser caracterii.ados como quantidades numericas,
calculadas a partir de uma distribuiyao de freqilencias (ou de probabilidades),
e que sao utilii.adas para fornecer descriyoes resumidas da distribuiyao estu­
dada. Dentro da ampla classe dos momentos estao inclufdas duas importantes
medidas estudadas anteriormente: a media e a variiincia.

Como vemos, a noyao de momento e generica e abrange igualmente


aquelas duas medidas. Apenas nos as tratamos. separadamente devido a sua
grande importancia no contexto da Estatistica Descritiva.

6.2.1. Momento Natural (Absoluto) de Ordem r

Sfmbolo: m; onde r e um numero inteiro positivo.

0 momento natural de ordem r de um conjunto de niJmeros e definido


da seguinte forma: 227
a) Para Dados. Brutos

x � +x r + +x�
I
= =---
. . .

mr
n n
(1)

b) Para Dados Tabelados


k
I xffi
/=1
m, =
I

n
(2)

Quando os valores estiverem agrupados em classes x1 serao os pontos


medios de classe.

Exemplo 1:

Calcular os momentos naturais de primeira, segunda, terceira e quarta


ordens do conjunto de numeros x = {2, 3, 5, 7, 8}.
Recorramos a tabela auxiliar 6.1 para realizar OS cfilculos:

TABELA6.1.
(r =1) (r= 2) (r = 3) (r-= 4)
x; x; 2
x�
I
x;
4

2 4 8 16
3 9 27 81
5 25 125 625
7 49 343 2.401
8 64 512 4.096
s 5 5 5
I x;= 25 Ixf = 151 Ixl =1.015 Ixt=1.219
i=l i=l i=l i=l

Momento natural de primeira ordem (ou primeiro momento natural)


5
Ix;
= � = 2+3+5+7+8 =�=5
5 5 5
Notar que o momento natural de primeira ordem e a pr6pria media
aritmetica, ou

228
Momento natural de segunda ordem (segundo momento natural)
n
L,xr
I
m =-- - =
i=1
x2 + x2 +
1 2 x32 + x42 + x2 5
=
2 n 5

4 + 9 + 25 + 49 + 64
= =
5

= ;
1 1
=30,2
I m = 30,2
� I
Momento natural de terceira ordem (terceiro momento natural)
n

L,xr
=
i=l
--- =
x� + xi + xt + x! + xf =
n 5

2 3 + 33 + 53 + 73 + 83 8 + 27 + 125 + 343 + 512


= =
5 5

=
l. 15
� =203 I m� =203
I
Momento natural de quarta ordem (quarto momento natural)
n

L, xt
=---=
i=1 x� + xi + xj + x: + x: =
n 5

2 4 + 34 + 54 + 74 + 84
=
5
16 + 81 + 625 + 2.401 + 4.096 7.219
= -- =1.443,8
5 5

I
...... - - - - - -- __,
m� =1.443 .8

Exemplo.2:

Calcular o momento natural de primeira, segunda, terceira e quarta


ordens da seguinte distribui\:ao de freqi.iencias:
TABELA 6.2

Classes 'i •
j Xjfj
I /
" 'i j
x fi x fi/
1 II I
10 f---2 0 2 15 30 450 I 6.750 101.250
20 f---30 4 25 100· 2.500 I 62.500 1.562.600
30 f---40 5 I 35 175 6.125 I 214.375 7.5031125
40 f---50 8 45 360 I 16.200 I 729.000 I 32.805.000
50 f---60 5 55 27.5 I 15.125 I 831.875 I 45.753.125

?,
I
60 f---70 4 65 260 16.900 1.098.500 71.402.500

I' /
70 f---80 2 75 150 11.250 843.750 63.281.250
7 7 7

L 'i=30 xjfj=1.350 ?x ti=68.550 L x/'i 3.1ss.1so L x/'i 222.4os.1su


229
= =

j=l /=:1 /"'I j= i·-1


J -
Momento natural de primeira ordem: r = 1
7

Ixjt;
j=l
mi = �-n-- m�
I 1.350
= = 45 = 45
30

Momento natural de segunda ordem: r = 2


7

Ix/1;
j=l -
- -� - m�
68.550
m2I _

n
_

2.285 = 2.285

Momento natural de terceira ordem: r = 3


7

Ixlt;
j=
1n
=
3.7
8�07 50
= 126.225 m� = 126.225

Momento natural de quarta ordem: r = 4


7

Ixlt;
m;· i=1 222 .4�� ·750 1 m;
n
= = = 7.413.625 = 7.413.625

6.2.2. Momento de Ordem r em Rela�o a uma Ori gem Qualquer x 0


Sfmbolo: xomr
0 momento de ordem r em relayao a origem arbitraria x0 e definido
da seguinte maneira:
a) Para Dados Brutos
n

L (xi - xoY
i=l
n (3)

b) Para Dados Tabulados

k
L (Xj xoff;
j= l
-

xomr =
_______
n
(4)

Exemplo 3:
Considerando x0 4, calcular os momentos de primeira e segunda
x = {2, 3, 5, 7, 8} em relayao aquela origem.
=

230 ordens do conjunto


TABELA6,3

4
t 2
x; Ix; - xol Ix; - xol

2 2-4=-2 (-2) =4
2
3 3-4=-1 ( 1 1 2 =1
-

5 5-4=1
2
1 =1
7 7-4=3
2
3 =9
8 8-4=4
2
4 =16

'E.x; =25 'E.(x; - 4) = 5 l;(x/ - 41


2 = 31

Recorrendo a f6rrnula (3 ), obteremos o


Momento de primeira ordem em relaylio a origem x0 = 4; r = I
'f.(Xi - 4)1
=
5
(- 2) + (-I) + I + 3 + 4
= = I
5
e o Momento de segunda ordem em relayao A origem x0 4; r = 2 =

'f.(Xj- 4) 2 2+(-1)2+12+ 32+42


- (-2) -

5 5

4+I+I +9 + 6 1
= = B_ = 6 '2
5 5
Exemplo 4:
Dada a tabela abaixo, calcular os momentos de primeira, segunda e
terceira ordens em relayao a origem x 0 = 40:
TABELA 6.4

Claa.1 fj (Xj-Xg) lxj-xoifj lxj-xol'fj lxj-xol'fj


"i
10t---- 20 2 15 15-40= -25 -50 1.250 -31.250

20t---- 30 4 25 25-40=-15 -60 900 -13.500

30t---- 40 5 35 35-40= -5 -25 125 -625

40t---- 50 8 45 45-40= 5 40 200 1.000

50 I-- 60 6 55 55-40=15 75 1.126 16.876

601-- 70 4 65 65-40=25 100 2.500 62.500

70 I-- 80 2 75 75-40=35 70 2.450 86.750

I:fj=30 2: (Xj - 401fj= 160 I:<xj-4012fj= 8.560 2:(xj-4013fj= 120.760

231
Neste, utilizaremos a f6rmula (4):

Momento de primeira ordem em rela9ao a origem x0 = 40; r = 1


7

I (x; - 40)ff
j=l 150
40 m1 = -=--------= - = 5
30 30

Momento de segunda ordem em rela9ao a origem x0 = 40; r = 2


7

I (x; - 40)21J
j=l 8 550
40m2 = ------= ____:___ = 285
30 30
Momento de terceira ordem em rela9ao a origem x0 = 40; r = 3
7

I (x; - 40)3f/
;=1
n
=
1
2��5 0
=4.025

Observa�ao:

Parece claro que, se fizermos x0 = 0, o momento em rela9ao a origem


seni igual ao momento natural.

0m, =
�(xi - of =
---- �x!' = m;
1 para dados brutos
n n
e

omr =
�(x; - O)'fj - �x/fj - m' para dados Tabulados.
n - n - '
6.2.3. Momento Centrado na M6dia de Ordem r

Simbolo: m ,

0 momento de ordem r centrado na media x e definido fazendo


x0 = � nas formulas (3) e (4) apresentadas no item anterior:

a) Para Dados Brntos


n

I (xi - x)
'
i=l
m, = (S)
----
n --
b ) Para Dados Tabulados
k

I (x; - x)'fj
j=l
m, = -'-- (6)
232 ---
n --
E facil perceber que, para r = 2, o momento centrado corresponde a
variancia de distribui\!ao.

Assim, fazendo r =
2,
para dados brutos

�(x; - x)2
m, = = s2
n

Para dados tabulados,

�(x; - x)2f;
m, = = s2
n

Exemp/,o 5:
Calcular os momentos centrados na media, de primeira, segunda, ter­
ceira e quarta ordens do conjunto x = {2, 3, S, 7, 8}.
Temos, inicialmente:

�Xi 2 + 3 + 5 + 7 + 8
x= = =
�= S
n S 5

TABELA 6.5

x; x;-x (x;-xP (x;-xl3 (x;-xJ4

2 (2 -51=-3 (-312 =9 (-313 = -27 81


3 (3 -51=-2 (-212 =4 (-213= -8 16
5 (5 -51= 0 02 =O 03 =O 0
7 (7 -51 =2 22 =4 23 =8 16
8 (8-51=3 32 =9 33 =27 8r

s 5 5 s 5

:L x;=25 :L (x;-51=0 L (x;-xl2=26 L (x;-xl3=0 :Ltx;-xl4= 194


i=l i=l i=l i=l i=l

Momento centrado de primeira ordem

�(x; - x) o
m1 = = -= 0 ==> m1 = 0
n 5

Momento centrado de segunda ordem (variancia)

�(x; - x)2 26
m = = 5 = 5,2 ==> m = 5,2
2 n 2
233
Momento centrado de terceira ordem

l:(x; - x)3 0
m3 = n = = 0 >
5
Momento centrado de quarta ordem
4
l:(x; - x) 194
m4 = n = -- = 38,8 > m4 = 38,8
5

Notar que os momentos centrados de primeira ordem sa-o sempre nulos.

m1 = 0

Exemplo 6:
Usando os dados da distribuiyll'o de freqtiencias do exemplo 4, calcular
os quatro prirneiros momentos centrados. Usando uma tabela auxiliar, temos:

TABELA 6.6

3 4
Class.s f; Xj Xjfj (xj - X)fj fx; - xPt; fJ(j - XJ fj fx; - XJ fj

10 t-- 20 15 30 1-JOJ x 2=-60 1.800 -54.000 1.620.000

20 t-- JO 4 25 1tlO 1-20) x 4=-80 1.600 -32.000 640.000

30 t-- 40 5 35 175 l-10IX5=·-50 500 -5.000 50.000

40 1--- 50 45 360 OX8=0 0 0

50 t-- 60 55 275 10 x 5 = 50 500 5.000 50.000

60 t-- 70 65 260 20X4=80 1.600 32.000 640.000

70 f-- 80 75 150 30X2=60 1.800 54.000 1.620.000

2 3
n=30 'f.xjfj=1.350 Eix;-451f;=O Elx;-451 f;= 7.800 'ilx1-�) fj = 0 EIXf- xl4f;=4.620.ooo

x = "'E.xifi
n = 1.350
= 45 x = 45
30
·

Momento centrado de prirneua ordem:


k

L (x i - x)ft
j=l 0
m1 = -'---- n--- = _3_0_ = 0 =>

Momento centrado de segunda ordem (variancia):


k
2
L (x i - x) fi
m2 = ..:..i_=_
1 _____
n = 7 ·:: = 260 > m2 = 260 I
234
Momento centrado de terceira ordem:

L (x; - x)3f;
k

j=t 0
m3 =

n = 30 = 0 m3 = 0

Momento centrado de quarta ordem:


k
L (x; - x)4f;
j= t 4.620.000
m4 �--
=
-n --- =

30 =
154.000

I m4 154.ooo
6.2.4. Rela�o Geral entre os Momentos Centrados na Media
e os Momentos Naturais

E possivel determinar os momentos centrados na media a partir dos


momentos naturais (hem como a partir dos momentos centrados em rela�o
a uma origem arbitniria x0). Para chegarmos a relayao geral entre tais
momentos, partiremos da expressao (6):
k
L (x; - x)'t;
j= l
m, =
_,______ _ n
Desenvolvendo o segundo membro de 6,

_�.. [Xjr (r)Xjr-t(X-) (r) Xjr-2(-)2


mr n1 f... lX - + +
2
• • •
- -

J= l

+ (-I)s(:)x;-s(x)s + ... + ( l) r-1(r�1)x1(x)'-1


- +

+ (-1)'(x)'] t;
onde s <re

r
( :) =

(r � s)!
s!
= coeficiente binomial

OU
m; m� m;_1
.i. .i. +
x
'T. f-f; - x ;-11; 'J:. x
n (1) n
r
m,---_
-

235
+ (- l)r-1 ( \ (.x )r-1 'kxjfj + ( - l)'(x )'-
r
r- 1 ) n
1-· /
:J:,f{
-It"
n

.j. .j. .j.


1
(m�y- m: (m:Y
ou, ainda,

+ (- l)�:) cm;) • m;_s + ... +


s
(7)

1
+ (- l)r- ( � ) (m�)'- m� + (- l)'(m�)'
1 ,
1

Como nos problemas corriqueiros temos necessidade no maximo de


momentos ate quarta ordem, apresentaremos os casos particulares de relayao
entre os momentos centrados na media e os naturais ate essa ordem:

(m�=1)
r
Para r=1 => ( )m1
m1 =m1, -
1
1
, • m1, - 1 =m; - m;-= 0

Parar= 2 ==> m2=m� - (i)m: • m�-1 + (;)(m;)2m�-2


=m� - 2(m;)2 + (m;)2=m� - (m;)2
Parar=3 => m3=m3, - ( )m1•m3-1 ( 2) m1')2m3-, 2
3
1
, , +
3
(

- ( ) m1')3m3-3 =m3 -
3
3
< , + 3(m1')2m1, - , 3 m1m2
, ,

3
- (m;)3 =mi - 3m;m� + 3(m;}3 - (m;} =
3
=mi - 3m;m� + 2(m;)
Para r=4 ==> m4=m� - ( i)m:m�-1 + ( �)(m;)2m�-2
- (�)(m;)3m�-3 + (!)m;)4m�-4 =

3
=m� - 4m; ·mi+ 6(m;)2m� - 4(m;} •m; +
236 + (m;)4=m� - 4m;•mi+ 6(m;)2� - 3(m;) 4
Em resumo,

r m,

1 m1 = 0
2 m2 = m2, - (m1')2
(8)
3 m3 = m� - 3 m;m� + 2(mD3
4 m4 = m� - 4 m; m� + 6(m�)2m� - 3(m�)4

Exemplo 7:

Usando os dados do exemplo 2, calcular os seguintes momentos:


m1, m2, m3 e m4.
No exemplo 2, foram calculados os quatro primeiros momentos na­
turais cujos resultados sao:

m� = 45 m� = 2.285 m� = 126.225 m� = 7.413.625


Levando esses resultados nas express5es indicadas acima,

m1 = 45 - 45 0 =

m2 = m� - (mD2 2.285 - (45)2 2.285 - 2.045 260


= = =

m3 = m� - 3m;m� + 2(m;)3 126.225 - 3. 45 2.285 +


= •

+ 2(45)3 126.225 - 308.475 + 182.250 0


= =

m4 = m� - 4m;m� + 6(m;)2m� - 3(mD4 7.413.625 - =

- 4 45 126.225 + 6 (45)2 2.285 - 3 (45)4


• • • • • =

= 7.413.625 - 22.720.500 + 27.762.750 - 12.301.875 =

= 154.000

I m1 = 0 I I m2 = 260 I I m3 = 0 I I m4 = 154.000
Esses resultados podem ser confrontados com os valores obtidos no
exemplo 6.
6.2.5. Relat;io entre Momentos Centrados na Mlkiia e Momentos
Centrados em uma Origem Arbitraria x0
Da mesma forma como no caso anterior, e possivel estabelecer rela�oes
entre m, e x0m,. Apresentaremos apenas as express5es dos quatro primeiros
momentos e as rela�oes serao desenvolvidas a partir das formulas para dados
agrupados em classes. As formulas (4) e (6) estabelecem

k k
L (x1 - Xo)'fj L (x1 - x)'fj
j =I j=I
xomr e m, 237
n
= =

n
onde x; representa um ponto medio de classe generico.

Fa\:amos, para simplificar, x; - x0 = D;. Assim, podemos escrever

LDffj
j=I
xomr = n
Essa expressao representa, em ultima analise, a media aritmetica pon­
derada das r-esimas potencias dos desvios D; = x; - x0 , ou, mais simples­
mente:

(9)

Dessa forma,

Para r = I > x0m1 = l5


r = 2 > xom2 = fj2
3 -
r = 3 > x0m3 = D
-4
r = 4 > x0m4 = D
Vejamos agora como relacionar os momentos centrados na media com
os centrados em uma origem arbitraria x0•
a) Para
"i:.(x; - x)fj
r = I > m1 = = 0 (primeira propriedade
n
da media)
b) Demonstrafiio para r = 2
Como se sabe, D; = Xj - x0 ou x; = D; + x0

Multiplicando por fj
x;fj = (D; + Xo )fj = D;f + Xofj

Aplicando "i:.,

"i:.x;fj = "i:.D;f; + "i:.xof; = "i:.D;fj + Xo "i:.fj

Dividindo por
. "i:.f = n,
---n
'J:,x·J;· "i:.D·J; ·
_ _I _I
= _/ /
_
+ Xo
_ :£fr -- OU X = 15 + Xo
n n ..n-

ou ainda

(x; - x) = x; - (l5 + x0) = x; - xo - 15 = (D; - 15)



D;
238
Nestas condi«;oes,

L (xi- x)2 ii L (Di- l5)2 ii


k k

j=l -n--- j=l n


m2 =�- = =

-n ["LD·2 �ifir "L�/fj - L�ii 2


=
l
I
/,· -
I ( ) =

.i. .i.
OU

(10)

c) Demonstra¢o para = r 3

L (Dj - D)3 ii
k

m3 = j=l n = [LD/fj - 3DLDi2 ii l


n +

3(l5)2r.Diii - (f5)3Lfj]
LD�J;· - 3LD·J;· LD?-J;. 3 LD·J;- LD·J;i 3
+ =

n ,_I
n n ( nD 3 Q n )
__, , I I + _0 ,_, ,

= n ii - n jii n fj 2 ("£, n jfj


"f.D/ 3 LD "f.Dj
= _
_ _ • ___
- __
_ _ :0::


+ OU

(11)

Demonstra¢o para
-
d)

L D - D 4
4

( j n ) fj [LD/ii4 - 4D"f.
r =

m4 - Djf;3 6(D-)2"i,D2iii -
n
l

- 4(l5)3"f.Difi (D)4'f-ii]
= = +

"i,D�J;1- 1· - 4 -- "i,D·J;· LD�fi LD·J;· 2 "LD°?-J;·


+ =

-- n ( n -1 1) (--n 1-)1 6 (-n -1 1 ) n 1 1


_

=
+

--n -1 J;-1 )3 (LD·n J;·) ("f.nD·J;·)4


- 4 ("LD· •
__
_ , ,
+
__
_
, ,
239
2
m4=x0m4 - 4(x0m1)(x0m3) + 6(x0m1) (x0m2) -
(12)
4
- 3(x0m1)

Exemplo 8:

Calcular os quatro primeiros momentos centrados na media, a partir


dos momentos centrados em rela\:iio a origem x0 = 40, com os dados dos
exemplos 4 e 6.

De acordo com os resultados dos exemplos 4 e 6, temos:

m1=0 40m1=5
m2 =260 40m2= 285
m3= 0 40m3= 4.025
m4 =154.000 40 m4 =193.625

Confirmaremos tais resultados atraves das formulas demonstradas


acima:

a) Momento centrado de primeira ordem: m1

m1 = 0

b) Momento centrado de segunda ordem: m2

2 2
m2 =40m2 -- (40m1) = 285 - 5 = 260

c) Momento centrado de terceira ordem: m3


3
m3 =40m3 - 3(40m1)(40m2) + 2 (40m1) =
3
=4.025 - 3(5)( 285) + 2 (5) =

= 4.025 - 4.275 + 250=0

d) Momento centrado de quarta ordem: m4


2 4
m4 =40m4 - 4(40mi)(40m3) + 6(40m1) (40m2) - 3 (40m1) =
2 4
=193.625 - 4 5 4.025 + 6• 5 • 285 3 5 = • • - •

=193.625 - 80.500 + 42.750 - 1.875=154.000

m4=154.000
0 resultado seguinte nao foi ainda calculado.
_ '1:.(Xj -40)4/j _

40m4- n
-

4 4
l<-25) • 21 + l<-15) .41 + [(-5)4.51 + [(5)2.81+[(15)2.51 + [(25)2.41 + [(35)2 .21=
30

781.250 + 202.500 + 3.125 + 5.000 + 253.125 + 1.562.500 + 3.001.250


30

5.808.750
193.625
240
= = .
30
6.2.6. Processo Breve para o Calculo dos Momentos

Os momentos podem ser calculados atraves do processo breve (ou


metodo abreviado), o qual parte dos mesmos principios que aqueles ja
apresentados para a media e para 0 desvio-padrao (OU variancia ) . Como 0
leitor deve recordar-se, o processo breve e desenvolvido com o recurso da
j
variavel transformada d ,tambem chamada de Msvio reduzido, cuja defini-rao
e, para dados agrupados em classes:
, Xj - Xo
di= �-­c
onde Xj = ponto medio de classe generico;
x0 = constante arbitraria, geralmente escolhida como o ponto
medio de classe de maior freqtiencia;
c =amplitude do intervalo de classe.
Para apresentar as formulas que deverao ser usadas no calculo dos
momentos atraves do processo breve, recorreremos a um exemplo, o que
facilitara a demonstra-rao e a comprova-rao dos resultados.
Exemp/o 9:
A Tabela 6. 7 fornece os dados relativos ao quociente de inteligencia de
480 alunos de determinada escola. Calcular as seguintes quantidades:
'
a) 94m1 i) m 1

j)
'
b) 94m2 m 2
'
c) 94m3 k) m 3
'
d) 94m4 I) m 4

TABELA 6.7

Quociente de Numero de
Inteliglincia Estudantes

681--- 72 4
12r-- 76 9
761--- 80 16
801--- 84 28
84r-- 88 45
881-'--- 92 66
921--- 96 85
961--- 100 72
100 I-- 104 54
1041--- 108 38
1081---112 27
112 r--116 18
1161--- 120, 11
120 I-- 124 5
124 l-'---128 2
n = 480

241
Utilizaremos, para n calculos necessarios, a Tabela 6.8 auxiliar.

TABELA6.8

, Xj-94
Xj fj di = - - df j dj2 fj d/ ti dj4fi
4 '

70 4 -6 -24 144 -864 5.184


74 9 -5. -45 225 -1.125 5.625
78 16 -4 -64 256 -1.024 4.096
82 28 -3 -84 252 -756 2.268
86 45 .... 2 -90 180 -360 720
90 66 -1 -66 66 -66 66
94 85 0 0 0 0 0
98 72 1 72 72 72 72
102 54 2 108 216 432 864
106 38 3 114 342 1.026 3.078
110 27 4 108 432 1.728 6.912
114 18 5 90 450 2.250 11.250
118 11 6 66 396 2.376 14.256
122 5 7 35 245 1.715 12.005
126 2 8 16 128 1.024 8.192

15

L fj=n=480 �df j=236 �dj2 fj=3.404


'
�d j3 ti =6.428 �dj4fj=14.588
j=I

I - Oilculo dos momentos centrados na origem Xo = 94.


Antes de procederrnos aos calculos, devemos lembrar que
Xj - Xo Xj 94
di,
-

ou seja,
=
c =
4

x0 = 94 (media arbitraria)
c = 4 (ponto medio de classe).
Os momentos centrados em rela¢o a origem x0 apresentam a seguinte
propriedade:

'f.dj'fj
o mr = c
. r
(13)
x
-n-
= Xj - Xo
onde dj c Xj

�[� -..xol'fj
n =
n
�(cdj)'fj c'�dj'fj
c 'f.dj'.-
, -- fj
242
=
n =
n n=
Em particular,
3
'l;djf;
-- 3 'l;dj f;
Xomt = c n x0m3 = c n
2 4
2- 'l;dj f; 4 'l; dj f;
c - c - - -
xom2 =
n xom4 =
n
No problema em questio, teremos, de acordo com os valores cons­
tantes da tabela 8:

'l;d'fi
94m1 = 4 _J_j_ =
480
4
X
236
480
= 1 ' 9667 I. 94m1 = 1,9667
2
2 'l;dj
f; 16 x 3-404
94m2 = 4 • "480 = . = 113,4667
480

I 94m2 = 113,4667 I
3
3 'l;d! Ii 64 x 6.428
94m 3 = 4 • � =
480
= 857,0667

I94m3 = 857,0667 I
4
4 'l;dj f; 256 x 74.588
94m4 = 4 � • = = 39.780,2667
480

I 94m4 = 39.780,2667 I
II - Cdlculo dos momentos centrados na media.
Neste caso, recorreremos as identidades 10, 11 e 12.
Momento de primeira ordem centrado na media: m1

'l;(x; - x)f;
mi = = ..!_ ( 2-:xfi· - 'l;x"·
11 ) = l..(2-:x;f; - x2-:f;)
n n II n .._..,
=

'l;x;f; xJ( n
= -- --=x -x=O
n J(
_

m1 = 0
_

I
,
Momento de segunda ordem centrado na media: m2

Tomemos a rela?o 10
2
m2 = x0m2 - (x0m1)
No problema em questao:

2
m2 = 94m2 - (94mi) = 113,4667 - { l,9667)2 = 109,5988

I m2 = 109,5988 I
Momento de terceira ordem centrado na media: m3 243
{11),
Devemos ter agora, conforme expressao
= 3
m3 xom3 - 3(xom1)(xom2 ) + 2(xom=1)
=857,0667 - 3(1,9667)(113,4667) + 2(1,9667)
= 3 202,8158

=
m3 202,8158 I
Momento de quarta ordem centrado na media: m4
12 nos da
A relayao
4
m4 x0m4 - 4(x0m1Hx0m3) + 6(x0m1)2(x0m2 ) - 3(x0m1) ""
=
=39.780,2667 - 4{1,9667)(113,4667) +
4
+ 6(1,9667)2(113,4667) - 3(1,9667) = 35.627,2853

=
m4 35.627,2853 I
III - Cdlculo dos momn
t
e osn
atu
r
ais
Da mesma forma como fizemos para os momentos centrados numa
origem arbitraria Xo, podemos utilizar 0 metodo abreviado para 0 calculo
dos momentos naturais.
'Partiremos da relayiio
x· - x0
=
d} / =desvio reduzido,
c
de onde tiramos =Xj cdj +. x0
Assim,

. m' = LxJfj = L(cdj + x0)'fj


r
n n

Parr
=
a l

L(cdj + x0)fj CLdjfj + Xo L/j Ldjfj


=
m� = =c + Xo
n n n
Ld/fi -,
=Xo + c =x0. + cd
n
--

=
m� x0 + cd' {14)

r
=2
Para

, L(cdj + xo)2fj 1
=
m"l =n [LC2dj2fj + 2cXoLd}fj + Xo2Lfj] ::::
n
Ldj2fj Ldjfj
=c-
2 - + 2cxo
n
+ xl
244 n
d 2ii
m2I
=
'i:.djfj
Xo2 + 2cxo-- + c2 'i:. nj
--·-
(15)
n

Parar=3

'i:.(cdI! + x0 )3/iI· 1 [r, 3 ' 31'.


m3I -
-
n
-

- n C dj Jj + 3C2Xo "'f. dj'21'.


Jj +
+ 3cx02 'i:.djfj + xJ'i:.ii]

Para r = 4
4
, _ 'i:.(cdj + xo> ii 1 [ 4 14 3 13
m4 - = . c "'f.di f; + 4c x0'i:.dj ii +
n n

+ 6c2 x'6r.dj2ii + 4cxgr.dfii + x:r.ii]

1 14 (17)
3 'i:. dj 3f; 4 'i:.dj ii
+ 4c x0 -- + c --
n n

Em termos do problema:
Momento natural de primeira ordem: m; para x0 = 94 e c = 4
Basta recorrer agora aos dados expostos na Tabela 8.
m; = 94 + 4 8 36:i = 95,9667 m; = 95,9667
Momento natural de segunda ordem: m;
236 + 42 X 3·404
m2' = (94)2 + 2 X 4 X 94 X
480 =
480
= 8.836 + 369,7333 + 113,4667 = 9.319,2
m; = 9.319,2 I
Momento natural de terceira ordem

36
m3I = (94)3 + 3 X 4 x (94)2 x 2480 + 3 X 42 X 94 x 3 .4o4
480 +

+ 43 x 64��8 =
245
= 830.584 + 52.132,4 + 31.997,6 + 857,0667 = 915.571,06

m� = 915.571,06 I
Momento natural de quarta ordem
4 236 3·404 +
m 4I = 94 4 x 4 X 943 x 480 + 6 x 42 x 942 x 480
+

+ 4 x 43 x 94 x
6.428 4 x 74.588
480 + 4
=

480
= 78.074.896 + 6.533.927,3 + 6.015.548,4 + 322.257,06 +
+ 39.780,27 = 90.986.409
I I
.
m4I = 90.986.409
_ _

0 leitor podera comparar os resultados acima calculando os momentos


centrados na media a partir desses momentos naturais, utilizando as ex­
pressoes (8). Os resultados deverao ser pr6ximos dos seguintes ja calculados
nesse exemplo (as pequenas diferen9as, porventura existentes, deverao ser
resultantes de arredondamentos):

m1 = 0
m2 = 109,6
m3 = 202,8
m4 = 35.627,3
6.2.7. Controle de Charlier e Corre�o de Sheppard para os Momentos

a) Controle de Charlier
0 controle de Charlier, apresentado no capitulo precedente, pode ser
generalizado a todos os momentos, sendo de grande utilidade no processo
breve de determinac;:ao dessas quantidades, quando os dados vierem dispostos
em tabelas de freqiiencias. 0 controle proposto por Charlier recorre as
seguintes identidades:

I;(dj + l)f; = I;djfj + n �I;f;


I;(dj + 1)2!; = I;dj2fi + 2"'Edffj + n
(18)
"'E(dj + 1)3!; = I;dj3f; + 3I;dj2fj + 3I;djfj + n
4
"'E(dj + 1)4!; = "'Ed} fj + 4"'Edj3fj + 6"'£dj2fj + 4"'Edjfj + n

Exemplo 10:

Com os dados do problema 9, utilizar o controle de Charlier para


comprovar os calculos daquele problema.

A Tabela 6.8 fornece os seguintes valores, os quais deverlfo ser utili-


246 zados no desenvolvimento do controle de Charlier:
n = "T.,f; = 480
"T., dffj = 236
"l:,,dj2fj = 3.404
"T.,dJ3fj = 6.428 e

"l:,,dJ4fj = 74.588.
A Tabela 6.9 apresenta as demais quantidades necessarias para se
processar o controle. As tres primeiras colunas foram repetidas por conve­
niencia apenas.
TABELA6.9

Xj t; d:
I
dj+ 1 ldj+ 11f; ldj + 1Pt; ldj + 1i3r; ldj+ 114f 1

70 4 -6 -5 -20 100 - 500 2.500


74 9 -5 -4 -36 144 -576 2.304
78 16 -4 -3. -48 144 -432 1.296
82 28 -3 -2 -56 112 -224 448
45 -2 -1 -45 45 -45 45

90 66 -1 0 0 0 0 0
94 85 0 1 85 85 85 85
98 72 1 2 144 288 576 1.162
102 54 2 3 162 486 1.458 4.374
106 38 3 4 152 608 2.432 3.728
110 27 4 5 135 675 3.375 16.875
114 18 5 6 108 648 3.888 23.328
118 11 6 7 77 539 3.773 26.411
122 5 7 8 40 320 2.560 20.480
126 2 8 9 18 162 1.458 13.122

n=_T.f;=480 T.V:tf+11f;=716 'I:, V:tf+1l2f;= 4.356 T.V:tj + 1l3f1=17.828 T.Vif +114f;= 122.148

}";(dj + l)f; 716 e (r.dffj + n) == 236 + 480 == 716


==

r.(dj + 1)2!; == 4.356 e ("T.,dJ2fj + 2"J;djfj + ) = n

== 3.404 + (2 x 236) + 480 = 4.356


"J;(dj + 1)3!; == 17.828 e ("J;dj3fj + 3"J;dj2fj + 3"J;djfj + n) ==
== 6.428 + (3 x 3.404) + (3 x 236) + 480 17.828 ==

"J;(dj + 1)4!; == 122.148 e ("T.,dJ4fj + 4"kdj3fj + 6"kdj2fj +


+ 4"kdjfj + ) 74.588 + (4 X 6.428) +
n ==

+ (6 x 3.404) + (4 x 236) + 480 122.148 ==

Esses resultados perrnitem afirmar que os caJ.culos dos valores cons­


tantes da Tabela 8 estao corretos.

b) Co"effio de Sheppard para os Momentos


Os momentos centrados sao corrigidos atraves das seguintes express6es,
onde c == amplitude do intervalo de classe: 247
Var!iincia corrigida (momento centrado de segunda ordem corrigido)

m2 (corrigido)=m2 - /2 c2 (19)

.---O
-- U ------1

1 2
s2 (corrigido)=s2 - TI c

Momento centrado de quarta ordem corrigido

c2m 2 7c
4
m4 (corrigido)=m4 - - - + (20)
2 240

onde m2=s •
2

Observa�o: os momentos de primeira e terceira ordem nao sao corrigidos.


Exemp/o 11:

Usando OS dados do problema 9, corrigir, pelo metodo de Sheppard OS


momentos centrados (na media) de segunda e quarta ordens.
Os momentos centrados na media, de segunda e quarta ordens, obtidos
no exemplo 9, sao:

m2 = 109,5988 m4 = 35.627,2853 e c=4


Assim,
2 42
a) m2 (corrigido)=m 2 - TI= 109,5988 - TI= 108,2655

I m2 (corrigido)= 108,2655 I
4
c2 2 7c
b) m4 (corrigido)=m4 - ; + 240
=
4
42 x 109,5988 7 x 4
= 35.627,2853 - + =
2 �
= 34.757,9616

m4 (corrigido)= 34.757,9616

Observa�o: Quando os momentos se referirem a popula�ao, ao inves de


serem simbolizados por m serao pela letra grega µ (pronuncia-se mi). Assim,

µ;=momento natural de ordem r para a popula�ao;

xoµ;= momento de ordem r em rela�ao a origem arbitraria x0;

248 µ,= momento de ordem r centrado da media.


Na populayao,

µ: OU simplesmente µ representa a media (momento natural de primeira


ordem);
µ� ou a2 (sigma) designa a variancia (momento centrado de segunda
ordem).
6.3. MEDIDAS DE ASSIMETRIA OU DE ENVIESAMENTO

Assimetria, como o pr6prio nome insinua, significa desvio ou afasta·


mento da simetria. Em outros termos, assimetria e o grau de deformayao
de uma curva de freqiiencias (polfgono polido).

Quanto ao grau de deformayao ou assimetria, podemos ter tres tipos


de curvas de freqiiencia:

a) Curva Simetrica ou Dis tribuifffo Simetrica


Uma distribuiyao de freqiiencias simetrica apresenta como caracteris­
tica principal o fato de as tres medidas de tendencia central mais usadas -
moda, media aritmetica e mediana - serem iguais. Em termos graficos, a
curva de freqiiencias apresentara as duas caldas com a mesma configurayao
(Grafico 6.1).

GRAFICO 6.1 - CURVA DE i=REQU£NCIAS SIMETRICA,


SEM DEFORMACAO

x=Md=Mo j (21}

er x=Md=Mo Xj

b) Curva ou Distribuifffo de Frequencias As simetrica Positiva ou


Desviada (Deformada) a Direita

Toda distribuiyao deformada e sempre assimetrica. Entretanto, a assi­


metria pode dar-se na cauda esquerda ou na direita da curva de freqiiencias.

Uma distribuiyao com deformayao positiva se apresenta com uma


cauda mais alongada a direita da ordenada maxima (ordenada correspondente
a moda) do que a esquerda. 0 Grafico 6.2 ilustra melhor. 249
Nas distribui�oos assimetricas a direita, ha uma predominancia de
valores superiores a moda. Os valores concentram-se na extremidade inferior
da escala. Nestas circunstancias podemos escrever: Mo <Md < x.

GRAFICO 6.2 - CURVA DE FREQUi!lNCIAS ASSIM�TRICA A DIREITA


(DEFORMACAO POSITIVAI

Mo <Md <x {22)

0 Mo Md x Xj

c) Curva ou Distribuifilo de Frequencias Assimetrica Negativa ou


Desviada (Deformada) d Esquerda
Nas distribui�oos assirnetricas negativas, predominam valores inferiores
a moda. Neste caso, a curva de freqiiencias apresenta uma cauda mais longe a
esquerda do que a direita da ordenada maxima. Nas distribui�OeS com
assimetria negativa, a media aritmetica e menor que a mediana, e esta e
menor que a moda, conforme pode ser observado no Grafico 6.3.

GRAFICO 6.3 - CURVA DE FREQUi!lNCIAS ASSIM�TRICA A ESQUERDA


(DEFORMACAO NEGATIVAI

0 x Md Mo

x <Md <Mo I (23)

250
Notas:

1. As distribui9oes de quocientes costumam apresentar deforma9lfo positiva,


o que parece ser razoavel se tivermos presente que um quociente nao
pode ser menor que zero e pode chegar a um valor positivo muito grande.
lgualmente, as caracteristicas que se compoem de varios fatores multi­
plicativos podem apresentar assimetria positiva.

2. A deforma9ao a esquerda nao e Corrente, alem de nao ser facil relacionar


suas possiveis causas.

Para avaliar o grau de assimetria de uma distribui9ao, ou seja, a inten­


sidade relativa com que uma curva de freqiiencias se desvia da simetria, sao
propostas diversas medidas, as quais serao examinadas a seguir.

Principais Medidas de Assimetria


6.3.1. Metodo de Comparaqio entre Medidas de Tendincia Central

Trata-se do metodo mais rudimentar, o qual nao permite estabelecer


ate que ponto a curva analisada se desvia da simetria. A comparayao e
bem simples:

x > Mo > Assimetria positiva


x = Mo > Simetria
x < Mo � Assimetria negativa

Exemplo 12:
Verificar o tipo de assimetria das distribui9oes de freqiiencias das
tabelas seguintes:
TABELA 6.10 TABELA 6.11 TABELA 612

Classes fj Classes fj Classes fj


101---20 5 10 l---20 5 101---2 0 5
201---30 10 201---30 10 201---30 20
301----40 15 301---40 15 301---40 15
401---50 20 401---50 10 401---50 10
501----60 5 501---60 5 501---60 5
55 45 55

Para os calculos necessarios, recorreremos as seguintes tabelas auxiliares:

TABELA 6.13
2
Classes fj Xj Xjfj Xj fj Fj
101--- 20 5 15 75 1.125 6
201--- 30 10 25 250 6.250 16
301--- 40 15 35 525 18.375 30
401--- 50 20 45 900 40.500 50
501--- 60 5 55 275 15.125 55
2
n = 55 'E.Xjfj = 2.025 'E.Xj fj = 81.375
251
TABELA 6.14

Classes fj Xj Xjfj Xj2fj Fj


10f--- 20 5 15 75 1.125 5

20f--- 30 10 25 250 6.250 15

30f--· 40 15 35 525 18.375 30

401--- 50 10 45 450 20.250 40

501---6 0 5 55 275 15.125 45

n = 45 "i:.Xjfj = 1.575 "i:.Xj2 fj = 61.125

TABELA 6.15

Classes fj Xj Xjfj Xj2fj Fj


10f--- 20 5 15 75 1.125 5

201--30 20 25 500 12.500 25

30f--- 40 15 35 525 18.375 40


401-- 50 10 45 450 20.250 50

501--60 5 55 275 15.125 55

n = 55 "i:.Xjfj = 1.825 "i:.Xj2fj = 67.375

Cdlculo das Medias "£x;fj 2.025


Da Tabela 6.13 ===.>' x= = = 36,82
n 55
- "£x;f I; 1.575
Da Tabela 6.14 x= = 35
45
--
n
- "£x;f; 1.825
Da Tabela 6.15 x = --I 55
= 33,18
n

Cdlculo das Modas (Metodo de Czuber)


fMo fant
Tabela 6.13>Mo=I + c F
-

Da
Vant + [,post) =
2JMo - {F .

20 - 15
= 40 + 10
(2 x 20) - (15 + 5) =

= 42,50
15 - 10
Da Tabela 6.14 > Mo = 30 + 10
(2 X 15) (10 + 10) = _

= 35
20 - 5
Da Tabela 6.15 ===>Mo= 20 + 10
(2 X 20) (5 + 15) = _

252 = 27,50
Temos, entlfo,

Primeira Distribuiylfo
x = 36,82 e Mo= 42,5 ===> x <Mo > Assimetria Nega-
tiva
Segunda Distribuiylfo
x = 35 e Mo= 35 x = Mo Simetria

Terceira Distribuiylfo
x = 33,18 e Mo= 27,5 x >Mo Assimetria Posi­
tiva
6.3.2. Coeficiente Hndice) de Pearson
Uma medida usada muito freqiientemente para avaliar o grau de
assimetria ou de deformaylfo de uma distribuiylfo e o coeficiente sugerido
por Karl Pearson, o qual se calcula mediante as expressoes:

a) Primeiro Coeficiente de Enviesamento (ou Assimetria) de Pearson


Sfmbolo: e1
Definiyao:

x -Mo
(24)
s

b) Segu,ndo Coeficiente de Assimetria de Pearson


Sfmbolo: e2
Definiylfo:
3(x - Md)
(25)
s

Observa�s:

1. Alguns autores preferem o s{mbolo Sk em lugar do sfmbolo e pa�a


designar a assimetria de uma distribuiylfo;S e k correspondem as primeiras
letras da palavra inglesa "skewness", traduzida por deformaylfo ou assi­
metria.

2. A expresslio 25 decorre da relaylfo empirica proposta por Pearson, apre­


sentada no Capitulo 4 (expresslfo 42):

(x - Mo)=== 3(x - Md)

Da expresslfo (24) tiramos, por substituiylio:


x - M0 ::: 3(x - Md)
s s
que e a formula (25) vista acima.
Como essas relay6es slfo aproximadas e nao exatas, somente quando a
distribuiylfo for simetrica elas se equivalerlfo. 253
A (24) tern o inconveniente de requerer a determina9lio previa da moda.
Tratando-se, entretanto, de distribui9oes que nao se apresentem com
forte assimetria, deve-se dar preferencia a expressao (25).
3. A expresslio (25) pode alcanyar um valor te6rico de ±3. Todavia, nao 6
comum o aparecimento de curvas de freqilencias com deforma9lio
superior a ± 1.

Exemplo 13:
Admitindo-se que numa distribui9lio de freqilencias x = 95, Md= 90
e s = 33,33, calcular o segundo coeficiente de Pearson e interpretar o
resultado.
3(x -Md) 3(95 - 90) 15
e2 =
+o.45
33,33 33 33
=

s '

j e2 =
0,45 ou 45% ===> Assimetria positiva

Exemplo 14:
Calcular o primeiro e o segundo coeficientes de Pearson para as distri­
bui90es de freqilencias do exemplo 12.
Os valores necessarios para determinar as medidas que comporlio o
coeficiente de Pearson ja se encontram calculados nas tabelas constru{das
na solu9ao do exemplo 12.

Stlgunda Oi6tribu!Po Terct1in1 Di1tribuifio

(Tabela 131 (Tabela 141 ITabela 151

ii = 'E.x ;fj = 2.025 =36'82 ii=


'E.x;f; = 1.5 75 = 35 ii=
'E.xjfj. = 1.8 25 =33' 18
· n 66 n 45 n 55

Mode (Czuborl

5
=4 2,5 0 Mo=30+ 101 =3 6 Mo =20+10 1 =27,50
Mo=40+ 10 1 X
2 2
��=1,1 5 + 51 2
x 1 1:,::::� o+ 101 2
x 2::;:=�5+ 151

.!!.-Fant
27,5 15 ,5 15 2 25
2
Md=!+ c- __ = 30+10 - = Md= 30+10 22 - =3 5 Md=30+10 7�; =31,67
15 15
fMd

=38.33

Ji Md Mo Md Mo Mo < Md < Assimet�ia


< < Assimetria X
i i i -+ Negativa i J. � Simetria .:, .i. -" _,.Positive
35 35 35 31,67
36,82 38,33 4 2,5 27,5 33,18

254
Determina�iio do Desvio-Padriio

Primeira Distribui?o Segunde Di1tribui�io Terceira Distribui?o

(Tabela 13) (Tabela 14) (Tabela 15)

s2 =
� [61.125 - (1 .:�5 12 ] = s2 =
� [67.375 - 11·��5'2] =

[81.375 -
(2.025)
55
2
] ....!...
54
= = 136,36 = 154,96

= 126,26 s = 11,68 s = 12,45

s = .j126,26 = 11,24

a) Cdlculo do Primeiro Coeficiente de Pearson


A formula 24 nos da
x - Mo
e1 = _____
s

Primeira Distribuii;io Segunda Distribuii;io Terceira Distribuii;io

36,82 - 42,50 35 - 35 33,18 -27,50


81 = = - 0'51 e1= � =0 81 = 046

11,24 12,45

Assimetria negativa Assimetria nula > Assimetria positiva


curva sim�trica

b) Cdlculo do Segundo Coeficiente de Pearson


A formula 25 nos da
3(.X - Md)
ez =
s

Primeira Distribuii;io Segunda Distribuii;io Terceira Distribuii;io

3 (36,82 - 38,33) 3 (35 - 35) .3 (33,18 - 31,67)


83 =
=

62 = = 82 = =0
11,24 11,68 12,45

=-0.40 =0,36

Assimetria negativa Assimetria nu la > Assimetria positiva

� simetria

Os primeiro e segundo coeficientes de Pearson difei:em em valor, mas


nao em sinal, como pode ser observado nos resultados apresentados nas
Tabelas 18 e 19. 255
6.3.3. Coeficiente Quartil de Assimetria
Sfmbolo: eQ
Outra medida de assimetria freqiientemente usada e o coeficiente
quartil de assimetria, que, em seu calculo, recorre aos tres quartis. Trata-se
de uma medida muito util quando nlro for possfvel empregar o desvio-padriio
como medida de dispersao, mas apenas alguma medida que dependa dos
quartis .
0 coeficiente quartil de assimetria e definido pela seguinte relayiio:

(Q3 - Md)- (Md - Qi)


eQ
(Q3 - Md) + (Md - Qi)
OU (26)
Q3 -2Md+ Qi
eQ =

Q3 - Qi

a qual revela que a assimetria e uma quantidade tomada como o quociente


entre a diferenya entre os afastamentos dos quartis e sua soma.
0 coeficiente quartil de assimetria assume valores entre os limites
+l e-1.
1..---- 1- �-e-Q-�-1
I
.......

Exemplo 15:
Calcular o coeficiente quartil de assimetria para as tres distribuiyoes
do exemplo 12.
A mediana (segundo quartil) das tres distribuiyoes ja foi calculada no
exemplo anterior:
Primeira distribuiyiio: Md = 38,33
Segunda distribuiyiio: Md = 35
Terceira distribuiyiio: Md = 31,67

Resta calcular os primeiro e segundo quartis:

Primeira Distribuit;io Ssgunda Distribuir;lo Terceira Distribuir;iio


n
4-Fant 11,25-5 = ,75 - 5
01 =l+c = o, =20+ 10 a, =20 + 10 13 =
'
a,
10 20

= 20+ 10 13•75 - 5 = 28'75 =26,25 = 24, 375


10
3n
4 -Fant 41,25-4 0
03 =/· + c 33,75 - 3 0 = 03 =40+10
'o
= Q3 = 40+10 10 10
=
,
4 ,25-30
=4 0+ 1 0 1 = = 43,75 = 41,25
20

256 =45,625
Determinemos agora o coeficiente quartil de assimetria.

Primeira Distribuirao

Q3 - 2Md +Qi 45,625 - 2 x 38,33 + 28,75


= =
Q3 - Qi 45,625 - 28,75

- 2,285
= - 0•135
16 875
'

e = - 0,135 > Assimetria Negativa


Q

Segunda Distribuifiio

43,75 - 2 x 35 + 26,25
eQ = =0
43,75 - 26,25

I eQ =
o I > Simetria

Terceira Distribui¢o

41,25 - 2 x 31,67 + 24,375 2,285


eQ = = =0•135
41,25 - 24,375 16,875

I e
Q
=0,135 I ==> Assimetria Positiva

6.3.4. Coeficiente de Assimetria entre os Percentis 10 e 90

Sfmbolo: ec
0 coeficiente de assimetria entre os percentis 10 e 90 obedece ao
mesmo principio que o coeficiente quartil de assimetria, mas, neste caso,
temos um quociente entre a diferenya entre os afastamentos dos percentis
em relayao a mediana (quinquagesimo centil) e sua soma. Em termos de
f6rmula:
(C90 - Md) - (Md - C10)
(C90 - Md)+ (Md -
C10)
,__���ou�����--< ( 27)
C90 - 2Md + Cio
C90 - C10

Exemplo 16:
Calcular o coeficiente de assimetria entre os percentis 10 e 90 das tres
distribuiyOeS do exemplo 12.
As medianas das tres distribuiyOeS, como sabemos, sao iguais a
Primeira distribuiyao: Md = 38,33
Segunda distribuiyao: Md = 35
Terceira distribuiyao: Md = 31,67 257
Cd/culo do Decimo Centi/: C10
lOn
TOO - Fant
C10 = I+ c ,
JC10
Os calculos seril'o baseados nas tabelas do exemplo 12.

Primeira Distribui9io Segunda Distribui9io Terceira Oistribui9iio

55 5 45 0 55 5
C10 = 20 + 10 = -
C10= 10+ 10 -' -- C10=20+ 10 • - =
10 5 20
--
· -- =

= 20,5 =19 =20,25

Cdlculo do Nonagesimo Centi/: C90


90n
100 - Fant
= I+ c
{90

Primeira Distribui9io Segunda Oistribui9iio Terceira Distribuiylio

4 5 0 40,5- 40 ,5 40
c90 40 + 10 9, -3 C90 = 50+10 c 90= 40 + 10 49 -
20 5 10
= =

= 49,75 =51 = 49,5

Calculo do ec
Primeira Distribui�iio
Md
t
C90 - 2Cso + C 10 49,75 - 2 x 38,33 + 20,5
C10
=

C90 -
49,75 - 20,5

-641
29 is
'
= -0,219

ec = -0,219 > Assimetria Negativa

Segunda Distribuifiio
51 - 2 x 35 + 19
= O
51 - 19

> Simetria
258
Terceira Distribuifllo
49,5 - 2 x 31,67 + 20,25
ec = = �� 0,219
49,5 "'."" 20,25 5
=

'

-1 e-c - - - --.
= 0 ,219
1 ===:> Assimetria Positiva

6.3.5. Coeficiente Momenta de Assimetria

Slmbolo: eM
Outra medida utilizada para avaliar a assimetria de uma distribui¢o
de freqiiencias e o coeficiente momenta de assimetria, calculado com base
nos momentos centrados da segunda, terceira e quarta ordens, que e definido
por:
Vb. (b2 + 3)
(28)

onde
mi m4
b1 = -3 e b2 = -
2
m2 m2
Algumas vezes utiliza-se apenas a raiz quadrada de b1 para representar
o coeficiente de assimetria, ou seja:

=--
3 (29)
s

onde m2 = s2 e '17ii; = s.
Exemplo 17:
Com os dados do exemplo 9, calcular o coeficiente momento de
assimetria da distribui�o dos coeficientes de inteligencia.
Precisaremos, para resolver o problema, dos seguintes dados ja calcu­
lados no exemplo 9 (item II), os quais serao arredondados ate a segunda
casa decimal:

m2 = 109,60 >mi = 12.012,16 ===> m: =


= 1.316.532,74 ===> v'm� = 1.147,40

m3 = 202,82 > mi = 41.135,95


m4 = 35.627,29

Com esses dados, podemos calcular o coeficiente momenta de assi­


metria. Antes, porem, e Conveni.ente determinar OS valor es de bl e b2•
(202,82)2 41.135•95
= 0,0312457
(1 09,60)3 1.316.521,74 259
e VF; =
0,1768
m4 35.627,29
b2 =
2
= =
2 9659
m2 12.012 16 '
'
VF; (b 23) +
eM = =
1 2(5b2 - 6b1 - 9)

=
0,1768(2,9659 + 3) =

2[(5 x 2,9659) - (6 x 0,0312457) - 9]


=
1,0548 1,0548 = = o,o93
2(14,8295 - 0,1875 - 9) 2 x 5,6420
==:> Pequena Assimetria Positiva _

202,82
eM = = =
0,1768 � eM =
0,1768
2 1.147,40 2
Vf};
6.4. MEDIDAS DE CURTOSE

A curtose ou excesso indica ate que ponto a curva de frequencias de


urna distribui�ao se apresenta mais afilada ou mais achatilda do que urna
curva-padrao, denorninada curva normal. De acordo com o grau de curtose,
podemos ter tres tipos de curvas de frequencia:

a) Curva ou Distribui¢o de Frequencias Mesocilrtica


Se a curva de frequencias apresentar um grau de achatamento equiva­
lente ao da curva normal, ela sera denominada curva mesocfutica (Grafico
6.4).
GRAFICO 6.4 - CURVA DE FREQUISNCIAS NORMALMENTE ACHATADA
(MESOCURTICAI

b) Curva ou Distribuifiio de Frequendas Platic:Urtica


Urna curva platicfutica apresenta-se com alto grau de achatamento,
superior ao da normal, conforme pode ser observado no Grafico 6.5.
c) Curva ou Distribuifiio de Frequencias Leptocilrtica
Urna curva leptocurtica revela um alto grau de afilamento, superior ao
260 normal.
GRAFICO 6.5 - CURVA DE FREQUENCIAS EXCESSIVAMENTE ACHATADA
(PLATICURTICAI

GRAFICO 6.6 - CURVA DE FREQUENCIAS MUITO AFILADA


(LEPTOCURTICAI

Para avaliar o grau de curtose de uma curva ou distribui�ao de fre­


qtiencias, usaremos dois tipos de medidas:

6.4.1. Coeficiente Percentrlico de Curtose

Simbolo: k
0 coeficiente pe rcenti1ico de curtose e a medida mais ele mentar usada
para avaliar o grau de curtose de uma distribui�ao ou curva de freqtiencias.
E definido pela seguinte expressao:

k = Dq
C90 - Cao
·I
_
(30)
261
onde
Q3 - Qi
Dq = Desvio quartilico (Capitulo 5)"=
2
C90 = Nonagesimo centil
C1o = Decimo centil
Se
k= 0,263 > curva ou distribui?o mesocurtica
k > 0,263 ==> curva ou distribuiyao platicurtica
k < 0,263 ==> curva ou distribuiyao leptocurtica

Exemplo 18:
Calcular o coeficiente percentilico de curtose das distribuiy6es de
frequencias apresentadas no exemplo 12.

Os dados necessarios para determinar o coeficiente percentilico de


curtose encontram-se ja calculados nos exemplos 15 e 16, a saber:

Primeira Distribuit;iio Segunda Distribuii;iio Terceira Distribuii;iio

03 45,625
= 03 43,75
= 03 41,25
=

01 28,75
= 01 26,25
= 01 24,375
=

(03 - 011 16,875


= (03 - 011 = 17,5 (03 - 011 = 16,875
03 - 01
Dq 8,4375 Dq 8,75 Dq 8,4375
2
= = = =

C90 49,75
= C90 51
= C90 49,5
=

C10 20,5
= C10 19
= C10 20,25
=

(C90 - C1ol = 29,25 (C90 - C1ol = 32 (C90 - C1ol = 29,25

0 calculo do coeficiente agora e imediato:


Primeira Distribuirilo
Ds 8,4375
k= = = 0 '288
C9-0 C1 0 29,25
-

I k= o,288 > Distribui?o Platicurtica

Segunda Distribuirilo
Dq 8 75
k= • = 0 '273
C90 - C10 32

1 k= 0,273 1 > Distribuiyao Platicurtica

Terceira Distribuirilo
Dq 8,4375
k= = 0 '288
C90 - C10 29,25

262 k= 0,288 > Distribuiyao Platicurtica


6.4.2. Coeficiente Momento de Curtose
Simbolo: b2

· 0 coeficiente mQmento de curtose utiliza-se do quociente entre o


momento centrado de quarta ordem e .o quadrado do momento centrado
de segunda ordem ( variancia), ou seja:

OU (31)

Obserw�o: A quantidade b2 aparece na formula do coeficiente momento


de assimetria apresentado anteriormente (item 6.3.5).

Se b2 = 3 > distribuiyao ou curva mesoc6rtica


b2 < 3 > distribui�o ou curva platicurtica
b2 > 3 > distribui�o ou curva leptoc6rtica.

Exemplo 19:
Calcular o coeficiente momento de curtose da distribuiyao dos coefi­
cientes de inteligencia com os dados do problema 9.

Recorreremos aos seguintes valores ja calculados no exemplo 9.

m4 = 35.627,29

m2 = s2 = 109,60 > m i = 12.012,16

Entao,

35 .627,29
2 966 - 30
12.012,16
= = =
' '

b2 = 2,966 === 3,o I ==> Distribui�o Mesocurtica

A curtose pode ser medida igualmente pelo coeficiente c2 :

I C2 =
b2 -
3 (32)

Teriamos, entao:

c2 = 0 curva mesocurtica
c2 > 0 · > curva leptocurtica

c2 < 0 > curva platicurtica 263


EXERCfCIOS PROPOSTOS

6.1. Dada a distribui�o de salarios abaixo, determinar:


6.1.1. A mediana.
6.1.2. Primeiro quartil.
6.1.3. Terceiro quartil.
6.1.4. Momento natural de H ordem.
6.1.5. Momento natural de 2� ordem.
6.1.6. Desvio quartil.
6.1.7. Momento centrado de 2� ordem.
6.1.8. Segundo coeficiente de assimetria de Pearson.

Sa/Arias Freqiiincias

201---25 10
251---30 15
301--- 35 20
351--- 40 18
401-- 45 4

67

6.2. Com os dados do exercicio anterior, determinar:


6.2.1. Primeiro coeficiente de assimetria.
6.2.2. Coeficiente quartil de assimetria.
6.2.3. Coeficiente percentilico de curtose.
6.3. A tabela abaixo apresenta a porcentagem de bacterias encontradas
por cm em 100 amostras de determinado produto.

Classes Freqiiincias
% fj

0,0----10,1 2
0, 1 ----1 0,2 5
0,2 ----1 0,3 10
0,3----10.� 15
0.4 ----10 ,5 18

0,5 ----10 ,6 18
0,6----10,7 15
0,7 ----10,8 10
0,8----10,9 5
0,9 ----l 1,0 2

100

Pede-se:
264 6.3.1. Coeficiente percentilico de curtose.
6.3.2. Coeficiente quartil de assimetria.
6.3.3. Primeiro coeficiente de assimetria.
6.3.4. Segundo coeficiente de assimetria.
6.3.5. Coeficiente de assimetria entre os percentis 10 e 90.

6.4. Determinar o coeficiente percentilico de curtose dos dados da tabela


seguinte:
ClaSSllS

21-- 4 2
41-- 6 8
61-- 8 10
81---10 8
101---1 2 2
30
6.5. Assimetria ou enviesamento :
a) ocorre quando uma curva de frequencias apresenta um desvio-padrao
grande;
b) e o grau de deforma9ao de uma curva de freqilencia;
c) e o achatamento de uma curva de freqilencias;
d) e o desvio de uma curva de freqilencias com rela9ao a uma origem
arbitraria;
e) n.r.a.
6.6. Dados os resultados:
M0 = 30
Md= 28
x = 22
podemos afirmar que a curva de freqilencias e:
a) mesocurtica;
b) simetrica;
c) assimetrica negativa;
d) assimetrica positiva;
e) assimetrica leptocurtica.
6.7. 0 coeficiente de curtose para uma determinada distribui\:ifo de fre·
qilencias apresentou o seguinte resultado: k 0,278. Podemos, entio,
=

afirmar que a curva e:


a) assimetrica positiva;
b) leptocurtica;
c) mesocurtica;
d) simetrica;
e) platicurtica.

RESPOSTAS DOS EXERC[CIOS PROPOSTOS

6.1. 6.1.1. 32;13


6.1.2. 27,25 265
6.1.3. 36,46
6.1.4. 31,83
6.1.5. 1.045,80
6.1.6. 4,61
6.1.7. 32,76
6.1.8. -0,16
6.2. 6.2.1. -0,30
6.2.2. -0,06
6.2.3. 0,29

6.3. 6.3.1. 0,272


6.3.2. zero
6.3.3. zero
6.3.4. zero
6.3.5. zero

6.4. 0,295

6.5. b 6.6. c 6.7. e

OUTROS EXERC[CIOS COM SOLUC0ES


1. Seja a tabela abaixo:

ClaSS111 Freqiilncia1

1001--110 2
1101--120 4
1201--130 6
1301---140 6
1401--150 2

a) construir o histograma da distribui�ao de freqiiencias correspondente


(freqiiencias absolutas e freqiiencias relativas).
b) construir o poligono de freqiiencias absolutas e relativas.
c) construir o polfgono de frequencias acumuladas "abaixo de" (absolutas e
relativas).

2. Tres moedas foram lan�adas duzentas vezes, sendo anotado o nfunero de


coroas que apareceram em cada lance.

Nfunero de coroa1 Numero de lanCBI


Xf 'i
0 16
1 51
2 84
3 49.
266
a) Construir o grafico correspondente a distribui�ao de freqiiencias expressa
pela tabela.
b) Construa a tabela de freqiiencias absolutas acumuladas e o grafico
corresponden te.
3. Os dados abaixo representam os acidentes com veiculos ocorridos no
munidpio de Gerivo no periodo de 1966 a 1970.

Numero de acidentes Numero de meses


fj

1 0001---1 100 3
1 1001---1 200 8
1 2001---1 300 10
1 3001---1 400 20
1 4001---1 500 11
1 5001--1 600 5
1 6001---1 700 3

a) Construir o poligono de freqiiencias absolutas e relativas.


b) Construir o poligono de freqiiencias acumuladas absolutas e relativas.
c) Qua! a percentagem de meses com mais de 1 400 acidentes?
d) Qual a percentagem de meses com menos de 1 500 acidentes?
e) Qual a percentagem de meses com mais de 1 300 e menos de 1 600 aci­
dentes?
4. Uma empresa procurou estudar a ocorrencia de acidentes com seus
empregados, tendo, para isso, realizado um levantamento abrangendo um
periodo de 36 meses, conforme tabela:

Numero de operarios Numero de meses


acidentados par mis (xjl (fjl
1 1
2 2
3 4
4 5
5 7
6 6
7 5
8 3
9 2
10

a) Construir um grafico representando as freqiiencias simples absolutas.


b) Construir um grafico representando as freqiiencias acumuladas "abaixo
de". 267
c) Em quantos por cento dos meses houve seis empregados acidentados?
d) Em quantos por cento dos meses houve ate quatro empregados aci­
dentados mensalmente?

5. Uma empresa apresentou a seguinte evolu�ao de vendas de um de seus


artigos, no periodo de dois anos, computados trimestralmente:

Peflodo ft) 1971 1972


Trimestres 19 29 39 49 19 29 39 49

Vendas 100 120 95 90 120 140 113 108

Representar a evolu�ao das vendas, atraves de um grafico em linha.

6. Um produto e vendido por apenas tres empresas, em um determinado


mercado. Em 1972, para um total de 18 000 unidades vendicias, tivemos
a seguinte distribui�ao das vendas pelas tres empresas:

Empress A B c

Vendas 7 200 4 800 6 000

Representar graficamente (grafico em setores) a distribui�ao das vendas


de cada empresa (distribui�ao absoluta e percentual).
7. Calcular a media aritmetica do seguinte conjunto de valores: {5, 7, 3,
2, 9, 10, 11, 6, 5, 2}.
8. A tabela seguinte representa a distribui1Jao dos salarios mensais dos ope­
rarios de uma empresa.

Sa/Brios Numero de
(Cr$) empregados ff)

2801-- 400 15

4001-- 520 30

520 1-- 640 20

6401-- 760 10

7601-- 880 4

8801--1 000

Calcular 0 Salano medio pago aos operanos.


9. Uma prova de estatistica realizada numa classe com cinqiienta alunos
268 apresentou os seguintes resultados:·
Notas (xj) 0 2 3 4 5 6 7 8 9 10

NC? de alunos (fj) 2 4 5 6 7 8 7 5 3 2

Calcular a media aritmetica das notas.


10. Seja o seguinte conjunto de nfuneros: {5, 7, 9, 11, 13}. Mostrar que
somando ou subtraindo, a cada valor do conjunto, a constante 4, a
media resultante ficara somada ou subtraida dessa quantidade.
11. Considere o seguinte conjunto de mimeros: {210, 212, 223, 231, 242,
253, 264, 275}.
a) Calcular a media aritmetica desses nfuneros pelo metodo normal.
b) Calcular a media aritmetica pelo metodo abreviado, fazendo Xo = 230
(media arbitraria).
c) Compare os resultados.

12. Dada a seguinte distribui�ao de frequencias:

Classes

Ol-- 4 2
41-- 8 4
81---1 2 7
121---16 16
161--2 0 26
201---24 12
241---28 6
281---32 2

a) Calcular a media aritmetica pelo metodo normal.


b) Fazendo agora x0 = 16 (media arbitraria), calcular a media pelo
metodo abreviado.
13. Um aluno recebeu as seguintes notas finais: 82 em Matematica, 90 em
Estatistica, 65 em Hist6ria e 70 em Geografia. Atribuindo-se a essas
materias, respectivamente, os pesos 3, 3, 2, 1 calcular a media aritmetica
das notas recebidas pelo aluno.
14. Em uma classe, dez alunos tern 18 anos de idade, quinze tern 19
anos, catorze tern 20 anos, e um tern 21 anos. Calcular a idade media
da classe.
15. Se tomarmos x0 = 10 como a media arbitraria de um conjunto
de mimeros, chegaremos aos seguintes desvios, calculados em rela�ao
a x0: {-4, -1, 2, 0, 3, -3, 5, 1}. Calcular a media verdadeira do
conjunto. 269
16. Considere a seguinte distribuiyiio de freqiiencias:

Vari,val (x) 870 871 872 873 874 875 876

Fr«1iilncias (f) 2 4 6 8 7 4

Calcular a media aritmetica dos valores pelos metodos normal e abreviado.


Para 0 segundo metodo, tomar Xo = 873.

17. A tabela seguinte refere-se a uma distribui�o de freqiiencias do compri­


mento de cem barras de ferro:

Comprirmmto (cm) Numero de barras (f)

751---1
- 00 2
100 I-- 125 4
125 I-- 150 11
150 I-- 175 18
175 I-- 200 31
200 I-- 225 22
225 I-- 250 9
250 I-- 275 2
275 I-- 300 1

Calcular a media aritmetica das cem barras, usando o metodo abreviado


e fazendo x0 = 187,5 e c = 25.

18. Sejam os seguintes conjuntos de nfuneros: A= {10, 11, 12, 13, 14, 15} e
B ={0, 1, 2, 3, 4, 5}. Calcular a media aritmetica dos dois conjuntos
e comparar os resultados,

19. Calcular a moda dos seguintes conjuntos: A = {3, 5, 7, 9, ll};B = {3, 5,


5, 7, 7, 7, 9, 9, 11} e C = {l, 3, 5, 5, 5, 7, 7, 7, 9, 9, 11}.
20. Numa certa seyiio de uma empresa foram levantadas as idades dos fun­
cionarios, chegando-se aos seguintes resultados:

ldades (x) 25 26 27 28 29 30

N9 de emprsgados (f) 2 4 6 7 5

Qual a idade modal dos empregados dessa seyiio?

21. Calcular a moda dos valores apresentados na tabela abaixo.


a) Pelo metodo de King.
270 b) Pelo metodo de Czuber.
Classes fj

10f--20 5
20f--3 0 10
30f--40 15
40 1-- 50 8
501--60 2

40

22. Seja a seguinte tabela:

Freqiiencias acumuladas
Classes
"Abaixo de"
Of-- 4 2
41-- 8 6
Sf-- 12 13
121--16 29
161--20 55
201--24 67
241--2 8 73
281--32 75

a) Qual e a classe modal?


b) Qual e o valor da moda bruta da distribui�ao?
c) Determinar a moda pelo metodo de Czuber (pela formula e grafica­
mente) .
23. Determinar o elemento mediano dos seguintes conjuntos de numeros:
A = {2, 4, 11, 13, 16, 18, 20} e
B =
{2, 4, 11, 13, 16, 18}.
24. A tabela abaixo apresenta as notas obtidas por vinte alunos, em uma
prova de Estatistica:
Nora (x) 2 3 4 5 6 7 8

/119 de alunos ff) 2 3 5 4 3 2

Determinar a nota mediana.


25. As notas obtidas por 21 alunos em uma prova de Conhecimentos Gerais
estao anotadas na tabela abaixo:

Notas (x) 4 5 6 7 8 9 10

/119 de alunos ff) 2 4 5 4 4

Calcular a nota mediana da classe. 271


26. Calcular a mediana da seguinte distribui�ao de freqtiencias:

Classe.s Freqiilncia.s (f}

401-- 50 1
501-- 60 3
601---- 70 6
701--- 80 11
801--- 90 19
901---1
- 00 35
1001---110 27
1101--120 15
1201---130 14
1301---140 7
1401---150 5
1501---160 2
1601--170

27. Dado o histograma abaixo, no interior de cujos retangulos foram anotadas


as freqtiencias simples absolutas, calcular a mediana do conjunto (Gra­
fico XIV).
GRAFICO XIV

_ .._ rif1h
_ ___. _ __
10
..____....____..____....__,.�
20
30 .._40 50 60 Classes

28. Dado o histograma abaixo, no interior de cujos retangulos foram anotadas


as freqilencias simples relativas, calcular a mediana do conjunto (Gra­
fico XV).
GRAFICO XV

15% 20% 30% 25% 10%

_ ___.___...___
__, '--___.___....
30 __.�
._
40 Classes
50 60
10 20

272
29. Dado abaixo o poligono de freqiiencias relativas acumuladas, determinar
a mediana do conjunto (Grafico XVI).

Frj Pol (gono de freqii6ncias relativas acumulades

100

90

80

70

60

GRAFICOXVI
50

40

30

20

10

0 _,._ __..__ _._


....._ _ _ __ .._
...._
....__
.. ...____._ JC

50 150 250 350 400 450 550 650

30. Seja o seguinte histograma, no interior de cujos retangulos estao anotadas


as freqiiencias simples absolutas (Grafico XVII).

GRAFICOXVII

5 6 4 3

100 200 300 400 500 600 JC

273
a) Calcular a media, a moda (Czuber) e a mediana do conjunto.
b) Calcular a moda, usando a rela�io de Pearson.

31. Seja a seguinte distribui�ao de freqiiencias:

Freqiiincias ff)

501-- 60 8
60r--- 70 10
701-- 80 17
80r--- 90 13
901--100 9
1001--110 6
1101--120 2

a) Calcular o primeiro, o segundo e o terceiro quartis.


b) Calcular o primeiro, o segundo e o oitavo decis.
c) Calcular o vigesimo, o trigesimo quarto e o septuagesimo quinto centis.
32. Dado o poligono de freqiiencias abaixo, calcular o primeiro quartil e a
mediana da distribui�o (Grafico XVIII).

GRAFICO XVIII

3
2

0 10 20 30 40 50 60

33. Seja a seguinte tabela de freqiiencias:

Clas!llll f

Of-- 20 2
201---- 40 3
401---- 60 6
601---- 80 3
801----100 2

274 Calcular a media, a moda e a mediana.


34. A amplitude total de urn conjunto de n6meros e 500. Se a distribui�ao
de freqiiencias apresenta vinte classes, qual devera ser o limite inferior e
0 ponto medio da quinta classe, se 0 limite superior da primeira classe
e igual a 35?

35. Dado o conjunto de n6meros, A = {-10, -5, 2, 3, 6, 9, 10}, qual e


o valor da amplitude total do conjunto?

36. Calcular o desvio medio do seguinte conjunto de n6meros:A= {300, 400,


500, 600, 700}.

37. Dada a distribui�ao de freqiiencias abaixo, calcular 0 desvio medio.

2 3 4 5 6

3 5 5 3

38. Considere a seguinte tabela de freqiiencias:

1,5.1--1,6 4
1,61--1,7 8
1,71--1,8 12
1,81---1,9 15
1,91--2,0 12
2,01--2,1 8
2.11--- 2.2 4

Calcular o desvio medio da distribui�o.

39. Calcular a variincia e o desvio padrio dos seguintes conjuntos de n6meros:

A= {O, 0, 0,1, 1, l} e B = {-2,-1, 0, 1, 2}.


40. A distribui�o de freqiiencias seguinte representa o n6mero de pe�as
defeituosas produzidas por uma maquina em 31 dias de observa�ao.
Calcular o desvio padrao do n6mero de pe�s defeituosas pela f6rmula
original e pela f6rmula desenvolvida.

2 3 4

N9 de di• (f) 3 5 15 5 3

41. A distribui�ao de freqiiencias dos pesos de cem operarios de uma fabrica


e a seguinte:
c1- (f>B$os} N9 de operlrios (f}

501--58 10
581-- 66 15
661--74 25
741--8 2 24
821--90 16
_ so 1-- e8
__ _ ______ 10 275

_ __

_ _
Calcular o desvio padrao dos pesos dos cem operarios, pela f6rmula ori­
ginal e pela f6rmula desenvolvida.

42. Usando os dados do problema 41, calcular o desvio padrao pelo processo
breve, fazendo x0 =70.
43. A distribuiyao da renda semanal proveniente do aluguel de duzentas
casas pertencentes a uma empresa imobiliaria encontra-se na tabela
abaixo.

Renda semanal Numero de casas (f)

751----125 12
1251---- 1 75 26
1751---- 2251 45
2251---- 275 60
2751---- 325 37
3251---- 375 13

375f---425 7

Calcular o desvio padrao da renda semanal, pelo processo breve e com o


uso da variavel reduzida, fazendo x0 =250 e c = 50.
44. Dados os conjuntos de m1meros,

A ={220, 230, 240, 250, 260} e


B ={20, 30, 40, 50, 60},
que relayao existe entre os desvios padr5es dos dois conjuntos?
45. Considere os seguintes conjuntos de m1meros:
A ={10, 20, 30, 40, 50} e
B = {100, 200, 300, 400, 500}.
Que relayao existe entre os desvios padroes dos dois conjuntos de
nfuneros?
46. Um teste de estatistica foi aplicado em duas classes, e os resultados da

{ {
avaliaylio foram os seguintes:
:X=6 x=7
ClasseA ClasseB
s=2 s=l
Calcular o coeficiente de variayao de Pearson para os dois conjuntos.
47. Considere os seguintes resultados relativos a tres tabelas de freqiiencias:

Distribui�io A Distribui�io B Distribui�io C

X=50 X=4S X=51


Md=50 Md=49 Md=50

Mo= 50 Mo=50 Mo =49

276
Quanta ao enviesamento das curvas de freqiiencia correspondentes, que
tipo de distribuiyao temos em cada caso?
48. Examinando o Grafico XIX, indicar qual das distribuiyOeS apresenta um
desvio padrao maior (supor que as areas sob as curvas sejam iguais).

GRAFICOXIX

49. Considere o polfgono de freqiiencias relativas acumuladas do Grafico XX.

GRAFICO XX

Fr FreqUlnciu relatives
acumuladas

100

90

so
..Eq3---------------------
70

60

50 _Emd·-----------------

40

30

20

10

0 100 200 300 400 500 600 700

a) Calcular o desvio quartilico.


b) Calcular a mediana. 277
50. Calcular o valor do primeiro coeficiente de assirnetria de Pearson usando
os resultados do problema 47, sabendo-se que as variancias das distri­
bui�oes sao, respectivamente: sJ 4, sj 4, st: = 2,25.= =

51. Sejam as seguintes tabelas de freqiiencias


I U m

Classes fj CIS!J$1JS fj Claues fj

101--20 2 101--20 3 10.1--20 1


201--30 4 201--30 5 201--30 2
301---40 6 301---40 7 301---40 7
401--50 4 401---5 0 2 401---50 5
501---60 2 501--60 501---60
- 3

a) Calcular o prirneiro coeficiente de assirnetria de Pearson.


b) Calcular o segundo coeficiente de assirnetria de Pearson.
c) Calcular o coeficiente quartil de assirnetria.

52. Seja a seguinte tabela de freqiiencias:

Classes fj

1001--200 2
200 I-- 300 22
3001--400 52
4001--500 22
500 1-- 600 2

Calcular o coeficiente de curtose da distribuicao. ·

RESOLU<;AO DOS EXERCfCIOS


1. a) Constru?o do histograma (Gr.ifico I).

Freqii6ncias absolutas Freqii6ncias relativas


fj % frj
6 30

4 - 20
GRAFICOI
3

2 - ....__ 10

0 100 110 120 130 140 150 x


278
b) Constru�o do polfgono de freqiiencias simples (GrMico II).

fj
6

4 20

GRAFICO II 3

2 10

0 100 110 120 130 140 150 x

Para construir o eixo das freqiiencias relativas fazemos:

n = � !; = 20 = frequencia total

2 x 100

{
20 -- 100% � x = = 10%
20

2--x

Portanto, duas observa�oes correspondem a 10% do total de obser­


va�Oes. Anotamos essa percentagem no eixo das freqiiencias relativas,
na mesma altura do valor 2, que e a frequencia simples absoluta da
primeira e ultima classes. E assim prosseguimos, ate completar a escala.

c) Poligono de freqiiencias acumuladas (GrMico III):


Inicialmente, devemos constru� a tabela de frequencias acumuladas:

Freqiilncias acumuladas
C/11$$8$ fj
"Abaixo de"

1001----110 2 2
1101----120 4 6
120 1----1 30 6 12
130 1----140 6 18
140 1----150 2 20
279
Freqiiincias absolutas acumuladas Freqiiincias relativas acumuladas

20

18

16

14

12
r--
I
I
I GRAFICO Iii
10 I
I
I
I
I
8 I
I
I
I
I
6

0 100 110. 120 130 140 150

2. a) Grafico em hastes (IV):

Numero de lances
100

80

60
GRAFICO IV

40

20

0
T
0 2 3 Numero de coroas
280
b) Tabela de frequencias absolutas acumuladas:

Xj Freqiilncias acumuladas
'i

0 16 16
1 51 67
2 84 151
3 49 200

Poligono de Frequencias Acumuladas (Grafico V).

Freqii6ncias acumuladas
200
11
I
160 I

120 -
II
I
I GRAFICO V
I
I
I
80 I

rl
I
40 I
I I

.0 ...._
._ r-1
...._ I_
_...__.... ... 1_
_._ i___ Numero de coroas
' __.

3. a) Poligono de frequencias (Grafico VI).

Numero de meses
Porcentagem
35 de meses (%)

GRAFICO VI
15

10

o 1000 1100 1200 1300 1400 1soo 1600 l '100 Numero de acidentes
281
b) Poligono de frequencias acumuladas (Grffico VII):
TABELA DE FREQU�NCIAS ACUMULADAS

Cl- 'i Ff8qiilncia1 acumulada1

1 0001-- 1 100 3 3
1 1001--1 200 8 11
1 2001--1 300 10 21
1 3001--1 400 20 41
1 4001--1 500 11 52
1 5001---1 600 5 57
1 6001--1 700 3 60

GRAFICO VII

Numero de meses Porc:entagens de mases %


60 1 00

90

80
45
70

60

30 50

40

30
15
20

10

vv"F-�.---,.�-,.�-,.�-.-�""T""�-r-�O
0 1000 1100 1200 1300 1400 isoo 16 00 1100 Numero de acidentes

c) 0 mlmero de meses com mais de 1 400 acidentes e .19, ou seja


19
11 + 5 + 3. Portanto, percentualmente, teremos: 60 X 100 �31,67%.

d) Com menos de 1 500 acidentes temos 86,67% dos meses, ou seja:


Frequencia acumulada ate a classe

1 4001---- 1 500 : 52. Frequencia total = 60.

Frequencia relativa acumulada ate a classe


52
1 400f-- I 500 : 60 X 100 � 86,67%.
282
e) 0 m1mero de meses em que ho.uve mais de 1 300 e menos de 1 600
acidentes foi 36, isto e, 20 + 11 + 5. Percentualmente, teremos:
36
x 100 = 60%.
60
4. a) Grafico das frequencias simples absolutas (Grafico VIII):

8 'i

6
GRAFICO VIII
5

3.

T T
0 2 3 4 6 6 7 8 9 10

b) Grafico das frequencias acumuladas "abaixo de" (Grafico IX):


FreqiiAncias acumuladas
40

35

30
r----r-r
GRAFICO IX 25

20
rfl
I
I
I
I

rl
I
I
15 I

· IrI
10
r--i
I I
I
I
5
I I
I
I I
0 Xj
2 3 4 5 8 9 10

c) Houve seis empregados acidentados em 16,67% dos nieses. Assim:


6
x 100 £:;: 16,67%.
36
d) Tivemos doze observayoes (meses) correspondentes a ate quatro empre­
gados acidentados. Percentualmente, teremos:

!� x 100 £:;: 33,33%.


283
5. Grafico X.

Vendas
140

130

120
GRAFICO X
110

100

90

19 29 39 49 10 29 39 49 t

-1911- -1912 -

6. Distribuiyao absoluta das vendas pelas empresas A, B e C (Grafico XI).

GRAFICO XI 7 200 6000


A c

Distribuiyao percentual (relativa) das vendas pelas empresas A, B e C


(Grafico XII).

GRAFICO XII 4 0%
A

284
7. x =
�x = 5 + 7 + 3 + 2 + 9 + 10 + 11 + 6 + 5 + 2 =
60 = 6
10 10
·

8.
Salarios f Ponto medio x x . f

2801-- 400 15 340 5 100

400t-- 520 30 460 13 800

5201-- 640 20 580 11 600

6401-- 760 10 700 7 000

7601-- 880 4 820 3 280

8801--1 000 1 940 940

80 41 720

x =
�x · f = 41 720 = 521' 5
n 80
9.
Xj fj Xj' fj

0 1 0
1 2 2
2 4 8
3 5 15
4 6 24
5 7 35
6 8 48
7 7 49
- T-xr fj 268
8 5 40 x = =-= 5' 36
9 3 27
n 50
10 2 20
A nota media e, portanto,
50 268
5,36.
10. lnicialmente, temos:
Xi = 5 + 7 + 9 + 11 + 13 �=
= 9
5 5
Somando-se 4 a cada um dos valores do conjunto original, teremos:
{9, 11, 13, 15, 17}. A media desse novo conjunto sera:

x2 9 + 11 + 13 + 15 + 17 �=
= = 13
5 5
A media resultante e igual a media do conjunto original mais a constante
4. Subtraindo-se, agora, a constante 4 de cada valor do conjunto original,
teremos: 285
1 +3 +5 +7 + 9 25
{1 , 3 , 5 , 7 , 9} e X3= = 5.
- =

5 5
Esse valor e igual a media do conjunto original menos a constante 4.

11. a) Metodo normal:

x
210
212
223
231 x �xi 1 910
242 = = = 238'75
263 n 8
264
275
1:.x; 1 910
=

b) Metodo abreviado: x 0 = 230

x;- x0
=
d;

-20
-18
- 7
1 �d·1
12 X =Xo +-
23 n
34 - 70
45 x = 230 + --s
Ll;=10
x = 230 + 8,75 238,75
=

c) Os resultados sao absolutamente iguais.

12. a) Metodo normal

C/11$111$ Pontomldio 'i xi• fi


01--- 4 2 2 4
41--- 8 6 4 24
81---12 10 7 70
121--16 14 16 224
161--20 18 26 468
20t--24 22 12 264
t 210
241--28 26 6 156 -x·- �r f; =
15==
__

281--32 30 2 60 n

286 75 1 270 == 16,93


b) Metodo abreviado: x0 = 16

Ponto mtJdio fxj) dj=Xj- Xo

2 -14 -28
6 -10 -40
10 -
6 -42
14 -
2 -32
18 2 52
22 6 72
26 10 60
30 14 28

70

- T.df 70
x =x0 + = 16 +75= 16 + 0,93 � 16,93
n

13.
Nam (x) PBS06 (p) x • p

82 3 246
90 3 270 - 716
65 2 130 x =9 � 79,6
70 1 70

9 716

14. Xjfj
/dade Xj N9 de alunos fj

18 10 180 x = 'T.xj· fj =
19 15 285 n

20 14 280 . = 766
= 19 15
21 1 21 40 '

40 766

ldade media da classe: � 19 anos.

"£d,
-
J
15. x =x0 +­
n

+ 3 + (-3) + 5 + 1
x = 10 + (-4) + (-1) + 2 +80

3
= 10 +g- = 10 + 0,375 = 10,375. 287
16. a)

Xj 'i Xj, fj

870 2 1 740
871 4 3 484
872 6 5 232
873 8 6984
874 7 6 118
875 4 3 500 -x Derfj = 21 934
= =
876 1 876 n 32
=
32 27 934 872,9375

b) Metodo abreviado: x0 = 873

dj = Xj- X o dj. 'i


'i
-3 2 -6
-2 4 -8
-1 6 -6
0 8 0
1 7 7
2 4 8
3 1 3

32 -2

X = Xo + "Edrfj __
873
+
�22 = 873 - 0,0625
=
872,9375
n

17. Xo = 187,5 e c = 25 (constante arbitraria). Entao, o desvio reduzido,


d'; seni:
Xj -Xo Xj-187,5
d'; =
c 25

, X -XO
j
d = --
Classes x d j=-x j-XO j d
'i i c f'i

751---100 2 87,5 -100 -4 - 8


1001---125 4 112,5 - 75 -3 -12
1251---150 11 137,5 - 50 -2 -22
1501---175 18 162,5 - 25 -1 -18
1751---200 31 187,5 0 0 0
2001---225 22 212,5 25 1 22
2251---250 9 237,5 50 2 18
2501---275 2 262,5 75 3 6
2751---300 1 287,5 100 4 4

100 -10
288
x = x0 + ('l;-J;-!1-..J
d,. ![\c = 187,5 + �OO
10
• 25 = 187,5 - 2,5 =

= 185

0 comprimento medio das barras observadas e 185 cm.

18. Media do conjunto A:

- '£x 10 + 11 + 12 + 13 + 14 + 15 75
XA = -n = = 6 = 12,5
6
Media do conjunto B:

XB
'£x 0+ 1+ 2+ 3+ 4+ 5 .!..?_
= = = = 2'5
n 6 6
Os valores do conjunto A sao iguais aos valores do con junto B mais a
constante 10. Entao, a media de A devera ser igual a media de B mais a
constante 10. Trata-se de uma decorrencia da quarta propriedade da
media.

19. Moda do conjunto A: nlio M moda, pois nao M predominancia de


qualquer valor sobre os demais.

Moda do conjunto B: M0 = 7

Moda do conjunto C:
{ M: = 5
0 conjunto e bimodal
M = 7
20. A idade modal e 28 anos, porqtJe a freqiiencia de 28 e maior do que a
de qualquer outro valor do conjunto.

21. Classe modal:.30f---40


a) Pelo metodo de King:

£ = 30 I M
o
= £+
/p ot;:./ant •
cl
fpost 8
8
=

M0 30 + 10
8 + 10
=

c
fant 10

=

10 80
30 + 18+ 4,44 34,44
=
= =

b) Pelo metodo de Czuber:

£ = 30
! M =£+
o 81 A� 82 •cl
81 = 15 - 10 = 5
5
-
c
82 15 - 8 7 30 +- 10
5+7
= = = • =

10
1Q.
=

- 30 + 30 + 4,17 ::: 34,17


289
=

12
22. Para calcular a moda precisamos, inicialmente, construir a tabela de
freqilencias simples.

Classes Freqiiincias acumuladas Fj fj

01-- 4 2 2=2-0
41-- 8 6 4=6 - 2
81--12 13 7= 13-6
12 t--16 29 16= 29-13
16 t--20 55 26=55-29
20 1--24 67 12=67-55
24 1--2 8 73 6=73 --' 67
28 t--32 75 2=75 - 73

a) Classe modal: 161---20


b) Moda bruta: 0 18 (ponto medio da classe modal)
M
=

c) Determin�ao da moda (f6rmula de Czuber):

I Mo
=

2
+
D.1 ; D.2 •
c
I 10 40
16
Mo
4 16 + 24
10 + 14
= = =

D.1 26 - 16 10

+ ==
= =

D.2 = 26 - 12 = 14 = 16 1,67 17,67

c
= 4

28

24 ' I
"
\ I
20
I�
' \
GRAFICO XIII
16 \
12
\

0 ._
___,_�_._�....__..._.._._�.._�..___._.Xj
4 8 12 16 20 24 28 32

Mo=17,67
290
23. Para o conjunto A, temos
ri+l 7+1 -
EMd 4
=- 2- =- 2-=
0 elemento mediano sera entlio o 49 da lista. Para o conjunto B o ele-
, n 6 3.
mento med.1ano sera 2
= = 2
=

24. Para calcular a mediana recorremos as freqilencias acumuladas:

Numero Freqiiencias
Notas de alunos acumuladas
Xj fj "Abaixo de" Fj

2 1

3 2 3

4 3 6
5 5 11

6 4 15

7 3 18

8 2 20

0 elemento mediano e i�ual -a

' Ti 20
IO.
2=2=
Pelas freqilencias acumuladas verificamos que ate a nota 5 acumulamos
11 observa�OeS. Portanto, a mediana e a nota 5.

25. Calculemos primeiramente as freqilencias acumuladas "abaixo de":

Numero de Freqiilncia
Not/ls
Xj alunos fj acumulada Fj

5 2 3

6 4 7

7 5 12

8 4 16

9 4 20

10 21

0 elemento mediano e

n +1 21+1
11'
2 = 2 =

que corresponde a nota 7. Portanto, a mediana e a nota 7. 291


2 .
6

Classes fj FffJQiiiJncias acumuladas Fj

40f-- 50 . 1 1
50f-- 60 3 4
60f-- 70 6 10
70f-- 80 11 21
80f-- 90 19 40
90f--100 35 75
100f--110 27 102
110f--120 15 117
120f--130 14 131
130f--140 7 138
140f--150 5 14
. 3
150 f-
. 1- 60 2 145
1601:--170 1 146

146

. , n 146
0 elemento med1ano e 73: 2= 2 = 73.

A classe mediana e: 90f--100.

JI
= 90
c= 10
!Md= 35

Fant = 40

73 - 40
Md = 90 + • 10
35
330
Md = 90 + 35 = 90 + 9,43 = 99,43

27. Somando-se as freqtiencias temos:

�fj = 8 + 13 + 19 + 14 + 7 = 60

0 elemento mediano e: EJfJ = 6 2° = 30. Entlio, a classe da mediana ea


terceira classe. Assim,
30 - 21 9o
Md = 30 + •
10 = 30 + = 30 + 5 = 35
!8 18

28. A mediana dos valores corresponde aquele valor ate o qual temos 50%
das observa�6es. Para chegarmos ate esse valor teremos que acumular as
percentagens de observa�6es ate que atinjamos os 50% das observa�0es.
Somando-se as percentagens das duas primeiras classes teremos 35% das
292
observ�oes. Para atingirmos os 50% precisamos ainda de 15%, exata-
mente a metade da percentagem de observacy6es da terceira classe. Por
conseguinte, o valor de mediana e Md = 35, ou o ponto medio c.Ja
terceira classe.

29. Como temos o poligono de freqilencias acumuladas, basta localizar no


eixo vertical a freqilencia acumulada cujo valor e 50%. Tracyando uma
paralela ao eixo das classes, atingiremos o polfgono de freqilencias em um
ponto a partir do qua! tracyamos uma perpendicular ao mesmo eixo das
classes. Essa perpendicular encontrara o eixo das classes exatamente no
ponto correspondente ao valor da mediana. Portanto Md = 400.
30. Vamos, inicialmente, construir a distribuicyao de freqilencias:

Freqiiencia
Classes fj Xj Xj fj
acumulada Fj

1001---200 2 150 300 2


2001---300 5 250 1 250 7
3001---400 6 350 2 100 13
4001---500 4 450 1 800 17
5001---600 3 550 1 650 20

20 7 100

a) x = fa�. fj 7;go = = 355 (media)

l
M0 = 300 + l+2 · 100 = 333,33 (moda)

l
Md = 300 + O �- 7 • 100 = 350 (mediana)

b) Pela relac;ao de Pearson devemos ter:

M0 = 3Md - 2x
M0 = 3 • (350) - 2(355) = 1 050 - 710 = 340
31. Vamos primeiramente calcular as freqilencias acumuladas:

Classes fj Freqiiencia acumulada Fj

501-- 60 8 8
601-- 70 10 18
701--- 80 17 35
801-- 90 13 48
901---100 9 57
1001---110 6 63
1101---120 2 65

65
293
a) l<J quartil
65
Eqi = 4 = 16,25

60 f-- 70 => classe do 19 quartil


16•25 - 8
Qi = 60 + IO= 68,25
IO

29 quartil

65
EMd = Eq2 =1 = 32,5

classe med1ana: 70 f-- 80


32 5 - 18
Md = Q 2 = 70 + • IO = 78,53
17

3<J quartil

3 X 65
Eq3 = = 48 '75
4
classe do 39 quartil: 90 f---100
8
Q3 = 90 + 4 •7 � - 48 • IO= 90, 83

b) J<J decil
65
Edi =IO= 6,5

classe do 19 decil: 50f--60


6 ,5 - 0 65
Di = 50 + IO= 50 + = 50 ' 125
8 8
-

29 decil

X 65
Ed2 = 2 = 13
10

classe do 29 decil: 60f--70


13 - 8
D2 = 60 + IO= 65
lO

89 decil

8 X 65
Eds = = 52
IO

classe do 89 decil: 90 f----100


294
52 - 48
D8 = 90 + 10 = 90 + 4,44 = 94,44
9

c) 209 centil

20 X 65
EC:zo = = 13
100

Como Ec20 = Ed2 = 13, o 209 centil e igual ao 29 decil, ou seja


2
C 0 = 65.

349 centil

34 x 65
Ec34 = = 22,l
100

classe do 349 centil: 701--80

22,1 - 18
C34 = 70 + 10 = 70 + i! = 72 '41
17 17

759 centil
75 x 65
Ec,s = = 48,75
100
Como Ec75 = Eq3 = 48, 75, o 759 centil e igual ao 39 quartil.
Entao, C75 = 90,83.

32. Com base na figura podemos construir a seguinte tabela:

C/a$$eS fj Freqiiiincias scumuladss Fj

101--20 3 3
201--3 0 4 7
301--40 6 13
401---50 5 18
50.1-6
- 0 2 20

20

19 quartil
n 20
Eq1=4=4 = 5
5 - 3 20
Q. = 20 + . 10 = 20 + = 20 + 5 = 25
4 4
-- -

Mediana
n' 20
EMd=2=2= 10
.

295
7 30
Md = 30 + IO - • 10 = 30 + = 30 + S = 35
6 6

33. Como a distribui�ao e simetrica, a media sera igual a moda e esta igual a
mediana. Para calcular essas medidas, basta determinar o ponto medio da
classe de maior freqiiencia.

401---60 classe de maior freqiiencia.

Entao, M0 = x = Md = SO

34. Dados:

At= 500
Total de classes: 20
Limite superior da H- classe: 35

c
=
am t� � tud total
=
5° °
= 25 (amplitude de classe)
n. e c asses 20

Entao, a primeira classe e 101---35 e a quinta classe e l lOf--135.


Assim, 110 e 0 limite inferior da classe e 0 seu ponto medio sera igual
a 122,5, ou seja,
110 + 135 245
= = 122' 5
2 2

35. A t= (maior valor)-(menor valor)= 10-(-10)= 10+ 10 = 20

36.
x; d; jd;j
300 -200 200
x
2 500
400 -100 100 = = 500
5
500 0 0

�ldl =
600 100 100 600