Você está na página 1de 36

Universidade Federal de Minas Gerais Instituto de Cincias Exatas Departamento de Estatstica

Anlise Descritiva de Dados Tabelas e Grficos


Edna A. Reis e Ilka A. Reis Relatrio Tcnico RTE-04/2001

Relatrio Tcnico Srie Ensino

Universidade Federal de Minas Gerais Instituto de Cincias Exatas Departamento de Estatstica

Anlise Descritiva de Dados


Tabelas e Grficos

Edna Afonso Reis Ilka Afonso Reis

Primeira Edio Outubro/2001

NDICE
1. 2. 3. 4.
4.1. 4.2. 4.3. 4.4. 4.5.

Introduo Coleta e Armazenamento de Dados Tipos de Variveis Estudando a Distribuio de Freqncias de uma Varivel
Variveis Qualitativas Nominais e Ordinais Variveis Quantitativas Discretas Variveis Quantitativas Contnuas Outros Grficos para Variveis Quantitativas Aspectos Gerais da Distribuio de Freqncias

5 5 7 8
8 12 15 18 20

5. 6.

Grfico para Sries Temporais O Diagrama de Disperso Referncias Bibliogrficas Anexo I: Conjunto de Dados do Exemplo dos Ursos Marrons Anexo II: Passos para Construo da Tabela de Distribuio de Freqncias de uma Varivel Contnua

23 26 31 32 34

1. Introduo
A coleta de dados estatsticos tem crescido muito nos ltimos anos em todas as reas de pesquisa, especialmente com o advento dos computadores e surgimento de softwares cada vez mais sofisticados. Ao mesmo tempo, olhar uma extensa listagem de dados coletados no permite obter praticamente nenhuma concluso, especialmente para grandes conjuntos de dados, com muitas caractersticas sendo investigadas. A Anlise Descritiva a fase inicial deste processo de estudo dos dados coletados. Utilizamos mtodos de Estatstica Descritiva para organizar, resumir e descrever os aspectos importantes de um conjunto de caractersticas observadas ou comparar tais caractersticas entre dois ou mais conjuntos. As ferramentas descritivas so os muitos tipos de grficos e tabelas e tambm medidas de sntese como porcentagens, ndices e mdias. Ao se condensar os dados, perde-se informao, pois no se tm as observaes originais. Entretanto, esta perda de informao pequena se comparada ao ganho que se tem com a clareza da interpretao proporcionada. A descrio dos dados tambm tem como objetivo identificar anomalias, at mesmo resultante do registro incorreto de valores, e dados dispersos, aqueles que no seguem a tendncia geral do restante do conjunto. No s nos artigos tcnicos direcionados para pesquisadores, mas tambm nos artigos de jornais e revistas escritos para o pblico leigo, cada vez mais freqente a utilizao destes recursos de descrio para complementar a apresentao de um fato, justificar ou referendar um argumento. Ao mesmo tempo que o uso das ferramentas estatsticas vem crescendo, aumenta tambm o abuso de tais ferramentas. muito comum vermos em jornais e revistas, at mesmo em peridicos cientficos, grficos voluntariamente ou intencionalmente enganosos e estatsticas obscuras para justificar argumentos polmicos.

2. Coleta e Armazenamento de Dados


WExemplo Inicial: Ursos Marrons W

Pesquisadores do Instituto Amigos do Urso tm estudado o desenvolvimento dos ursos marrons selvagens que vivem em uma certa floresta do Canad. O objetivo do projeto estudar algumas caractersticas dos ursos, tais como seu peso e altura, ao longo da vida desses animais. A ficha de coleta de dados, representada na Figura 2.1, mostra as caractersticas que sero estudadas na primeira fase do projeto. Na primeira parte do estudo, 97 ursos foram identificados (por nome), pesados e medidos. Os dados foram coletados atravs do preenchimento da ficha de coleta mostrada na Figura 2.1. Para que os ursos possam ser identificados, medidos e avaliados, os pesquisadores precisam anestesi-los. Mesmo assim, medidas como a do peso so difceis de serem feitas (qual ser o tamanho de uma balana para pesar ursos ?). Desse modo, os pesquisadores gostariam tambm de encontrar uma maneira de estimar o peso do urso atravs de uma outra medida mais fcil de se obter, como uma medida de comprimento, por exemplo (altura, circunferncia do trax, etc.). Nesse caso, s seria necessria uma grande fita mtrica, o que facilitaria muito a coleta de dados das prximas fases do projeto. Geralmente, as coletas de dados so feitas atravs do preenchimento de fichas pelo pesquisador e/ou atravs de resposta a questionrios (o que no foi o caso dos ursos ). Alguns dados so coletados atravs de medies (altura, peso, presso sangnea, etc.), enquanto outros so coletados atravs de avaliaes (sexo, cor, raa, espcie, etc.). Depois de coletados, os dados devem ser armazenados e sistematizados numa planilha de dados, como mostra a Figura 2.2. Hoje em dia, essas planilhas so digitais e essa a maneira de realizar a entrada dos dados num programa de computador. A planilha de dados composta por linhas e colunas. Cada linha contm os dados de um urso (elemento), ou seja de uma ficha de coleta. As caractersticas (variveis) so dispostos em colunas. Assim, a planilha de dados contm um nmero de linhas igual a nmero de participantes do estudo e um nmero de colunas igual ao nmero de variveis sendo estudadas.

A planilha de dados dos ursos tem 97 linhas e 10 colunas (veja Anexo). Alguns ursos no tiveram sua idade determinada. Esses dados so chamados dados faltantes e comum represent-los por asteriscos (na verdade, cada software tem sua conveno para representar missing data).
Figura 2.1 Ficha de coleta de dados dos ursos marrons.


   

!#"#$%&')( 234( 57698#:;

*,+-+/.10

#3<( => F `

?@BACBAED MR

BGBHIJ(LKNMIPORQS$%B"STC4( U
VWYX K7' BQ[Z\Q]J( =^BW_^ MR BACMIRHS4(aKbOIQEcdTSQ_4( KbOIQEcdTSQ_4( e1f4W-= V4f4WYX MR MR

gQ]R2
(

' TC\Q]J( =<=4X1W-e MR ` BAC4( U


>W-VJ= hIZ

ijEk[jmlRjmnCoqp rEk[j s tvuxwty9w9z{ | oS}rmlRo,~CCnq oS_IC orI]oS_E_rpCrp jnCoqp rSk[js .9I;3/;8:&6

Figura 2.2 Representao parcial da planilha de dados do exemplo dos ursos.

V A RI V E I S
Nome 1 2 3 4 5 6 Allen Berta Clyde Doc Quincy Kooch Ms Obs. jul jul jul jul set out

Idade 19 19 19 55 81 * Sexo macho fmea macho macho macho macho

E L E M E N T O S

Cabea Cabea Pescoo Altura Comp. Larg. Peri. 25,4 12,7 38,1 114,3 27,9 16,5 50,8 120,7 27,9 14,0 40,6 134,6 41,9 22,9 71,1 171,5 39,4 20,3 78,7 182,9 40,6 20,3 81,3 195,6

Trax Peri. 58,4 61,0 66,0 114,3 137,2 132,1

Peso 29,5 31,8 36,3 156,2 188,9 196,1

93 94 95 96 97

Sara Lou Molly Graham Jeffrey

ago ago ago jul jul

* * * * *

fmea macho fmea macho macho

30,5 30,5 33,0 30,5 34,3

12,7 14,0 15,2 10,2 15,2

45,7 38,1 55,9 44,5 50,8

142,2 129,5 154,9 149,9 157,5

82,6 61,0 101,6 72,4 82,6

51,8 37,2 104,4 58,1 70,8

3. Tipos de Variveis
Varivel a caracterstica de interesse que medida em cada elemento da amostra ou populao. Como o nome diz, seus valores variam de elemento para elemento. As variveis podem ter valores numricos ou no numricos. Variveis Quantitativas: so as caractersticas que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numricos que fazem sentido. Podem ser contnuas ou discretas. Variveis contnuas: caractersticas mensurveis que assumem valores em uma escala contnua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas atravs de algum instrumento. Exemplos: peso (balana), altura (rgua), tempo (relgio), presso arterial, idade. Variveis discretas: caractersticas mensurveis que podem assumir apenas um nmero finito ou infinito contvel de valores e, assim, somente fazem sentido valores inteiros. Geralmente so o resultado de contagens. Exemplos: nmero de filhos, nmero de bactrias por litro de leite, nmero de cigarros fumados por dia. Variveis Qualitativas (ou categricas): so as caractersticas que no possuem valores quantitativos, mas, ao contrrio, so definidas por vrias categorias, ou seja, representam uma classificao dos indivduos. Podem ser nominais ou ordinais. Varivel nominais: no existe ordenao dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/no fumante, doente/sadio. Variveis ordinais: existe uma ordenao entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estgio da doena (inicial, intermedirio, terminal), ms de observao (janeiro, fevereiro,..., dezembro). Uma varivel originalmente quantitativa pode ser coletada de forma qualitativa. Por exemplo, a varivel idade, medida em anos completos, quantitativa (contnua); mas, se for informada apenas a faixa etria (0 a 5 anos, 6 a 10 anos, etc...), qualitativa (ordinal). Outro exemplo o peso dos lutadores de boxe, uma varivel quantitativa (contnua) se trabalhamos com o valor obtido na balana, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.). Outro ponto importante que nem sempre uma varivel representada por nmeros quantitativa. O nmero do telefone de uma pessoa, o nmero da casa, o nmero de sua identidade. s vezes o sexo do indivduo registrado na planilha de dados como 1 se macho e 2 se fmea, por exemplo. Isto no significa que a varivel sexo passou a ser quantitativa !
WExemplo do ursos marrons (continuao). W

No conjunto de dados ursos marrons, so qualitativas as variveis sexo (nominal) e ms da observao (ordinal); so quantitativas contnuas as demais: idade, comprimento da cabea, largura da cabea, permetro do pescoo, permetro do trax, altura e peso.

4. Estudando a Distribuio de Freqncias de uma Varivel


Como j sabemos, as variveis de um estudo dividem-se em quatro tipos: qualitativas (nominais e ordinais) e quantitativas (discretas e contnuas). Os dados gerados por esses tipos de variveis so de naturezas diferentes e devem receber tratamentos diferentes. Portanto, vamos estudar as ferramentas - tabelas e grficos - mais adequados para cada tipo de dados, separadamente.

4.1. Variveis Qualitativas Nominais e Ordinais


Iniciaremos essa apresentao com os dados de natureza qualitativa, que so os mais fceis de tratar do ponto de vista da anlise descritiva. No exemplo dos ursos, uma das duas variveis qualitativas presentes o sexo dos animais. Para organizar os dados provenientes de uma varivel qualitativa, usual fazer uma tabela de freqncias, como a Tabela 4.1, onde esto apresentadas as freqncias com que ocorrem cada um dos sexos no total dos 97 ursos observados. Cada categoria da varivel sexo (feminino, masculino) representada numa linha da tabela. H uma coluna com as contagens de ursos em cada categoria (freqncia absoluta) e outra com os percentuais que essas contagens representam no total de ursos (freqncia relativa). Esse tipo de tabela representa a distribuio de freqncias dos ursos segundo a varivel sexo. Como a varivel sexo qualitativa nominal, isto , no h uma ordem natural em suas categorias, a ordem das linhas da tabela pode ser qualquer uma.
Tabela 4.1: Distribuio de freqncias dos ursos segundo sexo.

Sexo Feminino Masculino Total

Freqncia Absoluta 35 62 97

Freqncia Relativa (%) 36,1 63,9 100,0

Quando a varivel tabelada for do tipo qualitativa ordinal, as linhas da tabela de freqncias devem ser dispostas na ordem existente para as categorias. A Tabela 4.2 mostra a distribuio de freqncias dos ursos segundo o ms de observao, que uma varivel qualitativa ordinal. Nesse caso, podemos acrescentar mais duas colunas com as freqncias acumuladas (absoluta e relativa), que mostram, para cada ms, a freqncia de ursos observados at aquele ms. Por exemplo, at o ms de julho, foram observados 31 ursos, o que representa 32,0% do total de ursos estudados. Note que as freqncias acumuladas no fazem sentido em distribuio de freqncias de variveis para as quais no existe uma ordem natural nas categorias, como o caso das qualitativas nominais.
Tabela 4.2: Distribuio de freqncias dos ursos segundo ms de observao.

Freqncias Simples Ms de Observao Abril Maio Junho Julho Agosto Setembro Outubro Novembro Total Freqncia Absoluta 8 6 6 11 23 20 14 9 97 Freqncia Relativa (%) 8,3 6,2 6,2 11,3 23,7 20,6 14,4 9,3 100,0

Freqncias Acumuladas Freqncia Freqncia Absoluta Relativa Acumulada Acumulada (%) 8 8,3 14 14,5 20 20,7 31 32,0 54 55,7 74 76,3 88 90,7 97 100,0 ---------

A visualizao da distribuio de freqncias de uma varivel fica mais fcil se fizermos um grfico a partir da tabela de freqncias. Existem vrios tipos de grficos, dependendo do tipo de varivel a ser representada. Para as variveis do tipo qualitativas, abordaremos dois tipos de grficos: os de setores e os de barras. Os grficos de setores, mais conhecidos como grficos de pizza ou torta, so construdos dividindo-se um crculo (pizza) em setores (fatias), um para cada categoria, que sero proporcionais freqncia daquela categoria. A Figura 4.1 mostra um grfico de setores para a varivel sexo, construdo a partir da Tabela 4.1. Atravs desse grfico, fica mais fcil perceber que os ursos machos so a grande maioria dos ursos estudados. Como esse grfico contm todas as informaes da Tabela 4.1, pode substitu-la com a vantagem de tornar anlise dessa varivel mais agradvel. As vantagens da representao grfica das distribuies de freqncias ficam ainda mais evidentes quando h a necessidade de comparar vrios grupos com relao variveis que possuem muitas categorias, como veremos mais adiante. Uma alternativa ao grfico de setores o grfico de barras (colunas) como o da Figura 4.2. Ao invs de dividirmos um crculo, dividimos uma barra. Note que, em ambos os grficos, as freqncias relativas das categorias devem somar 100%. Alis, esse a idia dos grficos: mostrar como se d a diviso (distribuio) do total de elementos (100%) em partes (fatias).
Figura 4.1 Grfico de setores para a varivel sexo. Figura 4.2 Grfico de barras para a varivel sexo.
100% 90% 80%
Freqncia Relativa (%)

70% 60% 50% 40% 30% 20% 10% 0%

63,9%

Macho Fmea 36,1%

Uma situao diferente ocorre quando desejamos comparar a distribuio de freqncias de uma mesma varivel em vrios grupos, como por exemplo, a freqncia de ursos marrons em quatro regies de um pas. Se quisermos usar o grfico de setores para fazer essa comparao, devemos fazer quatro grficos, um para cada regio, com duas fatias cada um (ursos marrons e ursos no marrons). Uma alternativa a construo de um grfico de colunas (barras) como os grficos das figuras 4.3 e 4.4, onde h uma barra para cada regio representando a freqncia de ursos marrons naquela regio. Alm de economizar espao na apresentao, permite que as comparaes sejam feitas de maneira mais rpida (tente fazer essa comparao usando quatro pizzas e comprove!!) Note que a soma das freqncias relativas de ursos marrons em cada regio no 100% e nem deve ser, pois tratam-se de freqncias calculadas em grupos (regies) diferentes. A ordem dos grupos pode ser qualquer, ou aquela mais adequada para a presente anlise. Freqentemente, encontramos as barras em ordem decrescente, j antecipando nossa intuio de ordenar os grupos de acordo com sua freqncia para facilitar as comparaes. Caso a varivel fosse do tipo ordinal, a ordem das barras seria a ordem natural das categorias, como na tabela de freqncias.

Figura 4.3 Grfico de barras horizontais para a freqncia de ursos marrons em quatro regies.

Figura 4.4 Grfico de barras horizontais para a freqncia de ursos marrons em quatro regies.
80
Freq.Relativa de Ursos Marrons (%)

70 60 50 40 30 20 10 0 A B C D

Regies do Pas

20

40

60

80

Freqncia Relativa de Ursos Marrons (%)

Regies do Pas

A Figura 4.5 mostra um grfico de barras que pode ser usado da comparao da distribuio de freqncias de uma mesma varivel em vrios grupos. tambm uma alternativa ao uso de vrios grficos de setores, sendo, na verdade, a juno de trs grficos com os da Figura 4.2 num s grfico. Porm, esse tipo de grfico s deve ser usado quando no houver muitos grupos a serem comparados e a varivel em estudo no tiver muitas categorias (de preferncia, s duas). No exemplo da Figura 4.5, a varivel raa tem trs categorias, mas uma delas muito menos freqente do que as outras duas. Atravs desse grfico, podemos observar que a populao brasileira total, em 1999, dividia-se quase que igualmente entre brancos e negros, com uma pequena predominncia de brancos. Porm, quando nos restringimos s classes menos favorecidas economicamente, essa situao se inverte, com uma considervel predominncia de negros, principalmente na classe da populao considerada indigente, indicando que a classe scio-econmica influencia a distribuio de negros e brancos na populao brasileira de 1999.
Figura 4.5 Grfico de barras para comparao da distribuio de freqncias de uma varivel (raa) em vrios grupos (indigentes, pobres e populao total).
Distribuio da populao brasileira total e das populaes de indigentes e de pobres segundo raa em 1999 (%) Brancos Negros Outros

Indigentes

30,73

68,85

0,42

Pobres

35,95

63,63

0,42

Total

54,02
0 20 40 60

45,33
80

0,65
100

Freqentemente, necessrio fazer comparaes da distribuio de freqncias de uma varivel em vrios grupos simultaneamente. Nesse caso, o uso de grficos bem escolhidos e construdos torna a tarefa muito mais fcil. Na Figura 4.6, est representada a distribuio de freqncias da reprovao segundo as variveis sexo do aluno, perodo e rea de estudo. Analisando os trs grficos da Figura 4.6, podemos notar que o percentual de reprovao entre os alunos do sexo masculino sempre maior do que o percentual de reprovao entre os alunos do sexo feminino, em todas as reas, durante todos os perodos. A rea de cincias exatas a que possui os maiores percentuais de reprovao, em todos os perodos, nos dois sexos. Na rea de cincias humanas, o percentual de reprovao entre os alunos do sexo masculino cresce com os perodos, enquanto esse percentual entre as alunas se mantm praticamente constante

durante os perodos. Na rea de cincias biolgicas, h uma diminuio do percentual de reprovao, a partir do segundo perodo, entre os alunos do dos sexos, sendo mais acentuado entre os estudantes do sexo masculino. Chegar s concluses colocadas no pargrafo anterior atravs de comparao numrica de tabelas de freqncias seria muito mais rduo do que atravs da comparao visual possibilitada pelo uso dos grficos. Os grficos so ferramentas poderosas e devem ser usadas sempre que possvel. importante observar que a comparao dos trs grficos da Figura 4.6 s foi possvel porque eles usam a mesma escala, tanto no eixo dos perodos (mesma ordem) quanto no eixo dos percentuais de reprovao (mais importante). Essa observao vlida para toda comparao entre grficos de quaisquer tipo.
Figura 4.6: Distribuio de freqncias de reprovao segundo rea, perodo e sexo do aluno.
rea Exatas
20 15 10 5 0 1 2 3 4 Masculino Feminino

Reprovao (%)

Perodo

rea Humanas
20 15 10 5 0 1 2 3 4 Masculino Feminino

Reprovao (%)

Perodo

rea Biolgicas
20 15 10 5 0 1 2 3 4 Masculino Feminino

Reprovao (%)

Perodo

Fonte: A Evaso no Ciclo Bsico da UFMG, em Cadernos de Avaliao 3, 2000.

4.2. Variveis Quantitativas Discretas


Quando estamos trabalhando com uma varivel discreta que assume poucos valores, podemos dar a ela o mesmo tratamento dado s variveis qualitativas ordinais, assumindo que cada valor uma classe e que existe uma ordem natural nessas classes. A Tabela 4.3 apresenta a distribuio de freqncias do nmero de filhos por famlia em uma localidade, que, nesse caso, assumiu apenas seis valores distintos.
Tabela 4.3 Distribuio de freqncias do nmero de filhos por famlia em uma localidade (25 lares).

Nmero de filhos 0 1 2 3 4 5 Total

Freqncia Absoluta 1 4 10 6 2 2 25

Freqncia Relativa (%) 4,0 16,0 40,0 24,0 8,0 8,0 100

Freqncia Relativa Acumulada (%) 4,0 20,0 60,0 84,0 92,0 100,0 ------

Analisando a Tabela 4.3, podemos perceber que as famlias mais freqentes so as de dois filhos (40%), seguida pelas famlias de trs filhos. Apenas 16% das famlias tm mais de trs filhos, mas so ainda mais comuns do que famlias sem filhos. A Figura 4.7 mostra a representao grfica da Tabela 4.3 e a Figura 4.8 mostra a distribuio de freqncias do nmero de filhos por famlia na localidade B. Como o nmero de famlias estudadas em cada localidade diferente, a freqncia utilizada em ambos os grficos foi a relativa (em porcentagem), tornando os dois grficos comparveis. Comparando os dois grficos, notamos que a localidade B tende a ter famlias menos numerosas do que a localidade A . A maior parte das famlias da localidade B (cerca de 70%) tm um ou nenhum filho.
Figura 4. 7: Distribuio de freqncias do nmero de filhos por famlia na localidade A (25 lares). Figura 4. 8: Distribuio de freqncias do nmero de filhos por famlia na localidade B (36 lares).

Distribuio das famlias segundo no. de filhos (local A)


Procentagem das Famlias 50 Porcentagem das Famlias 40 30 20 10 0 0 1 2 3 4 5 Nmero de filhos

50 40 30 20 10 0

Distribuio das Famlias segundo No. de Filhos (local B)

Nmero de Filhos

Importante:

Na comparao da distribuio de freqncias de uma varivel entre dois ou mais grupos de tamanhos (nmero de observaes) diferentes, devemos usar as freqncias relativas na construo do histograma. Deve-se, tambm usar a mesma escala em todos os histogramas, tanto na escala vertical quanto na horizontal.

Quando trabalhamos com uma varivel discreta que pode assumir um grande nmero de valores distintos como, por exemplo, o nmero de ovos que um inseto pe durante sua vida, a construo da tabela de freqncias e de grficos considerando cada valor como uma categoria fica invivel. A soluo agrupar os valores em classes ao montar a tabela, como mostra a Tabela 4.4.
Tabela 4.4: Distribuio de freqncias do nmero de ovos postos por 250 insetos.

Freqncias Simples Nmero de ovos 10 a 14 15 a 19 20 a 24 25 a 29 30 a 34 35 a 39 40 a 44 Total Freqncia Absoluta 4 30 97 77 33 7 2 250 Freqncia Relativa (%) 1,6 12,0 38,8 30,8 13,2 2,8 0,8 100

Freqncias Acumuladas Freq. Rel. Freq. Abs. Acumulada Acumulada (%) 4 1,6 34 13,6 131 52,4 208 83,2 241 96,4 248 99,2 250 100,0 -----

A Figura 4.9 mostra o grfico da distribuio de freqncias do nmero de ovos postos por 250 insetos ao longo de suas vidas. Podemos perceber que o nmero de ovos est concentrado em torno de 20 a 24 ovos com um ligeiro deslocamento para os valores maiores.
Figura 4. 9: Distribuio de freqncias do nmero de ovos postos por 250 insetos.
45 40 Frequncia Relativa (%) 35 30 25 20 15 10 5 0 10 a 14 15 a 19 20 a 24 25 a 29 30 a 34 35 a 39 40 a 44 Nmero de ovos

A escolha do nmero de classes e do tamanho das classes depende da amplitude dos valores a serem representados (no exemplo, de 10 a 44) e da quantidade de observaes no conjunto de dados. Classes muito grandes resumem demais a informao contida nos dados, pois foram a construo de poucas classes. No exemplo dos insetos, seria como, por exemplo, construir classes da tamanho 10, o que reduziria para quatro o nmero de classes (Figura 4.10). Por outro lado, classes muito pequenas nos levaria a construir muitas classes, o que poderia no resumir a informao como gostaramos. Alm disso, para conjuntos de dados pequenos, pode ocorrer classes com muito poucas observaes ou mesmo sem observaes. Na Figura 4.11, h classes sem observaes, mesmo o conjunto de dados sendo grande. Alguns autores recomendam que tabelas de freqncias (e grficos) possuam de 5 a 15 classes, dependendo do tamanho do conjunto de dados e levando-se em considerao o que foi exposto anteriormente.

Figura 4.10: Distribuio de freqncias do nmero de ovos postos por 250 insetos (classes de tamanho 10).
80 70 Frequncia Relativa (%)
Frequncia Relativa (%)

Figura 4. 11: Distribuio de freqncias do nmero de ovos postos por 250 insetos (classes de tamanho 2).
16 14 12 10 8 6 4 2 0

60 50 40 30 20 10 0 10 a 19 20 a 29 30 a 39 40 a 49 Nmero de ovos

10 a 12 a 14 a 16 a 18 a 20 a 22 a 24 a 26 a 28 a 30 a 32 a 34 a 36 a 38 a 40 a 42 a 44 a 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45

Nmero de Ovos

Os limites inferiores e superiores de cada classe dependem do tamanho (amplitude) de classe escolhido, que deve ser, na medida do possvel, igual para todas as classes. Isso facilita a interpretao da distribuio de freqncias da varivel em estudo. Com o uso do computador na anlise estatstica de dados, a tarefa de construo de tabelas e grficos ficou menos trabalhosa e menos dependente de regras rgidas. Se determinado agrupamento de classes no nos pareceu muito bom, podemos construir vrios outros quase que instantaneamente e a escolha da melhor representao para a distribuio de freqncias para aquela varivel fica muito mais tranqila1. O grfico da Figura 4.12, com classes de tamanho trs, uma alternativa ao grfico da Figura 4.9.
Figura 4.12: Alternativa distribuio de freqncias do nmero de ovos da Figura 4.9.
30 Frequncia Relativa (%) 25 20 15 10 5 0

10 a

13 a 12

16 a 15

19 a 18

Nmero de ovos

22 a 21

25 a 24

28 a 27

31 a 30

34 a 33

37 a 36

40 a 42 39

Em publicaes mais antigas sobre construo de tabelas de freqncias, h frmulas para determinao do nmero de classes de acordo com o nmero de dados. Essas frmulas eram teis, pois a construo dos grficos era muito custosa sem o auxlio do computador. Hoje em dia, essas frmulas s so (ou deveriam ser) usadas pelos programas de computador, que precisam de frmulas na gerao de tabelas e grficos no modo automtico. Esse procedimento aconselhvel como uma primeira visualizao da distribuio de freqncias de uma varivel.

4.3. Variveis Quantitativas Contnuas


Quando a varivel em estudo do tipo contnua, que assume muitos valores distintos, o agrupamento dos dados em classes ser sempre necessrio na construo das tabelas de freqncias. A Tabela 4.5 apresenta a distribuio de freqncias para o peso dos ursos machos.
Tabela 4.5: Distribuio de freqncias dos ursos machos segundo peso.

Peso (kg) 0 |- 25 25 |- 50 50 |- 75 75 |- 100 100 |- 125 125 |- 150 150 |- 175 175 |- 200 200 |- 225 225 |- 250 Total

Freqncia Absoluta 3 11 15 11 3 4 8 5 1 1 62

Freqncia Relativa (%) 4,8 17,7 24,2 17,7 4,8 6,5 12,9 8,1 1,6 1,6 100,0

Freq. Abs. Acumulada 3 14 29 40 43 47 55 60 61 62 -

Freq. Rel. Acumulada (%) 4,8 22,6 46,8 64,5 69,4 75,8 88,7 96,8 98,4 100,0 -

Os limites das classes so representados de modo diferente daquele usado nas tabelas para variveis discretas: o limite superior de uma classe igual ao limite inferior da classe seguinte. Mas, afinal, onde ele est includo? O smbolo |- resolve essa questo. Na segunda classe (25 |50), por exemplo, esto includos todos os ursos com peso de 25,0 a 49,9 kg. Os ursos que porventura pesarem exatos 50,0 kg sero includos na classe seguinte. Ou seja, ursos com pesos maiores ou iguais a 25 kg e menores do que 50 kg. A construo das classes da tabela de freqncias feita de modo a facilitar a interpretao da distribuio de freqncias, como discutido anteriormente. Geralmente, usamos tamanhos e limites de classe mltiplos de 5 ou 10. Isso ocorre porque estamos acostumados a pensar no nosso sistema numrico, que o decimal. Porm, nada nos impede de construirmos classes de outros tamanhos (inteiros ou fracionrios) desde que isso facilite nossa visualizao e interpretao da distribuio de freqncias da varivel em estudo. Mesmo assim, para os que no se sentem vontade com tamanha liberdade, disponibilizamos, no Anexo 2, os passos a serem seguidos na construo de uma tabela de freqncias para variveis contnuas. A representao grfica da distribuio de freqncias de uma varivel contnua feita atravs de um grfico chamado histograma, mostrado nas figuras 4.13 e 4.14. O histograma nada mais do que o grfico de barras verticais, porm construdo com as barras unidas, devido ao carter contnuo dos valores da varivel.
Figura 4.13: Histograma para a distribuio de freqncias (absolutas) do peso dos ursos machos. Figura 4.14: Histograma para a distribuio de freqncias (relativas) do peso dos ursos machos.

Os histogramas das figuras 4.13 e 4.14 tm a mesma forma, apesar de serem construdos usando as freqncias absolutas e relativas, respectivamente. O objetivo dessas figuras mostrar que a escolha do tipo de freqncia a ser usada no muda a forma da distribuio. Entretanto, o uso da freqncia relativa torna o histograma comparvel a outros histogramas, mesmo que os conjuntos de dados tenham tamanhos diferentes (desde a mesma escala seja usada!) Analisando o histograma para o peso dos ursos machos, podemos perceber que h dois grupos de ursos: os mais leves, com pesos em torno de 50 a 75 Kg, e os mais pesados, com pesos em torno de 150 a 175 Kg. Essa diviso pode ser devida a uma outra caracterstica dos ursos, como idades ou hbitos alimentares diferentes, por exemplo. A Tabela 4.6 apresenta a distribuio de freqncias para o peso dos ursos fmeas, representada graficamente pelo histograma da Figura 4.15. Apesar de no haver, neste conjunto de dados, fmeas com peso maior de que 175 Kg, as trs ltimas classes foram mantidas para que pudssemos comparar machos e fmeas quanto ao peso.
Tabela 4.6: Distribuio de freqncias dos ursos fmeas segundo peso.

Peso (kg) 0 |- 25 25 |- 50 50|- 75 75 |- 100 100 |- 125 125 |- 150 150 |- 175 175 |- 200 200 |- 225 225 |- 250 Total

Freqncia Absoluta 3 5 18 5 2 1 1 0 0 0 35

Freqncia Relativa (%) 8,6 14,3 51,4 14,3 5,7 2,9 2,9 0 0 0 100,0

Freq. Abs. Acumulada 3 8 26 31 33 34 35 35 35 35 -

Freq. Rel. Acumulada 8,6 22,9 74,3 88,6 94,3 97,1 100,0 100,0 100,0 100,0 -

A Figura 4.16 mostra o histograma para o peso dos ursos machos. Note que ele tem a mesma forma dos histogramas das figuras 4.13 e 4.14, porm com as barras mais achatadas, devido mudana de escala no eixo vertical para torn-lo comparvel ao histograma das fmeas. Comparando as distribuies dos pesos dos ursos machos e fmeas, podemos concluir que as fmeas so, em geral, menos pesadas do que os machos, distribuindo-se quase simetricamente em torno da classe de 50 a 75 Kg . O peso das fmeas mais homogneo (valores mais prximos entre si) do que o peso dos ursos machos.
Figura 4.15: Histograma para a distribuio de freqncias do peso dos ursos fmeas. Figura 4.16: Histograma para a distribuio de freqncias do peso dos ursos machos.

Muitas vezes, a anlise da distribuio de freqncias acumuladas mais interessante do que a de freqncias simples, representada pelo histograma. O grfico usado na representao grfica da distribuio de freqncias acumuladas de uma varivel contnua a ogiva, apresentada na Figura 4.17. Para a construo da ogiva, so usadas as freqncias acumuladas (absolutas ou relativas) no eixo vertical e os limites superiores de classe no eixo horizontal.
Figura 4.17: Ogivas para as distribuies de freqncias do peso dos ursos machos e fmeas.

O primeiro ponto da ogiva formado pelo limite inferior da primeira classe e o valor zero, indicando que abaixo do limite inferior da primeira classe no existem observaes. Da por diante, so usados os limites superiores das classes e suas respectivas freqncias acumuladas, at a ltima classe, que acumula todas as observaes. Assim, uma ogiva deve comear no valor zero e, se for construda com as freqncias relativas acumuladas, terminar com o valor 100%. A ogiva permite que sejam respondidas perguntas do tipo: a) Qual o percentual de ursos tm peso de at 125 Kg?
Na Figura 4.18(a), traamos uma linha vertical partindo do ponto 120 kg at cruzar com cada ogiva (fmeas e machos). A partir deste ponto de cruzamento, traamos uma linha horizontal at o eixo das freqncias acumuladas, encontrando o valor de 70% para os machos e 95% para as fmeas. Assim, 95% das fmeas tm at 125 kg, enquanto 70% dos machos tm at 125 kg. o mesmo que dizer que apenas 5% das fmeas pesam mais que 125 kg, enquanto 30% dos machos pesam mais que 125 kg.

b) Qual o valor do peso que deixa abaixo (e acima) dele 50% dos ursos?

Na Figura 4.18(b), traamos uma linha horizontal partindo da freqncia acumulada de 50% at encontrar as duas ogivas. A partir destes pontos de encontro, traamos uma linha vertical at o eixo do valores de peso, encontrando o valor de 80 kg para os machos e 65 kg para as fmeas. Assim, metade dos machos pesam at 80 kg (e metade pesam mais que 80 kg), enquanto metade das fmeas pesam at 65 kg.

Figura 4.18: Ogivas para as distribuies de freqncias do peso dos ursos machos e fmeas.
(a)

(b)

4.4. Outros Grficos para Variveis Quantitativas


Quando construmos uma tabela de freqncias para uma varivel quantitativa utilizando agrupamento de valores em classes, estamos resumindo a informao contida nos dados. Isto desejvel quando o nmero de dados grande e, sem um algum tipo de resumo, ficaria difcil tirar concluses sobre o comportamento da varivel em estudo. Porm, quando a quantidade de dados disponveis no to grande, o resumo promovido pelo histograma no aconselhvel. Para os casos em que o nmero de dados pequeno, uma alternativa para a visualizao da distribuio desses dados so os grficos denominados diagrama de pontos e diagrama de ramo-e-folhas.

O Diagrama de Pontos
Uma representao alternativa ao histograma para a distribuio de freqncias de uma varivel quantitativa o diagrama de pontos, como aqueles mostrado mostrados na Figura 4.19. Neste grfico, cada ponto representa uma observao com determinado valor da varivel. Observaes com mesmo valor so representadas com pontos empilhados neste valor.
Figura 4.19 Diagramas de pontos para o peso de ursos machos e peso dos ursos fmeas.

Atravs da comparao dos diagramas de pontos da Figura 4.19, podemos ver que os ursos machos possuem pesos menos homogneos (mais dispersos) do que as fmeas, que esto concentradas na parte esquerda do eixo de valores de peso.

O Diagrama de Ramo-e-Folhas
Outro grfico til e simples para representar a distribuio de freqncias de uma varivel quantitativa com poucas observaes o diagrama de ramo-e-folhas. A sua sobre os demais que ele explicita os valores dos dados, como veremos.
WExemplo dos ursos marrons (continuao) W

Dos 35 ursos fmeas observados, somente 20 puderam ter sua idade estimada. Para visualizar a distribuio dos valores de idade dessas fmeas, usaremos um diagrama de ramo-efolhas, j que um histograma resumiria mais ainda algo que j est resumido. Os 20 valores de idade (em meses) disponveis, j ordenados so:

11

17

17

19

20

44

45

53

57

57

57

58

70

81

82

83

100

104

Podemos organizar os dados, separando-os pela dezenas, uma em cada linha:

8 9 11 17 20 44 45 53 57 70 81 82 100 104

17

19

57 83

57

58

Como muitos valores em cada linha tem as dezenas em comum, podemos colocar as dezenas em evidncia, separando-as das unidades por um trao. Ao dispor os dados dessa maneira, estamos construindo um diagrama de ramo-e-folhas (Figura 4.20). O lado com as dezenas chamado de ramo, no qual esto dependuradas as unidades, chamadas folhas.
Figura 4.20 - Ramo-e-folhas da idade (meses) dos ursos fmeas.

0 1 2 3 4 5 6 7 8 9 10

8 9 1 7 7 9 0 4 5 3 7 7 7 8 0 1 2 3 0 4
Legenda: 5 | 3 = 53 meses 10| 0 = 100 meses

Os ramos e as folhas podem representar quaisquer unidades de grandeza (dezenas e unidades, centenas e dezenas, milhares e centenas, etc). Para sabermos o que est sendo representado, um ramo-e-folhas deve ter sempre uma legenda, indicando o que significam os ramos e as folhas. Se a idade estivesse medida em dias, por exemplo, usando esse mesmo ramo-efolhas, poderamos estabelecer que o ramo representaria as centenas e as folhas, as dezenas. Assim, 0|8 seria igual a 80 dias e 10|4 seria igual a 1040 dias. Analisando o ramo-e-folhas para a idade dos ursos fmeas, percebemos a existncia de trs grupos: fmeas mais jovens (at 20 meses), fmeas mais crescidas (de 44 a 58 meses) e um grupo mais velho (mais de 70 meses), com destaque para duas fmeas bem mais velhas. O ramo-e-folhas tambm pode ser usado para comparar duas distribuies de valores, como mostra a Figura 4.21. Aproveitando o mesmo ramo do diagrama das fmeas, podemos fazer o diagrama dos machos, utilizando o lado esquerdo. Observe que as folhas dos ursos machos so dependuradas de modo espelhado, assim como explica a legenda, que agora deve ser dupla. Observando a Figura 4.21, notamos que os ursos machos so, em geral, mais jovens do que os ursos fmeas, embora possuam dois ursos bem idosos em comparao com os demais.

Figura 4.21 Ramo-e-folhas para idade dos ursos machos e fmeas (em meses).
Idade dos Machos (meses) Idade das Fmeas (meses)

9 9 8 9 9 8 7 6 6 1 0 0 0 3 1 1 1 5 4 4 4 3 2 2 5 5 8 6 5 1 8 0 3 1 5

7
Legenda:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

8 9 1 7 7 9 0 4 5 3 7 7 7 8 0 1 2 3 0 4

|3|1 significa 31 meses para fmeas 1|3| significa 31 meses para machos

Importante:

No ramo-e-folhas, estamos trabalhando, implicitamente, com freqncias absolutas. Assim, ao comparar dois grupos de tamanhos diferentes, devemos levar isso em conta. Caso os tamanhos dos grupos sejam muito diferentes, no se deve adotar o ramo-e-folhas como grfico para comparao de distribuies.

4.5. Aspectos Gerais da Distribuio de Freqncias


Ao estudarmos a distribuio de freqncias de uma varivel quantitativa, seja em um grupo apenas ou comparando vrios grupos, devemos verificar basicamente trs caractersticas: Tendncia Central; Variabilidade; Forma. O histograma (ou o diagrama de pontos, ou o ramo-e-folhas) permite a visualizao destas caractersticas da distribuio de freqncias, como veremos a seguir. Alm disso, elas podem ser quantificadas atravs das medidas de sntese numrica (no discutidas aqui).

Tendncia Central
A tendncia central da distribuio de freqncias de uma varivel caracterizada pelo valor (ou faixa de valores) tpico da varivel. Uma das maneiras de representar o que tpico atravs do valor mais freqente da varivel, chamado de moda. Ou, no caso da tabela de freqncias, a classe de maior freqncia, chamada de classe modal. No histograma, esta classe corresponde quela com barra mais alta (pico).

No exemplo dos ursos marrons, a classe modal do peso dos ursos fmeas claramente a terceira, de 50 a 75 kg (Figura 4.16). Assim, os ursos fmeas pesam, tipicamente, de 50 a 75 kg. Entretanto, para os ursos machos, temos dois picos: de 50 a 75 kg e de 150 a 175 kg (Figura 4.17). Ou seja, temos um grupo de machos com peso tpico como o das fmeas e outro grupo, menor, formado por ursos tipicamente maiores. Dizemos que a distribuio de freqncias do peso dos ursos fmeas unimodal (apenas uma moda) e dos ursos machos bimodal (duas modas). Geralmente, um histograma bimodal indica a existncia de dois grupos, com valores centrados em dois pontos diferentes do eixo de valores. Uma distribuio de freqncias pode tambm ser amodal, ou seja, todos os valores so igualmente freqentes.

Variabilidade
Para descrever adequadamente a distribuio de freqncias de uma varivel quantitativa, alm da informao do valor representativo da varivel (tendncia central), necessrio dizer tambm o quanto estes valores variam, ou seja, o quo dispersos eles so. De fato, somente a informao sobre a tendncia central de um conjunto de dados no consegue represent-lo adequadamente. A Figura 4.22 mostra um diagrama de pontos para os tempos de espera de 21 clientes de dois bancos, um com fila nica e outro com fila mltipla, com o mesmo nmero de atendentes. Os tempos de espera nos dois bancos tm a mesma tendncia central de 7 minutos. Entretanto, os dois conjuntos de dados so claramente diferentes, pois os valores so muito mais dispersos no banco com fila mltipla. Assim, quando entramos num fila nica, esperamos ser atendidos em cerca de 7 minutos, com uma variao de, no mximo, meio minuto a mais ou a menos. Na fila mltipla, a variao maior, indicando-se que tanto pode-se esperar muito mais ou muito menos que o valor tpico de 7 minutos.
Figura 4.22 Diagrama de pontos para tempo de espera (minutos) em filas nica e mltipla.


    

Forma
A distribuio de freqncias de uma varivel pode ter vrias formas, mas existem trs formas bsicas, apresentadas na Figura 4.23 atravs de histogramas e suas respectivas ogivas. Quando uma distribuio simtrica em torno de um valor (o mais freqente), significa que as observaes esto igualmente distribudas em torno desse valor (metade acima e metade abaixo). A assimetria de uma distribuio pode ocorrer de duas formas: quando os valores concentram-se esquerda (assimetria com concentrao esquerda ou assimetria com cauda direita); quando os valores concentram-se direita (assimetria com concentrao direita ou com assimetria cauda esquerda); Ao definir a assimetria de uma distribuio, algumas pessoas preferem se referir ao lado onde est a concentrao dos dados. Porm, outras pessoas preferem se referir ao lado onde est faltando dados (cauda). As duas denominaes so alternativas. Em alguns casos, apenas o conhecimento da forma da distribuio de freqncias de uma varivel j nos fornece uma boa informao sobre o comportamento dessa varivel. Por exemplo, o que voc acharia se soubesse que a distribuio de freqncias das notas da primeira prova da disciplina de Estatstica que voc est cursando , geralmente, assimtrica com

concentrao direita ? Como voc acha que a forma da distribuio de freqncias da renda no Brasil ?
Figura 4.23 Formas bsicas para a distribuio de freqncias de uma varivel quantitativa e, abaixo, o esboo das respectivas ogivas.

Assimtrica (concentrao esquerda) ou (cauda direita)

Simtrica

Assimtrica (concentrao direita) ou (cauda esquerda)

Note que, quando a distribuio assimtrica com concentrao esquerda, a ogiva cresce bem rpido, por causa do acmulo de valores do lado esquerdo do eixo. Por outro lado, quando a distribuio assimtrica com concentrao direita, o ogiva cresce lentamente no comeo e bem rpido na parte direita do eixo, por causa do acmulo de valores desse lado. Quando a distribuio simtrica, a ogiva tem a forma de um S suave e simtrico. A ogiva para uma distribuio de freqncias bimodal (Figura 4.24) mostra essa caracterstica da distribuio atravs de um plat (barriga) no meio da ogiva. A ogiva para o peso dos ursos machos (Figura 4.18) tambm mostra essa barriga.
Figura 4.24 Esboo do histograma e ogiva para uma distribuio de freqncias bimodal.

5. Sries Temporais
Sries temporais (ou sries histricas) so um conjunto de observaes de uma mesma varivel quantitativa (discreta ou contnua) feitas ao longo do tempo. O conjunto de todas as temperaturas medidas diariamente numa regio um exemplo de srie temporal. Um dos objetivos do estudo de sries temporais conhecer o comportamento da srie ao longo do tempo (aumento, estabilidade ou declnio dos valores). Em alguns estudos, esse conhecimento pode ser usado para se fazer previses de valores futuros com base no comportamento dos valores passados. A representao grfica de uma srie temporal feita atravs do grfico de linha, como exemplificado nas figuras 5.1 e 5.2. No eixo horizontal do grfico de linha, est o indicador de tempo e, no eixo vertical, a varivel a ser representada. As linhas horizontais pontilhadas so opcionais e s devem ser colocadas quando ajudarem na interpretao do grfico. Caso contrrio, devem ser descartadas, pois, como j enfatizamos antes, um grfico deve ser o mais limpo possvel.
Figura 5.1 Grfico de linha para o nmero de ursos machos e fmeas observados ao longo dos meses de pesquisa.
15

Figura 5.2 Grfico de linha para a taxa de mortalidade infantil de 1989 a 1997 nas Regies Nordeste e Sul e no Brasil.
90 80 Taxa de Mortalidade Infantil (bitos por mil nascidos vivos) 70 60 50 40 30 20 10 Nordeste Brasil Sul

Fmeas Machos

No. de ursos observados

12

0 abr mai jun jul ago set out nov


0
1989 1990 1991 1992 1993 1994 1995 1996 1997

Ms de observao

Ano

No grfico da Figura 5.2, podemos notar que a taxa de mortalidade infantil na regio Nordeste esteve sempre acima da taxa da regio Sudeste durante todo o perodo considerado, com um declnio das taxas nas duas regies e tambm no Brasil como um todo ao longo do perodo. Embora o declnio absoluto na taxa da regio Nordeste tenha sido maior (aproximadamente 20 casos em mil nascidos vivos), a reduo percentual na taxa da regio Sudeste foi maior (cerca de 8 casos a menos nos 30 iniciais, ou seja, 27% a menos, enquanto 20 casos a menos nos 80 iniciais na regio Nordeste representam uma reduo de 25%. Podemos observar ainda uma tendncia estabilizao da taxa de mortalidade infantil da regio Sudeste a partir do ano de 1994, enquanto a tendncia de declnio permanece na regio Nordeste e no Brasil. Ao analisar e construir um grfico de linhas, devemos estar atentos a certos detalhes que podem mascarar o verdadeiro comportamento dos dados. A Figura 5.3(a) apresenta um grfico de linhas para o preo mdio do litro de leite entre os meses de maio e agosto de 2001. Apesar de colocar os valores para cada ms, o grfico no mostra a escala de valores e no representa a srie desde o comeo da escala, o valor zero. Essa concentrao da visualizao da linha somente na parte do grfico onde os dados esto situados distorce a verdadeira de dimenso da queda do preo, acentuando-a. Ao compararmos com o grfico da Figura 5.3(b), cujo escala vertical comea no zero, percebemos que houve mesmo uma queda, mas no to acentuada quanto aquela mostrada no grfico divulgado no jornal. Outro aspecto mascarado pela falta da escala que as diferenas entre os valores numricos no correspondem s distncias representadas no grfico. Por exemplo, no grfico de linha divulgado para a srie do preo do leite, vemos que a queda no preo de maio para junho foi de R$0,02 e, de julho para agosto, foi de R$0,04, duas vezes maior. No entanto, a distncia

(vertical) entre os pontos de maio e julho maior do que a distncia (vertical) entre os pontos de julho e agosto!! E mais, a queda de junho para junho foi de R$0,05, pouco mais do que a queda de R$0,04 de junho a agosto. Porm, a distncia (vertical) no grfico entre os pontos de junho e julho cerca de quatro vezes maior do que a distncia (vertical) dos pontos de julho e agosto!! Examinando o grfico apenas visualmente, sem nos atentar para os nmeros, tenderemos a pensar que as grandes quedas no preo do leite ocorreram no comeo do perodo de observao (de maio a julho), enquanto, na verdade, as quedas se deram quase da mesma forma ms a ms, sendo um pouco maiores no final do perodo (de julho a agosto). Alm disso, a palavra despenca nos faz pensar numa queda abrupta, que o que o grfico divulgado parece querer mostrar. No entanto, analisando o grfico da Figura 5.3(a), que corrige essas distores, notamos que houve sim uma queda, mas no to abrupta quanto colocada na Figura 5.3(b).
Figura 5.3 Grfico de linhas para o preo mdio do litro de leite: (a) original (jornal Folha de So Paulo, set/2001), (b) modificado, com a escala de valores mostrada e iniciando-se no zero.

a)

b)

0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 M aio Junho Julho Agosto

A Figura 5.4 mostra os efeitos na representao de uma srie temporal quando mudamos o comeo da escala de valores do eixo vertical. medida que aproximamos o comeo da escala do valor mnimo da srie, a queda nos parece mais abrupta. A mesma observao vale para o caso em que o grfico mostrar um aumento dos valores da srie: quanto mais o incio da escala se aproxima do valor mnimo da srie, mais acentuado parecer o aumento. De maneira geral, um grfico de linhas deve ser construdo de modo que: O incio do eixo vertical seja o valor mnimo possvel para a varivel que est sendo representada (para o caso do preo de leite, o valor zero, leite de graa), para evitar as distores ilustradas na Figura 5.4; O final do eixo vertical seja tal que a srie fica centrada em relao ao eixo vertical, como mostrado na Figura 5.5(a);

Os tamanhos dos eixos sejam o mais parecidos possvel, para que no ocorra a distoro mostrada nos grficos (b) e (c)) da Figura 5.5.

a)
0,40

Figura 5.5 Efeitos da mudana no incio e/ou final da escala do grfico em linhas da srie temporal do preo do leite. b)
0,40 0,36

c)

0,35

0,34 0,35

0,30

0,32

0,25

0,30

0,30

0,20

0,28 0,25

0,15

0,26

0,10 M aio Junho Julho A gosto

0,20 Maio Junho Julho A gos to

0,24 Maio Junho Julho A gos to

Figura 5.6 - Efeitos de alteraes na dimenso horizontal do grfico de linhas da srie do preo do leite a)
0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 Maio Junho Julho Agosto

b)

0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00

c)

0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 Maio Junho Julho Agosto

6. O Diagrama de Disperso
O diagrama de disperso um grfico onde pontos no espao cartesiano XY so usados para representar simultaneamente os valores de duas variveis quantitativas medidas em cada elemento do conjunto de dados. O Quadro 6.1 e a Figura 6.1 mostram um esquema do desenho do diagrama de disperso. Neste exemplo, foram medidos os valores de duas variveis quantitativas, X e Y, em quatro indivduos. O eixo horizontal do grfico representa a varivel X e o eixo vertical representa a varivel Y.
Quadro 6.1 - Dados esquemticos.
Indivduos A B C D Varivel X 2 4 4 8 Varivel Y 3 3 5 7

Figura 6.1 - Esquema do Diagrama de Disperso.


8 7 6 5

4 3 2 1 0 0 1 2 3 4 5 6 7 8

O diagrama de disperso usado principalmente para visualizar a relao/associao entre duas variveis, mas tambm para muito til para: Comparar o efeito de dois tratamentos no mesmo indivduo. Verificar o efeito tipo antes/depois de um tratamento; A seguir, veremos quatro exemplos da utilizao do diagrama de disperso. Os dois primeiros referem-se ao estudo da associao entre duas variveis. O terceiro utiliza o diagrama de disperso para comparar o efeito de duas condies no mesmo indivduo. O ltimo exemplo, similar ao terceiro, verifica o efeito da aplicao de um tratamento, comparando as medidas antes e depois da medicao.

WExemplo dos ursos marrons (continuao). W

Recorde que um dos objetivos dos pesquisadores neste estudo encontrar uma maneira de conhecer o peso do urso atravs de uma medida mais fcil de se obter do que a direta (carregar uma balana para o meio da selva e colocar os ursos em cima dela) como, por exemplo, uma medida de comprimento (altura, permetro do trax, etc.). O problema estatstico aqui encontrar uma varivel que tenha uma relao forte com o peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado, na verdade) o valor peso indiretamente, atravs de uma equao matemtica. O primeiro passo para encontrar esta varivel fazer o diagrama de disperso das variveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de informaes de todos os ursos. Voc pode tentar as variveis: idade, altura, comprimento da cabea, largura da cabea, permetro do pescoo e permetro do trax. Nas figuras 6.2 e 6.3, mostramos a relao entre peso e altura e entre peso e permetro do trax. Respectivamente.
Figura 6.2 - Diagrama de disperso da altura versus o peso dos ursos marrons.

Figura 6.3 - Diagrama de disperso do permetro do trax versus o peso dos ursos marrons.

Podemos ver que, tanto a altura quanto o permetro do trax so fortemente associados ao peso do urso, no sentido de que quanto mais alto o urso ou quanto maior a medida de seu trax, mais pesado ele ser. Mas note que este crescimento linear para o permetro do trax e no-linear para a altura. Alm disso, com os pontos esto mais dispersos no grfico da altura, a varivel mais adequada para estimar, sozinha, o peso o permetro do trax (a tcnica estatstica adequada aqui chama-se Regresso Linear Simples).

WExemplo dos morangos. W

Um produtor de morangos para exportao deseja produzir frutos grandes, pois frutos pequenos tm pouco valor mesmo no mercado interno. Alm disso, os frutos, mesmo grandes, no devem ter tamanhos muito diferentes entre si. O produtor suspeita que uma dos fatores que altera o tamanho dos frutos o nmero de frutos por rvore. Para investigar a relao entre o nmero de frutos que uma planta produz e o peso destes frutos, ele observou dados de 10 morangueiros na primeira safra (Quadro 6.2). O diagrama de disperso mostrado na Figura 6.4.
Quadro 6.2 Peso dos frutos e nmero de frutos por planta em 10 morangueiros na primeira safra.
Planta
1 2 3 4 5 6 7 8 9 10

No de frutos
5 6 7 8 9 10 11 12 13 14 15,15 14,00 13,67 11,00 10,24 9,00 7,82 7,25 6,95 7,00 15,45 14,50 13,76 11,50 11,12 9,32 8,56 9,41 7,61 8,00 15,63 15,35 14,06 12,39 12,05 10,67 8,74 10,15 8,53 9,00 15,65 15,86 14,11 12,39 12,37 11,56 9,57 10,33 10,00 10,00 16,38 15,94 14,54 12,90 13,48 11,67 11,08 10,80 10,94 10,00

Peso dos Frutos (gramas)


16,13 14,89 14,50 13,80 12,56 11,92 10,95 11,04 10,50

15,50 15,50 14,04 12,83 12,13 11,13 11,43 11,00

16,56 15,39 12,84 12,50 11,48 11,63 11,16

16,00 13,43 14,14 11,49 11,97 11,17

15,09 14,20 12,86 12,02 11,70

14,00 13,37 15,04 12,74 13,53 14,00 12,45 12,89 13,47 13,54

Figura 6.4 - Diagrama de disperso do nmero de frutos por rvore versus o peso do fruto e linha unindo os pesos mdios dos frutos.
18,00

Peso do Fruto (g)

15,00

12,00

9,00

6,00 4 5 6 7 8 9 10 11 12 13 14 15 Nmero de Frutos

O diagrama de disperso mostra-nos dois fatos. O primeiro, que h um decrscimo no valor mdio do peso do fruto por rvore medida que cresce o nmero de frutos na rvore. Ou seja, no vantagem uma rvore produzir muitos frutos, pois ele tendero a ser muito pequenos. O segundo fato que percebemos que, com o aumento no nmero de frutos na rvores, cresce tambm a variabilidade no peso, gerando tanto frutos muito grandes, como muito pequenos. Assim, conclui-se que no vantagem ter poucas plantas produzindo muito frutos, mas sim muitas plantas produzindo poucos frutos, mas grandes e uniformes. Uma anlise mais detalhada poder determinar o nmero ideal de frutos por rvore, aquele que maximiza o peso mdio e, ao mesmo tempo, minimiza a variabilidade do peso.

WExemplo da Capacidade Pulmonar. W

Em um estudo2 sobre tcnicas usadas para medir a capacidade pulmonar, coletaram-se dados fisiolgicos de 10 indivduos. Os valores constantes no Quadro 6.3 a seguir representam a capacidade vital forada (CVF) dos indivduos em posio sentada e em posio deitada. Deseja-se verificar se a posio (sentada/deitada) influi ou no na medio da capacidade vital forada.
Quadro 6.3 - Capacidade Vital Forada (litros) medida em 10 indivduos nas posies sentada e deitada.
Indivduo Sentado Deitado A 4,66 4,63 B 5,70 6,34 C 5,37 5,72 D 3,34 3,23 E 3,77 3,60 F 7,43 6,96 G 4,15 3,66 H 6,21 5,81 I 5,90 5,61 J 5,77 5,33

As amostras de cada posio (sentada/deitada) so do tipo emparelhadas, pois os mesmos indivduos foram utilizados nas duas amostras. Assim, natural compararmos a CVF em cada posio para cada indivduo, tomando a diferena na CVF deitada sentada (ou o contrrio):
Deitado - Sentado: -0,03 0,64 0,35 -0,11 -0,17 -0,47 -0,49 -0,40 -0,29 -0,44

Para grande maioria dos indivduos, a CVF na posio sentada maior do que na posio deitado. Mas como podemos visualizar isto e, ainda, ver se estas diferenas so grandes ? Atravs do diagrama de disperso mostrado na Figura 6.5.
Figura 6.5 - Diagrama de disperso da capacidade vital forada nas posies sentada e deitada e linha correspondendo igualdade das posies.
Capacidade Vital Forada (litros) 8,00

6,00 Deitado 4,00

2,00 2,00

4,00 Sentado

6,00

8,00

Cada ponto no diagrama de disperso corresponde s medidas de CVF de um indivduo, medida com o indivduo sentado e deitado. A linha marcada no diagrama corresponde situao onde a CVF do indivduo a mesma nas duas posies. Os pontos acima desta linha so os indivduos cuja CVF maior quando deitado; os pontos abaixo da linha so os indivduos cuja CVF menor quando deitados. Quanto maior a distncia dos pontos linha, maior a diferena na CVF entre as duas posies. Podemos ver que, embora a maior parte dos pontos esteja abaixo da linha, eles esto bem prximos a ela, mostrando que a diferena no significativa.

Dados de Validation of Esophageal Balloon Technique at Difefrent Lung Volumes and Postures, de Baydur et al,. Journal of Applied Physiology, v. 62, n. 1.

WExemplo do Captopril. W

Captopril um remdio destinado a baixar a presso sistlica. Para testar seu efeito, ele foi ministrado a 12 pacientes, tendo sido medida a presso sistlica antes e depois da medicao (Quadro 6.4).
Quadro 6.4 - Presso sistlica (mmHg) medida em 12 pacientes antes e depois do Captopril.
Paciente Antes Depois A 200 191 B 174 170 C 198 177 D 170 167 E 179 159 F 182 151 G 193 176 H 209 183 I 185 159 J 155 145 K 169 146 L 210 177

Os mesmos indivduos foram utilizados nas duas amostras (Antes/depois). Assim, natural compararmos a presso sistlica para cada indivduo, comparando a presso sistlica depois e antes. Para todos os pacientes, a presso sistlica depois do Captopril menor do que antes da medicao. Mas como podemos ver se estas diferenas so grandes ? Atravs do diagrama de disperso mostrado na Figura 6.6.
Figura 6.6 - Diagrama de disperso da presso sistlica antes X depois da medicao e linha correspondendo ao no efeito individual da medicao.
Presso Sistlica
Depois=Antes 220

200

Depois > Antes

Depois

180

160

Depois < Antes

140 140

160

180 Antes

200

220

Cada ponto no diagrama de disperso corresponde s medidas de presso sistlica de um paciente, medida antes e depois da medicao. A linha marcada no diagrama corresponde situao onde a presso sistlica no se alterou depois do paciente tomar o Captopril. Veja que todos os pontos esto abaixo desta linha, ou seja para todos os pacientes o Captopril fez efeito. Grande parte destes pontos est bem distante da linha, mostrando que a reduo na presso sistlica depois do uso do medicamento no foi pequena.

Referncias Bibliogrficas
Freund J. E. and Simon, G.A. (2000) Estatstica Aplicada Economia, Administrao e Contabilidade. 9a Edio, Bookman, 404 pg, ISBN 85-7307-531-7. Huff, D. (1982) How To Lie With Statistics. W.W. Norton & Company, 142 pg, ISBN 0-393-31072-8. Lopes, P. A. (1999) Probabilidades e Estatstica. Reichmann & Affonso Editores, 174 pg, ISBN 8587148-07-9. MINITAB Statistical Software, Release 13.30. Licenciado para Departamento de Estatstica UFMG. Peixoto, M.C.L., Braga, M.M. e Bogutchi, T.F. (2000) A Evaso no Ciclo Bsico da UFMG. Cadernos de Avaliao 3. Avaliao Institucional PAIUB-PROGRAD-UFMG, p. 7-28. Triola, M. F. (1999) Introduo Estatstica (traduo). 7a edio, Editora LTC, 410 pg, ISBN 85-2161154-4. Zeisel, H. (1985) Say It With Figures. 6a edio, Harper & Row Publishers,272 pg, ISBN 0-06-181982-4.

Anexo I: Conjunto de Dados do Exemplo dos Ursos Marrons


Nome 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 36 37 38 39 40 41 42 43 44 45 46 47 48 Allen Berta Clyde Doc Quincy Kooch Charlie Geraldine Fannie Dieter John Xeronda Clara Abe Eugene Floyd Kim Ichabod Lorie Mighty Oliver Ness Pete Robert Smokey Tozia Unser Viking Walt Xavier Yogi Zelda Allison Buck Diane Edith Gary Herman Jim Ken Leon Noreen Orville Pasquale Rich Ian Suzie Ms da Obs. jul jul jul jul set out jul ago abr jul abr set mai jun ago ago ago ago ago ago set set set set set set set set set set set set set set out out out out out out out out out out nov nov out nov Idade 19 19 19 55 81 * 115 104 100 56 51 57 53 * 68 8 44 32 20 32 45 9 21 177 57 81 21 9 45 9 33 57 45 21 10 82 70 10 10 34 34 34 58 58 11 23 70 11 Sexo macho fmea macho macho macho macho macho fmea fmea macho macho fmea fmea macho macho macho fmea macho fmea macho macho fmea macho macho fmea fmea macho macho macho macho macho fmea fmea macho macho fmea fmea macho macho macho macho macho fmea macho macho macho macho fmea Cabea Comprimento 25,4 27,9 27,9 41,9 39,4 40,6 43,2 39,4 33,0 38,1 34,3 34,3 31,8 30,5 40,6 22,9 31,8 35,6 29,2 33,0 34,3 22,9 33,0 40,6 31,8 33,0 33,0 25,4 40,6 25,4 34,3 33,0 33,0 36,8 24,1 34,3 36,8 27,9 29,2 33,0 41,9 35,6 34,3 39,4 29,2 30,5 39,4 22,9 Cabea Largura 12,7 16,5 14,0 22,9 20,3 20,3 25,4 16,5 17,8 19,1 20,3 17,8 15,2 21,1 22,9 11,4 11,4 12,7 12,7 20,3 17,8 11,4 15,2 24,1 12,7 12,7 12,7 10,2 15,2 10,2 15,2 14,0 16,5 14,0 11,4 16,5 16,5 12,7 12,7 17,8 16,5 14,0 16,5 17,8 15,2 16,5 17,8 12,7 Pescoo Permetro 38,1 50,8 40,6 71,1 78,7 81,3 80,0 55,9 53,3 67,3 68,6 50,8 45,7 47,0 73,7 33,0 26,7 54,6 44,5 54,6 61,0 30,5 48,3 76,2 48,3 50,8 43,2 33,0 61,0 34,3 55,9 44,5 53,3 50,8 40,6 71,1 66,0 43,2 43,2 53,3 68,6 61,0 54,6 71,1 41,9 48,3 71,1 38,1 Altura 114,3 120,7 134,6 171,5 182,9 195,6 182,9 157,5 177,8 186,7 174,0 162,6 147,3 153,2 185,4 94,0 160,0 170,2 132,1 149,9 162,6 91,4 149,9 182,9 146,1 154,9 137,2 101,6 160,0 109,2 168,9 153,7 152,4 154,9 101,6 162,6 165,1 124,5 119,4 149,9 182,9 165,1 160,0 179,1 121,9 127,0 194,3 116,8 Trax Permetro 58,4 61,0 66,0 114,3 137,2 132,1 124,5 88,9 104,1 104,1 124,5 96,5 78,7 81,3 111,8 48,3 81,3 94,0 73,7 83,8 99,1 48,3 76,2 121,9 81,3 83,8 71,1 58,4 106,7 58,4 86,4 78,7 87,6 86,4 66,0 121,9 121,9 73,7 74,9 88,9 113,0 99,1 101,6 127,0 78,7 96,5 139,7 68,6 Peso 29,5 31,8 36,3 156,2 188,9 196,1 158,0 75,4 99,9 118,9 163,4 92,6 65,4 55,4 150,7 15,4 63,6 81,7 47,7 75,4 92,6 11,8 54,5 197,9 56,8 59,9 40,9 18,2 99,9 20,9 69,9 52,7 82,6 68,1 29,5 161,6 143,5 42,7 39,0 68,1 122,6 91,7 91,7 165,7 35,9 67,2 202,5 28,1

35 Christophe

Continua...

....Continuao
Nome 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 Thelma U-Sam Bill Wille XRay Vanessa Zack Albert * * Denise Evelyn Fran Gert Michele Villager Sally Mary Sonny Davy Patty Friday Swartz Ann Tiffy Ralph Bronson Eddie Ozz Margie Pam Addy Curt Kermit Paul Frieda Chet Brander Louise Nan Ian Larry Scott Grizz Sara Lou Molly Graham Jeffrey Ms da Obs. nov nov abr abr abr abr abr abr ago mai mai mai mai mai jun jun jun jun jul jul jul ago ago ago ago ago ago ago ago ago ago ago ago set set set set out out nov nov nov nov jun ago ago ago jul jul Idade 83 35 * 16 16 * * * * 17 17 17 * * * * * * * * * * * * * * * * * * * 8 * * * * * * * * 83 * * 18 * * * * * Sexo fmea macho macho macho macho fmea macho macho macho macho fmea fmea fmea fmea fmea macho fmea fmea macho macho fmea macho macho fmea macho macho macho macho macho fmea fmea fmea macho macho macho fmea macho macho fmea fmea macho macho macho macho fmea macho fmea macho macho Cabea Comprimento 36,8 34,3 47,0 25,4 25,4 33,0 39,4 34,3 40,6 29,2 29,2 27,9 30,5 34,3 34,3 35,6 30,5 33,0 36,8 30,5 27,9 36,8 38,1 30,5 43,2 39,4 30,5 44,5 33,0 33,0 31,8 25,4 41,9 43,2 30,5 35,6 33,0 40,6 34,3 31,8 39,4 39,4 36,8 31,8 30,5 30,5 33,0 30,5 34,3 Cabea Largura 17,8 21,6 21,6 10,2 12,7 17,8 22,9 17,8 22,9 12,7 12,7 11,4 15,2 12,7 12,7 16,5 12,7 15,2 16,5 16,5 12,7 15,2 20,3 15,2 22,9 20,3 15,2 20,3 12,7 14,0 15,2 11,4 21,6 21,6 14,0 17,8 16,5 19,1 14,0 14,0 20,3 19,1 17,8 21,6 12,7 14,0 15,2 10,2 15,2 Pescoo Permetro 58,4 58,4 59,7 39,4 38,1 53,3 73,7 62,2 80,0 43,2 38,1 33,0 48,3 43,2 43,2 53,3 48,3 44,5 54,6 47,0 39,4 57,2 67,3 48,3 74,9 50,8 45,7 76,2 45,7 49,5 49,5 25,4 74,9 77,5 45,7 53,3 52,1 71,1 49,5 48,3 77,5 64,8 55,9 45,7 45,7 38,1 55,9 44,5 50,8 Altura 156,2 161,3 171,5 121,9 104,1 149,9 200,7 157,5 190,5 134,6 133,4 116,8 144,8 147,3 147,3 160,0 148,6 154,9 162,6 141,0 123,2 170,2 180,3 135,9 177,8 160,0 168,9 210,8 141,0 156,2 148,6 110,5 175,3 201,9 138,4 168,9 152,4 185,4 154,9 142,2 190,5 186,7 171,5 145,5 142,2 129,5 154,9 149,9 157,5 Trax Permetro 111,8 111,8 106,7 66,0 66,0 86,4 127,0 104,1 119,4 77,5 71,1 58,4 87,6 73,7 74,9 88,9 85,1 83,8 94,0 69,9 64,8 101,6 108,0 81,3 115,6 83,8 86,4 124,5 77,5 94,0 81,3 61,0 125,7 123,2 81,3 94,0 92,7 114,3 88,9 81,3 137,2 109,2 96,5 83,3 82,6 61,0 101,6 72,4 82,6 Peso 107,1 96,2 92,6 27,2 29,1 66,3 181,6 112,6 158,9 51,8 34,5 21,8 67,2 51,8 52,7 89,9 51,8 61,3 81,7 49,9 35,9 98,1 137,1 55,4 146,2 69,9 66,3 179,8 55,4 70,8 64,5 13,2 158,0 167,1 52,7 72,6 69,9 143,5 71,7 54,5 233,4 147,1 89,0 63,6 51,8 37,2 104,4 58,1 70,8

Anexo II: Passos para Construo da Tabela de Distribuio de Freqncias de uma Varivel Contnua
1- Encontre o menor e o maior valor das observaes; 2- Determine o tamanho das classes (geralmente, valores mltiplos de 5 ou 10 facilitam a interpretao dos resultados posteriormente); 3- Construa as classes, lembrando-se de comear antes do valor mnimo e terminar depois do valor mximo; 4- Lembre-se de que o nmero de classes est associado ao Tamanho de classe escolhido. Uma tabela de freqncia no deve ter: - menos de 6 classes (muito resumida), - mais de 15 classes (muito dispersa); Nmero de observaes. Um grande nmero de observaes pode ser distribudo em muitas classes, mas um pequeno nmero de observaes requer poucas classes; 5- Em todas as etapas da construo das classes deve prevalecer o bom senso: se a primeira distribuio de freqncias construda no ficou boa (muito resumida ou muito dispersa), aumente ou diminua o nmero de classes, diminuindo ou aumentando o tamanho delas. Exemplo: Construo de tabela de distribuio de freqncias
Quadro AII.1 - Emisses de xido de Enxofre (em toneladas) de uma indstria em 70 dias.
15,8 22,7 26,8 19,1 18,5 8,3 25,9 26,4 9,8 22,7 15,2 23,0 21,9 10,5 17,3 6,2 18,0 22,9 24,6 12,3 15,9 11,2 14,7 20,5 26,6 20,1 22,3 27,5 23,9 17,5 11,0 20,4 16,2 13,3 18,1 24,8 26,1 20,9 21,4 18,0 11,8 17,9 18,7 12,8 15,5 19,2 7,7 19,3 9,4 13,9 28,6 19,4 21,6 13,5 20,0 24,1 9,0 17,6 16,7 16,9 23,5 25,7 20,1 13,2 23,7 10,7 19,0 14,5 31,8 28,5

123-

min = 6,2

max = 31,8

Tamanho de classe: 5 toneladas; 1a 2a 3a 4a 5a 6a classe: classe: classe: classe: classe: classe: 5,0 10,0 15,0 20,0 25,0 30,0 ||||||10,0 15,0 20,0 25,0 30,0 35,0

Tabela AII.1 Distribuio de Freqncias das Emisses de xido de Enxofre (em toneladas) de uma indstria em 70 dias.
Emisso de xido de Enxofre (toneladas) 5,0 |- 10,0 10,0 |- 15,0 15,0 |- 20,0 20,0 |- 25,0 25,0 |- 30,0 30,0 |- 35,0 Total Freqncia Absoluta 6 13 21 20 9 1 70 Freqncia Relativa (%) 8,6 18,6 30,0 28,5 12,9 1,4 100,0

(28,6)*

* Devido a erros de arredondamento, muitas vezes a soma das freqncias relativas no fecha nos 100% exatos, somando 99,9% ou 100,1%. Quando isso ocorrer, o ajuste (somar ou subtrair 0,1%) deve ser feito na classe de maior freqncia, se possvel. Se no, faz-se o ajuste na classe de segunda maior freqncia e assim por diante. Nesse exemplo, a soma das freqncias relativas igual a 100,1%. Se fizssemos o ajuste na categoria de maior freqncia (30%), ficaria estranho, pois 2170 exatamente 0,30. Desse modo, preferimos fazer o ajuste na classe com a segunda maior freqncia (28,6%), ajustando-a para 28,5%.