Escolar Documentos
Profissional Documentos
Cultura Documentos
Postos Percentis
Distribuições de Freqüências de Dados
Nominais Dados Decimais
Comparação de Distribuiçes Intervalos de Classe Flexiveis
Distribuições Acumuladas
A coleta de dados acarreta um sério esforço por parte dos pesquisadores sociais que procuram
ampliar seu conhecimento sobre o comportamento humano. Para entrevistar ou obterinforma-
ções de beneficiários da previdéncia social, alunos de faculdades, viciados em drogas, homosse-
xuais, norte-americanos de classe média ou outras pessoas, faz-se necessário um certo grau de
previsão, planejamento cuidadoso e controle, quando não tempo efetivamente gasto no campo.
A coleta de dados, entretanto, é apenas o começo no que diz respeito à análise estatistica.
Ela fornece o material bruto que os pesquisadores sociais utilizam para analisar dados, obter
resultados e testar hipóteses sobre a natureza da realidade social.
TABELA 2.3 Sexo de O pesquisador poderia tornar mais clara essa relação, dando a base (o denominador) em
graduandos em engenharia forma mais compreensivel. Por exemplo, a razão de sexo empregada por demógrafos que procu-
nas faculdades A e B
em qualquer população em geral é dada como
ram comparar os números de homens e mulheres
Matrículas em engenharia o número de homens por 100 mulheres.
Faculdade A4 FaculdadeB A titulo de ilustração, se a relação de homens para mulheres é 150/50, há 150 homens
3 homens para cada mulher). Para obter a versão convencio-
Sexo do estudante % para 50 mulheres (ou, reduzindo,
o nal da razão de sexo, multiplique por 100 a razão anterior:
Masculino 1.082 80 146 30
Feminino 270 f homens
20
Total 1.352 100
37
183
20
100
Razão de sexo =
(100) mulheres =(10300
Há, então, 300 homens na população para cada 100 mulheres.
Então, as
15 das 50 meninas
que reagiram procurando uma alternativa podem ser
sas pelaproporção P = 15/50 = 0,30 ou como uma porcentagem % = (100)(15/50) = 30%.
expres Outro tipo de razão- que tende a ser cada vez mais utilizada pelos pesquisadores sociais
é conhecida como taxa. Os sociólogos freqüentemente analisam populações quanto àstaxas
Assim, 30% das meninas conseguiram outro brinquedo para divertir. se
de reprodução, morte, criminalidade, desemprego, divórcio, casamento e Entre-
semelhantes.
Paralustrarautilidade das porcentagens para fazer comparações entre distribuições de
tamanhos grandes e desiguais, vamos examinar o sexo de graduandos em engenharia em duas
tanto, enquanto a maior parte das outras razões compara o número de casos em qualquer cate
goria ou subgrupo com o número de casos em qualquer outro subgrupo, as taxas indicam com-
faculdades em que os programas do curso são muito diferentes. Suponha que a faculdade A parações entre os casos efetivos e o número de casos potenciais, Por exemplo, para determinar
tenha 1.352 alunos de engenharia e a faculdade B, apenas 183 alunos nesse curso. a taxa de natalidade de determinada população, podemos exibir o número efetivo de nascidos
A Tabela 2.3 indica tanto as freqüências como as porcentagens de graduandos em enge- vivos entre as mulheres em idade fértil (os elementos da população que estão expostos ao risco
nharia nas faculdades A e B. Note quão dificil é determinar rapidamente as diferenças de sexo de parto, representando, portanto, casos potenciais).Analogamente, para determinar a taxa
entre alunos de engenharia com base apenas na tabela de freqüências. Ao contrário, as porcen- divórcio, podemos comparar o número efetivo de divórcios com o número de casamentos que
ocorrem em determinado período de tempo (por exemplo, 1 ano).As taxas em geral são da-
tagens revelam claramente que as mulheres tiveram representação igual
entre os alunos nas fa-
culdades A B. Especificamente, 20% dos alunos de engenharia tanto na faculdade A como na
e das em termos de uma base com 1.000 casos potenciais.Assim, as taxas de natalidade são dadas
como o número de nascimentos por 1.000 mulheres; as taxas de divórcio podem ser expressas
faculdade B são mulheres.
em termos do número de divórcios por 1.000 casamentos. Se ocorrem 500 nascimentos entre
4.000 mulheres férteis:
Razões e Taxas
tamanho-a
razão-compa- Í casos reais
Um método não muito utilizado padronização em relação ao
de Taxa de nascimento =
(1.000 -= (1.000) =125
homens) 4.000
ra diretamente o número de casos que se enquadram em uma categoria (por exemplo,
Í casos potenciais
freqüência em uma categoria Resulta que há 125 nascidos vivos para cada 1.000 mulheres em idade férti.
pode-se obter da maneira mostrada a seguir uma razão, ondef =
distribuições de nível nominal não precisam ser relacionadas em qualquer ordem em particular.
=]12,2
Assim, os dados sobre preferèncias religiosas mostrados
disposições diferentes, embora igualmente aceitáveis.
na Tabela 2.4 são apresentados em três
Há, assim, 12,2 homicidios para cada 100.000 moradores. a as categorias ou valores de escores em distribuições ordinais ou intervalares representam
E importante notar que
poderíamos ter definido a taxa como homicídios per capita sem o grau de presença de determinada característica. A listagem dessas categorias ou valores de escore
multiplicar a fração (homicídios em relação à população) pelo fator de escala de 100.000. En- em
distribuições simples de freqüência deve refletir aquela
tretanto, a taxa resultante de 0,000122, embora correta, é de dificil manuseio em raz o de seu
ordenação.
Por essa razão, as categorias ordinais e intervalares são
pequeno vulto. Podemos, portanto, aumentar a taxa para uma forma mais legível e sempre dispostas em ordem, em
digerível geral dos valores mais altos para os mais baixos (mas às vezes dos valores mais baixos para os mais
multiplicando por 100.000 (deslocando a vírgula decimal cinco casas para a direita), o que então' altos). Por exemplo, podemos relacionar as categorias de lasse social da mais alta
transforma a taxa per capita de 0,000122 em uma taxa de 12,2 por 100.000. para a mais baixa
ou
publicar os resultados de um exame de biologia em ordem consecutiva, da nota mais alta
Até aqui discutimos taxas que fazem comparações entre a mais baixa. para
populações diferentes. Por
exemplo, poderíamos querer comparar taxas de
natalidade entre negros e brancos, entre mulhe- A alteração da ordem de
categorias ordinais e intervalares reduz a legibilidade dos resul-
res da classedemédia e adataxa
classe
de
baixa, entre
grupos religiosos ou países inteiros e assim por diante. tados da pesquisa. Esse efeito
pode ser observado na Tabela 2.5, onde apresentamos as versões
Outro tipo taxa, variago, pode ser usado para comparar a mesma população em
dois momentos no tempo. Ao calcular a taxa de variação, comparamos a variação efetiva entre o
incorretae'correta' de uma
distribuição da posição em
relaço à cobrança de uma taxa para
caminhadas no
campus de uma faculdade. Qual é a versão que apresenta leitura mais fácil?
momento 1eomomento 2,
com o nível no momento 1 servindodebase. Assim, uma população
que cresce de 20.000 para 30.000 entre 1990 e 2000 acusa a seguinte taxa de variação:
TABELA 2.5 Distribuição de freqüêacias das posições em relação à cobrança de
taxa para caminhadas no
campus: apresentações incorreta e
(100Temp02/-tempo 1f 30.000-20.000) corTeta
50% Posição em relação
tempo 1f 20.000 à tara para caminhadas Posição em relação
à taxa para caminhadas
Levemente favorável
Em outras palavras, houve um aumento populacional de 50% no período de 1990 a 2000. Fortemente favorável 0
Desfavorável 21
Note que uma taxa de variação pode ser negativa, indicando um decréscimo no tamanho Favorável
Fortemente favorável
Levemente favorável 2
ao longo de determinado período. Por exemplo, se uma população varia de 15.000 para 12.000 Levemente desfavorável
Levemente desfavorável 4
em determinado período de tempo, a taxa de variação é: Fortemente desfavorável 10 Desfavorável 21
Favorável
Fortemente desfavorável 10
Total
12.000-15.000 -20% 38 Total 38
A coluna mais
significativa, especialmente se considerarmos comparações com outras
distribuições (como as notas do exame final em umn período diferente com número diferente de Limites de Classe
alunos), éa coluna de porcentagens, também chamada distribuição de porcentagens. Suponha que, ao subir em uma balança digital de banheiro, apareça no mostrador o núme-
ro
123. Você pesa realmente 123
libras?éOu é apenas mais realista dizer que pesa aproximada-
TABELA 2.6 Distribuição de freqüências das notas de 71 alunos em um exame final mente 123? Especificamente, seu
peso' superior a 122,5 e inferior a 123,5, e
a balança faz o
Nota Nota Nota Nota arredondamento para o inteiro mais próximo. Quando construímos intervalos de classe para o
âmbito de pesos de 120 a 129 libras, devemos incluir um fator de cobertura' para os números
inteiros. Assim, o intervalo de classe é efetivamente de 119,5 (extremo inferior de 120) e 129,5
99 0 85 71 4 57 0
98 1 84 70 9. 56 1
(extremo superior de 129). Os limites efetivos desse intervalo são 119,5 e 129,5. Na realidade,
97 83 0 69 55 0 qualquer pess0a cujo peso exato esteja entre
práticos, qualquer pessoa
119,5 e 129,5 será incluída nesse intervalo. Em ter-
96 82 3 68 4 1
mos
cujo peso
exato esteja entre 119,5 e 129,5 figurará na balança em
números inteiros de 120-129.
95 81 57 53 0
Cada intervalo de classe tem limite
94 30 2 52 um
superior e um limite inferior. A primeira vista,
93 79
pode parecer que esses limites sejam o maior e o menor valores em
qualquer categoria. Assim,
seria razoável esperar que os limites
92 1 78 64 50 superior e inferior do intervalo 60-64 fossem 64 e 60,
respectivamente. Nesse caso, entretanto, estaríamos errados, porque 64 e 60 não são realmente
91 7 63 N 71
os limites do intervalo 60-64.
90 0 76 62
Ao contrário do maior e do menor valor de escore em um
89 75 61 intervalo, os limites de classe
estão localizados no ponto a meio caminho entre intervalos de classe
88 74 60 2 adjacentes, servindo para
87 73 59 3 preencher alacuna entre eles (Figura olimite
2.1). Assim, intervalo 90-94 é94,5,
superior do
eo limite inferior do intervalo 95-99 também é 94,5. Da mesmainaneira, 59,5 étanto o limite
86 12 2 58 superior do intervalo 55-59 como o limite inferior do intervalo 60-64.
36 Parte I Descrição Capítulo 2 Organização dos Dados 37
h S-I
onde h =
tamanho de um intervalo de classe m= menor valor deescore+ maior valorde escore48+52s0
2
S =
limite superior de um intervalo de classe
I =limite inferior de um intervalo de classe Em certo sentido, o ponto médio pode ser considerado o representante de todos os va-
lores de escores em um intervalo de classe. E um número único, que pode ser usado para repre-
Por
exemplo, para intervalo 9094,o tamanho (h) é 94,5- 89,5 5. Isso
o
sentar todo um intervalo de classe.
ao valor que obtemos contando corresponde
simplesmente valores interior do intervalo (90,91,92,
os no
=
FIGURA 2.1 Menore maior valor de escoreversus limite inferior e superior do intervalo de classe
Distribuições Acumuladas
90-94. Por é
vezes
interessante apresentar freqüencias de uma maneira acumulativa, especialmente
quando procuramos localizar a posição de um caso em
relação ao desempenho global do grupo.
39
Capítulo 2 Organização dos Dados
38 Parte I Descrição
a% = (100)
ah=(100396
= (100)(0,0625)
onde fa = freqüência acumulada em qualquer categoria
= 6,25
N= número total de casos na distribuição
A Tabela 2.9 mostra a distribuição de porcentagens acumuladas, baseada nos dados da
Tabela 2.8. Note que a distribuição a% também pode ser obtida somando-se a distribuição per-
TABELA 2.8 Distribuição de freqüências acumuadas (fa) dos escores do centual (%).
conselho de faculdades para 336 estudantes
Intervalo de classe % Ja
Postos Percentis
750-799 4 1,19 336
700-749 4 7,14 332 Seu professor de estatística devolve as provas do bimestre. Sabendo que sua nota no curso de-
8,33 da
650-699
600-649
28
30 8,93
308
280
pende nota dessa prova,você abre
a vagarosamente. Vê então um 77 vermelho com um cir-
culo em volta. Você deve festejar silenciosamente e pensar na
comemoraço? Ou deve começar
550-599 35 10,42 250 a
pensar em propor um trabalho extracurricular que contribua para melhorar sua nota?
500-549 55 16,37 215 elos padröes covencionais aprendidos no ensino fundamental e médio, você poderia
450-499 51 18,15 160 ter traduzido
a nota 77 em um C+,
ligeiramente acima da média. Mas na faculdade, ou pelo
400-449
350-399
48
30
29
8,93
99
51
menos em
algumas
turmas, padrões convencionais não säo seguidos. Por si só, a nota 7 nada
os
significa sem alguma indicação do desempenho do restante da classe. Se a maioria da turma
obteve notas entre 50 e 60, você pode comemorar. Mas se a maioria obteve notas entre 80 e 90,
300-349 12 3,57 21
250-299 adie sua comemoração.
1,79 9
de outra
200-249 0,89 Colocando
teste. Em um exame muito
maneira, a qualidade da nota bruta 77
depende de quão fácil é o
Total 336 100 dificil, pode ser uma nota louvável, ao passo que, em um teste
77
simples, você deveria ter obtido melhor resultado. Naturalmente, o nível de dificuldade de um
40 Parte I Descrição
Capítulo 2 Organização dos Dados 41
TABELA29 Distribuição das porcentagens acumuladas
tt facnldades para 336
(«%) dos escores do conselho de Para sua turma de 20
estudantes (baseada na Tabela 2.8) alunos, o
Intervalo de classe
professor poderia decidir guardar para si os escores
apresentados anteriormente e apresentar
% aos alunos brutos
a a%
cias agrupadas: apenas seguinte distribuição de a
750-799 4
freqüên-
700-749 1,19 336
24 100,00
650-699 7,14 332 98,81 Intervalo de classe
28 8,33 308 fa a%
600-649 91,67
30 8,93 280 90- 3 15
550-599 35 83,33 80--89 20
10,42 100
500-549 250 74,40 20
55 16,37 215 70-79 17
85
450-499 61
18,15 60
63,99 60-69 30 13
65
400-449 47,62 59
15
48 14,29 35
350-399 99 29,46 10
30 8,93 40-49 20
5
300-349 12
15,18 2 10
10
3,57 21 6,25 N 20
250-299 6 100
1,79 2,68
200-249 3 0,89 0,89
Total As porcentagens
336 100
centis. De fato, como acumuladas constituem chave para a a
essas se definem como determinação
postos per
determinado intervalo de classe abaixo dele,porcentagens de escores que enquadram
dos
ou se
centis
exame só pode ser avaliado pelo desempenho da turma como um todo- isto é, correspondentes limites superiores de classes.
69,5 tem um
aos
as
porcentagens acumuladas são postos
per- os
em
ção total de notas. Assim, a única maneira de você dizer se pela distribui posto percentil de 35% (35% dos
limite superior 89,5
Assim, por exemplo, o limite
médio ou fraco é
77 foi um resultado
excelente, bom,
o
tem um
escores se
enquadram em 69,5 ou
superior
compará-lo
com toda a
distribuição de notas na turma. ou abaixo dele). posto percentil de 85% (85% dos abaixo dele), e
escores se
"Como se comporta o posto 77 em termos toda a turma?, o aluno
de E
quanto ao escore de 77? Esse
em 89,5 enquadram
fessor. O professor responde que seu desempenho foi, no mínimo, o mesmo depergunta pro-
ao
60% da turma, limite escore não se
superior de classe. Pode-se ver
indicando que seu posto perentil foi 60%. ocorre em 69,5 que seu posto
enquadra
convenientemente em nenhum
abaixo dele. Pode-se
ou
percentilé melhor do que 35%,
Oposto percentil de qualquer escore dado, digamos 77, define como porcentagem
se a priamente alto como 65%,
tão também observar que seu
posto
porque 35%6
limite superior percentil
dos casos em uma distribuição que se
enquadram naquele escore ou abaixo dele (por exemplo,a porque este corresponde ao
percentil do escore 77 situa-se em não é pro-
porcentagem da classe que acusà 77 ou menos).Os postos percentis são fáceis de calcular, desde A essa algum lugar entre 35% e 65%- 79,5. Assim, o posto
conhecido altura, podemos apenas estimar seu posto
mas
que o professor dê toda a coleção de escores brutos. Por exemplo, no seguinte conjunto de 20 exatamente onde?
escores brutos, 77 se situaria décimo segundo posto. Assim, seu posto percentil seria o décimo
em classe 70-79, comointerpolaçãoJ
que chamaremos
Focalizemos nossa
percentil com base em
atenção precisamente em seu um processo
segundo em 20, ou seja, 60%. seu limite
inferior 69,5 para seu intervalo crítico. O intervalo de
limite superior escore 77 est a três quartos do caminho de
79,5:
Décimo segundo entre 20 60%
77-69,5
79,5-69,5 =0,75
94 92 91 88 85 84 80 79 77 76 74 74 71 69 65 62 56 53 48 40 Seu escore de
77 está a três
trado a seguir: quartos (ou 0,75) do
Décimo segundo escore a partir do menor caminho de 69,5 a 79,5, conforme ilus-
raro-particularmente quando estão em jogo muitos números -você não poderá
Não 69,5
dispor de toda a coleço de escores que permita determinar o posto e o posto percentil. Em uma Limite
inferior 77 79,5
grande turma de 80 estudantes, por exemplo, a maioria dos professores não estaria disposta a Seu
escrever na lousa todoo
conjunto de notas, optando por apresentar a distribuição de freqüên- escore
Limite
cias das notas da turma. Pela superior
porcentagem de
qüências agrupadas anterior,casos (%) para esse intervalo de classe, dada na
sabemos que 30% dos distribuição de fre-
escores, ou notas, estão entre
69,5 e 79,5. Po
43
Parte I Descrição Capítulo 2 Organização dos Dados
demos, portanto, estimar que três quartos da dos escores nesse intervalo de classe 1. O limite inferior do intervalo critico (). E o ponto que está
a meio caminho entreo
Note que o posto superior e inferior (por exemplo, 79,5 69,5 10).
percentil
-
PP=a%, Estamos agora em condições de aplicar a fórmula seguint para o posto percentil:
demonstrado a seguir:
Intervalo de classe
750-799
Intervalo de classe
700-749
90- 650-699
-89 600-649 Intervalo de classe onde ocorre o escore de 620
70-79 -Intervalo de classe onde ocorre 77 550-599
500-549
60- 450-
-499
50-559 400-449
Abaixo de 50 350--399
300-349
250-299
Há várias características do intervalo crítico que devemos determinar antes de aplicar a 200-249
formula do posto de percentil:
Parte I Descrição Organização dos Dados 45
Capítulo 2
Cerca de metade dos entrevistados da pesquisa (50,1%) declarou usar sempre o cinto. Dois 100 997) (100)(0,356) =35,6%
terços dos entrevistados (50,1% +17,7% = 67,8%) responderam que usavam o cinto quasesempre.
Entretanto, não nos satisfaz apenas o conhecimento do grau de respeito à lei. Para anali- Assim, 35,6% da amostra consiste em mulheres que sempre usam o cinto (Tabela 2.16).
sar mais detidamente os dados da pesquisa, começamos examinando que tipos de pessoas usam As distribuições de freqüència de cada variável separadamente podem ser encontradas
cinto de segurança- isto é, quais características dos entrevistados esto relacionadas com o ao longo das margens de uma tabulação cruzada de dois critérios. São as chamadas distribuiçðes
uso do cinto.
Uma das mais significativas diferenças está entre os homens e as mulheres na
pesquisa. TABELA 2.16 Tabulação cruzada do uso do cinto de segurança por sexo, com as
Empregamos uma tabulação cruzada para observar as diferenças entre os sexos no que diz res-
porcentagens totais
peito ao uso do cinto de segurança. Ou seja, construímos uma distribuição de freqüências de
duas ou mais variáveis consideradas simultaneamente. A tabulação cruzada exibida na Tabela Sexo do entrevistado
2.15 mostra, por exemplo, que 144 homens afirmaram usar sempre o cinto e que 110 mulheres
Uso do cinto de segurança Masculin0 Feminino Total Marginal
declararam usar quase sempre o cinto. e linha
O fundamento das tabulações cruzadas foi apresentado quando comparamos as distri- Sempre 144 355 499 (totais
cruzada pode de linha)
buições por sexo de graduandos em engenharia de duas faculdades/ A tabulação 14,4% 35,6% 50,1%
Na maioria das vezes 66 110 176
6,6% 11,0% 17,7%
TABELA 2.15 Tabulação cruzada do uso do cinto de seguranga por sexo
Algumas vezes 58 66 124
Sexo do entrevistado 5,8% 6,6% 12,4%
Raramente 39 44 83
Uso do cinto de segurança Masculino Feminino Total
3,9 % 4,4% 8,3%
144 355 499 Nunca 60 55 115
Sempre
Na maioria das vezes 66 110 176
6,0% 5,5% 11,5%
Algumas vezes 58 66 124 Total Tamanho
367 630 997
Raramente 39 44 83 total da
36,8% 63,2% 100,0% amostra
Nunca 60 55 115
Total 367 630 997 Marginal de coluna
(totais de coluna)
52 Parte I Descrição
Capítulo 2 Organização dos Dados 53
Por
dividindo-se
exemplo, a porcentagem dos que usam sempre o cinto e que são mulheres é obtida
o número
(100630) 100)(0,563)-56,3%
respectivo pelo número total dos que usam sempre o cinto:
Assim, 56,3% das mulheres do e udo declararam usar
sempre o cinto de segurança.
(10033=(100)(0,711)=71,1%
499 que as
A Tabela 2.18
porcentagens
apresenta as porcentagens por coluna para
têm
por soma 100%
nossa tabulação cruzada. Note
longo de cada coluna. Assim, elas refletem
ao
buição do uso do cinto de segurança não só separadamente, a distri-
Vemos, assim, que 71,1% dos que sempre usam o cinto são mulheres. por sexo, como total.
As porcentagens por linha dão a distribuição da variável coluna para cada valor da variá-
vel linha. Assim, essas Escolha entre Porcentagens Totais,
porcentagens representam a distribuição por sexo dentro de cada nível de por Linha e por Coluna
uso do cinto de
segurança. Do mesmo modo, as porcentagens têm por soma 100% por meio de
cada linha, incluindo a coluna da Dispomos agora de três conjuntos de porcentagens- total, por linha e
marginal na base tabulação cruzada. ria perguntar: Qual deles é correto? por coluna. Você pode
Matematicamente, todos o são, isto é, foram todos calcula-
Parte I Descrição Capítulo 2 Organização dos Dados 55
Sexo do entrevistado Há outra maneira de enunciar essa regra: se queremos comparar linhas em uma tabu-
lação cruzada, devemos utilizar porcentagens por linha; exigem-se as porcentagens por coluna
Uso do cinto de em nosso exemplo, desejamos comparar os homens com
segurança Masculino Feminino Total para comparar colunas. Novamente,
Sempre as mulheres em termos de utilização
do cinto de segurança. O sexo é a variável coluna, e as
144 355 499 do uso do cinto de segurança para
39,2% 56,3%
porcentagens por coluna dão separadamente as distribuições
Na maioria das vezes
50,1% homens e para mulheres. Assim, essas porcentagens por coluna devem ser usadas para tazer
6 110 176 comparações de sexo.
8,0% 17,5% 17,7% Em certos casos, não é fácil dizer qual é a variável independente. Por exemplo, na tabula-
Algumas vezes 58 66 124 da
15,8% ção cruzada da afiliaço partidária do marido pela afiliação partidária esposa (Tabela 2.19),
10,5% 12,4% nenhuma das variáveis pode ser considerada claramente resultado da outra. (Nota: as cifras em
Raramente 39 44 83
10,6% 7,0%
cada cela da tabela representam freqüència, porcentagem por linha, porcentagem por
de maridoe
coluna
mulher
e
Nunca
8,3 % porcentagem total, respectivamente.) Até certo ponto, afiliações políticas
as
60 de os
podem se influenciar reciprocanmente, e em muitos casos podem ter ocorrido antes mesmo
55 115
16,3% 8,7 % 11,5% cbnjuges terenm se conhecido. A semelhança (ou mesmo discordància) em perspectivas politicas
Total 367 630 97 pode ter sido parte da atração dos dois.
100,0% 100,0% 100,0% Em termos dos dados da Tabela 2.19, poderíamos calcular a porcentagem de maridos
democratas que tém esposas democratas (70 em 100, porcentagem por linha = 70,06) ou a
porcentagem de esposas democratas que possuem maridos democratas (70 em 110, porcenta-
dos da maneira correta. Mas, em termos de
ser
significação substantiva, certas porcentagens podem
enganosas ou mesmo inúteis.
Em primeiro lugar, conforme
já observamos, as porcentagens totais por vezes têm signi TABELA2.19 Tabulação cruzada da filiação partidária do marido pela
filiação partidária da esposa: freqüências e porcentagens totais,
ficado ambíguo, como no caso do uso do cinto de
segurança por sexo. Depois, de acordo com as por linha e por coluna
porcentagens por linha, as mulheres predominam em todas as linhas, exceto no subgrupo Nun-
ca, em que os sexos se apresentam quase Freqüência
iguais. O que isso significa? Podemos tirar conclusões,
Como a sugestão de que os homens não dirigem tanto quanto as mulheres e, conseqüentemente, %linha
Filiação partidária da esposa
não figuram em grande
proporção em qualquer nível de uso do cinto? Obviamente essa infe- %coluna
rência seria artificial. A baixa representação dos homens em
quase todas as categorias de uso % total Democrata Republicana Total
do cinto é simplesmente uma
conseqüência da baixa porcentagem de homens na amostra em Filiação partidária do marido
geral (36,8%). Assim, o fato de 71,1% dos que usam sempre o cinto serem mulheres não é tão
esmagador se levarmos em conta que 63,2% do total da amostra so mulheres. Democrata 70 30 100
Para nosso
objetivo, as porcentagens mais informativas são as porcentagens por coluna. 70,0% 30,0% 52,6%
Estamos interessados em comparar homens e mulheres em termos do uso do cinto de segurança, 63,6% 37,5%
isto é,
desejamos saber a porcentagem das mulheres que usa freqüentemente o cinto em compa-
ração com os homens. Por exemplo, 39,2% dos homens afirmam usar sempre o cinto, em com-
36,8% 15,8%
paração com 56,3% das mulheres. Reciprocamente, 16,3% dos homens afirmam nunca ter usado Republicana 40 50 90
o cinto, em comparação com apenas 8,7% das mulheres. 44,4% 55,6% 47,4%
Felizmente, há uma regra empírica para orientar nossa escolha entre porcentagens por 36,4% 62,5%
linha e por coluna: se a variável independente está nas linhas, utilkize porcentagens por linha; se a 21,1% 26,3%
variável independente está nas colunas, utilize porcentagens por couna. Em nosso exemplo, esta- Total 110 80 190
mos
preocupados com a influència que o sexo de um entrevistado tem sobre o comportamento 57,9% 42,1% 100,0%
Partc Descrição 57
Capítulo 2 Organização dos Dados
Sea variável
independente está nas linhas, utilize porcentagens
por linha.
3. Se não há uma
independente cstá nas colunas, use porcentagens por coluna.
distinção clara entre variável independente variável
utilize porcentagens
a Casados (61,29%) -
para o
enfoque de interesse. que for mais significativa FIGURA 2.3 Gráico em setores do estado clvil.
Apresentações Gráficas
As colunas de números
costumam evocar temor, de setores possíveis.) Em comparação, o gráfico em barras (ou histogramna) pode acomodar um
Embora algumas ansiedade, tédio, apatia e desentendimento. número arbitrário de categorias em qualquer nível de mensuração, sendo, por isso, muito mais
pessoas pareçam desconfiar de
ma de tabela, elas dão informações
toda a atenção aos mesmos dados
estatísticas apresentadas em for- utilizado em pesquisa social.
ou ilustrativa. Como quando apresentados em forma gráfica A Figura 2.5 mostra um gráfico n barras da distribuição de freqüência do uso do cinto
resultado, muitos pesquisadores comerciaise autores populares preferem de
utilizar gráficos no
lugar de tabelas. Por razões análogas, os segurança apresentada na Tabela 2.14. O gráfico em barras é construido de acordo com a dis-
mente recorrem a auxílios visuais-
como gráficos em setores,
pesquisadores sociais freqlüente- posição padrão: uma reta-base horizontal (ou eixo x) ao longo da qual marcamos os valores
freqüências, gráficos em linha e mapas --sempre com o objetivo gráficos em barras, polígonos de dos escores ou categorias (nesse caso, os níveis de
utilização do cinto de segurança) e uma reta
de melhorar a vertical (eixo y) ao longo do lado
de seus resultados. legibilidade esquerdo da figura que exibe as freqüências para cada valor do
escore ou
categoria. (Para dados agrupados, tanto os pontos médios dos intervalos de classe quanto
Gráficos em Setores
os
próprios intervalos podem ser colocados ao longo da reta-base.) Como podemos ver na Figura
2.5, quanto mais alta a barra, maior a freqüência da
categoria.
Ográfico em setores (também conhecido como gráfico tipo pizza, gráfico
gráfico setorial) é um gráfico circular cujos setores perfazem 100%. tipo torta ou ainda
Esse de
tipo constitui
um dos métodos mais
simples de representação gráfica é especialmente útil gráfico
e
para mostrar as
Divorciados (8,9%) -
Soltciros (22,6%)
diferenças em freqüências ou porcentagens entre categorias de uma variável de nível
A tftulo de ilustração, as nominal.
figuras 2.3 2.4 apresentam distribuição do estado civil para adultos
e a
Viúvos (7,3%)-
de 18 anos ou mais. Note que 22,69 dos adultos são solteiros (nunca se casaram), 61,2% são
casados, 7,3% so viúvos e 8,9% são divorciados.
Em muitas inståncias, o pesquisador pode
pretender focalizar a atenção em determinada
categoria do gráfico em setores. Nesse caso, ele pode se interessar em focalizar o grupo de sol-
teiros. Para ilustrar esse aspecto do gráfico em setores,
podemos 'explodir' (mover ligeiramente
para fora) o setor do gráfico que merece maior atenção, como na Figura 2.4.
Algumas vezes
Raramente
10 Nunca
Na maioria Sempre
Nunca Raramente Algumas 10 20 0 40 50 60
vezes das vezesS
Porcentagen
Uso do cinto de segurança
FIGURA 2.7 Gráfico em barras horizontais para do cinto de
o uso
segurança
FIGURA 2.6 Gráfico em barras para o uso do cinto de segurança (com porcentagens). (com porcentagens).
60 Parte I Descrição
Capítulo 2 Organização dos Dados 61
400
350
FMasculino Feminino TABELA 2.20 Taxas de nascimento pela
idade da mäe
300
Idade Taxa de nascimento
250 da mãe (nascimentos por 1.000)
10 -14 ,2
15-19 54,4
I50
20-2 110,4
100 25-29 113,1
30--34 83,9
35-39 35,3
40--44 6,8
Nunca Raramente -49 ,3
Algumas Na maioria
Vezes
Sempre
das vezes
Uso do cinto de
segurança
Os gráficos em barras são utilizados também para grafar volumese taxas por meio de
FIGURA 2.8 Gráfico em barras para o uso do cinto de Subgrupos populacionais ou ao longo do tempo, e não só para distribuições de freqüências e
(com freqüências). segurança, por sero de porcentagens. Por
exemplo, as taxas de natalidade de 1997 (número de nascimentos por
1.000 mulheres, Tabela 2.20) são dadas por idade da mäe na
dividindo-se o número de partos de mulheres de determinado
Figura 2.10. Essas taxas são obtidas
obtemos uma ilustração melhor grupo etário pelo núímero de
grafando as porcentagens das colunas a partir da Tabela 2.18. mulheres naquele grupo e
multiplicando-se o resultado por 1.000. Como as duas categorias
Assim, o gráfico em barras da Figura 2.9 extremas
de segurança como também a influência permite-nos
ver não só a
distribuição do uso do cinto apresentam taxas muito pequenas, as barras são apenas visíveis. Assim,
exercida pelo sexo. a
legibilidade do gráfico, rotulamos cada barra com seu valor (o que, de resto, é para reforçar
uma
boa idéia). sempre
Masculino Feminino
120
S0
100
30
80
20
20
Uso do cinto de segurança 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49
FIGURA 2.9 Gráfico em barras para o uso do cinto de segurança, por sexo0 Tdade da me
(com porcentagens).
FIGURA 2.10 Grático em barras do número de nascimentos por 1.000 mulheres pela idade da me.
Organização dos Dados 63
Parte I Descrição Capítulo 2
Poligonos de Freqüências 20
que une todos os pontos nesse polígono não pode terminar voltando à reta-base,
porque as fre- FIGURA 2.11 Poligono de freqüências para
qüências acumuladas representadas são resultado de sucessivas adições. Qualquer freqüência acu- de estudantés.
a distribuição das notas de provas
mulada nunca é inferior (em
geral, é superior) à freqüência acumulada precedente. Também, ao
contrário de um polígono regular de freqüências, os pontos em um gráfico cumulativo são assina-
lados acima dos limites
superiores dos intervalos de classe, e não em seus pontos médios, porque
a freqüência acumulada representa o número total de casos tanto no interior como abaixo de um 80
intervalo de classe específico.
Intervalo
de classe fa
10
95-99 11
90-94 68
85-89 56
80-84 52 20
75-79 12 55
70-74 17 43
65-69 12 26
-64 5 14 54,5 59,5 64,5 69,5 74,5 79.5 84,5 89,5 945 99,5
55-59 5 9 Limite superior
-54 4 4
FIGURA 2.12 Poligono
de freqüências
N 71 acumuladas para a distribuição das notas de provas
de estudantes.
OoJ ap seure s ausDsaID OSS3Oe a
aquaosajope ogÓepndod ep oquewej ou a sTerorgod seoFprd seu 'sapepmeuad seu sesuepnu'ypu SE2Pus sagómqunsyp aayuo o503.m3 ep oóeueA ErTvanoIA
op ouunßns 'seßozp op ounsuos op ojuune qepei epu_joya ep ouune wen8y emer
-31 Pu Seprznpe sogzei se nug seyoupuaj sessa Jeodxo rejusi jerpos 1opesnbsad oe sqe»
Boupoosayn ) Eougoypeld (9 eoLupoondar (e)
uuenaeN O6 op epr>pp eu auopusop epeja enno 08 p epesop ep peuy ou epug81ns
-S91 PLIm '08 p epeopp ep sopeaui wa eponb run '0861 91e naouewod anb ayuapuaose ep
-upua) run '09 ap eprmop sopeau uo op exe) ep oqusune orqps o openauae
um
ep soppruros
8-2a 09ygiä oN sopep ap e onb op
1opepaaI sjeu as
onu ejuaszde
ouureep es
oDypis o quIUTEAON TTTPjqPL eu opejsI[ BuioJuo '866I e OS6I p (sanuerqeq o00'00I Jod
epod erpd sopei1odaI sOpjoruroy op oraunu) soptun sopejsg sou soporuios ap exej e en
-sou
'oduaxa 1od '9TZ ematI V eYu| wa so»Ypia 10d sopenjsn! OIdu»s asenb ogs ste1odun
seougpua) e sOAgeraI sopep so 'Seyuy u09 no seiieq uoo sepeyera ogs (apepmi»j ap soue
so opuptApqns aprpi ap sodnia ouoo) sodnißqns anus sagbereduoo se 0uenbu
apueis zej ogu opea»Idura opoj9u o "OT'7a STT Semnay se opueredwoo IaA apod as ouop
seLIeq u a um ap -eJiay Teuy u e x a u n ap sejou ap 3ssejern as as "eoLNuIs aquaueItaJIad a eLnausse eurnqu»u
oyed ruzoj uo aytouzo119ue sepeuasaade "apur ep apep! rpad apeprezeu
ap sexe se 'sequyj uua ooyrd un uo '3qpo 'oyduaxo Iod _Iz eam3H V "eja1 ap sojuouaos 1od eSnOe ogu se ua
ogðnqursipV s30baITp sequre sow»nxa sar0>sa ap orounu ouusauI o ps 'ose»
souod so s-opuun E no zoeA O
jpagTeAPUn ap Exe) 3s-vJe13 seyuy us ooyp1 un wg Teg ug seoupI sepne) Senp uuoo anb (°) ogdnquns1p e '>JUaUTeuy 'souaUTuexa
odu op oauoj oquduuosap woq ureresnoe saquepnisa sunae seusde sexeq ojnu ogs eongiodrs euun
oE no anua sjaapjea no papyrEA Fun uo ESsop sayuepngso sop seug sotuexa sop sejou sy (e1jap p
sodn3 sgóeoyipou uensou equ u s sooyp18 eDInuissE) Do119uISSD 31uauuvay
so ouenbu PAFLTEA EDTUTn eun ap saxo2s3 op ounfuoo un ap sopugnba( sep ophynqnsrp e -1sodg ogomquns1p e onb I3z1p souapod 'epe3uore epneo ep ogðop erod epep 9 eLNUTTSSE P
wqpa sepugnbay ap souoßjod so SeIAETed senno ug vyuy ua oonfpi3 un azun opo19u ouoo e]JOrp e epens pasa epneo eíns '(9)
ogdynqins1pe epnäos wa souusiapIsuoo
3853 eIoquua soey werejoAaI as sunare seuade anb a
'oduay op o$uot oe no sodnzß anua sexe) a sunoA Ieuasaida ered sopeoypou oquaduasap uoq 3A3) souepniso sop e;roreuu
19s e anb
uapod serougnbay ap souoßjod so 'eitoueuu eus>uu ega odu»j no seazp 'sodnis ap ojsu 1azp sowejropod 'Teug ouexo un u3 SEJOU ap
ogdnqtnstp ep ossejen as as
IOd sexej a sunjon ujqurej ouoo Sejou op ogðnqITISTp Pun ap su»aejuaoIOd a sepupnbay saIoosa weiaAg sunaTe SeuSde a "soxTeq
sojTe soI0sa 3ADIq0 sopejsTAaIus sop erIoeu e anb
9s opu re]uIsaIdaI ered sopesn 1s wapod seireq us sooypia so anb ajuuio;uoNue souiA ensou
ogbnqinsIp essa *e)IaIIp onb op epianbso Eauoj steu ojrnur epneo eun un anbiod (ep
-Jenbsa p eo;nguisse) vo1u19uissD
31uauvaj2v3au 9 ¥lT eInatJ eu (e) ogbtnq1nstp y
eLINUISSe ep opiai1p e a
sa10sa soonod
SEXIeq 01nu no seie ojnur aquaueaneror sop ogðezirpoj e eoiput epneo essap eutuisjap souanx»
ogðysod y
seou uoo saquepnisa soonod a soppuu sou»u no seu saJuepnjso op o19unu apueia un sou
epne, eun way ogðnqins1p e 'ogdap euun us 3s sa10os3 so anb
*epepunuoid
uamunse uo» zej anb
eynousse ajspxa opuenð 'seojn9urisse sagonqnistp ap
apepisianIP apueia euun pH
SonydeO ou epin>sIp 3yuouepeyjejop pa13s a
e
jejoos eSInbsad e eJed
wLagausse ap sagboup opueuosoida1 sagóynqunsyp s34L vI vaNDLA eyoadsa ogdeoyiuais u ) onb 1vuuou vaIn) ? (°)ET7 exnatg eu epEnsnj!
-9us ogdInqinstp ap odi uin 'eoFrnoosou eoun
uou
(sv1JuNDOsauu Sepeueup) seppjeype ojinur ogs
eOunguisse uoEANIsOd (9) eOLNIUIISSe uIUTEANE3oN (E)
0yd wpa ogu seyno (svounoiInjd sepeuuuouap) openyuase
owo 'senno (svo11ugoo1daj sepeuueyp) sepejeype queseq ogs "(9)gr7 enßiJ ep e
ouo e
openjue aJuejseq 0oyd wgi "(e)ET7
SeOLnPuIS sagbnqunsIp seurnatv (as01uno) od op vuuuof ep sou1) uo ein31H ep
-p wopod sero 'ojduaxa 1od 'SeDLnuTs
sagbmqunsp se anus nuaujaAIsuas uy
ogbeLJEA JOAPIopISuOD PH
eno Pu onb op
soseo STeu wejuasaide a oga1p eun us souuan
svo14191ujssD as-uereyp
sagdap se SEque ua souaiyxa soIOTEA sagÓ.nqLns1p seno s
'oxeq ered eup eIPd
ap O19UIFu ousau uJuoo o
-10 'SeDIugp! sapejou senp souajqo oua ou eAINS e
sagdinquns1p sesso Ouei
-;nstp seunay eIounbaiy ap sagOInqigsip Iod opueiqopsoouis ogs sagbnq
®
sOu-repn[e sejougnbaiy ap souoayod so sepruinsse seurog 3p opepis1aAp JezienstA
piougnba41 ap opdinquisiq vun ap vHY
S9 opeg sop ogÓEzIUEiO Tonjde,)
66 Parte I Descrição
Capítulo 2 Organização dos Dados 67
120
TABELA 2.22 Taxas de homicídio nos Estados Unidos: 1950-1998
100
Taxa de homicídio
Ano Taxa de homicídio
(por 100.000) Ano
por 100.000)
1950
4,6 1975
1951
4,4 9,6
1976
1952 8,8
4,6 1977
1953 8,8
4,5 1978
1954 9,0
40 1955
4,2 1979
9,7
4,1 1980
1956 10,2
4,1 1981
20 1957
4,0 9,8
1958
1982
4,8 9,1
1959
1983
4,9 8,3
1960 1984
10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 5,1
1961 1985
Idade da mãe
4,8 9
1962 1986
4,6 8,6
FIGURA 2.15 1963 1987
Gráfico em linha do número de nascimentos por 1.000 mulheres 4,6 8,3
pela idade da mãe. 1964 1988
4,9 8,4
1965 1989
5,1 8,7
1966 1990
5,6 9,4
1967 1991
6,2 9,8
1968 1992
6,9 9,3
1969 1993
10 7,3 9,5
1970 1994
1,9 9,0
1971 1995
8,6 8,2
1972 1996
9,0 7,4
1973 1997
9,4 1998
6,3
1974
9,8 6,3
Mapas
Até certa ocasião, os
pesquisadores sociais confiavam quàase
setores, gráficos em barras,
exclusivamente
entretanto, com o advento e polígonos de gráficos em
em
freqüencias e gráficos em linhas. Em anos
utilizar outras formas de
o
aperfeiçoamento das técnicas de recentes,
1950 1955 1960 1965 1970 1975 1980 1985 1990 1995
bastante popular, apresentação gráica. Um tipo em computação, eles começaram a
Ano
pelo governo (por concomitantemente com a maior particular- o
mapa- tornou-se
exemplo, dados dos censos). utilização de dados coletados e publicados
FIGURA 2.16 Gráfico em linha para as taxas de homicídio nos Estados Unidos: 1950-1998. O mapa oferece um método sem
dados. Por exemplo, a Figura 2.17 paralelo para a exploração de
padrões
mostra
distribuição de freqüências de geográficos
uma nos
quatra catrro1
ParteI Descriçao Capítulo 2 Organização dos Dados 69
68
a ontinui-
mas são especialmente úteis para dados ordinais e intervalares, porque enfatizam
dade ao longo de uma escala. Entre suas muitas aplicaqies, os gráficos em linhas prestarn-
especialmente a representar tendncias ao longo do tempo. Finalmente, os mapas
servem para
TERMOS-CHAVE
variável independente.
2. As distribuições de freqüência podem ser usadas para
de a.
comparar diferenças de sexo em comportamento criminal violento.
Pode-se usar também a representação gráfica de dados para facilitar a legibilidade
b. mostrar as notas de um exame de meio de ano
resultados de uma pesquisa. Nossa abordagem de apresentações gráficas incluiu gráficos em
para todos os estudantes de um curso de