Escolar Documentos
Profissional Documentos
Cultura Documentos
Fklb:" APLICADA
Cv; '
CINCIA$
HUMANAS
.1410tR3104
4111,8
t:4
Traduvo:
Sa.gio Francisco Costa
de Nst
FA,Adda".:ie de FilOsofia. Cincias e tetras
Siio Caetano do Sul (SP).
UN1VRSU)ADE FEDERAL
VIBLIOThCA CEN1
BARBRA -
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
'
Odip
A Flea, Michael,
Bonnie e Andrea.
k
tO
Superriso I>).
'
Provers ' :
: Maria Elizab th Santo
Maria Pia Ca tiglia
Produceo Grdfica Maria Braga e Jesus
c.
: Progruma
Capa Pr ducoes G:ficas
: Lourdes
Ltda.
impresso Mar ins
: GRAFICA EDITO
ESTATSTICA APLICADA A HAMBURG trim.
A CIENCIAS HU
Copyright 1978, ANAS
pela Editora Harpes
Rua Joaquin] Tivor & Ro do Brasil
663 , Vila Mariana, Ltda,
Rua Castro Alves131, ST. + Telefone: 70-3572,70-4891
49 andar, Liberdade,
S P. -- Telelone:
278-7109
Traduzlo de Elementary '
Statistics
Copyright 0 1977, por Jack Levin.
in Social ReSearch,
2 q, edia'o
Publicado originalmente
nos Estados Unidos
por Harper Row Publishers, .84,
Todos os direiros Inc.
reservados Fica
pareialnitente, sem terininantimente proibido
autorizaciio expressa reproduzir esta obra,
dos Editpres. totai Ou
Impresso no Braql
Printed M Brazil
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
,
<1? 6>0
1.6 '10
.4?
Prefcip
CZ'4,4(
Prefcio Edio Brasileira P_, 0 ,00
1 Por que o Pesquisador usa Estatfstica? 1
`
A natureza da pesquisa /
Por que testar hiperteses? 2
Os estagios da pesquisa 2
O ttso de sries numricas em pesquisa 3
Fun Vies da estatistici 6
Reuino 12
PAIRTE I DESCRIOO 13
2 Orgtinizao de Dados 15
Distribuies de freqncia de d dos nominal
CoMparao das distribuieS
M;t,dbuies dc freqiincias simi es relativas a dado dinais e intervalares
Dist ribuies de freqUncias com dadOs agrupados
Distribuies cumulativas
Posto percentil 27
Resumo
Represent es Gr 351
Grficos setoriais
'Graficos de barras
Polfgonos de freq cias 37/.
Construgo de grficos de arras e de pollgonos de freqncias 39 .
Medids de Variabilidade. 59
Amplitutk total 60
Des.triorn6dio 61
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Desvio padro 63
Comparao en tre amplitu e total, idesvio mdio e d'esvio padro 7/ ;
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
wo.Avk
34
A estatstica F(razo F) 165 awraorgeA i4f1:
Comparao mltipla de mdias 1 70
Exigncias para o uso da estatstica F(razo F) 1 72
Resumo I 72
11 Correlao 208
Fora da correlao 208
Sentido da correlao 209
Correlao curvilnea 210
Coeficiente de correlao 211
Coeficiente de correlao para dados intervalares 212
FOrmula para o clculo do r de Pearson 215
Anlise de regresso 220
Coeficiente de correlao para dados ordinais 226
Gama de Goodman e Kruskal 232
Coeficiente de correlao de dados nominais dispostos numa tabela 2 X 2 239
Coeficientes de correlao de dados nominais dispostos em tabelas de ordem
superior a 2 X 2 241
Resumo 244
APENDICES 261
Apndice A Reviso de Fundamentos de Matemtica 262
Nmeros decimais 262
Nmeros negativos 265
Clculo de razes quadradas mediante o uso da tabela A 266
Ape-ndice B Tabelas 268
Apendice C Lista de Frmulas 298
Apndice D Classificao de Classes Scio-Econmicas no Brasil 303
Referncias 306
Respostas aos Problemas Pares 304
Indice 308
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Prefcio
A NATUREZA DA PESQUISA
De modo mais ou menos semelhante, o cientista tem jdias sobre a natureza da reali-
dade(idias que ele denomina hiptaes) e freqentemente lesta suas ideias atravs
de_pesquisa sistemAtica Por exemplo, ele poderia levantar a hiptese_ de que crian-
yas socialmente isoladas agsistem mais televiso do que crianas bem integradas
em seus grupos-e, a partir da, fazer um levantamento em que fossem feitas perguntas
tanto As crianas socialmente isoladas, quanto As crianas bem integradas com relao
ao nmero de horas que elas passam diante do video. Ou, ele poderia levantar a hiptese
de que a familia constituda por um s genitor (me ou pai ausente) gera maior delin-
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Por que o Pesquisador usa Estatstica?
2 Por que o Pesquisador usa Estatstica?
1. o problema a ser estudado reduzido a urna hiptese testvel* (por exemplo:
qencia do que a famlia constituda por ambos os genitores (me e pai presentes); "famlias de um genitor produzem mais delinqncia que famlias de dois
ento, o pesquisador poderia entrevistar amostras de delinqentes e no-delinqentes genitores");
que procedessem de famlias de ambos os tipos. 2. um conjunto de instrumentos adequado desenvolvido (por exemplo, so ela-
Desse modo, semelhana do que ocorre nas ciacias fsicas, o cientista social
borados um questionrio ou esquema de uma entrevista);
freqentemente faz pesquisas para aumentar seu cabedal dos problemas e suas conse- dados so coletados (isto , o pesquisador pode ir a campo e fazer uma conta-
qncias em seu campo de estudos. A pesquisa assume muitas formas e pode ser gem ou um inqurito);
usada para investigar uma srie-enorme de problemas. 0 pesquisador pode, na qualidade (\4. os dados so analisados em cotejo com as hipteses iniciais; e
de observador participante, trabalhar com grupos de delinqentes; pode tambm traba-
5. os resultados da anlise so interpretados e comunicados ao pblico, por exem-
lhar num levantamento amostral de suas tendncias polticas, ou fazer uma anlise de
plo, por meio de conferncia ou publicao.
valores em folhetos politicos; ou, ainda, realizar um experimento a fim de determinar os
efeitos do remanejamento de moradias em indivduos atingidos por4esaliroptragiies Como veremos nos captulos subseqentes, o material apresentado neste livro
trata com maior profundidade daqueles aspectos da pesquisa relacionados com a anlise
de dados (ver 4, acima), os quais, depois de colecionados ou recolhidos pelo pesquisa-
POR QUE TESTAR HIPTESES? dor, so analisados luz das hipteses iniciais. nesse estgio da pesoisa..que_os_slados_
A.
, de modo geral, desejvel-para no dizer necessrio-testar sistematicamente nossas cakulados, contados, resumidos, reclassificados, comparados ou,
hipteses sobre a nattireia da realidade, mesmo aquelas que parecem verdadeiras, numa palavra, organizados, a fim de que a preciso ou a validade de nossas hipteses
em
lgicas otLevidentes. Os nossos "testes" de bom senso dirio geralmente baseiam-se possam ser testadas.
idias pr:concehidas muito estreitas, se no tendenciosas, e em experincias pessoais, o
que pode levar-nos a aceitar concluses no vlidas a respeito da natureza dos fenme-
nos. Para demonstrar esse ponto, vamos examinar as seguintes hipteses, que fo- 0 USO DE SRIES NUMRICAS EM PESQUISA
ram testadas com um grande nmero de soldados durante a Segunda Guerra Mundial.
Qualquer pessoa que j tenha feito pesquisa sabe os problemas que surgem
Voc teria sido capaz de prever estes resultados com base em suas experincias dirias?
na anlise dos dados devem ser seriamente confrontados na fase de planejamento (da
Voc acha que valeu a pena test-las? Ou ser que etas parecem to bvias e evidentes
pesquisa), uma vez que de seu significado depende a natureza de decises em fases
que dispensam pesquisas sistemticas?
posteriores. Tais problemas amide afetam no s aspectos do delineamento da pes-
1. Homens de nvel educacional mais alto apresentaram maior quantidade
de
instruo. quisa** como tambm a escolha dos tipos de instrumentos utilizveis na coleta de da-
sintomas psiconeurticos do que aqueles que haviam recebido menos dos. Por esta razo, buscamos constantemente tcnicas e mtodos que permitam melho-
du-
2. Homens procedentes do meio rural mantiveram-se mais bem-humorados_
meios urbanos. rar a qualidade da anlise dos dados.
rante o perodo de guerra do que os soldados recrutados nos Muitos pesquisadores acham que essencial fazer mensurao ou empregar uma
3. A capacidade dos soldados procedentes do Sul para suportar o clima
quente
do Norte. srie de nmeros na anlise dos dados. Por isso, os pesquisadores desenvolveram me-
das Ilhas dos Mares do Sul era maior que a dos soldados vindos
ansiosos para didas*** para urna grande variedade de fenmenos, tais como: prestgio ocupacional,
4. medida que a guerra prosseguia, os homens sentiam-se mais atitudes polticas, autoritarismo, alienao, anomia, delinqncia, classe social, pre-
retornar aos Estados Unidos do que aps a derrocada dos alemes. conceito, dogmatismo, realizao, etnocentrismo, vizinhana, religiosidade, ajustamento
Se voc acredita que essas relaes eram to bvias que qualquer teste sistemtico conjugal, mobilidade ocupacional, urbanizao, status sociomtrico, fertilidade etc.
teria sido dispensvel, saiba que cada item "representa a concluso oposta ao que real- Os nmeros trn pelo menos trs funes importantes para o pesquisador, depen-
mente se verificou.. Soldados parcamente educados neurotizaram-se mais do que os dendo do nvel de mensurao especfico que ele empregue. Especificamente, uma
que receberam boa educao; os sulistas no demonstraram maior habilidade que os srie de valores pode ser usada
nortistas em adaptar-se a um clima tropical; ... e assim por diante."' Ficar apenas na 1. para categorizar ao nvel de mensurao denominado nominal,
dependncia do bom senso ou da experincia do dia-a-dia tem seus limites!
* N.T.: Reduzir um problema a uma hiptese testvel significa definir o problema e a(s) hiptese(s)
OS ESTGIOS DA PESQUISA em termos operacionais. Uma definiao operacional explicita comportamentos observveis (direta ou
Testar sistematicamente nossas idias sobre a natureza da realidade muitas vezes requer indiretamente).
uma pesquisa cuidadosamente planejada e executada, onde: ** N.T.: 0 ideal ter a sido conservar a palavra "design". HA quem prefira "modelo" ou mesmo
"desenho".
Paul Lazarsfeld, "The American Soldier-An Expository Review", Public Opinion Quarterly, *** N.T.: Na verdade, desenvolveram "processos de mensurao".
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
outono de 1949, pg. 380.
Por que o Pesquisador usa Estatatica?
4 Por que o Pesquisador usa Estatstica?
propsito de agrupar os sujeitos em categorias separadas para indicar similitude ou
postos ou ordem ao nvel de mensurao denominado ordinal e
2. para atribuir diferena com referncia a uma dada qualidade ou caracterstica.
3. para avaliar ao nvel de mensurao denominado intervalar.
Antes de prosseguir com a discusso do papel da Estatstica na pesquisa vamps TABELA 1.1 Atitudes de Dez Estudantes Universitrios com Relao a "Neutralianos": Dados
parar aqui para examinar algumas caractersticas mais importantes desses nveis de Nominais
mensurao, caractersticas que, mais adiante, assumiro grande importancia ao tentar- Atitude corn Relao aos "Neutralianos" Freqiiincia
mos aplicar tcnicas estatsticas a determinadas situaes de pesquisa.
1 = Preconceituosos 5
Nvel Nominal 2 = No-preconceituosos 5
0 nvel nominal de mensurao envolve simplesmente o ato de nomear ou rotular; em_ Total 10
outras palavras, consiste em colocar indivduos* em categorias e contar a freqncia
com que ocorrem. Para ilustrar, poderamos usar uma medida de nvel nominal para -
indicar se cada respondente tem ou no preconceito com relao a determinado grupo Nvel Ordinal
social ("Neutrlia"). Como demonstra a Tabela 1.1, poderamos submeter 10 alunos de Quando o pesquisador vai alm desse nvel de mensurao e procura ordenar seus
determinada classe a um questionrio e verificar que 5 podem ser considerados "precon- sujeitos em funo do grau que apresentam de determinada caracterstica, ele est
ceituosos" (= 1) enquanto que 5, "no-preconceituosos" (= 2). irabalhando no nvel ordinal de mensurao. A natureza da relao entre categorias
Outras medidas de nvel nominal em pesquisa so: sexo (masculino versus ordinais depende da caracterstica que o pesquisador procura medir. Para citar um
feminino); classe scio-econmica (alta e baixa), partido poltico (ARENA e MDB), exemplo familiar, ele poderia classificar indivduos com referncia a status scio-eco-
carter social (voltado "para dentro" e tradicional), modo de adaptao (conformismo, nmico e disp-los em "classe baixa", "classe mdia" e "classe alta". Ou, em lugar
inovao, ritualismo, fuga, rebeldia), orientao no tempo (presente, passado e futuro), de categorizar os alunos de uma dada classe em preconceituosos ou no-preconceituosos,
urbanizao (urbano, rural e suburbano)-para mencionar algumas. ele poderia classific-los de acordo com o grau de preconceito contra os "neutralianos",
trabalhar com dados nominais, devemos ter em mente que cada sujeito deve A semelhana do que vai indicado na Tabela 1.2.
ser colocado em uma-e somente uma-categoria. Este requisito indica que as categorias 0 nvel ordinal de mensurao fornece informaes sobre a ordenao das cate-
no devem sobrepor-se, isto , devem ser mutuamente excludentes." Desse modo, a gorias, mas no indica a Aagnitude das diferenas entre os valores. Por exemplo, o
raa de um respondente no pode ser simultaneamente classificada em "branca" e pesquisador que emprega uma medida de nvel ordinal para estudar a varivel pre-
"preta"; qualquer respondente que seja classificado como "macho" no pode ser tam- conceito no sabe quanto um respondente mais (ou menos) preconceituoso que
bm classificado como "fdmeo". 0 requisito implica tambm o fato de que as catego- outro. No exemplo dado acima, no possvel determinar quanto Adriana mais
rias devem ser exaustivas-ou seja, deve haver um lugar_ especfico para cada suieito preconceituosa do que Maria ou quo menos preconceituosa Roberta corn relao a
experimental que aparea. A ttulo de ilustrao, imagine um estudo em que todos os Patrcia ou Pedro. Isto ocorre porque os intervalos entre os pontos ou postos numa
respondentes sejam entrevistados e categorizados por raa, como brancos ou negros. escala ordinal, no so conhecidos ou, melhor dizendo, dotados de significado. Portanto,
Onde que colocaramos um respondente chinds na hiptese de surgir um? Neste caso, no possvel atribuir valores a sujeitos localizados em diferentes pontos da escala.
poderia tornar-se necessrio ampliar as categorias originais e incluir "orientais" ou, TABELA 1.2 Atitudes de Dez Estudantes Universitrios com Relao a "Neutralianos": Dados
ento, admitindo-se que a maioria dos respondentes ser de raa branca (ou de raa Ordinais
negra), incluir a categoria "outros", onde tais excees possam ser colocadas.
Aluno Posto
0 leitor deve observar que os dados nominais nab so graduveis, ordenveis ou
escalonveis relativamente a qualidades tais como melhor ou pior, mais alto ou mais
Adriana
baixo, mais ou menos. Obviamente, ento, uma medida nominal de sexo no significa 1 mais preconceituosa (primeiro posto)
Nvel Intervalar
Em contraposio, o nvel intervalar de mensurao orienta-nos relativamente, or,dem Para chegar a concluses ou obter resultados, o pesquisador geralmente estuda cen-
das categorias, bem como indica-nos a distncia exata entre elas. Escalas iiire)rvala- tenas, milhares ou mesmo quantidades ainda maiores de pessoas ou grupos. Como
res implicam unidades constantes de medida (por exemplo: cruzeiros-ou centavos, um caso extremo, consideremos o trabalho do "United States Bureau of the Census"
graus Fahrenheit ou centgrados, metros ou centmetros, minutos ou segundos), as (Servio Norte-americano de Recenseamento) na enumerao exaustiva de toda a
(Timis comportam intervalos iguais entre os vrios pontos da escala. populao dos Estados Unidos, para o que mais de 200 milhes de sujeitos foram
Desse modo, uma medida intervalar de preconceito contra os "neutralianos"-por entrevistados. Apesar da ajuda de numerosos procedimentos sofisticados idealizados
exemplo, as respostas a uma srie de perguntas sobre esses sujeitos avaliadas numa escala para a tarefa, descrever e resumir a enorme quantidade de dados que se origin= de
de 0 a 100 (o mximo de preconceito correspondendo a 100)-poderia fornecer dados projetos de pesquisa social sempre um trabalho de propores astronmicas.
como os que constam da Tabela 1.3 sobre os dez estudantes numa dada sala de aula. Para dar um exemplo familiar, as notas de exame de uma classe de apenas 80
Como bem demonstra a Tabela 1.3, agora podemos ordenar os alunos em termos de alunos foram catalogadas na Tabela 1.4. Percebe-se algum padro nessas notas?
seus preconceitos e, alm disso, indicar as distancias que separam uns dos outros. Por Poder-se-ia descrev-las em poucas palavras? Ou em poucas sentenas? De modo geral,
exemplo, possvel dizes que Roberta a menos preconceituosa da classe, uma vez que seriam elas particularmente altas ou baixas?
ela recebeu o escore baixo. Podemos dizer tambm que Roberta apenas ligeira-
mente meniis preconceituosa que Patrcia ou Osvaldo, mas muito menos preconceituosa TABELA 1.4 Notas de Exame de 80 Alunos
es,$)
do que Adriana, Maria, Benito ou Jos, os quais receberam valores (escores) extrema-
mente altos. Dependendo do propsito para o qual o estudo foi concebido, seria impor- 72 83 91 29 dtb
e."0I?
<9
tante determinar tais informaes, as quais, entretanto, no estariam disponveis no 38 89 49 36
AN
43 60 67 49
nvel ordinal de mensurao. 0fr`
81 52 76 62
1
79 62 72 31
TABELA 1.3 Atitudes de Dez Estudantes Universitrios -,com Relao a "Neutralianos": Escala c
71 32 60 73
Intervalar 65 28 40 40
59 39 58 38
90 49 52 59
Aluno Escorea 60
83 48 68
39 65 54 75
Adriana 98 42 72 52 93
Maria 96 58 81 58 53
Benito 95 56 58 77 57
Jos 94 72 45 88 61
Ctia 22 63 52 70 65
Geraldo 21 49 63 61 70
Filipe 20 81 73 39 79
Osvaldo 15 56 69 74 37
Patrcia 11 60 75 68 46
Roberta 6
(classes) mais abrangentes, juntamente com o nmero ou a freqncia (f) de alunos tua-se entre 50 e 80, enquanto que as notas muito mais altas ou baixas so relativamente
cujas notas cassem nessas categorias.
poucas.
Pode-se prontamente observar, por exemplo, que 17 alunos receberam notas entre
No Captulo 4 ser apresentado um mtodo estatstico que particularmente
60 e 69, enquanto que somente 2 alunos receberam notas entre 20 e 29.
conveniente e til. Trata-se de algo com que j estamos mais ou menos familiarizados
Outro procedimento til (explicado no Captulo 3) seria reagrupar os dados grafi- e que consiste em perguntar: Qual a nota mdia desse grupo de 80 estudantes? A mdia
camente. Tal como ilustra a Figura 1.1, poderamos localizar as categorias (classes) de aritmtica (ou simplesmente mdia), que se obtm pela diviso da soma de todas as
notas (de 20-29 a 90-99) ao longo de um dos eixos do grfico (isto , a linha de base, notas pelo nmero de alunos, d-nos uma idia mais clara da tendncia geral do grupo.
horizontal) e o nmero delas (categorias), ou seja, as freqncias, ao longo do outro A mdia aritmtica do exemplo em questo de 60,5, nota bastante baixa se comparada
eixo (vale dizer: o eixo vertical). com outras mdias de classe com as quais a maioria dos alunos j est familiarizada.
Aparentemente, esse grupo de 80 alunos saiu-se relativamente mal como um todo.
TABELA 1.5 Notas de Exame de 80 Alunos: Distribuio Agrupada de Freqncias
Assim, com o auxlio de recursos estatsticos, tais como distribuies condensadas
Notas de freqncias, grficos e mdias aritmticas, possvel detectar e descrever modelos ou
tendncias em distribuies de valores (por exemplo, as notas da Tabela 1.4), o que
90-99 3
poderia ter passado despercebido pelo observador no preparado. Neste contexto, ento,
80-8 9 7 a Estatstica pode ser definida como um conjunto de tcnicas para a redudo de dados
70-7 9 16 quantitativos (ou seja, uma srie de nmeros) a um nmero menor de termos descritivos
60-69 17 que sejam mais convenientes, e facilmente comunicdveis.
50-59 15
40-49 11
30-39 9
Tomada de Decisties
20-29 2 Quando o propsito testar hipteses, muitas vezes necessrio ir alm da mera descri-
o. tambm geralmente necessrio fazer inferncias, isto , tomar decises com base
em dados colhidos de uma amostra, o que quer dizer: estudar apenas uma pequena
porciro de um grupo maior-que, por seu turno, representa o centro de interesse para
estudo. Custo, tempo e necessidade de superviso adequada so fatores que muitas vezes
15 -
_
impedem uma enumerao completa ou rol do grupo todo (grupo que os pesquisadores
chamam populaeo ou universo).
Como veremos no Captulo 7, todas as vezes que o pesquisador testa suas
hipteses numa amostra, ele precisa decidir se de fato acertado generalizar suas desco-
o
<CL)
10 -
_ bertas para toda a populao da qual a amostra foi tirada. Inevitavelmente surgem erros
o de amostragem, mesmo quando esta tenha sido convenientemente planejada e executa-
da. Este o problema da generalizao ou inferncia da amostra para a populao.2
5 - 2
Observagro para o leitor. O conceito de "erro amostral" (de amostragem) vai ser discutido com
maior profundidade no Captulo 7. Todavia, a fim de entender melhor o problema da inevitabilidade
de erro ao amostrar* de um grupo maior, o leitor pode querer desenvolver o seguinte experimento.
Use a Tabela 1.4 (como fonte de referncia) a qual contm as notas de uma populao de 80 alunos.
0 Aleatoriamente (por exemplo, feche os olhos e escolha com o dedo), selecione uma amostra de
20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 algumas notas (por exemplo, 5) da lista toda. Procure a nota mdia somando os valores sorteados e
Classes (Categorias) de Notas
dividindo o resultado por 5, que equivale ao nmero total de mdias. d foi mencionado que a nota
mdia para toda a classe (80 alunos) era 60,5. Em que medida a mdia da sua amostra difere da
mdia da classe toda (60,5)? Faa este experimento usando vrias outras amostras de notas selecio-
FIGURA 1.1 Notas de Exame de 80 Alunos Dispostas num Grfico de Barras nadas ao acaso-e sempre sorteadas do mesmo grupo (de 80 alunos). Com significativa perseverana
voc verificar que a sua mdia amostral vai diferir quase sempre, pelo menos um pouco, da mdia
obtida para o grupo todo. essa diferena, isto , a diferena entre a mdia da populao (80 alunos)
Essa disposio tem como resultado uma representao grfica facilmente visuali-
e cada uma das mdias amostrais encontradas que se chama "erro amostral".
zada (por exemplo, o grfico. de barras), onde podemos ver que a maioria das notas si- N.T.: "Amostrar" um neologismo empregado em Estatstica para significar "colher urna amostra".
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
10 Por que o Pesquisador usa Estatstica?
,Por que o Pesquisador usa Estatstica? 11
Nmero de estudantes TABELA 1.8 Uso de Maconha em Funo do Sexo do Respondente. Caso III
que experimentaram 60 40
Nmero de estudantes
Sexo dos Respondentes
que no experimentaram 40 60
Uso de Maconha Alunos Alunas
Total 100 100
Nmero de estudantes
sexo feminino. Para os nossos propsitos, entretanto, a questo mais importante que experimentaram 51 49
saber se essas diferenas de sexo ligadas ao uso de maconha so grandes o suficiente para Nmero de estudantes
que possamos, com confiana, generaliz-las para uma populao universitria muito que no experimentaram 49 51
maior de 20.000 alunos. Ser que tais resultados representam diferenas populacionais Total 100 100
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
12 Por que o Pesquisador usa Estatestica?
Ento, onde se situa a linha divisria? Em que ponto (ou em que momento) uma
diferena amostral torna-se suficientemente grande para scr tratada como significante
ou real? Com o auxlio da Estatstica podemos de pronto e com alto grau de confiana, UNIVERSIDADE 77.0 TIM_ DO
tomar tais decises sobre as relaes existentes entre amostras e populaes. Para B BLIOTEC A CENT
ilustrar: se tivssemos usado um dos testes de significtincia discutidos mais adiante
(por exemplo, qui-quadrado-ver Captulo 10), teriamos sabido que somente aqueles
resultados que aparecem na Tabela 1.6 poderiam ser generalizados para a populao
de 20.000 estudantes universitrios, o que equivalo a dizer que se de cada 100 alunos
60 j usaram maconha, e se de cada 100 alunas 40 fizeram o mesmo, tal descoberta
substancial o suficiente para ser extrapolada para a populao toda com um alto
grau de confiana. O nosso testa estatstico dlz-nos que h somente 5 possibilidades
em 100 de estarmos errados! Em contrapartida, os resultados apresentados nas Tabelas
1.7 e 1.8 so estatisticamente ndo-significantes, de sorte que resultam muito mais de
erro amostral do que de diferenas de sexo no uso dessa substncia. Usando um critrio
estatstico mais uma vez, podemos concluir quo eases resultados nab refletem diferenas
populacionais verdadeiras, e sim, meros erros amostrais.*
No presente contexto, portanto, Estaastica um conjunto de tcnicas para a
tomada de decises que auxiliam os pesquisadores na tarefa de fazerem inferncias de
amostras para populaceies e, a partir da, nos testes das hipteses levantadas sobre a
natureza da realidade.
PARTE I
RESUMO
Este captulo "juntou" nossas previses dirias sobre acontecimentos futuros com as
experincias do pesquisador, que usa a Estatstica como um recurso para teStar suas
Descrio
hipteses a respeito da natureza da realidade. A mensurao foi discutida em termos
de dados nominais, ordinais e intervalares. Foram identificadas, com a anlise de dados
(e resumidamente discutidas e ilustradas), as duas seguintes funes bsicas da Esta-
tstica:
1. descrio (isto , reduo de dados quantitativos a termos descritivos mais
convenientes e em menor nmero) e
2. tomada de decises (ou seja, inferncias de amostras para populaes).
* N.T.: No confundir ideal com real. 0 ideal seria ?brio cometer erros; na realidade, por maiores que
sejam os controles, erros casuais sempre ocorrem. praticamente impossvel evitar erros amostrais.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
2
Organizao de
Dados
aumentar seu conhecimento do comportamento humano. Para entrevistar ou, por ou'
eliciar informaes de um grupo de beneficirios da previdncia, de estudantes unitcr-
sitrios, de viciados em drogas, de moradores de penses, de homossexuais, de norte-
-americanos da classe mdia ou de respondentes de outras categorias, tornam-se necrs-
srios certo grau de previsao, planejamento cuidadoso, controle, alm do tempo desprn-
dido em campo.
Completar a coleta de dados, entretanto, somente o comeo daquilo que cons-
titui a anlise estatstica. A coleta de dados o passo inicial, a matria-prima com que
o pesquisador deve trabalhar se o seu objetivo analisar os dados, obter resultados e
testar hipteses acerca da natureza da realidade.
Masculino 80
Feminino 20
Total 100
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
16 DESCRIO
Organizao de Dados 17
O que o pesquisador pode fazer para organizar a dizer tambm que nas ocasies em que as moas compareceram, elas mostraram-se,
avalancha de dados brutos que
ele recolhe de seus respondentes? Que que ele faz 'de certa forma, mais inclinadas para a ala de pintura clssica que para a de moderna.
para transformar essa massa de
dados brutos num conjunto-resumo fcil de entender? O primeiro
passo poderia ser
construir umadistribuicdo de freqncias sob a forma de tabela.
Examinaremos a distribuio de freqncias da Tabela 2.1. TABELA 2.2 Comparecimento de Alunos de Ambos os Sexos a uma Exposio de Pintura (Arte
Observem, em pri-
meiro lugar, que a tabela encabeada por um nUmero (2.1) e Clssica e Arte Moderna)
por um dtulo que d ao
leitor uma idia da natureza dos dados apresentados-"Estudantes
de ambos os sexos
presentes a uma exposio de pintura". Esse o procedimento Comparecimento ers Exposies
padro; todas as tabelas
devem ser claramente tituladas e, quando forem Arte Moderna
apresentadas em seqncia, devem Arte Clssica
conter tambm um nmero. Sexo
As distribuies de freqncia de dados nominais
consistem em duas colunas.
Na Tabela 2.1, por exemplo, a coluna da esquerda indica
a caracterstica de interesse* Masculino 80 70
(sexo) e contm as categorias de anlise (homens e mulheres). Feminino
Uma coluna adjacente 20 30
titulada "Freqncia" ou `f" indica o nmero de sujeitos em cada
categoria (80 e 20, Total 100 100
respectivamente), bem como o nmero total de sujeitos (N = 100),
Uma rpida inspeo da distribuio de freqncia constante
da Tabela 2.1
revela perfeitamente que muito mais alunos do que alunas
compareceram exposio:
dos 100 alunos presentes 80 cram do sexo masculino. Propores e Porcentagens
Quando o pesquisador estuda distribuies de tamanho igual (isto , amostras de mesmo
tamanho), os dados freqenciais podem ser usados no estabelecimento de comparaes
COMPARAO DAS DISTRIBUIES entre os grupos. Assim, o nmero de rapazes presentes exposio de pintura clssica
Suponham, entretanto, que desejemos comparar a presena de pode ser diretamente comparado com o nmero de rapazes presentes de pintura
estudantes na ala de moderna, uma vez que sabemos terem visitado cada ala da exposio exatamente 100
arte moderna com a presena de estudantes na ala de arte
clssica. Fazer comparaes
entre distribuies de frequncias constitui um procedimento usado estudantes. Em geral no possvel, entretanto, estudar distribuies com exatamente
amide para tornar o mesmo nmero de sujeitos. Por exemplo, como podemos estar certos ("a priori") de
os resultados mais claros e a informao mais ampla. A
comparao especfica que o que precisamente 100 alunos comparecero a ambas as exposies?*
pesquisador faz determinada pela questo a que ele procura responder.
Voltando ao nosso exemplo hipottico, poderamos perguntar: ser que A fim de tornar tais resultados mais claros (mais "legveis"), necessitamos de um
os rapa- mtodo que permita padronizar distribuies de freqncias quanto ao tamanho, ou
zes so mais propensos a comparecer a exposies de
pintura moderna e clssica do
que as moas, ou ser que eles se distribuem casua1mente? seja, uma forma de comparar grupos a despeito de diferenas nas freqncias totais.
Para responder, poderamos
comparar a distribuio de 100 alunos** presentes ala de Dois dos mais teis e populares mtodos de padronizar tamanho e comparar distribui-
pintura moderna com a es so o mtodo da proporgro e o mtodo da porcentagem.
distribuio de outros 100-da mesma universidade-presentes ala de
pintura clssica. No mtodo da proporo, compara-se o nmero de sujeitos de uma dada categoria
Vamos imaginar que os resultados obtidos sejam os constantes da
Tabela 2.2. com o total de sujeitos que compe a distribuio (e na qual a dada categoria se inclui).
Tal como demonstra a tabela, de 100 estudantes presentes
na ala de pintura Podemos transformar qualquer freqncia nunia proporo P, atravs da diviso do
moderna, 30 eram do sexo feminino; j na ala de pintura clssica,
de 100 apenas 20
eram do sexo feminino. Isto j nos d muito mais informaes nmero de sujeitos de uma dada categoriaf pelo nmero total de sujeitos da distribuio
do que a simples distri- (N). Em smbolos:
buio de freqncia apresentada na Tabela 2.1. Assim, podemos
agora dizer que os
rapazes tiveram uma participao maior do que suas colegas de
universidade. Podemos
f **
% =
razsb = -
12
(100) .
Assim, 25% desse grupo de 40 estudantes compe-se = 25%. Se estivssemos interessados, por exemplo, na determinao da razo existente
de rapazes. Para ilustrar a utilidade entre torcedores de futebol, podetiamos comparar o nmero de simpatizantes do
das porcentagens nas comparaes entre distribuies,
vamos examinar o compareci- time A (f = 150) com o nmero de simpatizantes do time B (f = 100), o que daria
mento de estudantes a exposies de pintura realizadas
num "campus" universitrio em Simplificando a frao, isto , cancelando os fatores comuns do numerador e de-
que a arte moderna considerada de importncia
fundamental. Suponhamos, ento, que
alaleria de arte moderna atraiu um bom nmero de estudantes, nominador, resulta: jj = (Em termos concretos, isto significa que para cada 3 tor-
digamos 1.352, enquanto cedores do time A existem 2 torcedores do time B.)
que a galeria de pintura clssica conseguiu atrair
um nmero bem menor, digamos 183. O pesquisador poderia aumentar a clareza dessa razo se desse ao denominador
A Tabela 2.3 indica, ao mesmo tempo, as
freqiiticias e as porcentagens de visita- uma forma que fosse mais inteligfvel. Por exemplo, a chamada razo de sexo comumen-
o a ambas as galerias. Note o leitor a dificuldade
que surge ao tentar-se estabelecer te empregada por diemgrafos, relaciona o nmero de homens em funo de grupos de
rapidamente diferenas ligadas a sexo em termos de
comparecimento, se o quadro de 100 mulheres. Com isso, esses pesquisadores procuram comparar a quantidade de homens
referncia ficar restrito apenas as freqncias. Em contrapartida,
as porcentagens reve- coin a quantidade de mulheres existentes num ncleo populacional determinado.
lam de forma clara que em ambas as galerias o elemento
feminino foi igualmente repre- Ilustrando: se a razo de homens para mulheres for , haver 150 libmens para
sentado. Especificamente, 20% dos estudantes presentes 1-51+3
a ambas as galerias eram do 50 mulheres, ou, simplificando, 3 homens para cada mulher. Para obter a verso con-
sexo feminino.
vencional da razo de sexo, basta multiplicar o resultado acima por 100, donde:
De modo anlogo,
TABELA 2.3 Comparecimento de Alunos de Ambos os Sexos a uma Exposio de Pintura (Arte
Clssica e Arte Moderna)
P(A) = 10 = 0,2
50
Comparecimento cis Exposies
P(V) e P(A) representam, respectivamente, a Arte Moderna Arte Chissica
"probabilidade de ocorrer bola vermelha" e a "probabi-
lidade de ocorrer bola amarela".
Sexo
Note-se, finalmente, a analogia existente entre a
expresso
Masculino 1.082 (80) 146 (80)
P =
Feminino 270 (20) 37 (20)
e o quociente que di a probabilidade de ocorrncia de um Total 1.352 (100) 183 (100)
evento.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
20 DESCRIO
Organizao de Dados 21
As razes (como as indicadas acima) j no
so exaustivamente usadas em pesqui- a taxa de mudana, pode ser usada para comparar uma populao com si prpria em
sas-talvez pelos seguintes motivos:
dois momentos distintos. Ao computar a taxa de mudana, comparamos a
1. So necessrias muitas razes mudana
para descrever distribuies que possuem vrias efetiva ocorrida entre um tempo 1 e um tempo 2, onde a extenso do tempo 1 serve
categorias de anlise. de base. Desse modo, uma populao que cresceu de 20.000 a 30.000
2. Pode tornar-se difcil a comparao habitantes entre
de razes baseadas em nmeros muito 1960 e 1970 apresenta a seguinte taxa de mudana
grandes.
3. Alguns pesquisadores preferem evitar as
fraes geradas pelas razes.* (100 f de tempo 2
f de tempo
-f de tempo 1 ( -
(100) 0.000 20.000
50%
Taxas 1 20.000
Outro tipo de razo-que tende a ser muito mais
utilizado pelos pesquisadores- a Em outras palavras, houve um aumento populacional de 50% no perodo de 1960/70.
taxa. Os socilogos habitualmente analisam
populaes quanto a taxas de reproduo, Observe-se que a taxa de mudana pode ser negativa, caso em que indicar a
mortalidade, crime, divrcio, casamento e fatos semelhantes.
Todavia, enquanto que a diminuio de algo num dado perodo. Exemplo: se uma populao mudar de 15.000
maioria das outras razes compara o nmero de
sujeitos de um subgrupo qualquer para 5.000 habitantes num dado perodo a taxa de mudana ser
(categoria) com o nmero de sujeitos de qualquer
outro subgrupo (categoria), as
taxas indicam comparaes entre o nmero efetivo
Por exemplo, para determinar a taxa de nascimento
de sujeitos e o nmero potencial.
de uma dada populao, podera-
(100) 5.000 - 15.000 - -
67%
mos tomar o nmero efetivo de crianas nascidas 15.000
vivas e cotej-lo com o nmero de
mulheres cujas idades fossem compatveis com gravidez
(ou seja, aquelas mulheres da
populao que esto expostas ao risco de gravidez e DISTRIBUIES DE FREQUNCIAS SIMPLES RELATIVAS A DADOS ORDINAIS
que, por isso, representam ca-
sos**potenciais). De modo anlogo, para determinar a taxa de E INTERVALARES
divrcio, poderamos
comparar o nmero efetivo de divrcios com o nmero Posto que dados nominais so "rotulados" em vez de graduados ou mensurados, as
de casamentos durante certo
perodo (por exemplo, um ano). As taxas so freqentemente categorias das distribuies de nvel nominal no precisam ser construdas em
dadas em termos de nenhuma
uma base de 1.000 casos potenciais. Assim, taxas ordem especffica. Assim, os dados relativos a preferncias religiosas que aparecem
de nascimentos representam o nmero
de nascimentos por 1.000 mulheres; taxas na Tabela 2.4 podem ser apresentados de trs modos diferentes, embora
de divrcio, o nmero de divrcios por igualmente
1.000 casamentos. Ento, se ocorrerem 500 aceitveis.
nascimentos entre 4.000 mulheres (de
idade compatvel com gravidez), vem:
TABELA 2.4 Distribuio de Preferncias Religiosas. (Tres Apresentaes Diferentes.)
Disso resulta que para cada 1.000 mulheres Protestantes 30 Catlicos 20 Judeus 10
passveis de gravidez ocorrem 125 nasci- Catlicos 20 Judeus 10
mentos de crianas vivas. Protestantes 30
Judeus 10 Protestantes
At aqui discutimos taxas que podem ser teis no _30 Catlicos 20
estabelecimento de compara- Total 60 Total 60 Total
es entre diferentes populaes. Por exemplo, 60
poderamos querer comparar taxas de
nascimento entre pretos e brancos, entre mulheres de classe mdia e Em contraste, as categorias ou os escores das distribuies ordinais ou
de classe baixa, intervalares
entre grupos religiosos ou sociedades inteiras e assim por representam o grau em que uma caracterstica particular est presente. O arrolamento
diante. Outro tipo de taxa,
de tais categorias ou escores nas distribuies de freqncias simples deve
ser feito de
N.T.: Dos tres motivos apresentados, o mais fraco , al modo que reflita essa ordem.
sem dvida, o de n. 3, pois, como se ver
mais adiante, no se faz praticamente nada
em Estatfstica sem continua recorrncia
Por essa razo, as categorias intervalares e ordinais so sempre dispostas em
Probabilidades. Ora, a no ser nos casos (raros) de certeza de Teoria das ordem, isto , do valor mais alto ao mais baixo. Por exemplo, poderamos arrolar
que ocorre e certeza de que ndb ocorre, as
cujas probabilidades so, respectivamente, 1 e 0, ea tegorias componentes da varivel classe social da mais alta mais
todas as demais probabilidades so fracionrias e baixa (alta, mdia
menores que 1 (porm positivas). No ser, pois, evitando
as razes que evitar-se-o complicaes o baixa), ou poderamos atribuir postos aos resultados de
de clculo causadas pelo surgimento de nmeros um exame semestral de
fracionrios. Blologia, onde a ordem desses postos fosse seqencial; portanto, do mais alto ao
**N.T.: Comumente aparece a expresso casos com o mais
sentido de sujeitos.
boixo.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
DESCRIO Organizao de Dados 23
TABELA 2.5 Distribuio de Freqncias Relativas a Atitudes Quanto I Guerra. Apresentaes TA BELA 2.6 Notas de Exame Final de 71 Estudantes Dispostas numa Distribuio de Freqncias
Correta e Incorreta
Nota f Nota f Nota Nota
Atitude Quanto Guerra Atitude Quanto Guerra
99 0 85 2 71 4 57 0
Ligeiramente favorvel 2 Muito favorvel o 98 1 84 1 70 56 1
valor pertence ao intervalo 60-64. Mas que dizer do escore 69,4? E que tal tentar situar dade de ver, a posio dos limites de classe deve ser estabelecida a fim de ser possvel a
54,2 ou 94,6? 0 leitor poderia notar que os escores mais alto e mais baixo de um aplicao de certos procedimentos estatsticos.
intervalo qualquer deixam lacunas (espaos vazios) entre grupos numricos adjacentes,
de sorte que alguns valores fracionrios no podem ser includos em nenhum intervalo Ponto Mdio
de classe da distribuio, donde decorre que eles devem simplesmente ser
excludos. Outra caracterstica de qualquer intervalo de classe o seu ponto mdio, que se define
Contrariamente ao que sugerem o escore mais alto e mais baixo de um intervalo como o valor "mais central" desse mesmo intervalo. Um mtodo simples e rpido de
qualquer, os limites de classe esto localizados num ponto que se situa a meio caminho achar o ponto mdio procurar o valor do intervalo de classe que se situa exatamente
entre as classes intervalares adjacentes e, portanto, servem para preencher as lacunas no meio. Alguns exemplos: 50 o ponto mdio do intervalo 48-52; 3,5 o ponto
existentes (ver Figura 2.1). Assim, o limite superior do intervalo 90-94 94,5 e o limite mdio do intervalo 2-5. 0 ponto mdio tambm pode ser calculado mediante uma
frmula* que relaciona os limites superior e inferior de um dado intervalo. Por exem-
plo, o ponto mdio do intervalo 48-52
95
- 94,5 Limite Superior fimite inferior + limite superior 48 + 52
Escore = 50
Mais Alto 2 2
93
Determinao do Nmero de Intervalos
92
Para apresentar dados intervalares sob a forma de distribuio de freqncias agrupadas,
91 o pesquisador deve levar em conta o nmero de categorias (classes) que ele deseja
empregar. Os textos geralmente recomendam usar no menos que 5 nem mais que
Escore -I.- 90 20 intervalos. No tocante a este aspecto, cumpre lembrar que as distribuies de fre-
Mais Baixo - 89,5 -0-- Limite Inferior
qncias agrupadas so usadas com o intuito de revelar ou enfatizar um modelo grupal.**
89
Intervalos de classe em excesso ou em escassez podem tornar esse modelo menos inteli-
FIGURA 2.1 Escores Mais Alto e Mais Baixo Versus Limites Superior e Inferior da Classe Intervalar gvel e, com isso, trabalhar contra o pesquisador-que procura aumentar a clareza de
90-94 sua anlise. Alm disso, reduzir os escores individuais a um nmero desnecessariamente
inferior do intervalo 95-99 tambm 94,5. Da mesma forma, 59,5 tanto serve de Willie pequeno de intervalos, pode redundar em sacrifcio de muita preciso-justamente a
superior do intervalo 55-59 quanto do limite inferior do intervalo 60-64. 0
leitor preciso que se conseguiu no incio mediante o conhecimento da identidade dos escores
que fazer com o valor 59,5, uma vez que ele cai exatamente no individuais da distribuio. Em suma, portanto, o pesquisador geralmente toma sua
poderia perguntar o
ser
meio do espao que separa duas classes intervalares adjacentes. Esse escore deveria
includo no intervalo 55-59 ou no intervalo 60-64? Este problema geralmente contor- * N.T.: Tal como foi explicado nos tpicos anteriores, os nmeros que aparecem nos vrios inter-
59,5
nado mediante arredondamento para o inteiro par mais prximo. Por exemplo: valos de classe constituem seus limites aparentes. Ento, obriga-nos o rigor matemtico a respeitar-e
seria colocado no intervalo 60-64; 84,5, no intervalo 80-84.* Como teremos oportuni- usar nos clculos-os limites reais de pada intervalo de classe. Assim, o ponto mdio do intervalo
48-52 (que, segundo sugesto anterior, deveria grafar-se 48 1-52) no 50, mas, sim, 49,5, a menos
que os valores 48 e 52 sejam resultantes de uma contagem, pois, nesse caso, a varivel discreta (ou
no
tratarem-se de "fraes decimais". Se, de um lado, o que ele diz no est errado, de outro, descontnua), e s admite valores inteiros. A frmula que permite, com rigor matemtico, calcular o
chega a estar completo, uma vez que a notagab decimal uma forma de exprimir
fraes, mas no -
ponto mdio : (limite inferior aparente 0,5) + (metade da amplitude do intervalo). Em smbolos:
a nica. Alternativamente, existe a notao ordinria, expressa por numerador-trao-denominador, 1 = limite inferior aparente
Exempli-
capaz de, em muitos casos, atingir requintes de preciso que superam a notao decimal. = limite superior aparente
entretanto 0,333 ... jamais ser um li = (L - 1) =amplitude do intervalo
ficando: 2,25 (com notao decimal) o mesmo que 2 +
dado to preciso quanto 1/3.
H ,
ponto mdio = (1 - 0,5) +
* N.T.: Em Matematica, ocorrem com freqncia as seguintes
notaes de intervalos: ,
-
No caso dos pontos obtidos pelos universitrios (Tabela 2.8), observamos que a fre-
qncia f associada ao intervalo de classe 301-350 12. Tal freqncia (12) correspon-
12
de, tambm, freqncia acumulada relativa ao intervalo 301-350, uma vez que nenhum c % = (100) = (100)(0,0357) = 3,57%
membro do grupo fez menos pontos do que 301. A freqncia* da classe intervalar 336
A porcentagem dos que conseguiram 400 ou menos foi
TA BELA 2.8 Distribuio de Freqncias Acumuladas Varivel:Escores de Desempenho Acadmico
Obtidos por 336 Universitrios
Intervalo de Classe fa
c % = (100) -
45
336
= (100)(0,1339) = 13,39%
-
75 1-8 00 6 336
701-750 25 330 93
651-700 31 305 c % = (100) = (100)(0,2768) = 27,68%
601-650 30 274 336
551-600 35 244
501-550 55 209 A distribuio de porcentagens acumuladas baseada nos dados da Tabela 2.8 figura na
45 1-5 00 61 154 Tabela 2.9.
401-450 48 93
351400 33 45
301-350 12 12 POSTO PERCENTIL
Total 336 Suponhamos que voc tenha obtido 80 num exame de Estatstica. A fim de determinar
com exatidgo o seu grau de desempenho, seria provavelmente til saber como a sua
nota 80 compara-se com as notas dos demais colegas de classe que passaram pela mesma
seguinte (351-400) 33, enquanto que a freqncia acumulada para o mesmo intervalo prova. A maioria de seus colegas ficou em torno de 80 ou 90? Se assim foi, a sua clas-
45 (isto , 33 + 12). Essas informaes permitem-nos tomar conhecimento, portanto,
sificao (nota) pode no ter sido "terrivelmente alta"! Por outro lado, se a maioria de
de que 33 universitrios situaram-se na faixa 351400, e de que 45 receberam escores seus colegas no tirou mais que 60 ou 70, a nota 80 pode muito bem situar-se entre as
iguais ou inferiores a 400. Poderfamos continuar com este procedimento e obter fre- mais altas do grupo.
qncias acumuladas para todos os intervalos de classe, at chegarmos ao intervalo de Com o auxlio da distribuio de porcentagens acumuladas, podemos fazer com-
maiores limites, 751-800, cuja freqncia acumulada (336) igual totalidade de paraes precisas entre qualquer sujeito e o grupo ao qual ele pertence. Especificamente,
sujeitos-uma vez que nenhum membro do grupo conseguiu mais que 800 pontos. podemos calcular o posto percentil de um escore, que nada mais que um simples
inmero indicativo da porcentagem (total) de sujeitos de uma distribuio que conse-
* N.T.: comum falar-se em freqiincia simples para reduzir a possibilidade de confuso com
guiram menos que um dado valor. Por exemplo, se ao escore 80 corresponde o posto
freqii encias acumuladas.
percentil 95, ento 95% dos alunos receberam, nesse exame de Estatstica, escores
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
28 DESCRIO Organizao de Dados 29
inferiores a 80 (apenas 5% obtiveram valores acima de 80). Entretanto, se a um escore H vrias caractersticas relativas ao intervalo crtico que devem ser determinadas
de 80 corresponder um posto percentil de 45, ento somente 45% receberam notas de antes da aplicao da frmula do posto percentil:
exame abaixo de 80 (donde decorre que 55% conseguiu notas superiores). Em smbolos: 1. 0limite inferior do intervalo crtico-que corresponde ao ponto situado
entre o intervalo crtico 601-650 e o intervalo imediatamente abaixo dele,
c% abaixo \ limite inferior vale dizer: 551-600. Neste caso, o limite inferior (real) do intervalo 601-650
do limite escore - do intervalo / % no \ 600,5.
Posto percentil = inferior do crtico intervalo 2. 0 tamanho do intervalo* crtico-que se determina a partir do nmero de
intervalo tamanho do intervalo \ crtico / escores contidos nesse intervalo. No caso do intervalo 601-650, a amplitude
crtico crtico 50, uma vez que entre 601 e 650 h 50 valores.**
3. A porcentagem dentro do intervalo crtico-que se obtm dividindo o nmero
Para ilustrar o procedimento, vamos calcular, relativamente aos dados que apa- de sujeitos contidos nesse intervalo particular (f), pelo nmero total de sujeitos
recem na Tabela 2.8, o posto percentil do escore 620. Antes de aplicar a frmula, da distribuio (1V), e multiplicando a resposta por 100. Em smbolos:
TA BELA 2.9 Distribuio de Porcentagens Acumuladas. Varivel: Escores de Desempenho
Acarlimico Obtidos por 336 Estudantes Universitrios. (Esta Tabela Baseia-se na de
n.0 2.8)
% = (100)1 = (100) -
30
336
"50
= (100)(0,089) = 8,93%
Vemos, portanto, que 8,93% desses escores obtidos pelos universitrios caem
Intervalo de Classe fa e%
dentro do intervalo de classe 601-650.
4. A porcentagem acumulada abaixo do limite inferior do intervalo crtico. O
751-800 336 100%
701-750 330 98,21 valor de c% pode ser lido diretamente na Tabela 2.9, que fornece a distribuio
651-700 305 90,77 das porcentagens acumuladas. Ao percorrermos a coluna da c% de baixo para
601-650 274 81,55 cima, observamos que 72,62% dos escores ficam abaixo do intervalo crtico;
551-600 244 72,62 esta , pois, a porcentagem acumulada associada ao intervalo de classe que se
501-550 209 62,20
situa imediatamente abaixo do intervalo crtico.
45 1-5 00 154 45,83
401-450 93 27,68 Estamos agora preparados para aplicar a frmula do posto percentil:
351-400 45 13,39
301-350 12 3,57
Posto Percentil - 72,62 +
620 - 600,5 1
(8,93) - 72,62 +
[19,50
(8,93)1
50 50
devemos primeiro localizar o intervalo crtico, que corresponde ao intervalo de classe
onde o escore 620 est contido. Tal como demonstrado abaixo, o intervalo crtico = 72,62 + (0,39)(8,93) = 72,62 + 3,48 = 76,10
deste problema 601-650:
Resulta, ento, que pouco mais do que 76% recebeu escores inferiores a 620. Somente
Intervalo de Classe 23,90% obteve valores superiores.
751-800 N.T.: O tamanho do intervalo tambm chamado amplitude (amplitude da classe, amplitude do
701-750
Intervalo). diferena entre o maior valor e o menor valor de uma distribuio di-se o nome de
651-700
amplitude total.
601-650 Intervalo de classe que contm o escore 620 ** N.T.: Observe-se que a amplitude 50 decorre da aplicao da seguinte frmula:
551-600 (L - 1) + 1 = (650 - 601) + 1 =49 + 1 =50.
501-550
451-500 Nu verdade, trata-se, aqui, da aplicao da frmula que permite calcular o nilmero de termos de
401-450 uma progresso aritmtica, ou seja:
351-400 an -a +
301-350 n = 1, onde an = L, al = 1, r = 1
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
UNIVERSWADE
F RAL oc
30 DESCRIO CENTROrganizao de Dados 31
Como exemplo adicional, vamos calcular o posto percentil relativo ao escore 92 Estamos, agora, em condies de substituir esses dados na frmula do posto
da seguinte distribuio: percentil:
Intervalo de Classe f fa e% [92 - 89,5 2 50
90-99 6 49 100%
Posto percentil = 87,76 +
10
(12,24 )= 87,76 + 10
(12,24)
80-89 8 43 87,76
70-79 12 35 71,43 = 87,76 + (0,25)(12,24) = 87,76 + 3,06 = 90,82%
60-69 10 23 46,94
50-59 7 13 26,53
40-49
N =
_6
49
6 12,24
Quase 91% dos alunos, receberam notas menores que 92. Somente 9,18% receberam
notas superiores a 92.*
A escala de postos percentis consiste em 100 unidades. Certos postos percentis
situados ao longo dessa escala tm nomes especficos. Os decis dividem a escala em
Conforme a ilust ao abaixo, o intervalo crtico para um escore de 92 90-99: pores de dez. Assim, se um escore estiver situado no primeiro deal (posto percen-
til = 10), sabemos que 10% dos casos situam-se abaixo desse escore; se um escore estiver
Intervalo de Classe no segundo decil (posto percentil = 20), ento 20% dos casos estaro abaixo dele e
assim por diante. Os pontos que dividem a escala de postos percentis em grupos de 25
90-99 +- Intervalo de classe ao qual pertence o valor 92 (isto , 25%) so conhecidos pelo nome de quartis.* * Se um escore estiver localizado
80-89 no primeiro quartil (posto percentil = 25), sabemos que 25% dos casos caem abaixo
70-79 dele; se um escore estiver no segundo quartil (posto percentil = 50), ento 50% dos
60-69
50-59
40-49 Posto Pereentil Decil Quartil
% = (100) -
6
49
= (100) 0,1224 = 12,24%
35
30 =
25 =
3.o
1.
20 = 2.
15
4. A porcentagem acumulada abaixo do limite inferior do intervalo crtico pode
10 = 1.
ser encontrada na coluna c%, em correspondncia ao intervalo de classe imedia-
tamente abaixo do j citado intervalo crtico. A porcentagem acumulada que PIGURA 2.2. Escala de Postos Percentis Dividida em Decis e Quartis
corresponde classe intervalar 80-89 87,76%.
* N.T.: Observe-se que 91%+ 9,18% > 100%. Isto porque o autor arredondou para mais a porcen-
*N.T.: Veja-se, mais uma vez, a nota de rodap anterior. Mediante sua aplicao, resulta, de imedia-
-
to, o valor 10, pois: (L - 1) + 1 = (99 90) + 1 = 10.
* turn 90,82-anteriormente encontrada.
** N.T.: Os sujeitos de uma distribuio que se localizam entre o primeiro e o terceiro quartis
PDF compression, OCR, web optimization using a watermarked evaluation
portencem ao que copy
convencionou chamar of CVISION
de intervalo PDFCompressor
de normalidade.
I' - Apesar de tratar-se de
se
32 DESCRIO
Organizao de Dados 33
escores estaro situados abaixo dele; por igual raciocnio, para um escore que esteja
Estrutura Familiar de Crianas
no terceiro quartil (posto percentil = 75), haver 75% de escores abaixo dele (ver Pretas e Crianas Brancas
Figura 2.2).
Raa da Criana
Preta Branca
RESUMO Estrutura Familiar
Foram introduzidas, neste captulo, algumas das tcnicas bsicas usadas pelo pesqui-
sador na organizao do emaranhado de dados originais (brutos) que ele coleta de Um genitor 53 59
seus respondentes. Distribuies de freqncia e mtodos para comparar essas distri- Dois genitores 130 167
buies-quando compostas de dados nominais (propores, porcentagens, razes e Total 183 226
taxas)-foram discutidos e ilustrados. Examinaram-se, tambm, as caractersticas de
distribuies de freqncias simples, agrupadas e acumuladas com relao a dados
ordinais e intervalares. Finalmente, apresentou-se o procedimento que permite obter Calcular: (a) a porcentagem de crianas pretas que possuem dois genitores; (b) a
o posto percentil de um escore bruto.
porcentagem de crianas brancas que possuem dois genitores; (c) a proporo de
crianas negras que possuem dois genitores; (d) a proporo de crianas brancas que
tm dois genitores.
3. Num grupo de 4 sujeitos de alta realizao e 24 de baixa realizao, qual a razo
PROBLEMAS
1. Usando os dados do quadro abaixo, onde aparecem telespectadores e nao-telespec-
dos primeiros para os segundos?
4. Num grupo de 125 machos e 80 fe'rneas, qual a razo macho/fmea?
tadores, reclassificados quanto ao seu grau de reafizao, calcular: (a) a porcentagem
dos que no so telespectadores, porm grandes realizadores; (b) a porcentagem dos
5. Num grupo de 15 crianas negras e 20 brancas, qual a razo negros/brancos?
6. Se 300 crianas nascem vivas entre 3.500 mulheres (em idade compatvel com gra-
telespectadores que sNo grandes realizadores; (c) a proporo de no-telespectadores
que so grandes realizadores; (d) a proporo de telespectadores que so grandes videz), qual a taxa de nascimento?
realizadores.
7. Qual a taxa de mudana de uma populao que cresce de 15.000 habitantes em
1950 a 25.000 habitantes em 1970?
Rea lizao versus Assistncia a Programas 8. Transforme a seguinte distribuio de escores numa distribuio de freqncias
de Televiso agrupadas com quatro intervalos de classe e (a) determine o tamanho dos intervalos
de classe; (b) indique os fimites superior e inferior de cada classe; (c) identifique o
ponto mdio de cada intervalo de classe; (d) calcule a freqncia acumulada para
Situao
cada intervalo de classe; (e) calcule a porcentagem acumulada para cada intervalo de
No-telespectadores Telespectadores classe.
Realizao
Escores 41)4
Alta realizao 46 011111/eRSIDADt- Z
Baixa realizao 90 127
Total 183 173 FEIVRAL
cent
2. 0 quadro seguinte representa (para uma dada regio) a estrutura familiar de crianas r.R.1 1341Z4
pretas e crianas brancas.
I..moimm....,..0
"conveno", h uma lgica defensivel por trs disso: ho de ser normais os sujeitos que, relativa-
mente a uma dada varivel, ocupem, pelo menos, 50% da distribuio. Esses 50% devem ocupar o
"centro" da distribuio, ficando os 50% restantes divididos em duas pores de 25%, uma esquerda,
outra direita. Os 25% da esquerda so chamados subnormais e os 25% da direita, supernormais.
'A3NP ......
Finalmente, chamando o 1.0 quartil de Q1, e o 30 quartil de Q3, define-se a amplitude do intervalo
de normalidade pela diferena (Q3 - Q1). pi.N6 PDFCompressor
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION 113-Voo
34 DESCRIO
Intervalo de Classe
90-99
80-89
6
9
fa
48
42
3
70-79 10
Representaes
33
60-69 10 23
50-59 8 13
40-49 5 5
N= 48
Intervalo de Classe
40-44 5
35-39 5
30-34 8
25-29 9
20-24 10
15-19 8
10-14
Colunas numricas j conseguiram despertar medo, aborrecimento, apatia e mal-enten-
6
5-9 5
didos. Enquanto que algumas pessoas parecem "desligar-se" ao serem expostas a infor-
maes estatsticas em forma tabular, numrica, elas podem prestar bastante ateno As
N = 56
mesmas informaes apresentadas em forma grfica ou pictrica. Da resulta que muitos
pesquisadores e autures preferem usar grficos em substituio a tabelas numricas.
Razes semelhantes levam pesquisadores a utilizar, comumente, grficos tais como
os setoriais, grficos de barras, polgonos de freqncia etc., num evidente esforo
de tornar mais legveis as suas investigaes.
GRAFICOS SETORIAIS
O grfico setorial (ou de setor) um dos mais simples recursos grficos, posto que con-
siste em um crculo cujos setores (isto , partes do mesmo crculo) somam 100%. Os
grficos setoriais so particularmente teis quando se trata de visualizar diferenas
freqenciais entre algumas categorias de nvel nominal. Ilustrando: A Figura 3.1 repre-
senta a origem urbana, suburbana ou rural de uma populao de 2.000 universitrios.
Note-se que 70% desses alunos vm de reas suburbanas, enquanto que apenas 12% de
Areas rurais.*
* N.T.: Ndo se tome ao p da tetra essa repartio porcentual, uma vez que (a) a sociedade-referencia
a norte-americana; (b) essas porcentagens referem-se a um particular universo de universitrios.
Nada garante, portanto, que mesmo nos Estados Unidos todas as universidades apresentem igual
N.T.: So nnirnas as expresses percentil e posto percentil.
PDF
*
compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
s
repartieo de clientela.
36 DESCRIO
Representarcies Grficas 37
SO
70
38
25
Total
POLGONOS DE FREQNCIAS
150
Outra representao grfica comumente usada o polkono de freqncias. Muito
Classe Social do Respondente embora o polgono de freqncias tenha flexibilidade bastante para ajustar-se a uma
ampla variedade de situaes, ele tende a sugerir muito mais continuidade do que
FIGURA 3.2 Grfico de Barras Ilustrativo de uma Distribuio de Classes Socials* discriminaed; da sua particular utilidade na representao de dados ordinais ou inter-
valares. Isto acontece porque as freqncias so indicadas por uma srie de pontos
* N.T.: A classificao mais usual no Brasil a da ABA (Associao colocados exatamente acima (numa vertical) dos valores constantes do eixo dos X ou,
Brasileira de Anunciantes).
Essa classificao distribui os indivduos em quatro classes scio-econmicas-A,
B, C. D-, onde quando for o caso, exatamente acima dos valores que representam_os pantos mdios
A a classe mais alta e D, a mais baixa, e basta, para tanto, levar em jos intervalos de classe. Esses pontos so, a seguir, unidos por segmentos de retas
conta os itens e a pontuao
indicados no Apendice D.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor (donde-o nome "po-lgonos"), sendo que, em ambas as extremidades, a linha poligonal,
38 DESCRIO
Representaes Grfieas 39
A.
40 DESCRIO Representaces Grficas 41
respondente); a linha vertical costuma ser rotulada de acordo com o que se Existem vrios tipos de distribuies assimtricas ou enviesadas. Quando os
pretende representar (freqencias ou porcentagens), sendo que os valores nu- escores se amontoam num dos lados da curva assimtrica, a distribuio apresenta
mricos correspondem a pontos situados ao longo dos eixos. Alm disso, todo uma cauda acentuada. A posio dessa causa indica o sentido da assimetria, sentido
grfico deve ter um ttulo capaz de indicar a natureza dos dados ilustrados. esse que aponta para o lado onde se situam os escores mais extremos.
3. Na construo de um grfico, o comprimento do eixo vertical deve ser 75% A distribuio (a) da Figura 3.7 assimtrica negativa (enviesada para a esquer-
do comprimento do eixo horizontal. Tal procedimento introduz uma forma da), uma vez que sua cauda muito maior do lado esquerdo do que do lado direito.
relativamente padronizada de construir grficos e reduz ao mnimo fontes de Essa distribuio mostra que a maioria dos respondentes recebeu notas altas, e que
confuso potencial.* somente alguns receberam notas baixas. Se essa fosse a distribuio dos resultados
4. 0 primeiro ponto do eixo vertical-o ponto onde o eixo vertical cruza com o de um exame final, poderamos dizer que a maioria dos estudantes saiu-se muito bem,
horizontal-deve ser sempre zero, uma vez que qualquer outro procedimento enquanto que apenas alguns "rodaram".
poderia fornecer uma imagem distorcida dos dados.
4 chamadas de bimodais, em contraste com a variedade mais comum, unimodal, que tem
apenas uma corcova-ou ponto de freqncia maxima (ver Figura 4.1).
Medidas de
Valores
7 2
6 3
Tendncia Central 5
Mo 4. 4
3
2
4-
4
3
1 2
Pesquisadores em muitos campos te'm usado o termo "mdia" em questes tais como:
Total 23
qual a renda mdia de colegiais e universitrios j graduados? Quantos cigarros fuma,
em mdia,o adolescente? Qual a nota mdia de uma universitria? Em mdia, quantos
so os acidentes automobilsticos que resultam diretamente da ingesto de lcool ou MEDIANA
drogas?
Quando dados ordinais ou intervalares so dispostos por ordem de tamanho, torna-se
Uma forma til de descrever um grupo como um todo consiste ern encontrar
possvel localizar a mediana (Md), que corresponde ao ponto central da distribuio.
um nico nmero que represente o que "medic)." ou "tpico" naquele conjunto
particular de dados. Em pesquisa, tal valor conhecido por medida de tendncia central,
uma vez que ela geralmente se localiza em torno do meio ou centro de uma distribui-
.2
o-onde a maior parte dos dados tende a concentrar-se. <a
A idia que o leigo faz do termo "media" quase sempre vaga e mesmo confusa. o
A concepo do pesquisador muito mais precisa do que a do pblico em geral; ela
expressa numericamente como uma das vrias espcies de "medidas mdias"-ou Unimodal Bimodal
de tendncia central-que, para um mesmo conjunto de dados, pode assumir diferentes
valores. Somente as trs medidas de tendncia central mais conhecidas so aqui discuti- FIGURA 4.1 Representaes Grficas de uma Distribuio Unimodal e de uma Bimodal
das: a moda, a mediana e a media aritmtica.
Portanto, a mediana considerada a medida de tendncia central que corta a distri-
buio em duas partes iguais.
MODA Se estivermos diante de uma distribuio com nmero npar de dados, a mediana
Para obter a moda (Mo), procure simplesmente o escore ou categorfa que, numa dis- sera o dado que cai exatamente no meio da distribuio. A posio do valor mediano
tribuio, ocorre com maiw freqncil. A moda pode ser localizada com muito mais pode ser determinada pelo exame dos dados ou pela formula:
facilidade por exame do que por clculo. Por exemplo, no conjunto de escores 0,
2, 3,0 0,'
0,
6, 5, 4, 4, 4, 3, a moda 1, uma vez que 1 o nmero que ocorre com Posio da mediana =
+ 1
Se o nmero de dados for par, a mediana ser sempre aquele ponto da distribuio mais baixo, vamos somando as freqncias at chegar a um valor que contenha o dcimo
que antecedido e precedido por igual nmero de dados.* Para uma distribuio com segundo escore da distribuio. No exemplo em foco, o valor do escore mediano 4.
nmero par de dados, sempre h dois valores considerados "centrais". Ilustrando: os
nmeros 16 e 17 representam os dados centrais na seguinte distribuio: 11, 12, 13,
0,
0, 20 25, 26. Pe la frmula, (8 + 1)12 = 4,5, o que significa que a mediana vai
cair entre o quarto e o quinto valores; o ponto central dessa distribuio vai,
MDIA ARITMTICA
Sem sombra de dvida, a medida de tendncia central mais comumente usada a mdia
ser 16,5, uma vez que ele fica precisamente no meio de 16 (4.0 valor) e 17 (5.0 valor). aritmtica, X , cujo clculo consiste em somar um conjunto de escores e dividir o total
Por igual raciocnio, a mediana 9 na seqncia 2, 5,C), 0,
11, 12, porque est pelo nmero de parcelas. Portanto, podemos definir mdia aritmtica, mais formal-
mente, como a soma de um conjunto de escores dividida pelo namero de escores desse
situado exatamente entre os dois dados centrais, ou seja, (6 + 1)/2 = 3,5.
Outra circunstncia que precisa ser explanada e ilustradi, caracteriza-se pelo
.
conjunto. Em smbolos:
clculo da mediana de uma distribuio em que figuram, na regio central, vrios dados
numericamente idnticos. A soluo simples: a uele valor particular constitui a me-
diana. Assim, na seqncia 11, 12, 13,
de esse valor ocorrer mais de uma vez.
25, 26, 27, a mediana 16, apesar
X = -
EX
, onde
A mediana vem a ser o dcimo segundo valor nessa distribuio de freqncias. Para TABELA 4.3 Clculo da Mdia Aritmtica: Uma Ilustrao
facilitar a localizao desse dcimo segundo escore, poderamos construir uma distri-
buio de freqncias acumuladas, tal como ilustra a terceira coluna da Tabela 4.2 Respondentes X(QI)
(para um pequeno nmero de escores isso pode ser feito de cabea). A partir do escore
Benedito 125
Francisco 92 EX
TABELA 4.2 Localizao da Mediana numa Distribuio de Freqncias de Dados Isolados Sara 72
Miguel 126
Jesufno 864
Valores dos Escores fa 120 =
Helena 8
99
Benjamim 130
7 23 Paulo 100 = 108
6 3 21
5 4 18 EX = 864
Md 4 5 14
Em oposio ao que acontece com a moda,,a mdia nem sempre o escore que
3 4 9
ocorre com maior freqncia. Tambm, ao contrrio do que se passa com a mediana, a
2 3 5
1 2 2 nidia no e necessariamente o ponto central de uma chstribuio. O que, ento, sig-
Total 23
nifica media? Dque maneira ela pode ser interpretada? Veremos adiante que a mdia
.
pode ser tomada como o "centro de gravidade", isto , o ponto de qualquer distribuio
* N.T.: De acordo com o texto original, a traduo deveria ser: aquele ponto acima e abaixo do
qual ocorrem 50% dos valores da distribuio. Esta afirmao foi evitada no corpo do texto por A letra maiscula grega sigma, (E), ser observada vrias vezes ao longo do texto. Ela indica
sim-
tratar-se de uma incoerencia. De fato, se antes da Md h 50% dos escores, e depois dela tambm plesmente que devemos somar ou adicionar os valores da varivel em foco. No exemplo presente,
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
50% de escores, evidente que 50% + Md + 50% > 100%, o que um absurdo!
EX indica a soma de todos os escores brutos.
46 DESCRIO Medidas de Tendncia Central 47
em torno do qual se equilibram as discrepncias positivas e negativas. A fim de que seja serve perfeitamente. Entretanto, quando estamos diante de um nmero maior de dados,
possvel perceber essa caracterstica da mdia, devemos primeiro entender o conceito de pode ser mais prtico e menos demorado calcular a mdia de uma distribuio de
disf:repncia, que nada mais seno a distncia da media a qualquer escore bruto. Para freqUncias (dados isolados) pela frmula
calcular uma determinada discrepncia, basta subtrair a mdia afitmtica de qualquer
escore bruto dado. Em smbolos:
x = X - X , onde
-
X = -
EfX
, onde
=
mdia
um escore bruto qualquer da distribuio (isto , a prpria varivel)
um escore qualquer multiplicado pela respectiva freqncia de ocorrncia
X = qualquer escore bruto da distribuio
EfX = soma dos fX's
= mdia aritmtica.
N= total de escores.
TABELA 4.4 Discrepncias de um Conjunto de Escores Brutos com Relao a X
A Tabela 4.5 ilustra o clculo da mdia de um conjunto de dados isolados (porm
X
afetados de freqncias).
maioria dos nossos respondentes se identificassem como tais. Similarmente, poderamos A Figura 4.3 mostra que a moda, a mediana e a mdia no coincidem em dis-
dizer que a maioria dos estudantes freqentadores de uma dada universidade apresenta tribuies assimtricas, muito embora suas posies rekttivas permanecam constantes;
uma nota mdia 2,5 (Mo = 2,5). dito de outra forma, no sentido "pico"/"cauda", a ordem sempre da moda para a
A mediana exige uma ordenao de categorias, da mais alta mais baixa. Por essa mdia, com a mediana entre esses dois pontos. A moda a que cai mais perto do "pico"
razo, ela s pode ser obtida a partir de dados ordinais ou intervalares, mas nunca de da curva, j que ela corresponde ao ponto da escala cujo valor mais freqente. A
dados nominais. Ilustrando: poderamos descobrir que a renda anual mediana de den- mdia, ao contrrio, a que est mais prxima da "cauda", onde se situam os escores
tistas de uma pequena cidade da ordem de Cr$ 289.000,00. Esse resultado fornece-nos extremos (e poucos). Por essa razo, o escore mdio numa distribuio positivamente
um critrio slido para o exame da tendncia central de nossos dados. Contrariamente, assimtrica (Figura 4.3(a)) localiza-se entre os escores mais altos; a mdia numa distri-
faria pouco sentido calcular a mediana de escalas de filiao religiosa (protestante, buio negativamente assimtrica (Figura 4.3(b)) cai perto dos escores mais baixos.
catlico ou judeu), sexo (masculino ou feminino), ou pals de origem (Inglaterra, Polnia,
Frana ou Alemanha), onde no foi feita uma atribuio de postos (escalonamento).
O uso da mdia est restrito exclusivamente a dados intervalares. Calcular a mdia
de dados ordinais ou nominais d origem a um resultado sem sentido, que em geral no
indica a tendncia central. Que sentido faria o clculo da mdia de uma distribuio a
<CD
onde a varivel fosse filiaco religiosa ou sexo? Embora seja menos bvio, igualmente :0
C.
inapropriado calcular a mdia de dados que podem ser graduados porm no medidos.
Forma da Distribuio
O aspecto ou forma de uma distribuio outro fator que pode influenciar o
pesquisa-
dor na escolha de uma medida de tendncia central. Numa distribuio unimodal e Mo Md Md Mo
perfeitamente simtrica, a moda, a mediana e a mdia sero idnticas, uma vez que o (a) (b)
ponto de freqncia mxima (Mo) tambm o valor "mais" central (Md) e o "centro
de gravidade" dos dados (X). Como demonstra a Figura 4.2, as medidas de tendncia FIGURA 4.3 Posies Relativas de Medidas de Tendncia Centrah (a)-Distribuio Positivamente
central coincidiro no ponto central, exatamente no "pico" da distribuio simtrica. Assimtrica e (b)-Distribuio Negativamente Assimtrica
Quando o pesquisador trabalha com uma distribuio simtrica, a escolha de
uma medida de tendncia central baseia-se principalmente nos objetivos particulares Enquanto que a mdia muitssimo influenciada pelos escores extremos (ern
de sua investigao e no nvel em que seus dados foram colhidos. Entretanto, quando ambos os sentidos), a mediana sofre pouca ou nenhuma influncia de alteraes nos
ele trabalha com uma distribuio assimtrica, sua deciso muito influenciada pelo valores extremos. Isto porque a mdia considera todos os escores de qualquer distri-
formato dos dados de que dispe. buio, enquanto que a mediana (por definio) s se preocupa com o valor numrico
do escore que ocupa a posio "mais" central. Como ilustrado abaixo, a mudana do
valor de um escore extremo de 10 (distribuio.a) para 95 (distribuio b), no modifica
de maneira nenhuma o valor da mediana (Md = 7,5), enquanto que a mdia pula de
7,63 para 18,25.
outro lado, se a's fssemos representantes sindicais e estivssemos procurando melhorar nesse grupo de respondentes: uma com urn nmero bastante grande de pessoas (Mo = 8)
os nveis salariais, iramos provavelmente empregar a moda para demonstrar que o e outra com apenas algumas pessoas (Mo = 3).
salrio anual "mdio" de apenas Cr $ 17.000,00, o que representa uma quantia bas- TA BELA 4.7 Coneepes Ideais de Tamanho de Familia numa Amostra de 26 Respondentes de
tante reduzida. Para finalizar, se fssemos pesquisadores sociais desejosos de dar uma Renda Baixa. (Distribuio Bimodal)
informao acurada do salrio "mdio" dos empregados dessa corporao, emprega-
ramos, inteligentemente, a mediana (Cr $51.000,00), uma vez que esse valor cai entre Tamanho Ideal de Famlia
as outras medidas de tendncia central e, portanto, oferece um quadro mais equilibrado
da estrutura salarial. O mtodo mais aceitvel seria indicar as tits medidas de tendncia 10 1
4 2
TABELA 4.6 Medidas de Tendncia Central numa Distribuio Assimtrica de Salsios Anuais
3 6
2 2
Salrio Medido em Cruzeiros (6$) 1 1
N = 26
1.700.000,00
425.000,00
170.000,00 X = Cr $306.000,00 Objetivo da Pesquisa
85.000,00 At aqui, discutimos a escolha de uma medida de tendncia central em termos do nvel
17.000,00 Md = Cr $ 51.000,00 de mensurao e da forma de uma distribuio de escores. Perguntamos agora: que o
17.000,00 pesquisador espera fazer com a medida de tendncia central escolhida? Se el procura
17.000,00 Mo = Cr$ 17.000,00 uma medida descritiva que seja rpida, simples, ainda que grosseira, ou se ele estiver
trabalhan do com uma distribuio bimodal, ele geralmente empregar a moda. Na maioria
das situaes com que um pesquisador se defronta, entretanto, a mod.`' s til como
Ainda mais grave o fato de que alguns relatrios de pesquisa no especificam de forma um indicador preliminar de tendncia central, que pode ser obtida com rapidez a partir
exata a medida de tendncia central-moda, mediana ou mdia-que foi usada para de um exame cuidadoso dos dados. Se ele procura uma medida de tendncia central que
calcular a quantia ou posio "mdia" de um grupo de escores. Como demonstrou a seja exata,* a deciso fica geralmente entre a mediana e a mdia.
ilustrao anterior, uma interpretao razovel de certos dados pode tornar-se literal-
mente impossvel sem tal informao.
* N.T.: Muito embora o uso popular tenha tornado sinnimas as palavras preciso e exatido, do
Salientou-se pginas atrs que algumas distribuies de frequncias podem ser
ponto de vista formal estamos diante de coisas diferentes. Um instrumento preciso quando, em
caracterizadas como bimodais, uma vez que elas contm dois pontos de freqncia sucessivas mensuraes da mesma magnitude, ele apresenta um erro constante. Um instrumento
maxima. Para descrever adequadamente distribuies bimodais, , em geral, til identi- preciso caracteriza-se pela preciso.
ficar ambas as modas; aspectos importantes de tais distribuies podem ser encobertos Um instrumento exato quando, em sucessivas mensuraes da mesma magnitude, o erro
se a mediana ou a mdia forem usadas. varivel (para mais ou para menos), porm a mdia aritmtica de todas as mensuraes representa
o Valor mais provvel da dita magnitude. Por isso, a mdia aritmtica representa o valor exato bus-
Considerem a situao em que um pesquisador realizou entrevistas pessoais com
cado. O instrumento que produz mensuraes exatas caracteriza-se pela exatido.
26 respondentes de renda baixa, a fim de estabelecer seus conceitos ideais de tamanho Exemplificando: Se um objeto pesa realmente 2 kg, pesado com uma balana exata repetidas
de famlia. A cada um deles foi dito o seguinte: "Suponha que voc pudesse decidir vezes, as mensuraes resultantes podero ser: 2,1 kg; 2,2 kg; 1,9 kg; 1,8 kg; etc., onde a mdia
exatamente o tamanho de sua famlia. Incluindo todas as crianas e os adultos, quantas aritmtica produz o valor real buscado. Assim:
pessoas voc gostaria que ela tivesse?" Como demonstra a Tabela 4.7, os resultados desse 2,1 kg + 2,2 kg + 1,9 g + 1,8 kg
estudo indicaram amplas preferncias por tamanho de famlia, preferncias que variaram 4
. - 2 kg
desde viver sozinho (1) at viver com muitas pessoas (10). Usando ou a mdia ou a
mediana, poderamos concluir que a famlia ideal de um respondente "mdio" consis- Seja agora outra balana com a seguinte caracterstica: em cada quilo ela erra, para mais, 10 gramas.
tiria de seis pessoas = 5,58; Md = 6). Entretanto, sabendo que a distribuio bimo- Ento, esse objeto, cujo peso real 2 kg, pesar sempre 2 kg + 20 g. Se a pesagem for repetida
Pi vezes (n > 1), o erro ser consistente e constante: 20 g.
dal, percebemos que, de fato, houve duas concepes ideais de tamanho de famlia
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
ONIVERS1DADE I
52 DESCRIO
BE8 r feTd'iiir,a, tiendnia Central 53
TABELA 4.8 Localizao da Moda numa Distribuio de Freqncias com Dados Agrupados N = 100
Intervalo de Classe Ponto Medio Passo 2-Para encontrar o valor exato da mediana, aplicamos a frmula
50-54 52 4 Amplitude
N = 71
X do intervalo
mediano
* N.T.: Melhor seria dizer apenas o -seguinte: o intervalo mediano o intervalo que corresponde,
*N.T.: Balanceado significa aqui "que no sofre a influncia de valores extremos". na coluna freqncias acumuladas, ao valor que contm (pela primeira vez) metade do total de
**N.T.: Rigorosamente, o ponto na6dio da 6 4 classe (de cima para baixo) 71,5, se a varivel
for con-
os sujeitos da distribuio. Sendo fai uma freqncia acumulada de ordem i, o intervalo mediano ser
tnua. Para que esse ponto medio seja 72 preciso que, nas condies da tabela, sejam desprezados obtido por correspondncia com
porque a classe foi indicada pela notao 70-74, que a relao fai NI2. O intervalo mediano tambm chamado de
limites do intervalo, ou seja, 70 e 74. Isso
lugar niediano.
a maneira tradiional de indicar um intervalo aberto (dos dois lados).
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
54 DESCRIO Medidas de Tendeneia Central SS
Para os dados da Tabela 4.9*, a mediana calculada como segue: PASSO 2: Multiplicar cada ponto mdio pela respectiva freqncia absoluta, a fim de
50 - 26 )10 - 39,5 obter 2fX
Mediana = 39,5 + ( + 8,89 - 48,39 anos.
27 Intervalo X = Ponto Medio fX
Para calcular a mdia de uma distribuiO de freqncias com dados agrupados,
podemos usar uma verso modificada da frmula vista anteriormente (ver Tabela 4.5). 17 -20 18 1 18
Conforme exemplificado abaixo, o smbolo X no ser mais usado para designar um 14 -17 15 2 30
11 -14
-
escore, mas, sim, o ponto mdio de um intervalo de classe. Portanto, 12 3 36
8 -11 9 5 45
- EfX 5-8 6 4 24
X = , onde 2-5 3 2 6
N = 17 1fX = 159
= mdia
X = ponto mdio de um intervalo de classe PASSO 3: "Entrar" com o resultado do Passo 2 na frmula de X.
fX = ponto mdio de um intervalo de classe multiplicado pela respectiva freqncia
absoluta
N = nmero total de escores.
=
EfX
= -
159
17
= 9,35
3. objetivo: uma medida de tendncia central "confivel"; pode, as vezes, ser 13. Qual a discrepncia de cada um dos seguintes escores com relao a I- = 15?
usada em operaes estatsticas mais avanadas ou para "quebrar" uma distri- (a) X = 22,5; (b) X = 3; (c) X = 15; (d) X = 10,5.
buio em duas categorias distintas (por exemplo: alto X baixo). 14. Os escores relativos a atitudes de 31 estudantes frente a um grupo minoritrio,
foram dispostos na seguinte distribuio de freqncias (quanto maior o escore
Media: mais favorvel a atitude:
1. nvel de mensurao: intervalar (no mnimo);
2. forma da distribuio: mais apropriada para distribuies unimodais simtricas; Escores Rektivos e Atitudes
3. objetivo: medida de tendncia central exata; pode freqentemente ser usada em
operaes estatsticas mais avanadas, tais como os testes para tomada de 7 3
decises que aparecero mais adiante neste livro. 6 4
5 6
PROBLEMAS 7
1. Sete empregados horistas numa companhia de porte mdio ganham Cr$ 153,00;
3 5
2 4
Cr$ 136,00; Cr$153,00; Cr$68,00; Cr$17,00; Cr$ 102,00 e Cr$51,00. Calcule 1 2
(a) o salno-hora modal; (b) o salrio-hora me.diano e (c) o salrio-hora mdio.
N = 31
Suponha que a companhia do problema 1 tenha recrutado mais um empregado
pelo salrio-hora de Cr $17,00, resultando, assim, a seguinte distribuio:Cr $153,00; Calcule (a) a moda; (b) a mediana; (c) a mdia.
Cr$136,00; Cr$ 153,00; Cr$ 68,00; Cr$ 17,00; Cr$ 102,00; Cr$51,00; e Cr$ 17,00. 15. Trinta e uma crianas matriculadas numa terceira srie do primeiro grau de uma
Calcule (a) o salrio-hora modal; (b) o salrio-hora mediano; (c) o salrio-hora zona urbana indicaram, numa pesquisa, o nmero de irmos e/ou irms que viviam
mdio. com cada um deles em casa. Os dados resultantes foram dispostos na seguinte
3. Para os escores 205, 6, 5, 5, 5, 2, e 1 calcule (a) a moda; (b) a mediana e (c) a tabela de distribuio de freqncias:
mdia. Que medida de tendncia central no deveria ser usada para descrever
(isto , para analisar) esse conjunto de escores? Por qu? ATUrnero de Irmoslirmis
44. Seis estudantes num seminrio de sociologia foram testados por meio de um instru-
;' mento que produz mensuraes de nvel intervalar. O objetivo da pesquisa era 5 6
mensurar suas atitudes com relao a um grupo minoritrio. Suas respostas, numa 4 7
escala de 1 a 10 (quanto mais alto o escore, mais favorvel a atitude), foram: 5, 2, 3 9
2
6, 3, 1 e 1. 5
Relativamente aos escores acima, calcule (a) a moda;(b) a mediana e (c) a mdia. 4
1
5. Dados os escores 10, 12, 14, 8, 6, 7, 10, 10, encontre (a) a moda; (b) a mediana
e (c) a mdia.
Para essa classe de 31 crianas, ca1cule
Dados os escores 3, 3, 4, 3, 1, 6, 5, 6, 6, 4, encontre (a) a moda; (b) a mediana e (a) o nmero modal de irmos/irms;
(c) a mdia. (b) o nmero me diano de irmos/irms; Escores
7. Dados os escores 8, 8, 7, 9, 10, 5, 6, 8, 8, encontre (a) a moda, (b) a mediana
e (c) a mdia de irmos/inns.
10 3
(c) a mdia.
Dada a seguinte distribuio de fre- 9 4
8. Dados os escores 5, 4, 6, 6, 1, 3, encontre (a) a moda, (b) a mediana e (c) a mdia.
16.
8 6
qncias, calcule (a) a moda; (b) a
9. Dados os escores 8, 6, 10, 12, 1, 3, 4, 4, encontre (a) a moda, (b) a mediana
e
7 8
(c) a mdia. mediana e (c) a mdia: 6 9
a mediana e (c) a
10. Dados os escores 12, 12, 1, 12, 5, 6, 7, encontre (a) a moda, (b) 5 7
4 5
mdia.
11. Qual a discrepncia de cada um dos seguintes escores com
relao a X = 20,5? 3 2
2 1
(a) X= 20,5; (b) X = 33,0; (c) X= 15,0; (d) X = 21,0. 1 1
12. Qual a discrepncia de cada um dos seguintes escores com relao'
a X = 3,0?
N = 46
(a) X = 4,0; (b) X = 2,5; (c) X = 6,3; (d) X = 3,0.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
58 DESCRIO
5
17. Dada a seguinte distribuio de freqncias, calcule (a) a moda; (b) a mediana e
(c) a mdia:
Intervalo de Classe
20-24 2
15-19
10-14
5-9
-
4
8
5
Medidas de
N = 19
18:yada
a seguinte
(c) a mdia:
distribuio de freqncias, calcule (a) a moda; (b) a mediana e Variabilidade
No Captulo 4, vimos que a moda, a mediana e a mdia podiam ser usadas para resumir,
Intervalo de Classe
num nico nmero, aquilo que "mdio" ou "tpico" numa distribuio. Quando
16
empregada sozinha, entretanto, qualquer medida de tendncia central fornece apenas
90-99
80-89 17 uma viso incompleta de um conjunto de dados e, portanto, pode confundir ou distor-
70-79 15 cer tanto quanto esclarecer.
60-69 3 Com vistas a ilustrar essa situao, admitam que Honolulu (Hava) e Houston
50-59 2
(Texas) tenham quase a mesma temperatura mdia diria de 750.* Ser que, por isso,
40-49 3
podemos admitir que a temperatura basicamente a mesma em ambas as localidades?
N = 56 Ou no ser possvel que enquanto uma melhor para natao a outra o seja
para atividades extemas?
19. Dada a seguinte distribuio de freqncias, calcule (a) a moda; (b) a mediana;
Como bem ilustra a Figura 5.1, a temperatura em Honolulu varia muito pouco
(c) a mdia:
ao longo do ano, oscilando, em geral, entre 70F e 80F. Por outro lado, a temperatura
Intervalo de Classe
em Houston pode diferir estacionalmente, isto , apresentar-se baixa em janeiro-cerca
de 40F-e alta em julho e agosto-bem perto de 100F. Desnecessrio dizer, pois, que
2
as praias de Houston no esto apinhadas de gente durante todo o ano!
17-19
14-16 3 Vamos a um outro exemplo. Suponham que, numa particular cidade, tanto ladres
11-13 6 quanto professores secundrios tenham uma renda mdia anual de Cr$ 136.000,00.
8-10 5 Ser que essa informao indica que as duas distribuies de renda so necessariamente
5-7 1
semelhantes? Muito ao contrrio, poder-se-ia descobrir que elas diferem-e muito-num
N = 17 outro aspecto importante, qual seja, o fato de as rendas dos professores concentrarem-se
ao redor de Cr $ 136.000,00, enquanto que as dos ladres espalham-se mais, o que reflete,
portanto, maiores oportunidades para prises, desemprego, pobreza e, em alguns casos,
fortunas excepcionais.
* N.T.: A falta de uma unidade de medida pode, as vezes, confundir o leitor. Este livro, de autor
"norte-americano, traduz, em muitos pontos, aspectos da cultura vigente em pases anglo-saxes;
entre csses aspectos, destaca-se a escala de temperatura Fahrenheit, cuja caracterstica 6 a seguinte:
32F correspondem ao gelo fundente e 212F, a agua em ebulio. Em graus Celsius (centgrados),
75F correspondem a 23,9C (aprox.). A frmula de converso usada foi a seguinte:
- F - 32). e
o
c = 5
9
(
o
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
ADE
BlacroTEcA, Do
60 DESCRIO imecii4a4fk Variabilidade 61
DESVIO MEDIO
No captulo anterior, desvio* foi definido como sendo a distncia entre qualquer escore
bruto e a mdia da distribuio. Aprendemos, -s-siirvque, para calciar discrepancias
(desvios), bastava subtrair a media (aritrfitica) de qualquer escore bruto: x = (X
Se desejarmos agora obter uma medida de variabilidade que leve em conta todos os
escores da distribuio (e no apenas dois), poderemos tornar o valor absoluto de cada
discrepncia (isto , das distncias com relao media), somar esses valores e, ento,
= 75F = 75F dividir o total pelo nmero de escores. O resultado ser o desvio mdio. Em smbolos:
AT = 26F AT = 69F
Honolulu Houston E lx I
DM = , on de
FIGURA 5.1 Diferenas de Variabilidade: Distribuies de Temperaturas em Locais Distintos:
Honolulu e Houston (Valores Aproximados)
DM desvio mdio
Tal fato demonstra que necessitamos, alm de uma medida de tendncia central, E Ix soma dos valores absolutos das discrepncias (ou seja, soma das discre-
de um ndice que indique o grau de disperso dos escores em torno do centro da distri-
pncias sem considerar-se a presena dos sinais + e -)
buio (isto , em torno da mdia). Numa palavra, precisamos de uma medida indicativa
= total de escores (ou de sujeitos, respondentes ou dados).
do que costumeiramente se chama variabilidade (tambm designada como variao ou
disperso). Voltando a um exemplo anterior, poderamos dizer que a distribuio de Nota importante-No clculo de E Ix1 devemos ignorar os sinais "mais" (+) e
temperaturas em Houston (Texas) tem maior variabilidade do que a distribuio de "menos" (-) e somar apenas os valores absolutos. Este procedimento correto, porque
temperaturas em Honolulu (Hava). Da mesma forma, podemos dizer que a distribui- a soma das discrepncias reais (Ex)-onde os sinais indicam o sentido do desvio com re-
o de rendas entre professores apresenta menos variabilidade do que a distribuio de lao mdia* sempre igual a zero.*** As discrepncias positivas e as negativas ten-
rendas entre ladres. O presente captulo discute apenas as medidas de variabilidade dem a cancelar-se (compensar-se) e no podem, por isso, ser usadas para descrever ou
mais conhecidas: a amplitude total, o desvio mdio e o desvio padro. comparar a variabilidade de distribui0es. Por outro lado, a soma dos valores absolutos
das discrepncias tende a tornar-se maior medida que a variabilidade da distribuio
AMPLITUDE TOTAL aumenta.
Pode-se obter uma medida de variabilidade rpida (cmoda), embora no muito exata, Podemos agora ilustrar, passo a passo, o procedimento para o clculo do desvio
pelo clculo da chamada amplitude total (AT), que nada mais seno a diferena entre mdio. Para tanto, consideremos o seguinte conjunto de escores: 9, 8, 6, 4, 2 e 1.
o maior e o menor escore da distribuio. Por exemplo, se a temperatura anual mais PASSO 1: Calcular a mdia (aritmtica) da distribuio.
alta em Honolulu foi de 88F e a mais baixa, 62F, a amplitude total da temperatura
anual em Honolulu foi de 26F (isto , 88F -62F = 26F). Se o dia mais quente em X
Houston apresentou 102F e o mais frio, 33F, a amplitude total da temperatura anual
-
em Houston foi de 69F (isto , 102F 33F = 69F).
9
8 1= Ex
A vantagem da amplitude total-clculo rpido e fcil-constitui tambm sua mais 6
importante desvantagem. Por outras palavras, a amplitude total inteiramente depen- 4 30
dente de apenas dois escores: o maior e o menor num dado conjunto de valores. Como 2 6
resultado, a amplitude total fornece, via de regra, um mero ndice grosseiro da variabili-
1 = 5
EX = 30
dade de uma distribuio. Por exemplo, AT = 98 no seguinte conjunto de dados: 2, 6, 7,
7, 10, 12, 13, 100 (AT = 100 - 2 = 98); entretanto, AT = 12 neste outro conjunto:
N.T.: Insista-se no seguinte: desvio, afastamento e discrepncia so expresso-es sinnimas. Entre-
2, 6, 7, 7, 10, 12, 13, 14 (AT = 14 -2 = 12). Portanto, pela simples troca de um nico
*
tanto, prtica comum usar o termo discrepncia para designar qualquer X que resulte de (Xi - Y).
valor (14 em lugar de 100), fizemos com que a amplitude total flutuasse bruscamente de 98 N.T.: Os valores afetados de + (hiais) esto situados a direita do zero; os afetados de - (menos),
para 12. Qualquer medida que seja to afetada pelo escore de um nico respondente (ou A esquerda. Nos termos do texto, a mdia (aritmtica),
semelhana do zero, funciona como uma
por um nico valor da varivel) no pode, por certo, fornecer uma idia precisa quanto origem. Ento: a direita da mdia, discrepncias positivas; esquerda, discrepncias negativas.
variabilidade; quando hmito, possvel consider-la como um ndice preliminar ou, at, ***N.T.: Dizer que a soma das discrepncias sempre igual a zero o mesmo que dizer, em situ-
pouco exato. bolos, o seguinte: Ex = 0. Ora, Ex =EGv - Ento: E(x -x)= 0.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
62 DESCRIO Medidas de Variabilidade 63
PASSO 2: Subtrair de cada escore bruto a mdia da distribuio e somar as discrepn- Observem, antes de mais nada, que a media de cada distribuio Cr$ 340,00.
cias sem levar em conta os sinais (isto , "fazer de conta" que todas as discrepncias Notem tambm que parece haver diferenas marcantes em termos de variabilidade entre
trn o sinal +). essas distribuies-diferenas que podem ser detectadas com o auxlio da amplitude
total e do desvio mdio.
X
Vamos examinar, primeiro, a distribuio de rendas (a), onde todos os valores
9
so idnticos. Uma vez que todos os escores dessa distribuio so expressos pelo mesmo
8 valor numrico (Cr$ 340,00), podemos dizer que ela no apresenta variabilidade alguma.
6 Todas as pessoas (isto , as sete da amostra (a)) ganharam a mesma importncia naquele
4 determinado dia. Como resultado, a amplitude total 0 (zero) e no h absolutamente
2
nenhum desvio com relao mdia (DM = 0). As distribuies (b) e (c) apresentam va-
1
riabilidade. De forma especfica, a distribuio (b) tern uma amplitude total de Cr $ 102,00
EX = 30
e um desvio mdio de Cr$ 29,14; a distribuio (c) apresenta urna amplitude total de
Cr $510,00 e um desvio mdio de Cr$ 145,71. Podemos, pois, dizer que a distribuio
PASSO 3: Dividir E lx por N, a fun de garantir uma eqidistribuio que leve em
1 (b) contm menos variabilidade que a distribuio (c), ou seja, as rendas que fazem
conta o nmero de dados envolvido. parte da distribuio (b) so, entre si, mais semelhantes que as rendas da distribuio (c).
Elx1 16
DM = = 2,67
6
De acordo com o procedimento precedente, vemos que o desvio mdio para o DESVIO PADRO
conjunto 9, 8, 6, 4, 2 e 1 2,67. Isso indica que, em mdia, os escores dessa distribuio
oscilam 2,67 unidades em torno da mdia.
Com vistas a entender melhor a utilidade do desvio mdio, vamos voltar ao pro- Por motivos que logo se tornaro aparentes, o desvio mdio j no muito usado pelos
blema das distribuies (a), (b) e (c) de rendas dirias, tal como figuram na Tabela 5.1. pesquisadores; na maioria dos casos, ele foi abandonado como 'Imedida de variabilidade"
em favor de um "parente prximo" mais eficiente: o desvio padra-o. Como teremos a
TABELA 5.1 Variabilidade em Distribuies de Rendas Dirias, onde a Mdia Fixa (Cr $340,00) oportunidade de verificar, entretanto, o desvio mdio no pode ser considerado uma
perda de tempo, pois, na pior das hipteses, ele oferece-nos uma boa base para a com-
Distribuio (a) Distribuio (b) Distribuio (c) preenso da natureza do desvio padro.
X lx1 X lx1 X 1x1 Em discusses anteriores, vimos que o desvio mdio evita o problema de nmeros ne-
Cr$ Cr$ Cr$ gativos que cancelam os positivos; isso foi conseguido graas conveno de ignorarem-se
340
os sinais "mais" (+) e "menos" (-), somando, em seguida, os valores absolutos dos
0 391 +51 595 +255
340 0 374 +34 510 +170 desvios com relao mdia. Tal procedimento para a criao de uma medida de variabi-
340 0 357 +17 425 + 85 lidade tem a ntida desvantagem de impedir que esses valores absolutos sejam sempre
340 0 340 0 340 0 teis em anlises estatsticas mais avanadas (pois eles no comportam facilmente
-
-
340 0 323 -17 255 85 manipulaes algbricas).
340 0 306 -34 170 -170
340
-
0 289 -51 85 -255 Para superar esse problema e obter uma medida de variabilidade que seja mais
conveniente (isto , ajustada, "usvel") em procedimentos estatsticos avanados,
Elx1 = 0 Elx1 = 204 EtxI = 1.020
podemos elevar ao quadrado as discrepdncias reais (com os respectivos sinais) e som-las
X = Cr$340
AT = Cr$0
X = er$340
AT = Cr$102
i= Cr$340
AT = Cr$510
a seguir (Ex2). Corno ilustrado na Tabela 5.2, esse procedimento permite "fugir"
influncia dos sinais, j que o quidrado de qualquer nmero sempre positivo.
DM = Cr$0 DM = Cr$29,14 DM = Cr$145,71
Aps termos somado os quadrados das discrepncias, podemos dividir o total por
Nenhuma Pouca Muita N, a fim de garantir uma eqidistribuio desse resultado (total) rektivamente a todos
Variabilidade Variabilidade Variabilidade
os escores envolvidos. O valor que se obtm dessa operao conhecido pelo nome de
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
64 DESCRIO Medidas de Variabilidade 65
media quadrtica* (ou mdia das discrepncias ao quadrado). (Nota-Recorde-se que = desvio padro
procedimento semelhante foi adotado no clculo do desvio mdio, quando E lx1 foi Ex2 = soma das discrepncias ao quadrado
N total de escores da distribuio.
-
dividido por N.) Continuando corn a ilustrao da Tabela 5.2, vemos que =
Ex2
N
= -= 8,67
52
6
Para resumir: o procedimento para o clculo do desvio padro no difere muito
do mtodo que vimos anteriormente para o clculo do desvio mdio. Com refeitncia
ao exemplo presente, os seguintes passos devem ser seguidos:
TABELA 5.2 Elevao de Discrepncias ao Quadrado para a Eliminao de Nmeros Negativos.
(Dados da Tabela 5.1)
PASSO 1: Calcular a mdia da distribuio.
x2
4ikiz:9s
X
+4
8
9
+3
16
9
49:44('
11
9
6 +1 1
EX ('4 44144
8
4 -1 1 6 4'4,74> 00
2 -3 9 4 30
-4 1:14,4
1 16 2 6
Ex = 0 Ex2 = 52 1 = 5
EX = 30
Surge, agora, um problema adicional. Como conseqncia direta do fato de
termos elevado as discrepncias ao quadrado, a unidade de medida sofreu uma altera-
o, o que dificulta a Interpretao do resultado 8,67. De fato, temos 8,67, mas 8,67 PASSO 2: Subtrair de cada escore bruto o valor da media da distribuio para, dessa
unidades de qu? Com vistas, ento, a voltar unidade de medida original, extramos forma, obterem-se as discrepncias.
a raiz quadrada da mdia quadrtica, donde resulta:
/ /x2
N
- N/8,67 = 2,94 X
Cr = - 2
onde
2
1
PASSO 3:
-3
-4
siMbolos, S2 (X) = -
N.T.: Na verdade, a mdia quadrtica
Ex2
N
muito mais conhecida pelo nome de varkincia. Em
a2 (X); quando tal ocorrer, interprete-se assim: S2 (X) a varincia da amostra e 02 (X), da populao.
X
9 +4
x x2
16
** N.T.: Releia-se a nota de rodap anterior . O que ficou dito relativamente varincia tambm 8 +3 9
vale para o desvio padro. Observe-se, ainda, que o Autor no faz, a esta altura, nenhuma distingo 6 +1 1
na maneira de notar o desvio padro, quer seja ele calculado para uma populao, quer para uma
4 -1 1
amostra. Essa distino ser feita, entretanto, no Capftulo 7. Mais uma observao: o desvio padro 2 -3 9
pode ser definido como sendo a raiz quadrada positiva da varkincia. Assim: 1 -4 16
Ex2 = 52
VVarincia = Desvio padro.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
66 DESCRIO Medidas de Variabilidade 67
9
2:c2 52 EX 30
o- = = N/8 67 = 2,94 8
-
N 6 ' 6
N 6
4
12 25
Podemos agora dizer que o desvio padro do conjunto de escores 9, 8, 6, 4, 2 e 1 2
1
2,94.
IX = 30
fcil de obter-se o DP-um mtodo que prescinde das discrepncias e que trabalha
diretamente com os dados brutos.
A frmula desse novo mtodo
cr =
1X2
3C-2 = 1 202
6
- 25 = 03,67 - 25,00 = N/8,67
x2 7 1
6 2
9 81 5 3
8 64 4 5
6 36 3 2
4 16 2 2
2 4 1 1
1 1
N = 16
EX2 = 202
PASSO 2: Calcular a mdia aritmtica e elev-la ao quadrado. PASSO 1: Multiplicar cada escore
(X) pela respectiva freqncia (f), a fim de obter fX.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
68 DESCRIO Medidas de Variabilidade 69
ponto importante: enquanto que metros, centmetros sempre tem tamanho constante,
o valor do desvio padro varia de distribuio para distribuio. Alias, se no fosse
assim, no poderamos usar o desvio padro-como ilustramos pginas atrs-na compa-
rao de distribuies quanto sua variabilidade (por exemplo, DP = Cr $85.000,00 para
a distribuio da renda de professores secundrios; DP = Cr$ 255.000,00 para a distribui-
o da renda de larpios). Por essa razo, precisamos calcular o "tamanho" do desvio
padro de todas as distribuies com que estejamos trabalhando. Tambm em conse-
qncia deste fato, geralmente mais difcil compreender o significado do desvio
65 70 75 80 85 90 95 padro, em contraste com o significado de metros ou centmetros como unidades de
-3a -2a -la X +la +2a +36, mensurao. No captulo seguinte voltaremos a examinar o conceito de desvio padro.
FIGURA 5.2 Mensurao da Linha de Base em Unidades de Desvio Padro. (Neste exemplo, o COMPARAO ENTRE AMPLITUDE TOTAL, DESVIO MDIO E DESVIO PADRO
desvio padro (0) 5 e a mdia (X) 80)
A amplitude total pode ser considerada um mero ndice preliminar ou grosseiro da va-
unidades "sigma"). Por exemplo, poderamos somar um desvio padro ao valor da riabilidade de uma distribuio. Sua obteno rpida e fcil; todavia, ela no muito
mdia, a fim de determinar qual escore bruto localiza-se a exatamente um desvio padro "confivel". Pode ser aplicada a dados intervalares ou ordinais.
dela (isto , um escore bruto distante da media um sigma). Como ficou demonstrado A amplitude total tem utilidade no que diz respeito ao clculo do desvio padro.
na Figura 5.2, se X = 80 e DP = 5, ento o escore bruto 85 fica a exatamente um desvio A Figura 5.2 ilustra que seis desvios padres cobrem quase que inteiramente a distncia
padro acima da mdia (80 + 5 = 85); isso equivale a dizer que o escore 85 dista dela que vai desde o menor escore at o maior numa distribuio (de -3a a +3a). Esse fato
+1a. Essa direo "mais" (+) porque todas as discrepncias acima da mdia so isolado j nos d um mtodo conveniente para estimar (mas no calcular) o desvio
positivas; todas as discrepncias abaixo da mdia so "menos" (-) ou negativas. padro. De modo geral, o tamanho do desvio padro cerca de um sexto (1/6) do
Podemos continuar "graduando" a linha de base mediante a adio de mais um tamanho da amplitude total. Por exemplo, se a amplitude total for 36, espera-se que
desvio padro ao escore bruto 85. Tal procedimento d-nos o escore bruto 90, que se o DP caia bem perto de 6; se a amplitude total for 6, o DP deve de estar prximo de 1.
situa a exatamente dois desvios padres acima da mdia (85 + 5 = 90). Por igual pro- Essa regra pode assumir considervel importncia aos olhos do aluno que deseja
cedimento, adiciona-se um desvio padro ao escore bruto 90 e obtemos 95-que repre- "testar" se seu resultado tem grande probabilidade de estar correto. Tomemos um caso
senta o escore bruto localizado a exatamente tres desvios padres acima da mdia. extremo: se A T = 10 e o DP (calculado) = 12, devemos ter cometido algum erro, pois o
Para continuar esse processo do "lado negativo" (abaixo da mdia), vamos subtraindo, DP no pode ser maior que a amplitude total. Uma nota de alerta: a regra do "um
a partir de if, um desvio padro, dois desvios padres etc., donde resulta: 75 (localizado sexto" s se aplica a distribuies compostas de grande nmero de escores. Quando
a - -
la), 70 (localizado a 2a), e assim por diante. o nmero de escores for pequeno, via de regra, haver necessidade de menos desvios
Como bem ilustra a Figura 5.3, o processo de medir a linha de base em unidades padres para cobrir toda a amplitude da distribuio.
de desvio padro , em muitos aspectos, semelhante mensurao da distncia em metros Enquanto que a amplitude total calculada a partir de apenas dois escores, tanto
entre uma mesa e uma dada parede. No entanto, a analogia falha em pelo menos um o desvio padro quanto o desvio mdio levam em conta todos os escores da distribuio.
Apesar da sua relativa estabilidade, o desvio mdio no muito usado em pesquisa,
uma Vez que ele no se presta a muitas anlises estatsticas avanadas. Por outro lado,
o clculo do desvio padro implica a utilizao de um procedimento aceitvel do ponto
de vista matemtico, com vistas a contornar o problema dos sinais (+; -): quadrar as
(a) 2 metros -1- discrepncias em vez de simplesmente ignorar os sinais. Como resultado, o desvio padro
acabou por tomar-se o passo inicial na obteno de certas medidas estatsticas, em par-
ticular no terreno das inferncias. Essa caracterstica do desvio padro ser explorada
em detalhes em captulos subseqentes, especialmente nos de nmeros 6 e 7.
Apesar da sua utilidade como medida de disperso "confivel", o desvio padro
(b) X 90 +2 a X-80 a= 5 unidades de escore bruto
tambm apresenta algumas desvantagens. Comparado com outras medidas de variabili-
FIGURA 5.3 Mensurao de Distncias; (a) entre uma mesa e uma parede, onde a unidade de dade, seu clculo no s &P.M como demorado. Todavia, essas desvantagens esto
medida usada o metro; (b) entre um escore bruto e a mdia da distribuio, onde dia a dia sendo superadas pelo crescente uso ou de mquinas de calcular de alta veloci-
a unidade de medida vem expressa em unidades de desvio padro dade ou de computadores programados para a execuo de anlises estatsticas. O desvio
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
72 DESCRIO Medidas de Variabilidade 73
padro (da mesma forma que o desvio mdio) tambm tem a caracterstica de ser uma
medida intervalar, donde decorre que sua utilizao torna-se impossvel com dados
X = ponto mdio fX
nominais ou intervalares-via de regra utilizados no trabalho de muitos pesquisadores.
9 5 45 159
CALCULO DA AMPLITUDE TOTAL, DO DESVIO
MDIO E DO DESVIO PADRO 6 4 24 - 17
DE DADOS AGRUPADOS 3 2 6
= 9,35
fX = 159
Estejam os dados agrupados ou no, a amplitude total sempre a diferena entre o
maior e o menor escore. Seu clculo no requer o uso de nenhum mtodo especial ou PASSO 3: Calcular o desvio (= a discrepncia) de cada ponto mdio com relao
frmula. mdia.
Com o propeisito de ilustrar passo a passo o procedimento para a obteno do
desvio mdio numa distribuio de freqencias com dados agrupados, considere-se a X = Ponto Mdio - = ixl
seguinte tabela*:
18 8,65
Intervalo IS 5,65
de Classe 12 2,65
9 0,35
17-19 1
6 3,35
14-16 2
3 6,35
11-13 3
8-10 5
5-7 4
PASSO 4: Multiplicar cada discrepncia pela freqncia correspondente ao intervalo
2-4 2 de classe e, em seguida, somar esses produtos.
N = 17
Intervalo fx
PASSO 1: Calcular o ponto mdio de cada intervalo de classe.
17-19 1 8,65 8,65
14-16 2 5,65 11,30
Intervalo X = Ponto Mdio 11-13 3 . 2,65 7,95
8-10 5 0,35 1,75
17-19
5-7 4 3,35 13,40
18 2-4 2 6,35 12,70
14-16 15
11-13 12 N = 17 Ef x = 55,75
8-10 9
5-7 6
2-4 3 PASSO 5: Dividir por N.
- 3,28
17
X = ponto mdio fX
,
15
12
1
2
3
18
30
36
-
X = -
EfX
/V
Chegamos, assim, a um desvio mdio de 3,28.
Para o clculo do desvio padro de dados agrupados, podemos usar uma frmula
que se utiliza apenas dos dados brutos da tabela inicial. Em smbolos, temos:
* N.T.: sempre interessante especificar, na coluna onde figuram os intervalos de classe, a unidade
am que a varivel foi mensurada. \I"Nx2 )72
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
/ 18
74 DESCRIO Medidas de Variabilidade 75
onde PASSO 3: Multiplicar cada ponto mdio por fX e somar esses produtos.
Intervalo
de Ckisse a- - V1fX2 - j1773 - 87,42
17
= .V104,29 - 87,42 =
17-19 1
RESUMO
Introduzimos, neste captulo, o conceito de amplitude total, de desvio medio e de
desvio padrifo-que so trs medidas de variabilidade ou, para dizer de outra forma,
PASSO 1: Multiplicar cada ponto mdio pela freqncia do intervalo de classe cor-
medidas que "mostram" a maneira como os escores agrupam-se em torno do centro
respondente e somar esses produtos.
da distribuio. A amplitude total foi definida como um indicador de variabilidade
rpido e grosseiro, facilmente calculada a partir da diferena entre o maior e o menor
Intervalo de Classe f Ponto Medio (X) fX escore da distribuio. 0 desvio mdio-ou seja, a soma dos valores absolutos das dis-
crepncias (desvios), dividida por N-foi, desde o incio, tratado como uma medida
17-19 1 18 18 inadequada de variao, do ponto de vista matemtico, apesar de constituir slida base
14-16
para a compreenso do desvio padro; este, por sua vez, foi definido como .sendo a
2 15 30
11-13 3 12 36
8-10 5 9
raiz quadrada da varincia da distribuio. 0 desvio padro uma medida de variabi-
45
5-7 4 6 24 lidade confkivel, de nvel intervalar, que pode ser utilizada em operaes estatsticas
2-4 2 3 6 avanadas, descritivas ou inferenciais. 0 significado amplo do desvio padro ser
N = 17 EfX = 159 objeto de estudos posteriores: nas discusses relacionadas com a curva normal e nas
generalizaes de amostras para populaes.
N = 23
6. Calcule o desvio padro relativo seguinte distribuio freqencial escores:
10. Relativamente seguinte tabela de dados agrupados por freqncias, calcule: (a) a
amplitude total; (b) o desvio mdio; (c) o desvio padra-q.
Intervalo de Classe
5
4 5 17-19 2
3 6 14-16 3
2 2 11-13 6
1
N =
_
18
2 8-10
5-7
5
1
11. Relativamente seguinte tabela de dados agrupados por freqncias, calcule: (a) a
7. Calcule o desvio padro relativo seguinte distribuio freqencial de escores: amplitude total; (b) o desvio mdio; (c) o desvio padro.
Intervalo de Classe
20-24 2
7 2 15-19 4
6 3 10-14 8
5 5 5-9 5
4 7 N = 19
3 4
2 3
1 1
N = 25
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
PARTE II
Da Descrio
Tomada de Decises
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
6
A Curva Normal
1 x ,2
Y =
- a
2 ( , onde
uf27r
Y = ordenada correspondente a um dado valor de X (isto , a ordenada representa a freqiincia
com que X ocorre na distribuio)
77 = 3,1416
e = 2,7183
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
A
82 DA DESCRIO TOMADA DE DECISES
A Curva Normal 83
20
Poderfamos limitar uma poro dessa rea total se trassemos, a partir de dois
pontos quaisquer tomados na linha de base, segmentos perpendiculares at a prpria
15
curva. Por exemplo, usando a mdia como ponto de partida, poderfamos traar um
segmento em X e um outro no ponto que coincide com 1 DP (1 distncia sigma) acima
10
(isto , direita) de X. Esta poro sombreada da curva normal ilustrada na Figura 6.5
abrange 34,13% da freqncia total.
5
Da mesma forma, podemos dizer que 47,72% dos sujeitos sob a curva normal
caem entre X e 2 DP acima ( direita) da mdia; igualmente, que 49,87% caem entre
e 3 DP acima da mdia (ver Figura 6.6).
tC3
Como veremos mais adiante, uma proporvo constante da rea total sob a curva
normal cair entre a media e qualquer distncia dada a contar de X -desde que a men-
Renda (em US $ )
surao seja feita em unidades de desvio padro. Esta afirmao verdadeira, indepen-
FIGURA 6.3 Distribuio da Renda "Per Capita" (Naes do Mundo) dentemente da mdia e do desvio padro da distribuiO particular que estejamos
estudando e aplica-se a todos e quaisquer dados que tenham distribuio normal. Assim,
para um grupo relativamente pequeno de trabalhadores, isto porque, sendo todos a rea sob a curva normal compreendida entre X e 1 DP acima da mdia vai sempre
cidados de meia-idade, tm a seu encargo um nmero assustador tanto de velhos incluir 34,13% da totalidade dos dados, quer estejamos discutindo a distribuio de
(aposentados) quanto de jovens (ainda em perfodo escolar). estaturas, de inteligncia, de filiao partidria ou de desgaste nos degraus das portas
Naquelas circunstncias em que temos boas razes para esperar grandes diver- entrada de nossas casas. 0 requisito bsico, em cada situao, que estejamos tra-
gncias da normalidade-como, por exemplo, no caso da idade e da renda-a curva balhando com escores que tenham realmente distribuio normal.
A natureza simtrica da curva normal leva-nos a tirar outra concluso impor-
normal nab pode ser usada como "modelo" para os dados coletados. Vemos, assim,
que no possfvel aplic-la com liberdade a todas as distribuies que o pesquisador
tante: qualquer distncia medida em "sigmas", acima ou abaixo da media, contm
obtm, e deve, ao contrrio, ser usada com uma boa dose de bom senso. Felizmente a mesma poro da area sob a curva. Ento, se 34,13% da rea total situam-se entre
a mdia e 1 DP acima de Xi, tambm 34,13% da rea total situam-se entre a mdia e
os estatfsticos sabem que grande quantidade de fenmenos de interesse segue o modelo
1 DP abaixo de X ; se 47,72% situam-se entre a mdia e 2 DP acima de X, tambm
normal.
47,72% situam-se entre a mdia e 2 DP abaixo de X ; finalmente, se 49,87% situam-se
entre a mdia e 3 DP acima de X, tambm 49,87% situam-se entre a mdia e 3 DP
A AREA SOB A CURVA NORMAL
abaixo de X. Em outras palavras, como ilustra a Figura 6.7, 68,26% da rea total sob
a curva normal (34,13% + 34,13% -- 68,26%) caem entre -1 a e +1a, sendo a mdia
A fim de podermos empregar a curva normal na soluo de problemas, precisamos, antes, (aritmtica), X , o ponto de referncia; 95,44% da rea total (47,72% + 47,72%) caem
aprender o significado da expresso "rea sob a curva normal": aquela poro do plano,
compreendida entre a curva e a linha de base, que corresponde, ern qualquer distribuivo
entre - 2a e +2a a partir de X ; 99,74% da rea total-que, alis, praticamente toda
a rea sob a curva-caem entre -3a e +3a (sempre X como ponto de partida). Podemos
normal, a 100% dos dados considerados. A Figura 6.4 ilustra essa caracterfstica.
0.)
FIGURA 6.5 Porcentagem da Area Total sob a Curva Normal Limitada por X e por um Desvio
FIGURA 6.4 A Area sob a Curva Normal Padro Acima de X
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
86 DA DESCRIO TOMADA DE DECISES
A Curva Normal 87
+2 a +3 a
1--47,72%1
1-49,87%
99,74%
FIGURA 6.6 Porcentagem da Area Total sob a Curva Normal Limitada por
Padres Acima de X.
I e por Dois Desvios
FIGURA 6.8 Distribuio de QIs Masculinos
Neste caso especfico, vamos admitir que os QIs masculinos apresentem maior hetero-
geneidade do que os femininos; em outras palavras, a distribuio dos QIs masculinos
contm uma porcentagem maior de escores extremos-representativos de sujeitos
brilhantes e de sujeitos medocres-enquanto que a distribuio de Qls femininos
contm uma porcentagem maior de escores localizados prximos mdia, isto , ao
redor do ponto de freqncia mxima, no centro.
Em virtude de o desvio padro ser uma medida de variabilidade, essas diferenas
ligadas a sexo deveriam refletir-se no valor do DP de cada distribuio de QIs. Podera-
mos, assim, verificar, por exemplo, que DP = 10 para sujeitos do sexo masculino e que
-3 a -2 a -la X +la +2 a + 30 DP = 5 para os do sexo feminino.
L68,26%-1 Se conheassemos o desvio padro de cada conjunto de escores QI e admits-
95,44% semos que cada conjunto tivesse distribuio normal, poderamos estimar e, em seguida,
99,74% comparar as porcentagens de machos e fmeas localizadas numa dada amplitude de QIs.
FIGURA 6.7 Porcentagens da Area Total sob a Curva Normal Compreendidas Entre -10, -2cr e
-3 a
dizer, ento, que 6 DPs abarcam, para efeitos prticos, a totalidade dos dados sob
qualquer curva normal (mais de 99%).
* N.T.: Por questo de comodidade, o lado escolhido o da direita, j que, assim, nenhum valor
precisa vir antecedido de sinal.
** N.T.: Observe-se o que ficou dito na N. do T. anterior.
LFIGURA 6.10 Localizao de um Escore (Bruto) Localizado a 1,40 DPs Acima de X
*** N.T.: p =30,48 cm. jarda = ps e, portanto, igual a 3(30,48 cm) =91,44
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor 1 1
cm. 3
90 DA DESCRIO TOMADA DE DECISES
A Curva Normal 91
esquerda (abaixo) da mdia, num ponto ligeiramente superior a 2 DPs (ver Figura 6.11).
Obtemos um escore z atravs do clculo do escore-diferena (x = X X)-que d - z = X -X = 3 - 10 = -7
a distncia de um X qualquer at a mdia-e, ento, pela diviso dessa diferena por a.
X = za + X
$5.000 $7.000 3 10
z= +1,33 z = -3,5
FIGURA 6.12 Posio de z =1,33 (na Curva Normal), Relativa ao Escore Bruto US$7.000 FIGURA 6.13 Posio de z = -3,5 Relativa ao Escore Bruto =3
(escores padronizados) e a Tabela B no clculo da probabilidade associada a qualquer da a media, onde se localizam os escores mais freqentes, e h, ainda, reas me-
dado de uma distribuio. No contexto presente, o termo probabilidade refere-se nores progressivamente mais prximas de ambas as extremidades (caudas), onde en-
freqncia relativa de ocorrncia de um dado ou evento qualquer; em outras palavras, contramos, em pequenas propores, escores muito altos ou muito baixos. Ento, em
a probabilidade associada a um evento qualquer o nmero de vezes que tal evento termos probabilsticos, podemos dizer que a probabilidade decresce medida que, na
pode ocorrer em relao ao nmero total de eventos. Redispondo os termos dessa linha de base, nos afastamos da media em ambos os sentidos. Desse modo, dizer que
definio: 68,26% da freqencia total sob a curva normal caem entre -la
e +1 a, a partir da
media, o mesmo que dizer que a probabilidade de cerca de 68 em 100 de que um
Nmero de vezes que o dado caia dentro desse intervalo (-1 a +1a). De forma anloga,
I
Probabilidade de um dado ou evento pode ocorrer dizer que 95,44% da freqncia total sob a curva normal caem entre -2a e +2a, a
ou de um evento qualquer contar da mdia, o mesmo que dizer que a probabilidade de aproximadamente
Nmero total de dados
95 em 100 de que um escore bruto qualquer venha a situar-se dentro desse intervalo
ou eventos
(-2a1---1+2a) e assim por diante.
Assim, a probabilidade de extrair uma nica carta (digamos, um "As de espadas"), O que acabamos de fazer foi repetir precisamente o mesmo conceito de probabili-
de um mao embaralhado de 52 cartas, 1 em 52, uma vez que o evento "s de espadas" dade ou freqncia relativa que j estudamos quando extramos uma carta de um
s pode ocorrer uma vez no total (pois entre as 52 cartas s existe um "s de espadas"). baralho completo, quando jogamos uma moeda ou quando abrimos de forma aleatria
A probabilidade de obter-se "cara" com uma moeda honesta* (ou perfeitamente um livro numa pgina qualquer. Note-se, contudo, que as probabilidades associadas As
balan-
ceada), numa s jogada 1 em 2, j que "cara" s ocorre uma vez no conjunto total de reas sob a curva normal so sempre expressas com relao a 100%-que correspondem
possibilidades (2). Por igual raciocnio, se nos mandassem abrir um livro de 100 pginas rea total sob a curva (por exemplo, 68 em 100; 95 em 100; 99 em 100 e assim por
numa pgina qualquer (por exemplo, pg. 23),** a probabilidade de conseguir, numa s diante). Por essa razo e para garantir que em todo o resto deste livro o termo seja
tentativa e aleatoriamente, abrir o livro naquela pgina seria de 1 em 100. entendido de modo padronizado, vamos sempre falar em probabilidade como sendo o
A curva normal uma distribuio na qual possvel determinar probabi- nmero de vezes que um dado evento pode ocorrer num conjunto de 100 repetices.
Hades associadas a todos os pontos da linha de base. Como j foi mencionado Assim, a probabilidade de sortear um s de espadas de um baralho bem misturado
anteriormente, a curva normal uma distribuio de freqncias; a freqncia to- de 1,92 em 100 (h); a probabilidade de tirar "cara" no lance de uma moeda de 50
tal sob a curva igual a 100%; essa curva apresenta uma rea central que circun- em 100 (1). Note-se, alm disso, que usual expressar probabilidades sob a forma
decimal (P). Por exemplo, podemos dizer que P = 0,50-isto , (A)-de tirar "cara"
num s lance; analogamente, podemos dizer que P = 0,68-ou seja, (-,)-de que um
* N.T.: Alm do termo "honesto"(a), muito comum em
Estatstica, ocorrem, ainda: eqUiprovvel, escore bruto caia entre -1 a e +1 a sob a curva normal.
balanceado(a), nab viesado (a).
Expressa sob a forma de razo (quociente), a probabilidade sera sempre um
* *N.T.: Esse raciocnio falho! Se a idia for
abrir o livro na pgina 23, o mais "ingnuo" dos nmero que oscila entre 0 e 1. A probabilidade de ocorrencia de um evento 0 quando
pesquisadores procurar abri-lo na "primeira metade" e, a, o 100 fica sem sentido. Melhor
seria estamos absolutamente seguros de que ele no ocorrer; 1 quando estamos convenci-
suprimir a sugesto quanto pgina, deixando apenas qualquer.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor dos de que sem dvida nenhuma ele ocorrer. O problema que os pesquisadores nunca
94 DA DESCRIO TOMADA DE DECISES
A Curva Normal 95
esto totalmente seguros a respeito de coisa alguma! Em
conseqncia, podemos, via
de regra, esperar encontrar probabilidades iguais a 0,60,
0,25 ou 0,05; mas raras vezes
possvel esperar reduzir a probabilidade a 0 ou, por outro lado, elev-la Probabilidade de sair "cara" no primeiro lance
a 1.
Uma caracterstica importante das probabilidades reside na regra
da soma, que
estabelece o seguinte: a probabilidade de ocorrencia de um evento Probabilidade de sair "cara" no segundo lance
qualquer, num con-
junto de alternativas, igual el soma das probabilidades separadas.
Suponham, por
exemplo, que desejemos encontrar a probabilidade de extrair, dum
mao bem embara- Probabilidade de safrem "caras" nas duas joga-
lhado de 52 cartas, ou o "s de espadas", ou a "rainha de ouros" ou T (isto e,P - 0,25)
o "rei de copas" das sucessivas
num nico lance. Pela soma das probabilidades isoladas-( + +
h)-verificamos que
a probabilidade de obteno de qualquer dessas
3
cartas, numa nica tentativa igual a
, ou seja, P = 0,06. Em outras
palavras, temos 6 chances em 100 de obter, numa nica FIGURA 6.15 Ilustrao da Regra da Multiplicao: Clculo da Probabilidade de Sarem "Caras" em
tentativa, ou um "s de espadas", ou uma "dama de ouros" ou um "rei 2 Jogadas Sucessivas da Mesma Moeda
de copas"
(ver Figura 6.14).
A regra da soma sempre pressupe que os eventos sejam mutuamente a probabilidade de obteno de eventos mutuamente excludentes em srie igual ao
excludentes, produto das probabilidades separadas. Em lugar de "ou ou", a regra da multiplicao
em outras palavras, que dois eventos no podem jamais ocorrer em
simultaneidade. sugere "primeiro, segundo, terceiro, ..."
Por exemplo, num baralho de 52 cartas, no possvel que, ao mesmo tempo,
uma carta Por exemplo, qual a probabilidade de obter "cara" em duas jogadas sucessivas
seja de "espadas", de "ouros" e de "copas". Analogamente, uma
moeda, jogada uma de uma moeda (isto , "cara" tanto no primeiro lance quanto no segundo)? Visto que
s vez, no pode produzir em conjunto "cara" e "coroa". *1
Admitida a mtua excluso de eventos, podemos dizer que as probabilidades esses eventos so independentes, o evento relacionado com o primeiro lance no influen-
associadas a cada uma das possveis ocorrncias de um evento sempre tm 1 cia o segundo. Na primeira jogada da moeda, a probabilidade de sair "cara" igual
por soma. (ou seja, P = 0,50); na segunda jogada, a probabilidade desse mesmo evento ainda igua1
Essa afirmao estabelece que algo tem que ocorrer. Se no sair "cara",
sai "coroa"; se a -1 (isto , P = 0,50). Portanto, a probabilidade de conseguirmos "cara" em dois lances
no for um "s", ser um "rei", "rainha", "valete", "dez" e por a afora. No
lana- sucessivos de uma moeda igual a )(-- ) = (ou P = 0,25) (ver figura 6.15).
mento de uma moeda, a probabilidade de sair "cara" de (isto , P = 0,50). Natural-
mente, a probabilidade de sair "coroa" tambm de -} (ou seja, P = 0,50). Ento, Para aplicarmos o conceito precedente de probabilidade com referncia curva
se normal, vamos voltar a um exemplo anterior. Recorde-se o litor de que naquele proble-
somarmos as probabilidades relativas a todas as ocorrncias, verificaremos que a
proba- ma relacionado com a distribuio de renda anual de uma cidade (norte-americana),
bilidade de sair "cara" ou "coroa" 1 (isto , + = 1).
Outra propriedade importante das probabilidades a regra da multiplicao: um particular escore bruto teve de ser transformado no seu eqivalente z. Tal distribui-
a, o de rendas tinha mdia de US$5.000 e desvio padro de US$1.500.
o problema consiste em determinar a probabilidade de
realizao de dois ou mais Ao aplicarmos a firmula da "escala z", verificamos, anteriormente, que uma
eventos em sucessa-o, um aps o outro. A regra da multiplicao
estabelece o seguinte: renda anual de US $ 7.000 situava-se a 1,33 DPs acima da mdia (US$5.000); ou seja,
A z =
-
7.000 5.000
= +1,33
Probabilidade de extrair um "s de espadas"
= 52 1.500
Vamos agora determinar a probabilidade associada a um escore situado entre
Probabilidade de extrair uma "dama de ouros" = A + US$5.000-a prpria mdia-e US$7.000. Em outras palavras, qual a probabilidade
de escolher-se de forma aleatria, numa s tentativa, uma pessoa dessa cidade cuja
Probabilidade de extrair um "rei de copas"
renda anual caia entre US$5.000 e US$7.000? O problema est ilustrado graficamente
52 na Figura 6.16 (observe-se a rea sombreada sob a curva) e pode ser resolvido (em ma-
temtica) pela aplicao da frmula dos escores z, combinada com a Tabela B (fim
Probabilidade de extrair ou um "s de espa- do livro).
das", ou uma "dama de ouros" ou um rei de ; isto e, P = 0,06
copas" PASSO 1: Transformar o escore bruto (US$7.000) em escore z *
FIGURA 6.14 Exemplo Ilustrativo da Regra da Soma: Trata-se, Aqui, de Extrair num S
Lance, ou
um "A's de Espadas", ou uma "Dama de Ouros" ou um "Rei de Copas" * N.T.: Alm de "escore z", comum falar-se em "escore reduzido", "(varivel) normal reduzida"
ou, simplesmente, valor da "escala z".
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
96 DA DESCRIO TOMADA DE DECISES
A Curva Normal 97
C.
ocorrncias possveis relacionadas com um mesmo fenmeno. sejam de Cr$ 170,00 ou menos.
A aplicao da regra da multiplicao curva normal pode ser ilustrada com o 5. Dado um conjunto de escores brutos, distribudos normalmente, onde = 80 e
seguinte problema: qual a probabilidade de sortearmos de forma aleatoria, nessa popu- DP = 7,5, determinar (a) a porcentagem de respondentes que obtiveram 60 ou
lao, quatro sujeitos cujas rendas anuais sejam de US$ 7.000 ou mais? J sabemos que menos; (b) a probabilidade de sortear um respondente que tenha obtido 60 ou
a probabilidade de extrair casualmente um sujeito (dessa populao) cuja renda anual menos; (c) a porcentagem de respondentes que obtiveram entre 80 e 90; (d) a proba-
seja no mnimo igual a US$7.000 P = 0,09. Portanto, bilidade de sortear um respondente que tenha obtido entre 80 e 90; (e) a porcentagem
de respondentes que obtiveram 85 ou mais; (f) a probabilidade de sortear um respon-
P = (0,09)(0,09)(0,09)(0,09) = (0,09)4 ** = 0,00007 dente que tenha obtido 85 ou mais; (g) a probabilidade de sortear um respondente
que tenha tirado "70 ou menos" ou "90 ou mais"; (h) a probabilidade de sortear
Pe la aphcao da regra da multiplicao, vemos que a probabilidade de extrao tits respondentes que tenham tirado 90 ou mais.
aleatria de quatro sujeitos de renda igual ou superior a US $ 7.000 corresponde a 7
(chances) em 100.000.
04110310ADE
11114,10 FEDERAL
RESUMO TeC4 DO
CRIVTRA PAPA
Procurou-se, neste captulo, relacionar as propriedades da distribuio normal terica E
com problemas do "mundo real", que apresentam interesse para a pesquisa. Demons-
trou-se, assim, que a Area sob a curva normal pode ser usada tanto na interpretao do
desvio padro quanto na elaborao de afirmaes que envolvem a noo de probabi-
lidade. A importncia da distribuio normal tornar-se- mais visvel em captulos
subseqentes deste livro.
METODOS DE AMOSTRAGEM
Os mtodos de amostragem do pesquisador so, em geral, mais elaborados e sistemti-
cos do que aqueles utilizados no dia-a-dia. Ele preocupa-se basicamente Jill saber se
7
sua amostra de sujeitos bem representativa da populao, a fim de ser-lhe possfvel
fazer generalizaes de uma para a outra. Para fazer tais inferncias, o pesquisador
seleciona um mtodo apropriado de amostragem que leva em conta a possibilidade de
todos os membros da populao fazerem parte da amostra ou, ento, de apenas alguns
membros fazerem parte dela. Se todos os componentes de tal populao tiverem igual
oportunidade (probabilidade) de participar da amostra, diz-se que o mtodo usado o
Amostras e Populaes
da arnostragem casual; se este no for o caso, fala-se em amostragem ntio-casual.
Amostras No-casuais
O mtodo de amostragem no-casual mais conhecido-amostragem acidental-difere
muito pouco dos nossos procedimentos dirios de amostragem, uma vez que ele se
baseia com exclusividade no que convm ao pesquisador. Em outras palavras, o pesqui-
O pesquisador social procura geralmente tirar concluses
sador simplesmente inclui os sujeitos convenientes na amostra, dela excluindo os incon-
a respeito de um grande venientes. A maioria dos estudantes recorda-se de, pelo menos, algumas ocasies em que
ntimero de sujeitos. Por exemplo, ele poderia desejar estudar os 220.000.000 de
cida- um instrutor, interessado numa pesquisa, pediu-lhes que participassem de um experi-
dabs que constituem a populao dos Estados Unidos da Amrica do Norte,
os 1.000 mento ou preenchessem um questionrio. A popularidade dessa forma de amostragem
membros de um sindicato particular, os 10.000 norte-americanos negros que
moram acidental em Psicologia fez com que alguns crticos olhassem para essa disciplina como
numa cidade do sul ou os 45.000 estudantes habitualmente matriculados numa univer-
sidade do leste. sendo "a cincia dos calouros universitrios", dada a grande freqncia com que eles
At aqui, temos admitido que o pesquisador social investiga todo o grupo figuram como sujeitos experimentais em pesquisas.
que Outro tipo de amostragem no-casual o de quotas. Neste procedimento, diversas
ele tenta compreender. Conhecido por populao ou universo, tal grupo
consiste em caractersticas de uma populao, tais como idade, sexo, classe social ou etnia so amos-
um conjunto de indivduos que partilham de, pelo menos, uma caracterstica
comum, tradas nas mesmas propores em que figuram na populao. Suponham, por exemplo,
seja ela cidadania, filiao a uma associao de voluntrios, etnia,
matrcula na univer- que tivssemos de extrair urna amostra, por quota, da populao de alunos de uma dada
sidade etc. Desse modo, poderamos falar a respeito da populao dos Estados
Unidos, universidade, onde 42% fossem mulheres e 58%, homens. Usando esse mtodo, os entre-
da populao dos membros do sindicato, da populao dos norte-americanos
negros vistadores recebem a incumbncia de localizar uma quota de estudantes de tal forma que
residentes numa cidade do sul ou da populao de alunos universitrios.
somente 42% da amostra consista de mulheres e 58%, de homens. As mesmas porcenta-
Posto que o pesquisador trabalha com tempo, energia e recursos econmicos
gens que figuram na populao so reproduzidas na amostra. Se o tamanho global da
limitados, ele raras vezes estuda individualmente todos os sujeitos da populao
na amostra fosse 200, ento 84 moas e 116 rapazes deveriam ser selecionados.
qual est interessado. Em lugar disso, o pesquisador estuda apenas
uma amostra- Uma terceira variedade de amo5tra no-casual a de julgamento ou convenin-
que se constitui de um nfimero menor de sujeitos tirados de uma determinada
popu- cia.* A idia bsica aqui envolvida a de que a lgica, o senso comum ou um julgamen-
lao. Atravs do processo de amostragem, o pesquisador busca generalizar (concluses)
to equilibrado podem ser usados na seleo de uma amostra que seja representativa de
de sua amostra (o grupo pequeno) para a populao toda (o grupo maior), da qual
essa um grupo maior (populao). Por exemplo, para extrair uma amostra de revistas que
mesma amostra foi extrada.
reflitam valores da classe mdia norte-americana, poderamos, levados apenas pela
O processo de amostragem faz parte do dia-a-dia. De que outra forma
consegui- intuio, selecionar Reader's Digest, People ou Parade, uma vez que os artigos dessas
ramos informao acerca de pessoas diversas, nab fora amostrando as que esto nossa
revistas parecem refletir aquilo que a maioria dos norte-americanos de classe mdia
volta? Por exemplo, poderamos casualmente discutir assuntos polticos com alguns
deseja (por exemplo, a satisfao do sonho americano, sucesso econmico, e coisas
estudantes a fim de determinar a opinio geral que a classe estudantil tem com relao
semelhantes). De modo similar, certos bairros que tradicionalmente elegiam o candi-
a esse assunto; poderamos tentar descobrir como nossos
colegas de classe esto-se dato oficial, poderiam ser selecionados num esforo de predizer o resultado de uma
preparando para um exame particular atravs de conversas antecipadas com apenas
eleio oficial.
alguns membros da classe; poderamos mesmo investir na bolsa depois
de descobrir
que uma pequena amostra de nossos scios ganhou dinheiro dessa forma.
PDF compression, OCR, web optimization using a watermarked
N.T.: Umaevaluation copyo uso
traduo mais literal obrigaria
*
ofdeCVISION
"proposital". PDFCompressor
102 DA DESCRIO TOMADA DE DECISES.
A mostras e Populaes 103
Amostras Casuais*
aleatrios, o pesquisador arranja, em primeiro lugar, uma lista de todos os componen-
COMO j foi mencionado anteriormente, a amostragem casual d a cada
membro da tes da populao, e atribui a cada um deles um (e um s) nmero de
populao igual oportunidade de fazer parte da amostra. Esta caracterstica da amos- identificagffo. Por
exemplo, se ele estivesse fazendo uma pesquisa que envolvesse os 500 alunos
tragem casual implica que todos os sujeitos da populao devem ser identificados matricula-
dos na disciplina "Introduo Sociologia", ele poderia conseguir,
antes da extrao da amostra, exigncia geralmente preenchida mediante a obteno com a secretaria,
uma lista de todos os nomes, e atribuir a cada um, sem repeties, um' nmero
(elaborao) de uma lista que contenha todos os sujeitos da populao. Um pouco de da
srie 001, 002, etc. at 500. Concluda a preparao da lista, ele inicia
ateno sugere logo que o fato de conseguir um arrolamento completo de todos os a montagem
de sua amostra extraindo nmeros de uma tabela de nmeros aleatrios.
membros da populao nem sempre tarefa fcil, mormente se uma populao muito Digamos que
o pesquisador queira extrair uma amostra de 50 alunos para
grande ou muito diversificada estiver sendo estudada. Para dar um exemplo simples, representar os 500 membros
dessa populao. Ele poderia iniciar a consulta tabela de nmeros
onde poderamos conseguir uma lista completa dos a1unos regularmente matriculados aleatrios a partir
de qualquer nmero (de olhos fechados, por exemplo) e, movendo-se
numa universidade grande? Agueles pesquisadores que j tentaram fazer isto poderffo em qualquer
sentido, pegar nmeros adequados at que os 50 membros fossem selecionados. Ao
dar testemunho da dificuldade encontrada. Para exemplificar uma tarefa um pouco
olhar para uma poro da tbua de nmeros aleatrios acima, poderamos arbitraria-
mais laboriosa, tente-se encontrar uma lista de todos os residentes numa cidade grande.
mente comear na interseco da coluna 1 com a linha 3, caminhar da esquerda para
De que modo podemos estar seguros de ter identificado todo mundo-mesmo a
aqueles direita e tomar todos os nmeros que surgissem entre 001 e 500. Os primeiros nmeros
residentes que no desejam ser identificados?
que aparecem no cruzamento da coluna 1 com a linha 3 so 0, 4 e 5. Desse
O tipo bsico de amostra aleatria (casual), amostra casual simples, pode ser modo, o
obti- aluno nmero 045 o primeiro membro da populao a ser selecionado para a
do por um processo que no diferente daquela to conhecida tcnica de escrever o amostra.
Continuando da esquerda para a direita, vemos que 4, 3 e 1 so os trs nmeros que
nome de cada um em pedacinhos separados de papel e, de olhos vendados, extrair
\rem a seguir, de modo que o aluno 431 (da lista original) selecionado.
apenas alguns nomes de um chapu. Este procedimento d, idealmente, a cada membro Esse processo
continua at que os 50 sujeitos da amostra tenham sido escolhidos. Nota ao estudante:
da populao uma igual oportunidade de ser selecionado para a amostra, uma vez que
ao usar uma tbua de nmeros aleatrios, no considere nmeros que se
um e somente um pedacinho de papel, por pessoa, colocado no chapu. Por vrias repetem ou
que sejam superiores aos necessrios.
razes (inclusive o fato de que o pesquisador necessitaria um chapu extremamente
Todos os mtodos de amostragem casual so, na verdade, variaes do procedi-
grande), o pesquisador interessado numa amostra casual via de regra no tira nomes de
mento de amostragem aleatria simples que acabou de ser llustrado. Por exemplo, no
chapus. Em vez disso, ele usa uma tbua de nmeros aleatrios semelhante Tabua H
caso de amostragem sistemtica, no h necessidade de usar uma tbua de
localizada no fim deste livro. Parte de uma tbua de nmeros aleatrios foi reproduzida nmeros
aleatrios, uma vez que os membros da populao que participam da amostra so
abaixo.
determinados a partir de intervalos fixos. Ao empregar amostragem sistemtica, ento,
cada n-simo membro de uma populao includo numa amostra daquela
Coluna populao.
Ilustrando: na extrao de uma amostra de tamanho 1.000 de uma populao composta
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 de 10.000 inquilinos, poderamos, depois de proceder ao arrolamento
inicial, selecionar
1 2 3 1 5 7 5 4 8 5 9 0 1 8 3 7 2 5 9 9 3 cada dcimo sujeito da lista.
2 6 2 4 9 7 0 8 8 6 9 5 2 3 0 3 6 4 4
7 0 A vantagem da amostragem sistemtica est no fato de que no necessrio
3 0 4 5 5 5 0 4 3 1 0 5 .3 7 4 3 5 0 8 9 0 usar
4 1 1 8 3 7 4 4 1 0 9 6 2 2 3 4 tbuas de nmeros aleatrios. Como resultado, esse mtodo leva menos tempo do
1 3 1 4 8 que
5 1 6 0 3 5 0 3 2 4 0 4 3 6 2 2 2 3 5 0 o da amostragem casual simples, especialmente quando as populaes so
0 muito grandes.
Do ponto de vista das desvantagens, extrair uma amostra sistemtica implica
admitir
que o fator "posio" na lista dos componentes da populao no introduz vis
Uma tbua de nmeros aleatrios construda com a finalidade de gerar uma nos
srie de nmeros totalmente desprovida de uma "lei de formao". Como resultado,
resultados, isto , no toma a seleo menos aleatria. Se esse aspecto no for levado a
srio, na amostra final podem aparecer mais sujeitos de um tipo do que
o processo de utilizao de uma tbua de nmeros aleatrios produz uma
amostra de outro.
Isso pode ocorrer, por exemplo, quando se extrai uma amostra
no-viesada semelhante produzida pela retirada de nomes, com os olhos vendados, sistemtica de uma
populao de casas, onde as de esquina (por serem geralmente as mais caras do
de um chapu. guar-
teiro) ocupam uma posio fixa; ou, ento, quando os nomes de uma lista
Para extrair uma amostra casual simples por meio de uma tbua de nmeros telefnica
so amostrados por intervalos fixos, pode ocorrer que certos nomes,
vinculados a
problemas tnicos, sejam subestimados.
* N.T.: Ern alguns textos j aparece a expresso amostra Outra variao da amostra casual simples, a amostra estratificada, consiste em
randmica onde "randmica" um apor-
tuguesamento da palavra inglesa random (casual, aleatrio). dividir a populao em subgrupos mais homogneos-estratos-dos quais
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor amostras aleat-
104 DA DESCRIO TOMADA DE DECIS&S Amostras e Populavefes 105
rias, simples, so extradas. Suponham, por exemplo, que desejemos estudar a aceita- gem estratificada, surge uma exceo quando um estrato particular est desproporcional-
o de vrios dispositivos para o controle da natalidade entre os membros de deter- mente bem representado na amostra, tomando-se possvel, assim, uma subanlise
mals
minada cidade. Como as atitudes relativas a controle da natalidade variam com a reli- minuciosa daquele grupo. Tal situao poderia surgir, por exemplo, quando
negros
gio e com a situao scio-econmica, poderamos estratificar nossa populao com norte-americanos, que constituem uma pequena proporo de uma dada populao,
base nessas variveis, e obter, assim, subgrupos cuja homogeneidade maior. Mais so "superamostrados" num esforo de examinar suas caractersticas de maneira
mais
especificamente, suponhamos que fosse possvel identificar, na populao, catlicos, pormenorizada.
protestantes e judeus, bem como classe alta, classe mdia e classe baixa. Nosso proce- Apesar de suas aparentes similaridades, amostras por quota e por estratos so
dimento de estratificao poderia produzir os seguintes subgrupos ou estratos: essencialmente diferentes. Enquanto que os membros de amostras por quotas so
escolhidos atravs do mtodo pelo qual o pesquisador optou, os membros de amostras
protestantes de classe alta estratificadas so sempre selecionados de forma casual, de hbito por meio de uma
protestantes de classe mdia tbua de nmeros aleatrios aplicados lista completa (rol) dos componentes
da
protestantes de classe baixa populao.
catlicos de classe alta Antes de encerrarmos o tpico de mtodos de amostragem, vamos examinar
a
catlicos de classe mdia natureza de uma forma particularmente popular de amostragem casual, conhecida por
catlicos de classe baixa mtodo de conglomerados. Tais amostras so bastante usadas para reduzir os custos
judeus de classe alta de grandes pesquisas, nas quais os entrevistadores devem ser enviados
a locals muito
judeus de classe mdia esparsos, fato do qual decorrem muitas viagens. No emprego do mtodo de
conglome-
judeus de classe baixa rados pelos menos dois nveis de amostragem so empregados:
Tendo identificado nossos estratos, comeamos a colher amostras casuals simples 1.a unidade primria de amostragem ou conglomerado, que corresponde
a algu-
de cada subgrupo ou estrato (por exemplo, de protestantes da classe baixa, de catlicos ma rea bem delineada onde se concentram caractersticas encontradas
na po-
da classe mdia, e assim por diante), at que toda a populao tenha sido amostrada. pulaco toda (por exemplo, estado, comarca, quarteiro, e assim por diante)
e
Em outras palavras, cada estrato tratado, para fins de coleta de amostra, como se 2. os sujeitos amostrados dentro de cada conglomerado.
fosse uma populao completa, e o procedimento de amostragem casual simples
aplicado. Especificamente, cada membro de um estrato recebe um nmero de identi- Para fins ilustrativos, imaginem que quisssemos entrevistar uma amostra
repre-
ficao, arrolado e, a seguir, amostrado por meio de uma tbua de nmeros aleatrios. sentativa de sujeitos que vivem numa rea grande da cidade. Extrair uma amostra casual
0 passo final do procedimento consiste em juntar, num s grupo, os sujeitos seleciona- simples, ou sistemtica ou estratificada de respondentes espalhados numa
grande Area,
dos de cada subgrupo ou estrato, a fim de obter-se uma amostra da populao toda. implicaria muitas viagens, sem mencionar tempo e dinheiro. Se recorrssemos a
amos-
A estratificao baseia-se na idia de que um grupo homogneo requer uma tragem por conglomerados, entretanto, limitaramos nossas entrevistas Agueles sujeitos
amostra menor do que um grupo heterogneo. Por exemplo, estudar os sujeitos que localizados dentro de relativamente poucos conglomerados. Poderamos comear,
por
passam por uma particular esquina do centro da cidade, provavelmente requer uma exemplo, tomando os quarteires da cidade como nossa unidade primria de amostra-
amostra maior do que a necessria para estudar sujeitos que vivem num subrbio de gem ou conglomerado. Seria possvel continuar, ento, arranjando uma lista de
todos
classe mdia. Em geral, encontram-se, no centro da cidade, sujeitos que podem apre- os quarteires abrangidos pela rea, a partir da qual sorteramos uma
amostra casual e
sentar as mais variadas combinaes de caractersticas. Em contraste, as pessoas que simples de quarteires. Depois de ter extrado nossa amostra de quarteires da
cidade,
moram num subrbio de classe mdia so, via de regra, mais semelhantes no que res- selecionaramos os respondentes (ou lares) de cada quarteiro pelo emprego do mesmo
peita a educao, renda, orientao poltica, tamanho da famlia, atitude para com o mtodo casual. Mais especificamente, todos os sujeitos (ou lares) de cada um dos guar-
trabalho-para mencionar apenas algumas caractersticas. teires escolhidos so listados (arrolados) e, com o auxlio de uma tbua de nmeros
Superficialmente, as amostras estratificadas casuals apresentam uma enorme aleatrios, seleciona-se uma amostra de respondentes de cada quarteiro. Atravs do
semelhana com o mtodo de quotas no-casuais, tal como j discutido, uma vez que mtodo de conglomerados, cada entrevistador opta por um dos quarteires j sorteados
ambos os procedimentos requerem, de hbito, a incluso de caractersticas de amostra e contacta alguns respondentes que ali residem.
nas propores exatas com que figuram na populao. Portanto, se 32% de nossa popu- Numa escala mais ampla, o mesmo procedimento de conglomerados pode ser
lao compem-se de protestantes da classe mdia, ento exatamente 32% da nossa aplicado a pesquisas de mbito nacional; para tanto, basta (1) que regies, estados,
amostra devem ser colhidos dentre protestantes da classe mdia; da mesma forma, se parquias sejam tomados como unidades amostrais primrias, sobre as quais incide
11% de nossa populao consiste em judeus da classe baixa, ento 11% de nossa amostra o processo inicial de escolha e (2) que de cada regio, estado ou
parquia seja extrada
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
devem ser constitudos de forma semelhante, e assim por diante. No terreno da amostra- uma amostra aleatria simples-objeto das entrevistas. Desse modo, os entrevistado-
106 DA DESCRIO TOMADA DE DECISES
Amostras e Populaes 107
96
72
94
30
431
X =75,75 =62,25 I = 68,25
FGURA 7.1 Mdia do Tempo de Audio de uma Amostra Aleatria Tirada
M = 71,55 Populao de uma
PDF compression, OCR, web optimization using a watermarked evaluation
Hipottica copy of CVISION PDFCompressor
108 DA DESCRIO TOMADA DE DECISES Amostras e Populaes 109
Medias 421,
111 min 1
110 1
O4"
ids,
109 1 ./e-1 '((s
108 2 'C'
107
qs, ((se)ea,
2
FIGURA 7.2 Mdia do Tempo de Audio, Relativa a 98 Amostras Casuais Sorteadas de uma 106 CZ; r41(
3
Populao Hipottica em que M = 99,75 min. 105
la. o I
4
104 5
mdias amostrais aleatrias que tenham sido extradas da mesma populao. A Tabela 103 6
s' 444
7.2 apresenta, sob a forma de distribuio, as 98 mdias amostrais coletadas pelo nosso 102 8
101 9
pesquisador exantrico. Tal como quando se trabalha com uma distribuio de escores 100 9
brutos, as mdias da Tabela 7.2 foram dispostas consecutivamente, da mais alta mais 99 9
baixa, e suas respectivas freqncias de ocorre'ncia indicadas numa coluna adjacente. 98 8
97 7
Caractersticas de uma Distribuido de Mdias Amostrais 96 6
At este ponto, nab atacamos diretamente o problema da generalizao de amostras 95 5
94 4
para populaes. O modelo terico conhecido por distribuio de mdias amostrais
93 3
(tal como foi ilustrado pelas 98 mdias amostrais obtidas pelo nosso exantrico pes- 92 2
quisador) tem certas propriedades que lhe conferem um papel importante no processo 91 1
amostral de mdias: N = 98
1. A distribuiplo de medias amostrais aproxima-se de uma curva normal. Tal
como graficamente ilustrado na Figura 7.3(a), dispondo as mdias amostrais
da Tabela 7.2 num polgono de freqncia, acabamos obtendo uma distri- Como ilustra a Figura 7.3, a variabilidade da distribuio amostral sempre menor
buio normal. Isto verdade para todas as distribuies de mdias amostrais que a variabilidade da populao toda. Isso verdade porque tomamos escores
mdios
independentemente da forma da distribuio dos escores brutos que consti- (em lugar da totalidade dos escOres brutos que entram na composio dessas mdias), eli-
tuem a populao da qual as mdias foram extradas.1 minando, desta forma, valores extremos. Por exemplo, o escore mdio 100 pode ser ob-
tido a partir dos escores 60, 90, 110 e 140. Assim: (60 + 90 + 110 + 140 =41 = 100).
iIsso pressupe que extrafmos grandes amostras casuais, de igual tamanho, de uma dada populaco Ao levar esses escores brutos a um grfico, inclumos valores que se estendem
de 60 a
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
de escores brutos. 140; entretanto, ao colocar o escore mdio em grfico, obviamente reduzimos a ocor-
110 DA DESCRIO TOMADA DE DECISES A mostras e Populaes Ill
89 M = 99,75 111
(a)
-3 DP -2 DP -1 DP M +1 DP +2DP +3 DP
FIGURA 7.3 Polgonos de Freqncias Relativos a (a) Distribuio de Mdias Amostrais da Tabela L 68,26%-j
7.2 e (b) Populaes das Quais essas Mdias Foram Extradas 95 ,44% I
DP = desvio padro
99,74%
rncia de valores extremos a um Unico valor, 100. Como resultado, esperamos obter
FIGURA 7.4 A Distribuio de Mdias Amostrais Vista Como uma Distribuio de Probabilidades
um desvio padro menor sempre que certa quantidade de escores mdios for agrupada
e levada a grfico.
de uma curva normal, podemos dizer que as probabilidades decrescem medida
que nos
distanciamos da mdia das mdias (isto , da verdadeira media populacional). Isto faz
A Distribuico de Mdias Amostrais Vista como uma Curva Normal sentido porque, como o aluno poder recordar, a distribuio amostral um resultado
Se definirmos probabilidade em termos de freqncia de ocorrncia, como indicado que decorre de diferenas aleatrias entre mdias amostrais (erro amostral). Por essa
no Captulo 6, ento normal poder ser considerada uma distribuio de proba- razo, podemos esperar que, por acaso e puro a maioria das mdias amostrais
bilidades (e pode-se dizer que a probabilidade diminui A medida que caminhamos ao cair perto do valor que representa a verdadeira mdia popuiacional, enquanto que
longo da linha de base, a partir da mdia, em ambos os sentidos). relativamente poucas mdias amostrais cairo longe dela.
Com essa noo, podemos encontrar a probabilidade de obter diferentes escores A Figura 7.4 indica que cerca de 68% das mdias amostrais de uma distribuio
brutos numa distribuio, desde que sejam dados a mdia e o desvio padro. Por exem- amostral caem entre -1 DP e +1 DP, a partir da mdia das mdias (a verdadeira mdia
plo, para encontrar a probabilidade associada A localizao de um indivduo cuja renda populacional). Em termos probabilsticos, podemos dizer que P = 0,68 para qualquer
anual est entre Cr$ 85.000,00 e Cr $ 119.000,00 numa populao de renda media igual mdia amostral que caia nesse intervalo. Da mesma forma, podemos dizer que a proba-
a Cr $85.000,00, e desvio padro igual a Cr $25.500,00, traduzimos o escore bruto bilidade de que qualquer mdia amostral caia entre -2 DP e +2 DP de 0,95 (95 casos
Cr $ 119.000,00 em escore z (+ 1,33) e entramos na Tabela B do fim do livro para obter favorveis em 100), e assim por diante.
a porcentagem da freqncia total que cai entre o escore z (1,33) e a mdia. Essa rea Uma vez que a distribuio amostral toma a forma da curva normal, podemos
contm 40,82% dos escores brutos. Portanto,P = 0,41 (arredondando) de encontrarmos tambm usar os escores z e a Tabela B para calcular a probabilidade de obter qualquer
um sujeito cuja renda anual situa-se entre Cr$ 85.000,00 e Cr$ 119.000,00. Se desejar- media amostral-e no apenas aquelas que so mUltiplos exatos do desvio padro. Dados
mos a probabilidade de encontrar algum cuja renda de Cr $119.000,00 ou mais, a mdia das mdias e o desvio padro da distribuio amostral, o processo
idntico
precisamos ir um passo adiante, subtraindo de 50% o porcentual obtido na Tabela B. ao usado no captulo anterior relativamente a uma distribuio de escores brutos.
A
(Subtramos de 50% porque essa a porcentagem que se localiza de ambos os lados da nica coisa que muda so os nomes.
mdia.) Subtraindo 40,82% de 50%, verificamos que 9,18% caem exatamente em ou Imaginem, por exemplo, que certa universidade divulgue que seus alunos recebem
alm de Cr$ 119.000,00. Portanto, movendo a vrgula duas casas para a esquerda, uma renda anual media (M) de Cr$ 34.000,00. Supondo que temos boas
razes para
podemos dizer que P = 0,09 (9 casos favorveis em 100) de encontrarmos um sujeito questionar a legitimidade dessa afirmao, decidimos test-la com uma amostra
aleatria
de renda igual a ou maior que Cr $119.000,00. de 100 alunos. No processo, obtemos uma mdia amostral de apenas
Cr$ 23.800,00.
Na presente situao, no estamos interessados em obter probabilidades associa- Perguntamos agora: com que probabilidade obteramos uma mdia de Cr$ 23.800,00
das A distribuio de escores brutos. Ao contrrio, encontramo-nos trabalhando com ou menos se a verdadeira mdia populacional fosse, de fato, Cr$34.000,00?
Ser que a
distribuio de mdias amostrais que foram extradas de uma populao total de universidade divulgou a verdade? Ou ser que isso apenas um golpe
publicitrio na
escores, e desejamos fazer afirmaes probabilsticas acerca dessas mesmas mdias. tentativa de aumentar as matrculas ou as doaes? A Figura 7.5 ilustra a Area
para a
Como ilustra a Figura 7.4, j que a distribuio de mdias amostrais toma a forma
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor qual buscamos uma soluo.
112 DA DESCRIO TOMADA DE DECISES A mostras e Populaes 113
Na verdade, j nos distanciamos bastante de nossa posio original. Depois de ter = mdia
discutido a naturezo da distribuio de mdias amostrais, estamos agora preparados ay = erro padro da mdia
para estimar o valor de uma mdia populacional. Com a ajuda do erro padro da mdia,
podemos encontrar o intervalo de valores dentro do qual a verdadeira media populacio- Aplicando a frmula acima ao problema em foco, resulta:
18113 41CA CeATRAL
nal pode cair. Podemos, tambem, estimar a probabilidade com que nossa media popula-
cional realmente caird dentro desse mesmo intervalo (de valores de mdias). Este o
intervalo de confiana de 68% = Cr$ 23.800,00 Cr$ 3.400,00
conceito de intervalo de confrana. = Cr$ 20.400,00 Cr$ 27.200,00
O pesquisador, portanto, afirma que ele tem 68% de confiana de que a rendamdia
da populao composta por esses alunos universitrios de Cr$23.800,00 Cr$3.400,00.
1NTERVALOS DE CONFIANA Em outras palavras, h 68 possibilidades em 100 (P = 0,68) de que a verdadeira mdia
A fim de podermos explorar o procedimento que leva obteno de um intervalo de populacional caia realmente no intervalo de limites Cr$ 20.400,00 e Cr$ 27.200,00
confiana, vamos aprofundar o exame de um exemplo anterior. Suponham que uma (Cr$ 23.800,00 - Cr$3.400,00 = Cr$ 20.400,00; Cr$ 23.800,00 + Cr$3.400,00
amostra aleatria de 100 alunos de certa universidade apresente uma renda anual mdia = Cr$ 27.200,00). Essa estimativa feita a despeito do erro amostral, embora dentro
de Cr$ 23.800,00. Como esses dados resultam de apenas uma amostra aleatria, e no de uma margem de erro (de mais ou menos Cr$3.400,00) e a um nvel de confiana
de toda a populao de alunos, no h uma maneira segura de garantir que essa renda especificado (68%).
mdia reflita, de fato, a renda mdia da populao de alunos da universidade. Como j Os intervalos de confiana podem ser construdos para qualquer nvel de proba-
vimos anteriormente, o erro amostral , no fim das contas, a conseqncia inevitvel bilidade. A maioria dos pesquisadores nEo se sente suficientemente confiante em estimar
de amostrar a partir de populaes. uma mdia populacional sabendo que s h 68 possibilidades em 100 da mesma estar
Sabemos, entretanto, que 68,26% de todas as mdias amostrais aleatrias, numa correta (de cada 100 mdias amostrais 68 cairo dentro do intervalo Cr$ 20.400,00 e
distribuio de mdias amostrais, situar-se-o entre -1 DP e +1 DP, a contar da verda- Cr$ 27.200,00). Como resultado, tornou-se convencional usar um intervalo de confiana
deira mdia populacional. Se estimarmos o desvio padro da distribuio amostral mais amplo , embora menos preciso , mas que assegura com melhor probabilidade o
(ay = Cr$3.400,00), e usarmos a nossa mdia amostral de Cr $ 23.800,00 como uma clculo da estimativa da mdia populacional. O uso do intervalo de confiana de 95%
estimativa da mdia populacional, poderemos estabelecer o intervalo dentro do qual, permite obter esse clculo atravs do qual a mdia populacional estimada com a
com 68 possibilidades em 100 (por arredondamento), a verdadeira mdia populacional certeza de que h 95 possibilidades em 100 de estar-se coireto; e h 5 possibilidades
cair. Conhecido por interval de confiana de 68%, esse intervalo de rendas mdias em 100 de estar-se errado (de cada 100 mdias amostrais, 95 cairo dentro do intervalo).
est ilustrado graficamente no Figura 7.6. Entretanto, mesmo usando o intervalo de confiana de 95%, deve-se ter sempre em mente
O intervalo de confiana de 68% pode ser obtido da seguinte maneira: que a mdia amostral do pesquisador poderia ser uma daquelas cinco mdias amostrais
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
116 DA DESCRIO A TOMADA DE DEC1SES Amostras e Populaes 117
2
2
4 =V8,9 - 7,29
Concluso: temos 95% de certeza de que a verdadeira mdia populacional cai entre 4
4 16 =\/1,61
Cr $ 17.136,00 e Cr$ 30.464,00.
'i 3 9 = 1,27
Vamos resumir, passo a passo, o procedimento que leva obteno do intervalo
EX2 = 89
de confiana de 95% na seguinte amostra casual de escores brutos:
1,27 1,27
0,42
5
2
V10 - 1 3
3
4 PASSO 4: Multiplicar o erro padro da mdia por 1,96.
2
2 Intervalo de confiana de 95% = X 1,96) ox
4 = 2,7 (1,96)(0,42) = 2,7 0,82
3
PASSO 5: Somar e subtrair esse produto da mdia amostral, a fim de obter o intervalo
PASSO 1: Calcular a mdia da amostra. dentro do qual cai a mdia populacional.
2
1
2 -
27
10
49,50% da rea situada de cada lado da curva, a partir do centro (mdia). Dobrando essa
porcentagem, obtemos 99% da rea sob a curva; isso significa que 99% das mdias
amostrais cairo nesse intervalo. Em termos probabilfsticos, de cada 100 mdias amos-
4 = 2,7
3
trais, 99 cairo entre -2,58 DP e +2,58 DP a contar da mdia. Reciprocamente, so-
mente 1 de cada 100 mdias cair fora do intervalo. Em sfmbolos:
EX = 27
intervalo de confiana de 99% = X (2,58) ay , onde
PASSO 2: Calcular o desvio padro da amostra. X = mdia amostral
= erro padro da mdia.
5 25
'EX2 -2 * N.T.: A ttulo ilustrativo foi usada uma amostra pequena. Na prtica, entretanto, um
pesqui-
2 4 sador que use o procedimento acima para calcular um intervalo de confiana deve
trabalhar com,
3
4
9
16 =
'89 - (2,7)2 pelo menos, 30 dados, a fim de garantir a suposio de normalidade na
amostrais. (Ver a discusso da estatstica t no Captulo 8.)
distribuio de medias
Com referncia nossa estimativa da renda media dos alunos universitrios, temos: PASSO 2: Calcular o desvio padro da amostra.
intervalo de confiana de 99% = Cr$ 23.800,00 (2,28) Cr$ 3.400,00
= Cr$ 23.800,00 Cr $ 8.772,00 x2
= Cr$15.028,00 Cr$32.572,00
1 1
de 95% (de Cr$ 17.136,00 a Cr$30.464,00). O intervalo de confiana de 99% abrange 2 4 7,29
a maior parte da area total sob a curva normal e, portanto, um nmero maior de mdias 2 4
4 16 =V1,61
amostrais. Essa faixa mais ampla de escores mdios d-nos maior confiana no sentido
3 9 = 1,27
de termos estimado bem a verdadeira media populacional. Apenas uma nica media
amostral em cada 100 ficar fora do intervalo. Por outro lado, se aumentarmos a nossa EX2 = 89
confiana de 95% para 99%, tambm sacrificaremos o grau de preciso no estabeleci-
mento da media populacional. Mantendo o tamanho da amostra constante, o pesquisa- PASSO 3: Calcular o erro padro da media.
dor deve escolher entre estar correto com maior preciso ou estar correto com maior
confiana. 1,27 1,27
X = 0,42
A fim de resumir passo a passo o procedimento para o clculo do intervalo de 1 V10 - 1
3
2
2
Intervalo de confiana de 99% = 2,7 1,08 = 1,621-I 3,78.
4
3 Temos, assim, 99% de certeza de que a verdadeira media populacional cai entre 1,62
e 3,78.
PASSO 1: Calcular a media da amostra.
ESTIMATIVA DE PROPORES
At aqui, concentramo-nos em procedimentos para estimar mdias populacionais.
No raro, entretanto, o pesquisador procura obter uma estimativa duma proporo
populacional a partir de uma outra proporo resultante do estudo de uma amostra
casual. Uma circunstncia em que isso ocorre com freqencia a chamada prvia eleito-
ral, cujos dados sugerem que certa proporo de votos ir para determinado partido ou
determinado candidato. Quandb um pesquisador de opinio pblica anuncia que 45%
dos votos sero a favor de certo candidato, ele o faz com a convico de que no est
3
100% correto. Em geral, ele tem 95% ou 99% de confiana de que sua proporo esti-
EX = 27 mada cai dentro de certa faixa de propores (por exemplo, entre 40% e 50%).
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
120 DA DESCRIO TOMADA DE DEC1SES
Amostras e Populaes 121
Estimamos propores da mesma maneira utilizada para a estimao de mdias. PASSO 1: Obter o erro padro da proporo.
Todas as estatsticas-inclusive mdias e propores-possuem distribuies amostrais
prprias. Da mesma forma como calculamos h pouco o erro padro da mdia, podemos
agora calcular o erro padro da proporo. Em smbolos: Op =
P (1 - P) 1 0,40(0,60) 0,24
i0,0024 = 0,049
100 100
=
VP(1 - onde
PASSO 2: Multiplicar o erro padro da proporo por 1,96.
= 0,35 2 3
0,55
1 2
5 2
Temos, dessa maneira, 95% de certeza de que a verdadeira proporo populacional nem
PROBLEMAS 4 3
menor que 0,35, nem maior que 0,55. Mais especificamente, em algum ponto entre 5 2
35% e 55% situa-se a porcentagem de alunos universitrios que so favorveis a essa 1. Calcule o erro padro da mdia com a seguinte
1 4
legalizao. H um risco de 5% de estarmos errados; por outras palavras, 5 vezes em cada amostra composta de 30 escores amostrais. 6 6
100 tais intervalos de confiana no contero a verdadeira proporo populacional. 3 1
2 1
Vamos resumir o procedimento que permite estimar uma proporo mediante o
1 3
uso do intervalo de confiana de 95%. Admitamos que a proporo amostral a partir da 1 4
qual nossa estimativa deve ser feita seja da ordem de 0,40 (40% dos 100 sujeitos cairo 2 3
nessa categoria). 3 4
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
122 DA DESCRIO TOMADA DE DECISES
Amostras e Populaes 123
2. Com a mdia amostral do problema 1, calcule (a) o
intervalo de confiana de 95%; informao, (a) calcule o erro padro da proporo e (b) construa um intervalo de
(b) o intervalo de confiana de 99%.
3. Calcule o erro padro da mdia com a seguinte amostra confiana de 95%.
composta de 34 escores: 8. Dadas uma amostra de tamanho 150 e uma propor-o amostral de 0,32,
(a) calcule
o erro padro da proporo e (b) construa um intervalo de confiana de 95%.
10 1
9. Dadas uma amostra de tamanho 200 e uma proporo amostral de
4 8 0,25, (a) calcule
10 7
o erro padro da proporo e (b) construa um intervalo de confiana de 95%.
5 5
5 6
6 10
7 6
3 8
5 7
4 PeO*FRA
4
5
00
5
6 5 It' .A
64
6 4
7 3
5 4
8 5
4 4
2 3
5 6
6 6
1 7
1 1
7 5
8 7
7 8
8 8
8 4
2 5
6 3
5 2
6 6
4 5
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
entre Mdias
No Captulo 7, vimos que uma mdia populacional ou uma proporo podem ser esti-
madas a partir da informaa-o que obtemos de uma Unica amostra. Por exemplo, po-
deramos estimar o grau de anomia em determinada cidade, a proporo de pessoas
idosas economicamente prejudicadas ou a atitude mdia relativa ao problema da segre-
gao racial numa populao de norte-americanos negros.
Muito embora tenha o enfoque descritivo da estimago de mdias e propores
importncia bvia, ele no constitui a atividade principal, nem o objetivo Ultimo do
processo de tomada de decises exercitado pelos pesquisadores. A maioria deles, con-
trariamente, preocupa-se com o problema denominado teste de hiptese, onde esto
envolvidas diferenas entre duas ou mais amostras.
Ao testarem diferenas entre amostras, os pesquisadores fazem perguntas tais
como: (a) Sera que os alemaes diferem dos norte-americanos com respeito obedincia
autoridade? (b) 0 maior ndice de suicdios ocorre entre protestantes ou catlicos?
(c) Sera que o fato de um entrevistador ser branco ou preto interfere na "honestidade"
da resposta de um negro? (d) Sera que politicos conservadores da-o a seus filhos uma
disciplina mais severa que politicos liberais? (Ver Captulo 1.) Observe-se que cada uma
dessas indagaes implica fazer uma comparao entre dois grupos: conservadores versus
liberais, entrevistadores negros versus entrevistadores brancos, protestantes versus
catlicos, alemes versus norte-americanos.
No contexto presente, a hiptese nula pode ser simbolizada da seguinte forma: hiptese experimental que afirma existir uma verdadeira diferena populacional. Em
pesquisa, esse o resultado final sempre esperado. A hiptese experimental estabelece
M1 = M2 , onde que as duas amostras foram colhidas de populaes portadoras de mdias diferentes.
Diz mais: que a diferena obtida do confronto entre as mdias amostrais grande demais
M1 = mdia da primeira populao para ser explicada apenas por erro de amostragem.
M2 = mdia da segunda populao A hiptese experimental relativa diferena entre duas mdias simbolizada
como se segue:
Vamos examinar as hipteses nulas relativas as indagaes h pouco formuladas:
MI M2 , onde
1. Os alemes so nem mais nem menos obedientes autoridade que os norte-
-americanos.
= mdia da primeira populao
2. Protestantes apresentam a mesma taxa de suicdio que catlicos.
3. Respondentes negros so igualmente honestos em suas respostas, quer sejam M2 = mdia da segunda populao significa "no igual")
entrevistados por negros, que por brancos.
Com referncia as indagaes h pouco formuladas, eis como poderiam ser as hipteses
4. As crianas tanto de polticos conservadores quanto de polticos liberais rece-
bem a mesma "dose" de sentido disciplinar. experimentais:
1. Os alemes diferem dos norte-americanos com relao obedincia auto-
Deve-se notar que a hiptese nula no nega a possibilidade de ocorrerem diferen- ri dade .
as entre mdias amostrais. Ao contrrio, ela procura explicar tais diferenas atravs 2. Protestantes e catlicos apresentam diferentes taxas de suicdlo.
da inevitvel presena do erro amostral. De acordo com a hiptese nula, por exemplo, 3. Respondentes negros diferem em suas respostas conforme sejam entrevistados
se descobrirmos que uma amostra aleatria de dentistas do sexo feminino ganha menos por negros ou brancos.
do que uma amostra aleatria dentistas do sexo 4. Polticos liberals diferem de polticos conservadores quanto
masculino (X- = Cr$ 255.000,00), no conclumos, s por isso, que a populao das tido disciplinar imposta aos filhos.
dentistas ganha menos que a populao dos dentistas. Ern lugar disso, tratamos nossa
diferena amostral (Cr$ 255.000,00 - Cr $ 204.000,00 = Cr $ 51.000,00) como um
DISTRIBUIO AMOSTRAL DE DIFERENAS ENTRE MEDIAS
produto de erro amostral-aquela diferena que inevitavelmente surge quanto extramos
uma amostra de uma populao. Como veremos mais tarde, esse aspecto da hiptese No captulo precedente, vimos que as 98 mdias resultantes das 98 amostras colhidas
nula estabelece um elo importante com a teoria da amostragem. pelo nosso excntrico pesquisador puderam ser levadas a grfico, dando origem a uma
distribuio amostral de mdias. De modo anlogo, vamos agora imaginar que o mesmo
HIPOTESE EXPERIMENTAL:* HA DIFERENA ENTRE AS MEDIAS pesquisador exantrico colha no uma, mas duas amostras aleatrias de cada vez, de um
A hiptese nula em geral (embora no necessariamente) estabelecida com a esperana dado universo de pessoas. Suponha-se, por exemplo, que ele colha uma amostra de
de que possa ser rejeitada. Tal afirmao faz muito sentido se atentarmos para o fato de 500 polticos liberais e uma amostra de 500 polticos conservadores. Para testar a hip&
que a maioria dos pesquisadores vive buscando relaes entre variveis. Em outras tese experimental de que os liberais so pais mais ou menos permissivos que os conser-
palavras, eles esto sempre muito mais interessados na busca de diferenas do que na vadores, ele formula perguntas a todos os indivduos componentes das amostras acerca
prova de que elas no existem. Para ilustrar: quem se daria o trabalho de estudar catli- de seus mtodos educacionais (por exemplo: Voc costuma punir seus filhos? Voc
cos e protestantes, quanto sua taxa de suicdio, na esperana de concluir que eles j os espancou? Em caso afirmativo, com que freqncia?). Das respostas a tais pergun-
no diferem? As diferenas entre grupos-sejam elas baseadas em fundamentos tericos tas, o pesquisador obtm uma medida* da permissividade relacionada com a educao
ou empricos-freqentemente fornecem a estrutura lgica para a realizao de um
estudo.
* Seria ingenuidade imaginar que o conjunto de tais perguntas constitui um instrumento
Se rejeitarmos a hiptese nula, ou seja, se concluirmos que a hiptese que antecipa
vlido, capaz de produzir uma medida consistente da varivel "permissividade educacional".
a inexistncia de diferena entre as mdias frgil, automaticamente aceitaremos a fcil de perceber que nada impede-alis tudo favorece!-que esses politicos dem respostas que,
embora contrariando sua postura pessoal, convenham imagem pblica que desejam projetar. No
* N.T.: A hiptese experimental, tambm chamada hiptese alternative, costuma ser indicada se trata, aqui, de "criticar" o instrumento "desse exc'ntrico pesquisador", mas, sim, de alertar o
por Ha (ler "ag-a"). A hiptese nula, tambm chamada hiptese probanda, designa-se por Ho (ler leitor para o fato de que a construo de um instrumento de medida (questionrio ou qualquer
"ag-zero"). outro) implica utilizar tecnologia bastante especial.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
130 TOMADA DE DECISES
Testes de Diferenas entre Medias 131
de crianas, medida essa que pode ser usada na comparao entre a amostra de
liberais Aps ter colhido suas amostras, nosso excentrico pesquisador interroga cada
e a de conservadores. Os escores que resultam desse questionrio variam de 1 (no per- sujeito de cada amostra (isto , 1.000 X 70 = 70.000 pessoas) relativamente ao mtodo
missivo) a 10 (muito permissivo). Como graficamente ilustrado na Figura 8.1, nosso que adota na educao dos filhos; desse levantamento, resulta um escore mdio da
pesquisador excentrico descobre que a amostra proveniente de liberais mais permissiva varivel "permissividade" para cada uma das amostras de liberais e outro escore mdio
(kt = 8,0) do que aquela procedente de conservadores (X = 3,0).
(da mesma varivel) para cada uma das amostras de conservadores. Alm disso, ele
Poderamos perguntar: luz do erro amostral, ser que a diferena entre 8,0 e 3,0 calcula, para cada par de amostras, o escore-diferena das mdias. Por exemplo, se a
(8,0 - 3,0 = +5,0) pode ser estritamente explicada apenas pela ao do acaso? Ser que mdia de permissividade para os liberais for 7,0 e a mdia de permissividade para os
devemos aceitar a hiptese nula (H0) de que no h diferena populacional?* Ou ser conservadores, 6,0, ento o escore-diferena ser +1,0; por igual raciocnio, se a media
que a diferena amostral obtida (+5,0) grande o suficiente para indicar (sugerir) a para os liberais for 5,0 e a mdia para os conservadores, 8,0, o escore-diferena ser
existncia de uma verdadeira diferena populacional entre conservadores e liberais, dife- -3,0. Obviamente, quanto maior o escore-diferena, mais as duas amostras diferem
rena relacionada com suas prticas de educar crianas? com respeito caracterstica pesquisada (isto , permissividade na educao dos filhos).
Aprendemos, no Captulo 2, a interpretar distribuies de freqncias de dados Note-se que sempre subtraimos, para cada amostra, o escore mdio dos conservadores
brutos colhidos numa particular populao. No Captulo 7, vimos que era possvel do escore mdio dos liberais. Os 70 escores-diferenas (resultantes das diferenas entre
construir uma distribuio amostral de escores mdios, bem como uma distribuio de as me dias dos 70 pares de amostras) obtidos pelo nosso pesquisador foram ilustrados
freqncias de mdias amostrais. Focalizando nossa ateno no problema especfico na Figura 8.2.
desse captulo, precisamos ampliar a noo de distribuio de freqncias e examinar Vamos supor que saibamos que a populao de conservadores e a de liberais na
a natureza de uma distribuio amostral de diferenas, isto , uma distribuio verdade no diferem absolutamente com respeito permissividade nos mtodos de criar
de fre-
qncias de um nmero bem grande de diferenas entre mdias amostrais aleatrias que filhos. Digamos que M = 5,0 em ambas as populaes. Se admitirmos que a hiptese
tenham sido extradas de uma dada populao. nula est correta e que liberais e conservadores so idnticos nesse aspecto, poderemos
Para ilustrar a distribuio amostral de diferenas, vamos voltar ao trabalho de usar as 70 diferenas de mdias que o nosso pesquisador obteve para ilustrar a distribui-
nosso pesquisador excentrico cujo amor pela amostragem levou-o, mais uma vez, a
extrair um nmero to grande de amostras que ultrapassa os limites habituais. Em
lugar de extrair uma nica amostra de 500 liberais e outra nica amostra de 500 con- Nota: cada escore re-
presenta a diferena en-
servadores, ele decide extrair 70 pares de tais amostras (70 amostras com, cada uma,
tre (a mdia de) uma
500 conservadores, e 70 outras amostras com, tambm, 500 liberais cada uma). Em amostra de 500 liberais
outras palavras, cada vez que ele extrai 500 conservadores aleatoriamente ele extrai, e (a mdia de) outra
tambm de forma casual, 500 liberais. amostra de 500 conser-
vad ores.
la
FIGURA 8.1 Diferena Entre as Mdias de Permissividade Resultantes de Amostras de Liberais e de
Conservadores (Populao Hipottica)
TA BELA 8.1 Distribuio Amostral das Diferenas Resultantes de 70 Pares de Amostras Aleatrias populao de conservadores e a de liberals for zero, tambm esperamos que a mdia de
uma distribuio amostral de diferenas seja zero.
Diferenas Entre
It- Medias*
TESTES DE HIPOTESES RELACIONADOS COM
+5 1 A DISTRIBUIO DE DIFERENAS
+4 2
+3
Em captulos anteriores, aprendemos a fazer afirmaes probabilsticas acerca da ocor-
5
+2 7
rncia de escores brutos e mdias amostrais. No presente caso, vamos tentar fazer afir-
+1 10 maes de probabilidade com relao aos escores-diferenas da distribuio amostral
0 18 das diferenas mdias. Como j foi salientado anteriormente, essa distribuio amostral
-1 10 assume a forma de uma curva normal e, portanto, pode ser considerada como uma
-2 8
-3 5
distribuirab de probabilidade. Podemos dizer que a probabilidade decresce A. me dida
-4 3
-5 1
N = 70
* Esses escores-diferenas incluem os valo-
res fracionrios. (Por exemplo, -5 inclui os
valores que vo desde -5,0 at 5,9)
Por ser uma curva normal, a maioria das diferenas mdias amostrais desta distri-
buio cai nos arredores de zero-que o ponto da distribuio que tem
freqncia
mxima; h relativamente poucas diferenas mdias em quaisquer das caudas da distri- -3 SD -2 SD -1 SD O +1 SD +2 SD +3 SD
buio. Tal fato de se esperar, uma vez que o conjunto de todas as diferenas da distri-
buio resulta muito mais de erro amostral do que de reais diferenas populacionais L68,26%1
entre conservadores e liberals. Em outras palavras, se a diferena mdia real 95,44%
entre a
99,74%
10 que pressupe
que extraImos aleatoriamente amostras grandes de uma dada populao de FIGURA 8.4 Distribuio Amostral de Diferenas Entendida Como uma Distribuio de Probabi-
Iscores brutos.
lidades
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
134 TOMADA DE DECISES
Testes de Difereneas entre Mdias I 35
que nos afastamos da mdia das diferenas (zero). Mais
especificamente, como ilustra
a Figura 8.4, vemos que 68,26% das diferenas No contexto presente procuramos, de forma semelhante, traduzir a nossa diferen-
mdias caem entre -1 DP e +1 DP, a
contar de zero. Em termos probabilsticos, isso indica que P = a media amostral (+5) em unidades de desvio padro, mediante a seguinte
0,68 de que qualquer frmula:
diferena entre mdias amostrais cair dentro desse
intervalo. De forma anloga, pode-
mos dizer que a probabilidade de aproximadamente
0,95 (95 casos em 100) de que z =
(Xi -X2)-0 , onde
qualquer diferena de mdias amostrais caia entre -2 DP e +2
DP a contar da mdia raw
da distribuio, que zero, e assim por diante.
A distribuio amostral de diferenas oferece uma X = mdia da primeira amostra
slida base para testarmos
hipteses acerca da diferena media entre duas amostras aleatrias. = media da segunda amostra
Suponhamos, por
. exemplo, que uma amostra de 100 liberais tenha um escore "0" = "zero", isto , o valor da media da distribuio amostral de diferenas.
mdio de permissividade
igual a 7 e que outra amostra, tambm de 100 sujeitos,
porm conservadores, apresente (admitimos que M1 M2 = -
media 2. 0 raciocfnio o seguinte: se a diferena mdia que adz = desvio padro da distribuio amostral de diferenas.
obtivemos, 5, resultante
de (7 -
2 = 5), situar-se to longe da diferena "zero" de
maneira a conferir-lhe somente
uma pequena probabilidade de ocorrncia na distribuio J que o valor da mdia da distribuio de diferenas sempre admitido como
amostral de diferenas, rejeita-
mos a hiptese nula, ou seja, a hiptese que afirma ser a diferena sendo zero, podemos eliminar esse valor (0) da frmula acima (escala z) sem alterar o
obtida apenas o resul-
tado da aa-o do acaso.* Se, por outro lado, nossa diferena media resultado. Portanto:
amostral cai to perto
de zero de forma que sua probabilidade de ocorrncia
grande, devemos aceitar a hi-
ptese nula e tratar a diferena obtida como resultante de erro de
amostragem. Z =
-x 2
X = escore bruto
Portanto, a diferena mdia, 5, entre liberais e conservadores situa-se a 2,5 desvios
X = mdia da distribuio de escores brutos
padres, a contar da media zero, na distribuio de diferenas.
a = desvio padro da distribuio de escores brutos.
Perguntamos: qual a probabilidade de que uma diferenca de 5 ou mais entre
Analogamente, podemos traduzir os escores mdios de uma distribuio de medias amostrais ocorra nica e exclusivamente em funco do erro amostral?
mdias Recor-
amostrais em unidades de desvio padro atravs da frmula rendo Tbua B no fim do livro, verificamos que z = 2,5 representa 49,38% da distri-
buio quer para a direita, quer para a esquerda da mdia zero. Em outras palavras,
t7-. 4/ 98,76% (isto , 49,38% + 49,38% = 98,76%) das diferenas mdias amostrais
caem
, onde entre zero e uma diferena mdia de 5 para ambos os lados (a partir da mdia),
ax donde
resultam, como ilustra a Figura 8.5, valores positivos e valores negativos. Em termos pro-
X = mdia amostral
babilsticos, isto significa que existe uma P = 0,99 (99 possibilidades em 100) de que uma
M = mdia da populao (mdia das mdias) -
diferena media caia entre -5 e +5. Se subtrairmos de 100% (100% 98,76% = 1,24%),
encontraremos, por arredondamento, P = 0,01; essa a probabilidade de que uma dife-
0-X = erro padro da mdia (estimativa do
desvio padro da distribuio de
[
rena mdia de 5 (ou maior que 5) entre amostras ocorra nica e exclusivamente por
mdias). causa do erro amostral. Em outras palavras, uma diferena mdia de 5 ou mais
ocorre
por fora do erro amostral (e, portanto, aparece na distribuio amostral) apenas uma
* N.T. : comum usar-se com o mesmo sentido erro vez em cada 100 diferenas mdias. Sabendo disso, no poderamos
amostral e diferenea resultante da aetTo do considerar a rejeio
caso. da hiptese nula e a aceitactio da hiptese experimental? (Lembremo-nos de que a
. hip-
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor tese experimental-lia-estabelece que realmente existe uma diferena
.
populacional
136 TOMADA DE DECISES Testes de Diferenas entre Medias 137
NVEIS DE SIGNIFICNCIA
Para decidir se a diferena amostral obtida estatisticamente significante-resultado de
uma real diferena entre as populaes e nab apenas produto de erro amostral- habi-
tual estabelecer um nvel de confiana (tambm chamado nivel de signifialncia), nvel
esse que representa a probabilidade com que a hiptese nula pode ser rejeitada com
confiana (segurana)*** ou, dizendo de outro modo, a probabilidade com que a hip& FIGURA 8.6 Representao Grfica do Navel de Significncia (Confiana) de
0,05 (isto , 5%)
tese experimental pode ser aceita (com confiana). Em conseqncia, decidimos pela
* N.T.: Sendo de importncia- capital esse aspecto
da teoria da deciso estatfstica, no demais
recolocar a questo nos seguintes fermos: uma diferena entre mdias amostrais
N.T.: Esse ponto de referencia comumente designado valor critico. ocorre (1) porque
existe uma real diferena entre as mdias das populaes de onde foram
N.T.: Um resultado estatisticamente signzficante quando igual a ou maior que o valor extrafdas as amostras ou
(2) porque houve interferencia do erro de amostragem. Se houve erro de
crtico (isto , o ponto de referencia), o qual, via de regra, encontra-se tabelado. amostragem, tudo se passa
como se no existisse diferena entre as mdias amostrais. Esse fenmeno, porm,
relativamente
*** N.T.: Essa confiana ou segurana sempre relativa e no constitui um problema do estats- raro e, por isso, est associada a ele uma probabilidade muito pequena. Em
outras palavras, as reais
thy, seno do especialista na Area ern que determinada pesquisa esteja sendo feita. diferenas no ocorrem por acaso, mas, sim, por fora de um agente especfico.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
138 TOMADA DE DECISES
Testes de Diferenas entre Mdias 139
rena amostral encontrada deva-se apenas ao do acaso, isto , do erro de amostra- amostras pareadas, a fim de tornar possvel o seu clculo. Contudo, essc dcsvio padro
gem. O nvel de 0,01 representado pela rea que se estende de -2,58 a +2,58 desvios desempenha um importante papel nos testes de hipteses relacionados com diferenas
padres contados a partir de zero. entre mdias e, portanto, no pode ser ignorado.
Os nveis de confiana no nos oferecem garantia absoluta quanto correo da Felizmente, existe um mtodo simples atravs do qual o desvio padro da distri-
hiptese nula. Sempre que decidimos rejeit-la a um certo nvel de significncia, expo- buio de diferenas pode ser estimado de forma acurada com base nas duas amostras
mo-nos ao risco de estar tomando a deciso errada. Rejeitar a hiptese nula quando extradas. Essa estimativa do desvio padro da distribuio amostral de diferenas
deveramos t-la aceitado ocasiona o chamado erro alfa (ou erro tipo l). A probabilidade costuma ser designada erro padrab da diferena e simbolizada por cif Em smbolos:
de cometer um erro alfa s existe quando rejeitamos* a hiptese nula e varia de confor-
midade com o nvel de confiana adotado. Por exemplo, se rejeitarmos a hiptese nula,
dif = OX
- 2
UX
- 2
2
, onde
ao nvel de 5%, e concluirmos que conservadores de fato diferem de liberals quanto aos
mtodos de criao de filhos, haver 5 possibilidades em 100 de estarmos errados. Em
outras palavras, P = 0,05 de que cometamos um erro alfa-e conservadores no diferem adif = erro padro da diferena
realmente de liberais. De modo anlogo, se escolhermos o nvel de confiana (signifi-
ai = erro padro da primeira media amostral
cncia) de 1%, se:, h 1 possibilidade em 100 (P = 0,01) de tomarmos a deciso errada 2 = erro padro da segunda media amostral.
quanto diferena entre liberais e conservadores. bvio que, quanto mais rzgoroso o
Com o propsito de ilustrar, vamos supor que obtivemos os seguintes dados para
nosso nvel de confiana, menor a probabilidade de cometermos um erro alfa. (Note-se,
uma amostra de 50 liberais e outra amostra de 50 conservadores:
tambm, que, quanto mais rigoroso o nvel, mais na "ponta" das caudas ele se localiza.)
Para exemplificar com um caso extremo, se adotarmos o nvel de 0,001, o risco de
Liberais (N = 50) Conservadores (N =50)
ocorrncia de um erro alfa fica limitado a uma vez em cada mil.
Entretanto, quanto mais nas pontas das caudas localizar-se o nvel de significncia, X = 7,0 = 6,0
maior o risco de estarmos cometendo outro tipo de erro, conhecido por erro beta (ou s = 2,0 s = 1,5
erro tipo II). assim que se designa o erro de aceitar a hiptese nula quando, na verda-
de, ela deveria ter sido rejeitada. O erro beta indica que a nensa hiptese experimental A fim de calcular o erro padro da diferena, precisamos,.primeiro, encontrar o
ainda pode estar correta, apesar da deciso de rejeit-la em favor da hiptese nula. erro
padro para cada media amostral. Recorde-se que isso se faz a partir do desvio padro
Uma forma de reduzir o risco de cometer este tipo de erro beta aumentar o tamanho das de cada amostra (ver Captulo 7):
amostras, de sorte que, havendo uma real diferena entre as populaes, tal fato fique
mais evidenciado pelo procedimento.**
Nunca podemos estar certos de que no tomamos uma deciso errada relativamen-
te hiptese nula, j que examinamos apenas uma amostra e no a populao toda.
(TY'
s
- 1 \/50
2,0
- 1
= -
2,0
7,0
= 0,29
- 1 V50
1,5
- 1
= -
1,5
7,0
= 0,21
Uma vez que conheamos o ai para cada media amostral, podemos obter o ad,f como
ERRO PADRO DA DIFERENA se segue:
-
141
z -
17172
=
7 -6 - 1
= 2 86 Homens (N =35) Mulheres (N =35)
0dif 0,35 0,35 '
Xl X2 X2
/
1
1
4
1
2
4
4
16
1
1
zero. (Em outras palavras, 49,79% + 49,79% = 99,58%) Se subtrairmos essa soma 1 1 1
2 4 1 1
de 100%, veremos que menos de 1% (0,42%) dos escores-diferenas entre mdias possui 1 1 1 1
um valor igual ou superior a 1. Portanto, P menor que 0,01 de obtermos uma diferena 1 1 1 1
mdia igual a 1 por puro acaso (= erro de amostragem). Podemos rejeitar a hiptese 1 1 5 25
nula tanto ao nvel de significncia de 0,05 quanto ao de 0,01 dependendo, apenas, do 1 1 1 1
2 4 2 4
critrio estabelecido para o nosso estudo.*
4 16 2 4
5 25 1 1
1 1 1 1
Ulna Ilustrao 1 1 1 1
Com vistas a dar ao leitor uma ilustrao passo a passo do procedimento (acima) que 2 4 1 1
1 2
permite testar a significncia da diferena entre duas mdias amostrais, vamos imaginar 1 4
2 4 3 9
que, ao nvel de 0,05, quisssemos pr prova a seguinte hipbtese: do ponto de vista 1 1 1 1
etnocntrico, no h diferena entre homens e mulheres (M1 = M2). Nossa hiptese 2 4 1 1
experimental que as mulheres diferem dos homens com respeito ao etnocentrismo 2 1 1 1 1
(M1 M2 ). Para testar essa hiptese, vamos imaginar que "aplicamos" um instrumento 1 1 2 4
destinado a avaliar a varivel "etnocentrismo" a uma amostra aleatria de 35 homens e 1 1 2 4
1 1 2 4
a outra amostra, tambm aleatria, de 35 mulheres, obtendo os seguintes escores para
3 9 1 1
cada uma delas (X = escores etnocntricos. A escala vai de 1 a 5 e quanto maior o valor 3 9 1 1
maior o grau de etnocentrismo.) if*
EX -=
-1
60 EX2 = 142
1
16
EX -=
1
54 EX2 = 114
1
1
1
1
1
1
1
1
- =
IX1
- 60
- 1,71
1 1 2 4
2 4 1 1
1
1
1
1
1
1
1
1
X2 - 1X2
N
- 35
1,54
3 9 3 9
3 9 1 1 PASSO 2: Achar o desvio padro de cada amostra.
PASSO 3: Achar o erro padro de cada mdia. que contm pequeno nmero de respondentes (ou de dados). Do ponto de vista prtico,
uma amostra pode ser considerada pequena se contiver, por exemplo, menos de 30
07 1 07
- 1
V34
=
5,83
- 0 18
'
sujeitos. Embora os resultados baseados em amostras pequenas possam ser convenientes,
se no necessrios, dada a dificuldade de colher amostras maiores, eles podem
com-
prometer de forma sria as concluses, se sua interpretao for associada rea sob a
S2 0,94 0,94 curva normal (Tabela B). Esta afirmao verdadeira porque a distribuio amostral de
= = 0'16
- 1 N/34 = 5,83 diferenas s assume a forma da curva normal se as amostras que a compem forem
grandes. Um pesquisador que esteja trabalhando com 5, 10 ou 20 respondentes por
PASSO 4: Achar o erro padro da diferena. amostra no tem condies de satisfazer ta1 exigncia. Como resultado, ele no pode
usar escoresz baseados na distribuio normal.
adif = N/o,17,2 + a.7722 = \/(0,18)2 + (0,16)2 = N/0,03 + 0,03 = V0,06 Esse "afastamento da normalidade" na distribuio de diferenas pode ser com-
pensado estatisticamente mediante o uso do que se convencionou chamar razo t (ou
= 0,25 estatistica t). Tal como ocorre com o escore z, a razo t pode ser usada para traduzir
uma diferena mdia amostral em unidades de erro padro da diferena. Ainda com a
PASSO 5: Traduzir a diferena mdia amostral em unidades de erro padro da diferena. escala z como pano de fundo, a razo t pode ser analogamente obtida da seguinte
forma: calcular a diferena entre as mdias das amostras e dividi-la pelo erro padro
Z - - X2 1,71 - 1,54 0,17
0,68 da diferena. Em smbolos:
0dif 0,25 0,25
X1 X2
PASSO 6: Achar a porcentagem da rea total sob a curva normal entre z e a mdia das t = , onde
diferenas (0). (Ver Tabela B.) 0chf
Para testar essa hiptese, o pesquisador estabelece 5% como nvel de significncia; PASSO 2: Achar o desvio padro de cada amostra.
por outras palavras, ele decide, desde o incio, rejeitar a hiptese nula somente se a
probabilidade for de 5 em 100* de que a diferena mdia amostral resulte de erro de VXX2
amostragem (isto , por ao do acaso). Depois de ter estabelecido esse critrio de signi- A/ 6 N/2,00 - 1,77 = = 0,48
ficncia, ele colhe duas amostras aleatrias de doadores potenciais. A todos os membros
de ambas as amostras ele solicita donativos, em dinheiro, para distribuio aos sobrevi- /125
ventes de um terremoto de grandes propores. Aos 6 membros da primeira amostra ele
S2 =
V 6
(4,50)2 = N/20,83 - 20,25 = N5F3 = 0,76
d a garantia do anonimato; aos 6 membros da segunda amostra ele promete tornar
pblicos os seus nomes. Temos, a, as condies experimentais de anonimato versus PASSO 3: Achar o erro padro de cada mdia.
identidade conhecida.
0,48
As quantias** doadas pelos membros de ambas as amostras figuram no quadro - 0,48
abaixo: - - 1 - 2
= 0,21
* N.T.: Cumpre salientar que o ravel de significncia de 5%, tal como foi estabelecido, a proba- r- = = 0,34
bilidade mxima tolerada, mas nada impede que esse nvel seja efetivamente menor que o estabele-
V5 2,24
cido. Maior que no pode!
** N.T.: No texto original, as quantias figuram em dlares (USS). Tendo em mente aproveitar o PASSO 4: Achar o erro padro da diferena.
exemplo, que foi muito bem concebido, a unidade monetria (USS) foi eliminada, de sorte que
1, 2, 3, 4 e 5 podem significar qualquer quant, em qualquer moeda, desde que seja respeitada a Voi12 + Gri22 = V(0,21)2 + (0,34)2 = V0,04 + 0,12 = f0-,176- = 0,40
paridade cambial.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
146 TOMADA DE DECISES Testes de Diferenas entre Medias 147
onde
PASSO 5: Traduzir a diferena mdia amostral em unidades de erro padro da diferena.
si = desvio padro da primeira amostra
Ati - 1
'
33 - 4,50
=
3,17
- 0,40 =
S2 = desvio padro da segunda amostra
CilliVERSIDADE
FEDERAL
adif 0,40 = tamanho da primeira amostra BLEILIOTECil
DO
N2 = tamanho da segunda amostra. CENTRAL PARA
At agora, temos trabalhado com amostras que contm exatamente o mesmo nnmero 1 1 4 16
de respondentes ou de dados. Na ilustrao anterior, por exemplo, cada amostra con- 2 4 1 1
7
-
EX2 = 15
9
1 1
2
2
1
4
4
e outra de 22 mulheres. Para que seja possvel fazer comparaes entre amostras de 1 1
tamanhos diferentes, precisamos encontrar uma forma de atribuir peso adequado EX2 = 12 EX2 = 28
influncia de cada amostra. No caso de X, isso ocorre automaticamente, uma vez que
sempre dividimos EX por N. Tal, porm, no se aplica ao erro padro da diferena: cada
O procedimento para testar essa hiptese pode ser ilustrado como se segue:
desvio padro amostral-em que se baseia o adif-"contribui" da mesma maneira na
f6rmula aprendida pginas atrs, muito embora diferenas grandes e importantes, ligadas
PASSO 1: Calcular a mdia de cada amostra.
ao tamanho da amostra, possam estar presentes.
Esse problema pode ser contornado mediante o emprego da frmula do erro
padro da diferena, em que a influncia relativa de cada desvio padro pode ser ponde- = 1,75
ra da em termos do respectivo tamanho da amostra. Essa frmula figura a seguir:
PASSO 2: Calcular o desvio padro de cada amostra. mens vs. mulheres", "negros vs. brancos", "liberais vs. conservadores". Antes de pas-
sarmos para outro tpico, precisamos introduzir uma ltima variao de procedimento
estatstico para a comparao de duas mdias. Estamos falando do procedimento
- 3,06 = V3,75 - 3,06 = NATO. = 0,83 chamado painel ou antes-e-depois: trata-se de mensurar a mesma amostra em dois
momentos distintos (momento 1 vs. momento 2). Por exemplo, um pesquisador pode
querer medir a varivel "hostilidade" numa mesma amostra de crianas em dois mo-
278
2,92 = N/4,00 - 2,92 = ./T,F3 = 1,04 mentos distintos: antes e depois de terem assistido a um particular programa de tele-
viso. Da mesma forma, poderamos querer medir "diferenas atitudinais" com refe-
PASSO 3: Calcular o erro padro da diferena. rncia a um determinado candidato em dois momentos tambm distintos: antes e
depois da campanha eleitoral.
11.9 +12 N+ 2Ns 222 ) (N11 N12) V( 4(0,483+)2 7(%04)2) Para ilustrar, passo a passo, esse procedimento comparativo (antes-e-depois),
vamos supor que diversos sujeitos tenham sido desapropriados e forados a mudar
de residncia em virtude da construo de um novo elevado. Como pesquisadores
.\/( 2,76 +9 7,56) sociais, temos interesse em determinar o impacto da mobilidade residencial forada
(0,25 + 0,14) = - 1(19-z9 (0,39) = N/1,15k0,39) sobre os sentimentos de "vizinhana" (isto , se havia, por parte dos mesmos sujeitos,
k 9
predisposio favorvel para com os vizinhos antes da mudana e se essa predisposio
- NAT,,T3- = 0,67 sofreu alterao depois dela). Nesse caso, ento, M1 o escore mdio de "aceitao
dos vizinhos" no momento 1 (antes da mudana) e M2 o escore mdio de "aceitao
PASSO 4: Traduzir a diferena mdia amostral em unidades de erro padro da diferena. dos vizinhos" (outros, naturalmente) no momento 2 (depois da mudana). Portanto:
t =
Yet - X., 1,75 - 1,71 0,04
- 0,06
Hiptese Nula: 0 grau de "aceitao dos vizinhos" no sofre influncia da varidvel
craa 0,67 0,67 011 = M2) "mudana forada".
PASSO 5: Achar o nmero de graus de liberdade. Hiptese Experimental: 0 grau de "aceitao dos vizinhos"-sofre influncia da vania-
(111 *M2) vel "mudana forpada':
gl = + N2 - 2 = 4 + 7 -2 = 9
Para testar o impacto da mudana forada sobre os sentimentos de "vizinhana",
PASSO 6: Comparar a razo t obtida com a razo t tabelada (Tabela C). entrevistamos uma amostra aleatria* de 6 sujeitos, antes e depois da mudana. De
nossas entrevistas resultam os seguintes escores de "aceitao dos vizinhos" (escores
mais altos, numa escala de 1 a 4, indicam maior aceitao):
razo t obtida (t observado) 0,06
razo t tabelada (t crtico) 2,262
Antes da Depois da
gl = 9
Mudana Mudana Dzferena (Dtferena)2
0,05
Respondente Xi X2 X1 - X2 = D D2
Como indica o passo 6, para rejeitarmos a hiptese nula ao nvel de 0,05, com Estvo 2 1 1 1
9 graus de liberdade, nosso t calculado deve ser igual a 2,262 ou maior. Posto que Mrian 1 2 1 1
obtivemos um t calculado de apenas 0,06, devemos aceitar a hiptese nula e rejeitar Carolina 3 1 , 4
a hiptese experimental. Nossos resultados no sustentam a opinio de que crianas Linda 3 1 2 4
ilegras e crianas brancas diferem significativamente com respeito varivel "tendncia
Para a criminalidade".
Alan
Davi
-
= 14
1
EX2 =
-
2
1
8
1
3
ED2 = 20
1
9
Nessa frmula,
A rim de que seja possvel rejeitar a hiptese nula ao nvel de 0,05, com 5 graus
de liberdade, devemos obter um t observado de 2,571. Como o nosso t observado
s = desvio padro da distribuio de escores-diferenas antes/depois
igual a 1,47-menos do que o t crtico- aceitamos a hiptese nula e rejeitamos a hip&
D= diferena resultante da subtrao do "escore depois" do "escore antes" tese experimental. A diferena amostral obtida relativamente a "sentimentos de vizi-
N= tamanho da amostra (nmero de respondentes). nhana" antes e depois da mudana fruto, na verdade, de puro erro amostral.
PASSO 1: Calcular a media de cada momento. REQUISITOS PARA O USO DO ESCORE z E DA RAZO t
Como teremos a oportunidade de ver ao longo de todo o restante do livro, todos os
Tc, = 1,X - 14
= 2 33 testes estatsticos, para poderem ser usados, devem preencher certos requisitos. Quando
N 6 '
mais no for, pelo menos deve ser possvel admitir certas condies. O emprego de um
1X2 8 teste inadequado pode confundir e levar o pesquisador a falsas concluses. Por isso, os
N 6 '
seguintes requisitos devem ser rigorosamente observados sempre que cogitemos de usar
os escores z ou a razo t como testes de significncia:
PASSO 2: Calcular o desvio padro da diferena entre os escores colhidos nos mo- 1. comparacdo entre duas mdias. O escore z e a razo t so empregados a
mentos 1 e 2.
fim de possibilitar: (a) comparao entre duas mdias de amostras (aleatrias)
independentes; (b) comparao entre as mdias de dois conjuntos de escores
20 / 20
(Xi X2)
2
- 6
(2,33 - 1 33)2 =
A/ 6
1
'
00 relativos mesma amostra, porm colhidos em momentos distintos.
1
2. Dados Intervalares. Admitimos, aqui, que os nossos dados pertencem ao nvel
intervalar de mensurao. Portanto, no podemos usar escores z ou razo t
= 0,33 - 1,00 = V2,33 = 1,53
com dados ordinais ou dados que s possam ser categorizados, como o que
ocorre no nvel nominal de mensurao (ver Captulo 1).
PASSO 3: Calcular o erro padro da diferena.
3. Amostragem aleatria (casual). As nossas amostras devem ser sempre colhidas
1,53 1,53 aleatoriamente.
= = 0,68
(Td if
- 1 N/6 - 1 2,24 4. Distribuica-o normal. O emprego da razo t em amostras pequenas pressupe
que a varivel observacional,(na amostra) tenha distribuio normal na popula-
PASSO 4: Transformar a diferena mdia amostral em unidades de erro padro da o. O escore z, em amostras grandes, no muito afetado se esse requisito
diferena. no for respeitado. Geralmente, no temos 100% de certeza de que existe nor-
malidade de distribuio. No havendo razo para supor o contrrio, muitos
t
- x2 2,33 - 1,33 1,00
= 1,47
pesquisadores admitem pragmaticamente que a varivel observacional tenha dis-
Crdif 0,68 0,68 tribuio normal. Entretanto, se o pesquisador tiver boas razes para suspeitar
de possvel no-normalidade, aconselhamo-lo a no dar preferncia ao teste t
PASSO 5: Achar o nmero de graus de liberdade. (ver Captulo 6).
mdias amostrais. Com esse propsito em mente, descrevemos e ilustramos uma distri-
buio de diferenas entre mdias amostrais como uma distribuio de probabilidades. Amostra 1 Amostra 2
Com o auxilio dessa distribuio e do erro padro da diferena, foi possvel fazer afir-
maes de probabilidade acerca da diferena mdia; a partir da, foi tambm possvel 8 1
3 5
rejeitar ou aceitar uma hiptese nula a um especfico nvel de confiana (ou nvel de
1 8
significncia). Alm disso, vimos que uma estatstica t (razo t), associada a graus de 7 3
liberdade, podia ser usada para testar hipteses relacionadas com diferenas entre 7 2
pequenas amostras e entre amostras de tamanhos diferentes e, ainda, para testar a 6 1
tstica t depende de certos requisitos, tais como: (1) comparao entre duas mdias;
(2) dados intervalares;* (3) amostragem aleatria e (4) distribuio normal dos dados. 4. Dadas as duas seguintes amostras aleatrias de escores, testar a significncia da
diferena entre suas mdias:
Amostra 1 Amostra 2 11. Testar a significncia da diferena entre mdias, numa situao do tipo "antes-
-depois", com os seguintes escores componentes de amostras aleatrias:
5 10
7 7
7 9
Respondente Antes Depois
3 9
A 7 3
6 7
B 6 4
5 8
C 5 2
4
D 4 3
6
7
8. Testar a significncia da diferena entre as mdias das seguintes amostras aleatrias 1 2. Testar a significncia da diferena entre mdias, numa situao do tipo "antes-
de escores: -depois", com os seguintes escores componentes de amostras aleatrias:
3 7 A 6 3
6 8 7 4
4 8 10 9 tillul/ERSIDADE
2 9 9 7
9 8 5 FEDiR44
BIBLIOTECA
6 /JO Plifi4
5
C4ITRAt
9. Testar se a diferena entre as mdias dos escores que comp:5m as duas seguintes
amostras aleatrias significante:
A mostra I Amostra 2
10 10
4 10
1 8
2 7
4
8
3
5
10. Antes e depois de assistirem a um filme, cujo objetivo era aliviar a discriminao
contra grupos minoritrios, seis estudantes foram testados. A vafivel observa-
cional era "atitude para com judeus", e
quanto maiores fossem os escores, mais
Estudantes Antes Depois
favorveis seriam as atitudes. Com os dados
abaixo, testar a hiptese de que, com rela- A 2 4
o s "atitudes", o filme no exerceu B 2 5
a menor influncia sobre os estudantes. C 4 3
D 6 8
E 7 9
F 5 8
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
16.-
Anlise de Varincia 157
E.")
e seus dois componentes, temos as seguintes notaes: SSt = soma total de quadrados,
<cu SSe = soma de quadrados entre grupos, e SSd = soma de quadrados dentro dos grupos.
o.
t
X -X 2 variao entre grupos Vamos imaginar que de fato entrevistamos amostras aleatrias de quatro conser-
vadores, quatro moderados, quatro liberais e quatro radicais com vistas a determinar
adif variao dentro dos grupos
seus mtodos de educar crianas. Imaginemos, ainda, que os valores obtidos para per-
missividade sejam os constarnes da Tabela 9.1 (onde a varivel permissividade assume
De modo similar, a anlise de varincia comporta uma razo F, cujo numerador valores que vo de 1 (pouca) at 5 (muita).
representa a variao entre os grupos comparados, e cujo denominador contm uma
estimativa da variao dentro desses grupos. Como veremos, a estatstica F (razo F) in- Soma de Quadrados Dentro dos Grupos
dica o tamanho da diferena entre os grupos em funco do tamanho da variao dentro de A soma de quadrados dentro dos grupos d-nos a soma dos quadrados dos afastamentos
cada grupo. Da mesma forma como era verdade para a estatstica t, quanto maior de cada valor bruto com relao media da amostra a que ele pertence. Portanto, a
a
estatstica F (quanto maior a variao entre os grupos com relao variao dentro dos soma de quadrados dentro dos grupos pode ser obtida simplesmente pela combinao
grupos), maior a probabilidade de rejeitar-se a hiptese nula e aceitar-se a hiptese da soma de quadrados dentro de cada amostra. Em smbolos:
experimental.
SSd = Ex? + Ex3 + Ex3 + Exi , onde
SOMAS DE QUADRADOS
x = afastamento (discrepncia) obtido a partir de (X - X).
No mago da anlise de varincia est o conceito de soma de quadrados, que
representa
o passo inicial para medir a variao total e a variao entre e dentro dos Aplicando a formula SSd aos dados da Tabela 9.1, obtemos:
grupos. Pode
ser at uma agradvel surpresa descobrir que somente o ttulo "soma de quadrados"
novidade para ns. O conceito em si foi introduzido no Captulo 5 como sendo um SSd = 1,00 + 2,00 + 0,74 + 2,74 = 6,48.
passo importante no procedimento para a obteno do desvio padro. Naquele
con-
texto, aprendemos a encontrar a soma de quadrados multiplicando, numa dada distribui- Soma de Quadrados Entre Grupos
o, cada discrepncia por si mesma, somando, em seguida, os valores resultantes A soma de quadrados entre grupos representa a soma dos quadrados dos afastamentos
(Ex2).
Esse procedimento eliminou os sinais negativos, ao mesmo tempo que forneceu de cada mdia amostral com relao media total. De acordo com o que precede,
uma
base matemtica slida para o desvio padro. devemos determinar a diferena entre cada mdia amostral e a mdia total (X -
Xt),
Quando aplicado a uma situao em que grupos devem ser comparados, h mais elevar essa diferena ao quadrado, multiplic-la pelo nmero de valores da amostra e,
de um tipo de soma de quadrados, muito embora cada um deles represente a soma por fim, somar tudo. A frmula decorrente da definio de soma de quadrados entre
de
afastamentos, ao quadrado, a partir da mdia. Confonne a distino entre variao total
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor grupos
160 TOMADA DE DECISES
Andlise de Varidncia 161
O procedimento para encontrar a soma de quadrados entre grupos, relativamente aos A soma total de quadrados pode tambm ser definida em termos da equao
dados da Tabela 9.1, figura logo abaixo do quadro.*
SSt = E (X - ft)2, onde
TABELA 9.1 Valores para Permissividade Relacionada com a Educao de Crianas, Obtidos de X = um valor bruto de qualquer aniostra
Amostras de Conservadores, Moderados, Liberais e Radicais
Xt = mdia total (mdia de todos os valores brutos originrios de todas as
amostras combinadas)
Conservadores (N =4) Moderados (N =4) SSt = soma total de quadrados.
x, X2 X2 X X2
Usando a frmula anterior, subtramos a mdia total (ft) de cada valor bruto do estudo
1 - 0,50 0,25 1 - 1 1 (X), elevamos ao quadrado os desvios (afastamentos) resultantes, somando-os em
2 0,50 0,25 3 1 1 seguida.
- 0,50 0,25 2 0
Para os dados da Tabela 9.1, vem:
2 0,50 0,25 2 0 0
=6 Ex2 =1,00 EX= 8 Ix2 =2,00 SSt = (1 - 1,75)2 + (2 - 1,75)2 + (1 - 1,75)2 + (2 - 1,75)2 + (1 - 1,75)2
+ (3 - 1,75)2 + (2 - 1,75)2 + (2 - 1,75)2 + (1 - 1,75)2 + (2 - 1,75)2
Xi = 1,5 X2 =-1* = 2,0 + (2 - 1,75)2 + (2 - 1,75)2 + (3 - 1,75)2
+ (2 - 1,75)2 + (1 - 1,75)2 + (1 - 1,75)2
Liberais (N =4) = + (0,25)2 + (- 0,75)2 + (0,25)2 + (- 0,75)2 + (1,25)2
(- 0,75)2
Radicais (N =4)
+ (0,25)2 + (0,25)2 + (- 0,75)2 + (0,25)2 + (0,25)2 + (0,25)2
X3 X X2 x2 + (1,25)2 + (0,25)2 + (- 0,75)2 + (- 0,75)2
- 0,75 0,56
= 0,56 + 0,06 + 0,56 + 0,06 + 0,56 + 1,56 + 0,06 + 0,06 + 0,56 + 0,06
1 3 1,25 1,56
2 0,25 0,06 2 0,25 0,06 + 0,06 + 0,06 + 1,56 + 0,06 + 0,56 + 0,56
2 0,25 0,06 1 - 0,75 0,56 = 6,96
2 0,25 0,06 1 - 0,75 0,56
EX =7 1,2 = 0,74 EX =7 ax2 =2,74 Clculo das Somas de Quadrados
As frmulas decorrentes das definies de somas de quadrados para valores intra-grupos,
X3 =2,r = 1,75 4 4 = 1,75
4
valores inter-grupos e valores totais baseiam-se na manipulao de afastamento, o que
toma o processo trabalhoso e demorado. Felizmente, podemos, ao invs, empregar as
It = 1,75
firmulas abaixo, muito mais simples, para obter um resultado na forma de estatstica F,
a qual idntica (excetuados os erros de arredondamento) que se obtm com as
SSe = (1,50 - 1,75)2 4 + (2,0 - 1,75)2 4 + (1,75 - 1,75)24 + (1,75 -
1,75)24 frmulas decorrentes das definies, de natureza mais complexa.
= (-
0,25)2 4 + (0,25)2 4 + (0)4 + (0)4 = (0,06)4 + (0,06)4 + (0)4 + (0)4 Os valores brutos da Tabela 9.1 foram transcritos na Tabela 9.2 com o propsito
= 0,24 + 0,24 = 0,48
de ilustrar o uso das frmulas abreviadas para a soma de quadrados.
A frmula abreviada que permite calcular a soma total de quadrados a seguinte:
* N.T.: Por comodidade, N o mesmo para todas as amostras, isto 6, o nmero de elementos
(EX02
(sujeitos, dados) no varia de uma para outra. Isso no absolutamente necessrio, porm muito SSt = EX2t , onde
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
conveniente, e o tipo de coisa bastante controlvel pelo pesquisador.
Nt
162 TOMADA DE DECISES
Anlise de Varincia 163
-
Introduzindo os dados da Tabela 9.2 nessa frmula resulta:
4
(8)2
4
012
4
(7)2
4
(28)2
16
-+ - + 49- + 49- -
36
4
64
4 4 4
784
16
4 +4 +4 +4
- (28)2
- -=
784 = 9,0 + 16 + 12,25 + 12,25 - 49,0 = 49,5 - 49,0 = 0,50
= 56
16
= 56
16
56 - 49 = 7
Posto que a soma de quadrados intra-grupos constitui a parte mais demorada
TABELA 9.2 Valores para Permissividade Relacionada com a Educao de Crianas, Obtidos de para ser calculada, podemos tirar vantagem do fato de que a soma total de quadrados
Amostras de Conservadores, Moderados, Liberais e Radicais igual soma de seus dois componentes. Portanto,
1
X = escore bruto de qualquer amostra
1 3 9
2 4 2 4
N = o nmero total de escores de qualquer anostra.
2 4 1 1 Introduzindo os dados da Tabela 9.2, resulta:
2 4 1 1
A soma de quadrados entre grupos pode ser obtida mediante a seguinte frmula: = (10 - 9,0) + (18 - 16,0) + (13 - 12,25) + (15 - 12,25)
= 1,0 + 2,0 + 0,75 + 2,75 = 6,50
SS, y (IX)21 (1Xtotal )2
onde
N J Ntota I
X3 x2
TABELA 9.3 Quadro-resumo de Anlise de Variincia (Resumo Ligado aos Dados da Tabela 9.2)
110 12100
Ponta de Variao gl SS MS 100 10000
90 8100
Entre grupos 3 0,50 0,17 0,31 100 10000
Dentro dos grupos 12 6,50 0,54 85 7225
EX = 485 EX2 =47425
Hipelese Nula: As classes alta, media e baixa no diferem significativarnente com res- PASSO 1 : Calcular a mdia de cada amostra.
peito ao QI (Mi = M2 = M3).
1X
* N.T.: a) A raztio F ou a estatstica F que se obtm a partir de um conjunto de dados, e que o 1;VC2
Autor chama de calculada, costuma ser tambm denominada "Fo" (F observado). b) As razes F
que figuram na Tabela D so tambm chamadas "Fc" (F crticos). Observe-se que a rejeio de
627 572 485
urna hiptese nula em favor de uma hiptese experimental (ou alternativa) ocorre sempre que 5 5 5
F0 Fe. - 125,4 - 114,4 = 97,0
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
164 TOMADA DE DECISES Anlise de Varkincia 165
que N = 200 produzir uma SS maior do que quando N = 20. Como resultado, a soma
de quadrados no pode ser considerada como uma medida de variao "pura"
inteira-
mente satisfatria, a menos que, claro, possamos encontrar uma forma de controlar
o nmero de escores envolvidos.
81d = 16 - 4 = 12.
Felizmente, tal mtodo existe numa medida de variao conhecida por quadrado Estamos agora preparados para obter os quadrados mdios:
mdio (ou varkincia), que se obtm atravs da diviso da SSe ou da SSd pelo nmero
adequado de graus de liberdade (no Captulo 5, dividimos, de forma anloga, Ex2 por 0,50
N como um passo na obteno do desvio padro). Portanto, MS, = = 0,17
3
MSe = -SSe
gle
onde
6,50
MSd - = 0,54.
MSe = quadrado mdio entre grupos 12
SSe = soma de quadrados entre grupos
gle = graus de liberdade entre grupos
A ESTATSTICA F (RAZO F)
SSd Como observamos anteriormente, a anlise de varincia produz uma estatstica F na
MSd = , onde qual se comparam a variao entre grupos e a variao dentro dos grupos. Estamos
gld agora prontos para especificar o grau de cada tipo de variao-quando medida por
meio de quadrados mdios. Portanto, a estatstica F pode ser considerada como indica-
MSd = quadrado mdio dentro dos grupos tiva do tamanho do quadrado mdio entre grupos com relao ao tamanho do quadrado
SSd = soma de quadrados dentro dos grupos mdio dentro dos grupos, ou seja:
gld = graus de liberdade dentro dos grupos.
MS,
Contudo, precisamos ainda obter os graus de liberdade apropriados. Para o quadra-
F -
MSd
do mdio entre grupos,
-
Para a Tabela 9.2,
gle = R - 1, onde
0,17
R = nmero de amostras. F = = 0,31
0,54
Para encontrar o nmero de graus de liberdade no quadrado mdio dentro dos
grupos, Tendo obtido uma razo (estatstica) F, devemos agora decidir se ela grande o
suficiente para rejeitar a hiptese nula e levar aceitao da hiptese experimental.
Ser que conservadores, moderados, liberais e radicais realmente diferem quanto per-
gla = Ntotai -R , onde
missividade na educao de crianas? Quanto maior a razo F calculada (isto 6, quanto
maior a MSe e menor a MSd), com maior probabilidade vamos obter um resultado
Ntoto = nmero total de escores, somadas todas as amostras
R significante em termos estatsticos.
= nmero de amostras.
Mas como reconhecer de maneira exata uma razo F significante? Recorde-se que,
Ilustrando com os dados da Tabela 9.2, na qual SSe = 0,50 e SSd = 6,50, calcula- no Captulo 8, a razo t que obtivemos foi comparada com diversos valores de uma
mos nossos graus de liberdade como se segue: tabela de razes t, ao nvel de significncia de 0,05, e corn os graus de liberdade apro-
priados. De forma anloga, devemos agora interpretar nossa estatstica F (calculada)
= 4 -
PDF glecompression,
= 3
OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
1
com o auxlio da Tabela D no final do livro. Ela contm uma lista de razes F signifi-
168 TOMADA DE DECISES Andlise de Varidneta 169
Note-se que diferenas entre as mdias existem de fato, e que hi uma tendncia de PASSO 5: Calcular os graus de liberdade entre grupos.
aumento nos QIs medida que a classe varia de baixa para alta.
gle = k 1 = 3 1 = 2
PASSO 2: Calcular a soma total de quadrados
PASSO 6: Calcular os graus de liberdade dentro dos grupos.
SStotal IX2total
(IX total ) 2
v total
= Nt k = 15 3 = 12
(627 + 572 + 485)2
= (78709 + 65494 + 47425) PASSO 7: Calcular o quadrado mdio entre grupos.
15
= 191628
(1684)2 2835856 SSe 2050,53
= 191628
15 15 MS, = = = 1025,27
gle 2
= 191628 --- 189057,07 = 2570,93
PASSO 8: Calcular o quadrado mdio dentro dos grupos.
PASSO 3: Calcular a soma de quadrados entre grupos.
SSd
(ZXt)2 MS d = - 520 40 - 43,37
SSe = [ E gid 12
Nt
(627)2 (572)2 (485)2 (1684)2 PASSO 9: Calcular a razo F (F0, isto , o F observado).
+ +
5 5 5 15
MSe 1025,27
393129 + 327184
+
235225 2835856 'of F = 23,64
5 5 5 15 msd 43,37
= 78625,8 + 65436,8 + 47045,0 189057,07 = 191107,60 189057,07 PASSO 10: Comparar o F observado com o F crtico constante da Tabela D.
= 2050,53
F observado = 23,64
F crtico = 3,88
PASSO 4: Calcular a soma de quadrados dentro dos grupos.
2
SSd = SSt SSe = 2570,93 2050,53 = 520,40
OU
P = 0,05
ssd = E[ (IX') (iin Como bem demonstra o passo 10, para rejeitar-se a hiptese nula ao nvel
de
significncia de 0,05, com graus de liberdade*, nosso F calculado (observado) deve
(4855)2] ser de, no mnimo, igual a 3,88. Uma vez que obtivemos um F igual a 23,64,
= [ 78709 (627)2] + [ 65494 (572)2] + [ 47425 podemos
5 5 rejeitar a hiptese nula e aceitar a hiptese experimental. Especificamente,
possvel
concluir que, com relao varivel QI, existe uma real diferena entre as classes
3271841 1 2352251 baixa,
= [ 78709 3935129] + [ 65494 + 47425 mdia e alta.
5 ] 5 ]
= [78709 78625,8] + [65494 65436,8] + [47425 47045,0] * N.T.: No existe gxau de liberdade menor que 1. Por isso, no se v
confundir
COMPARAO MLTIPLA DE MEDIAS comparadas. Dependendo do valor de qa, quanto maior o nmero de mdias, mais
Um F significante d-nos uma informao a respeito da diferena global existente entre "conservadora" (= resistente) torna-se a DHS no tocante rejeio da hiptese nula.
Como resultado, obteremos menos 51iferenas significantes com a DHS do que com a
os grupos (amostras) estudados. Se estivssemos pesquisando a diferena entre apenas
razo t. Alm disso, uma diferenaientre mdias tem maior probabilidade de ser signi-
duas mdias amostrais, nenhuma anlise adicional seria necessria para a interpretao
ficante numa comparao mltipla de tre's mdias do que numa comparao mltipla
de nosso resultado: em tal situao, a diferena obtida ou estatisticamente significante
de quatro ou cinco.
ou nb, dependendo da magnitude de F. Entretanto, quando encontramos um F signi-
Para ilustrar o uso da DHS, vamos voltar ao exemplo anterior em que se verificou
ficante relacionado com diferenas entre tres ou mais mdias, pode ocorrer que seja
existirem diferenas nas classes sociais com respeito varivel QI. Mais especifica-
importante determinar onde se situam essas diferenas. Por exemplo, na ilustrao
mente, obtivemos um F significante (F = 23,64) para as seguintes mdias colhidas de
anterior, descobrimos que existem, com relao is tits classes sociais pesquisadas,
amostras das trs classes sociais:
diferenas de QI significantes do ponto de vista estatstico. Considerem as possibilida-
des levantadas por esse F significante: fi (alta) poderia diferir significantemente de XI (classe alta) = 125,4
X2 (media); Xi (alta) poderia diferir significantemente de 13 (baixa); 12 poderia :1172 (classe media) = 114,4
diferir significativamente de 13 (baixa). (classe baixa) = 97,0
Como j foi explicado pginas atrs, tentar obter uma razo t para cada compara-
co (Xi versus X2 ; Xi versus 13 ; X2 versus X3) implicaria uma quantidade proibitiva PASSO 1: Construir uma tabela de diferenas entre mdias ordenadas. Para os dados
de trabalho, alm de aumentar a probabilidade de cometer-se um erro alfa. Felizmente, presentes, a ordem das mdias (da menor para a maior) 97,0, 114,4 e 125,4. Elas so
estatsticos desenvolveram vrios outros testes que permitem fazer comparaes mlti- dispostas em tabela de tal forma que a diferena entre cada par de mdias aparea numa
plas a partir de um F significante (isto , Fo> Fe) e localizar onde se situam as diferen- matriz. Assim a diferena entre 11 (alta) e 13 (baixa) 28,40; a diferena entre X1
as significantes entre mdias. Vamos introduzir, ento, o teste DHS de Tukey, um (alta) e 12 (mdia) 11,0; e a diferena entre 12 (mdia) e 13 (baixa) 17,4*.
dos mais teis no terreno da comparao mltipla. (Obs.: DHS significa "diferena
honestamente significante".) 13 = 97,0 X2 = 114,4 XI = 125,4
O DHS de Tukey usado apenas quando um F significantej foi obtido**. Por este
mtodo, o que fazemos comparar a diferena entre quaisquer duas mdias com a DHS. 13 - 17,4 28,4
Uma diferena entre duas mdias diz-se estatisticamente significante s se for igual a ou 12 - 11,0
maior que a DHS. Em smbolos: ii -
PASSO 2: Procurar qa na Tabela I. Para encontrar qa na Tabela I (fim do livro), pre-
DHS = qa V
MSd
n cisamos ter: (a) os graus de liberdade (gl) relativos a MSd ; (b) o nmero mximo de
onde mdias (k) e (c) o nvel de significncia-0,01 ou 0,05. J sabemos, graas anlise de
varincia realizada, que gl = 12. Portanto, entramos na Tabela I pela coluna do lado
qa = valor tabelado (isto , valor crftico) para um dado nvel de significn- esquerdo, at localizar 12 graus de liberdade. Em seguida, como estamos comparando
cia*, a partir do nmero mximo de mdias que estejam sendo com- tress pares de mdias, consultamos a tabela horizontalmente, da esquerda para a direita,
paradas. at localizar a coluna que contm o nmero mximo de mdias (k = 3). Convencio-
MSd = quadrado mdio intra-grupos (obtido na anlise da varincia)
nmero de respondentes em cada grupo (admite-se que em todos os
II nando um nvel de significncia de 0,05, observamos que q0,05 = 3,77.
-
grupos, ou amostras, haja o mesmo nmero de sujeitos). PASSO 3: Calcular a DHS.
MSd 43,37
Em oposio ao que ocorre com a razo t, a DHS leva em conta o fato de que a DHS = q0,05 = 3,77 = 3,77 = 3,77(2,94)
probabilidade de um erro alfa aumenta medida que aumenta o nmero de mdias n 5
= 11,08
* N.T.: Recorde-se, mais uma vez, que o Autor "prefere" usar a expresso "nivel de confiana" PASSO 4: Comparar a DHS com a matriz de diferenas de mdias. Para que qualquer
cm lugar de "nivel de significncia". Na verdade, no h grande inconvenincia, desde que essa diferena entre mdias (ver matriz) seja considerada estatisticamente significante
- -
"confiana" seja interpretada da seguinte forma: (100% 5%) ou (100% 1%).
PDF
N.T.: compression,
** Isto , quando F, F, OCR, web optimization using a watermarked
.
evaluation
N.T. As diferenas copy
so consideradas of absolutos,
em valores
*
CVISION PDFCompressor
isto , desprovidas de sinal.
172 TOMADA DE DECISES UNI V ER Si DADE FE DAlese de Varidncia 173
BIBLIOTECA CEN1"
preciso que ela se iguale a ou exceda a DHS. De volta nossa matriz de diferenas de
mdias, verificamos que a diferena de 28,4 QI entre X-1 (classe alta) e X3 (classe Classe
baixa), e a diferena de 17,4 QI entre X2 (classe media) e X3 (classe baixa) so maiores Baixa Opeidria Media Alta
que DHS = 11,08. Como resultado, conclumos que essas diferenas entre mdias so
estatisticamente significantes ao nvel de 0,05. Somente a diferena de 11,0 entre 5
X 1 e X 2 no se iguala a nem excede DHS-e , por isso, no-significante do 2
ponto de
vista estatstico. 1
3
EXIGENCIAS PARA 0 USO DA ESTATSTICA F (RAZO F)
A anlise de varincia s deve ser feita depois de o pesquisador ter levado em conta as 2. Testar a significncia das diferenas entre as mdias das seguintes amostras aleatrias:
seguintes exigncias:
1. Comparao entre tres ou mais medias independentes-A razo F geral- Amostra 2 Amostra 3
mente empregada para fazer-se uma comparao entre tits ou mais mdias
extradas de amostras independentes. A estatstica F no se presta para testes 2 5 8
em que o nmero de amostras menor que dois. Porm, no caso especfico 1 4 9
3 3 7
de duas amostras, tanto faz usar F ou t, uma vez que F = t2 .
3 4 8
2. Dados intervalares-Ao fazer uma anlise de varincia, pressupomos ter atin-
gido o nvel intervalar de mensurao. Por igual raciocnio, dados categorizados 3. Testar se as diferenas entre as mdias das seguintes amostras aleatrias so sig-
ou ordenados no devem ser usados. nificantes:
3. Amostragem casual-Nossas amostras devero ter sido extradas aleatoriamente,
de uma dada populao de escores. Amostra A mostra 2 A mostra 3
4. Distribuio norrrwl-Admitimos que a varivel em foco possui, na populao
da qual se extraem as amostras, distribuio normal*. 12 6 3
RESUMO 6 5 2
A anlise de varincia pode ser usada para fazer comparaes entre tits ou mais mdias 8 7 5
7 5
amostrais. Esse teste produz uma estatstica ou razo F cujo numerador representa a 3
6 1 1
variao entre grupos, e cujo denominador contm uma estimativa da variao dentro
dos grupos. A soma de quadrados representa o passo inicial para mensurar a variao.
Entretanto, ele sofre grande influncia do tamanho da amostra. Para superar esse proble- 4. Testar se as diferenas entre as mdias das seguintes amostras aleatrias so signi-
ma, dividimos SSe ou SSd pelos gratis de liberdade apropriados, a fim de obter o quadra- ficantes:
do mdio. A razo F indica o tamanho do quadrado mdio entre os grupos em funo
do tamanho do quadrado mdio dentro dos grupos. Interpretamos nosso F observado A mostra I Amostra 2 Amostra 3
(calculado) mediante uma comparao com um F crtico adequado constante da Tabela
D. Com base nessa comparao, decidimos se a hiptese nula deve ou no ser rejeitada. 4 3
5 3 5
Aps a obteno de um F significante, podemos determinar onde se localizam as dife- 4 2
renas significantes aplicando o mtodo de Tukey para a comparao mltipla de 3 2 3
mdias. 6 1 3
PROBLEMAS
5. Utilizando os mesmos dados do problema 4, determinar
1. Nas seguintes amostras aleatrias de classe social, testar a hiptese nula de que a atravs do mtodo de
Tukey (comparao mltipla de mdias), onde, exatamente, ocorrem as diferenas
"camaradagem entre vizinhos" no varia com a "classe social". (Nota: escores mais
significantes.
altos indicam maior grau de camaradagem.)
6. Testar se as diferenas entre as mdias das seguintes amostras aleatrias
N.T.: No se pode admitir isso arbitrariamente. Havendo dvida quanto normalidade, faz-se
so sig-
PDF compression, OCR, web optimization using a watermarked
um teste para garantir-se eSse pr-requisito. evaluation copy of CVISION PDFCompressor
nificantes:
174 TOMADA DE DECISES 44
10
Ptp
<0
<49
A mostra 1 A mostra 2 A mostra 3 A mostra 4
0
3 4 6
0NO`
1 2 4 6
1C
4, e
Qui--quadrado
3 2 2 5
4 1 2 5 p o
2 5 3 4 e
1 5 3 6
No-paramtricos
Tal como indicamos nos Captulos 8 e 9, precisamos exigir muito do pesquisador que
emprega uma estatstica t ou uma anlise de varincia para fazer comparaes entre
suas amostras. Cada um desses testes de significncia apresenta uma lista de requisitos,
que inclui, entre outros, o pressuposto de que a caracterstica estudada (isto , a vari-
vel observacional) tem distribuio normal numa particular populao. Alm disso,
cada um desses testes supe que a varivel tenha sido mensurada a nvel intervalar, no
mnimo, garantindo-se, assim, a possibilidade de atribuir a cada membro da amostra
o respectivo escore. Quando um teste de significncia-tal como a estatstica (razo) t
ou a anlise de varincia-requer (1) normafidade e (2) nvel'intervalar de mensurao,
fala-se em teste parametrico.1
Como se arranja o pesquisador que nab consegue empregar um teste paramtrico
porque no pode, honestamente, admitir normalidade de distribuio ou porque seus
dados foram colhidos num nvel de mensurao inferior ao intervalar? Suponha-se, por
exemplo, que ele esteja trabalhando com uma distribuio assimtrica, tal como renda
anual, ou com dados que tenham sido categorizados ou contados (nvel nominal) ou,
ainda, com dados ordenados (nvel ordinal).* De que modo esse pesquisador pode fazer
comparaes entre amostras sem violar os requisitos de um determinado teste?
Afortunadamente, os estatsticos desenvolveram uma boa quantidade de testes
1
Tal designao baseia-se no termo "parmetro", aplicvel a qualquer caracterstica de uma
populao.
*N.T.: Esse problema de nveis de mensurao deve ser entendido como uma "escada": qualquer nvel,
a partir do segundo, pressupe que as caractersticas dos anteriores estejam sempre presentes. Entio,
por exemplo, suponha-se que X assuma os valores 160 cm, 170 cm e 185 cm, onde X representa a
estatura de trs sujeitos. Pelo que j foi visto anteriormente, "comprimento" pertence ao ravel ra-
cional (escala de razo); entretanto, nada impede que se atribua o "posto" 1 ao sujeito de 160 cm, o
2 ao de 170 cm e o 3 ao de 185 cm. Ou, nessa mesma ordem, podem aplicar-se as denominaes
"baixo", "mediano" e "alto", onde (baixo < mediano < alto). Essa operao, como flied de ob-
servar, constitui um abaixamento de nvel de mensurao (de nvel racional para nvel ordinal).
O que importante notar que o abaixamento de nvel quase sempre possi'vel enquanto que a
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
elevao (isto , melhora) raramente se consegue-com sucesso.
176 TOMADA DE DECISES Qui-quadrado e outros Testes Ndo-paratntricos 177
ndo-paramtricos de significncia-testes cuja lista de requisitos no inclui normalidade porque na populao matriz existem reais diferenas* entre as variveis
estudadas.
de distribuio ou nvel intervalar de mensurao. Para entendermos a posio impor- Porm, ao contrrio do que ocorre com os testes de significncia anteriores,
o qui-qua-
tante dos testes no-paramtricos em pesquisa, precisamos entender tambm o conceito drado empregado para fazer comparaes entre freqiincias e no entre
escores m-
estatstico de poder. Poder de um teste a probabilidade de rejeitarmos a hiptese nula dios. Como resultado, a hiptese nula para o teste de qui-quadrado
estabelece que as
quando ela realmente falsa-e, por isso mesmo, deve ser rejeitada. populaes neio diferem relativamente freqncia com que ocorre uma
caracterfstica
O poder varia de um teste para outro. Os testes mais poderosos-aqueles que, com particular; por outro lado, a hiptese experimental estabelece que as diferenas
amos-
maior probabilidade, levam rejeio da hiptese nula (Ho) quando ela mesmo fal- trais refletem diferenas reais na populao matriz-a partir da
freqncia relativa de
sa-so testes que possuem os pr-requisitos mais difceis de satisfazer. Geralmente, uma dada caracterstica.
esses testes so paramtricos, tais como o t ou o F, que pressupem dados colhidos em Para ilustrar o uso do qui-quadrado com dados freqenciais (ou com
propores
nvel intervalar (no mnimo) e distribuiao normal, na populao, das caractersticas que possam ser reduzidas a freqncias), imagine-se que, ainda uma
vez, tenhamos sido
estudadas (isto , as variveis) na amostra. Em contraposio, as alternativas no-para- chamados a investigar a relao entre "orientao poltica" e "permissividade
na educa-
mtricas exigem muito menos em termos de pr-requisitos, e constituem-se testes de sig- o de crianas". Em vez de dar. notas (isto , atribuir escores) a liberais e
conservadores
nificncia com poder bem menor que o dos correspondentes paramtricos. Em conse- em termos de seu grau de permissividade, podemos categorizar nossos
sujeitos amostrais
ao admitir a hiptese nula falsa (e ao manter inalterados fatores tais como numa base estritamente do tipo "ou ou";** em outras palavras, o
problema decidir
o tamanho da amostra), mais provvel que o pesquisador a rejeite pelo uso adequado quais so permissivos e quais so no-permissivos. Portanto:
de F ou de t do que mediante uma altemativa no-paramtrica.
bvio que os pesquisadores querem, a todo custo, rejeitar a hiptese nula-quan- Hiptese Nu la: A freqncia rektiva de liberais permissivos igual freqncia
relativa
do ela falsa mesmo. Por isso, a maioria deles preferiria, idealmente, empregar testes de conservadores permissivos.
paramtricos de significncia. Entretanto, como observamos h pouco, comum no Hiptese Experimental: A freqncia relativa de liberais permissivos
ser possvel preencher as exigncias mnimas dos testes paramtricos. Em primeiro lugar, diferente da fre-
qiincia relativa de conservadores permissivos.
muitos dos dados no campo psicossocial pertencem ou ao nvel ordinal ou ao intervalar.
Depois, nunca podemos ter certeza de que as caractersticas estudadas na amostra tm,
de fato, distribuio normal na populao da qual ela foi extrada.
CALCULO DO QUI-QUADRADO
Quando os requisitos de um teste (paramtrico) so violados, torna-se impossvel
conhecer o seu poder. Da que os resultados de um teste paramtrico, cujos requisitos O teste de significncia denominado qui-quadrado ocupa-se
essencialmente com a dis-
no foram satisfeitos, no tm interpretao significativa. Sob tais condies, a maioria tino entre freqncias esperadas e freqncias obtidas (observadas). As freqncias
dos pesquisadores opta inteligentemente por testes de significncia no-paramtricos. esperadas (fe) referem-se aos termos da hiptese nula, de acordo com
os quais se espera
Este captulo introduz alguns dos mais conhecidos testes de significncia no-para- que a freqncia relativa (ou a proporo) seja a mesma para todos os grupos.
Por exem-
mtricos: qui-quadrado, teste da mediana, prova de Kruskal-Wallis (anlise de varincia plo, se a expectativa de que os liberais sejam permissivos de 50%, ento
ela tambm
por postos) e prova de Friedman (dupla anlise de varincia). corresponde a 50% para os conservadores. Em contraposio, as freqncias observadas
(fo) referem-se aos resultados obtidos de forma efetiva no momento da
coleta de dados,
donde decorre que, de um grupo para outro, elas podem-ou no-variar.
No caso de
QUI-QUADRADO: UM TESTE DE SIGNIFICANCIA as diferenas entre as freqncias obtidas e as esperadas serem
suficientemente grandes
O mais "popular" teste no-paramtrico de significncia utilizado em pesquisa chama-se que rejeitamos a hiptese nula e decidimos pela afirmao de que existe uma
diferena
qui-quadrado (x2). Como veremos adiante, o teste de X2 usado na comparao* entre real na populao.
duas ou mais amostras. Continuando com o presente exemplo, suponha-se que extrassemos uma amostra
semelhana do que ocorreu com a estatstica t e a anlise de varincia, existe aleatria de 20 liberais e outra amostra, tambm aleatria, de 20 conservadores;
em
uma distribuiO amostral de qui-quadrado que pode ser usada para estimar a probabili- seguida, esses 40 sujeitos poderiam ser dicotomizados em "permissivos" e
"no-permis-
dade da obteno de um valor significante (de qui-quadrado) por mero acaso e no sivos" relativamente varivel observacional "mtodo de educar
crianas". A Tabela
10.1 apresenta as freqncias obtidas que poderiam resultar.
* N.T.: 0 termo "comparao" precisa ser interpretado, j que ele pressupe "maior que," menor
* N.T.: Veja-se, a propsito, o que ficou dito na nota anterior.
que" ou "igual a". 0 que o teste de qui-quadrado geralmente permite fazer um estudo relacional
entre variveis, ou seja, a determinao do tipo de relao existente entre elas: independncia ou N.T.: Categorizar com base no critrio "ou ou" , ao cabo, dicotomizar (se forem duas
dependencia. H, ainda, 6 qui-quadrado de aderencia e o qui-quadrado de homogeneidade, cujos categorias), tricotomizar (se forem trs), tetracotomizar (se forem quatro)
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
objetivos so outros. Esses dois ltimos testes no so estudados neste livro.
e assim por diante.
178 TOMADA DE DECISES Qui-quadrado e outros Testes Nao-parametricos 179
Os dados da Tabela 10.1 indicam que "mtodos permissivos" foram usados por TABELA 10.2 Dados da Tabela 10.1 Dispostos numa Tabela 2 X 2*
5 dos 20 liberais e por 10 dos conservadores. Esses dados podem ser retabelados num
quadro do tipo 2 X 2 (2 linhas e 2 colunas), no qual as freqncias observadas esto Liberais Conservadores
distribudas pelas caselas, ao lado das freqncias esperadas (tericas), que figuram Freqncia
entre parnteses (Tabela 10.2). Observe-se que essas freqncias esperadas baseiam-se Freqii encia
Observada
Esperada
apenas na Nab do acaso, donde decorre uma pressuposio (provisria) de que a hipte- ---A,
Permissivo 5 (7 ,5) 10 (7,5) .A-- 15
se nula esteja correta. Note-se, tambm, que os totais marginais na Tabela 10.2 foram
obtidos pela soma horizontal ou vertical das freqncias das caselas, ou seja: 15 e 25
representam as somas das linhas (somas horizontais); 20 e 20, as somas das colunas Total Marginal
(somas verticais). O nmero total de sujeitos (N = 40), sito , o tamanho da amostra, (Horizontal)
pode ser obtido somando-se os totais marginais horizontais ou os totais marginais 15 (12,5) 10 (12,5) 25
verticais.* No-permissivo
TABELA 10.1 Freqncias Observadas num Estudo de Permissividade Relacionada com Orientao
Politica 20 20 N = 40
Orientao Poltica
Mtodos de Educao de Lib erais Conservadores
x2
(5 - 7,5)2 (10 - 7,5)2 (15 - 12,5)2 (10 - 12,5)2
Crianas fo fo 7,5 7,5 12,5 12,5
Perm issivo 5 10 (-2,5)2 (2,5)2
No-permissivo
(2,5)2 (-2,5)2
15 10
To tal
7,5 7,5 12,5 12,5
20 20
gl = (2 - 1)(2 - 1) = (1)(1) = 1 Para a casela inferior esquerda da Tabela 10.2 (liberais no-permissivos):
Consultando a Tabela E (no fim do livro), encontramos uma lista de valores de qui-qua- (20)(25) _ 500
drado,*os quais sat' significantes aos nveis (de confiana/significncia) de 0,05 e 0,01. fe
40 40
- 12,5
Ao nvel de 0,05 e 1 grau de liberdade, vemos que o qui-quadrado crtico 3,84. Para
que a hiptese nula possa ser rejeitada, preciso que esse valor (isto , 3,84) seja exce- Finalmente, para a casela inferior direita da Tabela 10.2 (conservadores
no-permissivos):
dido ou, pelo menos, igualado pelo qui-quadrado observado. Como o nosso X2 observa-
do (calcalado) somente 2,66-e, portanto, menor que o valor tabelado (ou seja, menor (20)(25) _ 500
que o k)-devemos aceitar a hiptese nula e rejeitar a hiptese experimental. As fre- fe 12,5
40 40
qncias obtidas (observadas) no se afastam das esperadas o suficiente para podermos
expficar a diferena como resultado de real diferena populacional.** Em outros ter- Como veremos mais adiante, o mtodo que acabamos de apresentar
pode ser aplicado a
mos, tal diferena (3,84 -
2,66) deve ser interpretada como resultante da ao do qualquer problema de qui-quadrado que implique obter freqncias
esperadas (fe).*
acaso.
Ilustrao
C.LCULO DAS FREQENCIAS ESPERADAS (TERICAS) Para resumir passo a passo o procedimento que permite obter o
qui-quadrado observado
As freqincias esperadas para cada casela devem refletir a ao do acaso nos termos da ou calculado (xD, vamos supor que quisssemos estudar a relao entre
"fumar maco-
hiptese nula (Ho). Se tais freqncias tm que indicar "mesmice" em todas as amos- nha" e "desejo de cursar o segundo grau" (antigo "colegial"). Poderamos
especificar
tras, devem ser proporcionais aos seus totais marginais, quer para as linhas, quer para nossas hipteses da seguinte forma:
as colunas.
Ho: a relao entre "fumar maconha" (X) e "fazer o segundo
obter a freqncia esperada relativa a uma determinada casela, simplesmente
Para grau" (Y) de independen-
cia, isto , X e Y so independentes.
multiplicamos seus respectivos totais marginais (de linha e de coluna), dividindo, em Ha: a relao entre Xe Ye de dependncia.
seguida,o produto por N. Portanto:
A fim de testar estas hipteses ao nvel de significncia
_ (total marginal "linha")(total marginal "coluna") de 0,05, colhemos duas
amostras de alunos de primeiro grau (preferentemente das ltimas sries):
uma, compos-
ta de 21 sujeitos cujo objetivo "prosseguir os estudos" e, outra, com 15
sujeitos cuja
deciso "parar os estudos aps concluso do primeiro grau".
Para a casela superior esquerda da Tabela 10.2 (liberais permissivos): Suponha-se que, ape's a
realizao da pesquisa com esses 36 sujeitos, resultassem os dados
condensados na
Tabela 10.3.
f (20)(15) 300 Como podemos observar nessa tabela, 15 dos 21 alunos que tencionam fazer o
je = 40 40 segundo
grau fumam maconha; entre os que no pretendem fazer o segundo
grau, apenas 5 fu-
mam essa erva. Para descobrir se h uma relao significante entre "fumar maconha"
Da mesrna forma, para a casela superior direita da Tabela 10.2 (conservadores permis- e
"continuar os estudos", os passos que devemos efetuar so os seguintes:
sivos):
(20X15) 300
fe 40 40
- 7,5 * N.T.: Tal afirmao nem sempre verdadeira! Se o pesquisador estiver
de aderncia (teste de), as freqncias tericas (esperadas) so obtidas
trabalhando com x2
a partir da lei que rege o
particular fenmeno que esteja sendo estudado. Por exemplo, num jogo
* N.T.: Os valores tabelados de qui-quadrado so geralmente chamados qui-quadrados crfticos e de cara-ou-coroa, onde
C = cara e K = coroa, suponha-se que C = 20 e K =
notados por 80, com N = 100 (obviamente). Ento, se a
moeda for honesta, a freqncia esperada para a varivel C dever ser
igual freqncia esperada
**N.T.: Insista-se, mais uma vez, no que ficou dito na nota pg. 176. Dessa comparao entre o x20 e para a varivel K, ou seja:
o resulta uma infonnao a respeito do tipo de relafTo existente entre as variveis estudadas.
Ento, se )d. < y, as variveis so independentes; se xo 4 as variveis so dependentes. No
C ->
fo
20
fe
50
exemplo em foco, < e, por isso, a hiptese experimental foi rejeitada. Isso equivale a dizer K -* 80 50
Observe-se, pois, que a regra apresentada pelo autor no se
que, com certeza de 95% as variveis "filiao poltica" e "permissividade na criao dos filhos" so aplica ao clculo dessas freqncias, uma vez que o fenmeno
variveis independentes. N -> 100 100 estudado (isto 6, "sair cara-ou-coroa") possui uma lei prpria.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
182 TOMADA DE DECISES Qui-quadrado e outros Testes Ndo-paramtricos 183
TABELA 10.3 Consumo de Maconha entre Alunos de Primeiro Grau e sua Relao com Objetivos PASSO 3: Subtrair cada freqncia esperada da respectiva freqncia observada
A cadmicos Posteriores
fo -fe
Tenciona Cursar o 2.0 Grau (superior esquerda) 15 - 11,67 = 3,33
Sim Aldo
(superior direita) 5 - 8,33 = -3,33
Fuma Maconha (fo) (fo)
(inferior esquerda) 6 - 9,33 = -3,33
(inferior direita) 10 - 6,67 = 3,33
Sim 15 5
No 6 10 PASSO 4: Quadrar essas diferenas
Total 21 15
(fo -fe) 2
(superior esquerda) (3,33)2 = 11,09
PASSO 1: Dispor os dados numa tabela de dupla entrada (tipo 2 X 2). (superior direita) (-3,33)2 = 11,09
Continuam os Param os (inferior esquerda) (-3,33)2 = 11,09
Estudos (inferior direita) (3,33)2 = 11,09
Estudos
fe
No-fumantes 6 ) 10 16 11,09
( ( ) (superior esquerda) 0,95
11,67
11,09
(superior direita) 1,33
21 15 N = 36 8,33
11,09
(inferior esquerda) 1,19
PASSO 2: Obter a freqncia esperada (terica) para cada casela 9,33
(21)(20) 11,09
(superior esquerda) fe (inferior direita) 1,66
36 6,67
420 =
11,67 PASSO 6: Somar esses quocientes para obter o qui-quadrado observado
36
= -
300
36
36
(21)(16)
= 8,33
fe
0,95
1,33
6 (9,33) 10 (6,67) 16 (inferior esquerda)
-
fe 1,19
36 1,66
336
= = 9,33 X2 = 5,13
36
21 15 N =36
(15)(16)
(inferior direta) fe
36 PASSO 7: Achar o nmero de graus de liberdade
240
= 6,67
36 gl = (1 - 1)(c - 1) = (2 - 1)(2 - 1) = (1)(1) =
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
1
184 TOMADA DE DECISES Qui-quadrado e outros Testes Ndo-paramtrieos 185
PASSO 8: Comparar o valor do qui-quadrado observado (obtido) com o qui-quadrado Numa tabela 2 X 2, a disposio das caselas (A, B, C e D), com os respectivos
crtico (tabelado). Veja Tabela E (fim do livro) totais marginais, segue o modelo abaixo:
A= freqncia observada para a casela superior esquerda CORREO DE FREQNCIAS ESPERADAS PEQUENAS
B= freqncia observada para a casela superior direita
C= freqiincia observada para a casela inferior esquerda Se as freqncias esperadas numa tabela 2 X 2 forem muito pequenas (menores que
10
D freqiincia observada para a casela inferior direita em cada casela), as -frmulas que aprendemos at aqui podero produzir um qui-qua-
drado "inflado", isto , um valor de qui-quadrado maior do que o real. Note-se que isso
se) se aplica s freqncias esperadas e nab s de fato obtidas no
decorrer de uma pesqui-
sa; estas, alis, podem ser de qulquer tamanho.
* N.T.: No se v inferir da que existe uma relao obrigatria de causa e efeito. Alm disso, nada
indica que essa relao seja verdadeira. Primeiro, porque se trata de uma situao hipotetica;segundo, A fim de reduzir o "tamanho" do qui-quadrado observado e, assim, chegar-se a
porque, ainda que fosse verdadeira a relao de dependncia, ela seria, quando muito, verdadeira para um resultado mais "sensato", aplicamos a conhecida correct-to de Yates-sempre que a
um particular grupo de sujeitos, numa particular comunidade (norte-americana, no caso). tabela for do tipo 2 X 2. A correo de Yates consiste em reduzir de meia unidade
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
186 TOMADA DE DECISES
Qui-quadrado e outros Testes No-parametrkos 187
(0,5) todas as diferenas entre cada freqncia observada e a terica (esperada) respecti-
va. Uma vez que o x2 depende do tamanho dessas diferenas, conseguimos restringir,
tambm, o tamanho do prprio qui-quadrado observado.* A frmula "corrigida" do
(1 -fe I - 0,50)2
qui-quadrado, para situaes em que as freqncias esperadas so muito pequenas, (I fo -fe - 0,50)2 fe
a seguinte:
8,01 0,69
8,01 0,96
x2 x (I fo -fe I - 0,50)2 8,01 0,86
fe 8,01 1,20
X2 = 3,71
Na frmula "corrigida" (acima), as barras verticais que ladeiam fo indicam que -fe
meia unidade (0,5) deve ser subtrada do valor absoluto de cada diferena-ignorando-se
os sinais Como se observa acima, a correo de Yates produz um qui-quadrado (x2 = 3,71)
Vamos aplicar a frmula corrigida aos dados da Tabela 10.3: menor do que o obtido por meio das frmulas no-corrigidas (x2 = 5,13). No exemplo
em foco, nossa deciso quanto hiptese nula fica inteiramente a merc do fato de se
usar ou no a correo de Yates. Com a frmula corrigida, aceitamos a hiptese nula
X2
( I 15 - 11,67 - I 0,50)2 (15 - 8,33 - 0,50)2
I
(pois 3,71 < 3,84), e com as frmulas no-corrigidas, rejeitamos esta mesma hiptese.
11,67 8,33 A correo de Yates tambm se aplica frmula alternativa para o clculo do
( 6
I - 9,33 - I 0,50)2 ( I 10 - 6,67 - 1 0,50)2
qui-quadrado numa tabela 2 X 2. Assim:
9,33 6,67
N(1 AD - BC - N/2)2
(3,33 - 0,50)2 (-3,33 - 0,50)2 (-3,33 - 0,50)2
X2 - (A
1
* N.T.: As mesmas observaes feitas anteriormente com respeito ao termo "comparao" valem
* N.T.: Essa operao tambm conhecida pelo nome de correvcro de continuidade. para tabelas maiores que 2 X 2.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
188 TOMADA DE DECISES Qui-quadrado e outros Testes No-paramtricos 189
Hiptese Nula*: A freqncia relativa de mtodos permissivos, moderados e autoritdrios Orientao Poltica
a mesma tanto para liberais quanto para moderados quanto para
Mtodos Usados na Conservadores Moderados Liberais
conservadores. Educao de Crianas
Hiptese Experimental: A freqncia rekstiva de mtodos permissivos, moderados e 14
Permissivo 7 9 30
autoritdrios no a mesma para liberais, para moderados e
para conservadores.
Vamos admitir que, terminada a coleta de dados, resulte a Tabela 10.4. Nela, veri-
ficamos que 7 dos 32 conservadores, 9 dos 30 moderados e 14 dos 27 liberals adotam Moderado 10 10 8 28
Freq encia
prticas permissivas relativamente educao de seus filhos.
observada
7 9 14 (30)(32) 960
Tenha-se em mente que tanto a correo de Yates quanto a frmula altemativa (10,79) (10,11) (9,10) (superior esquerda) fe = 89 - 98
para o x2 so aplicveis apenas quando se trata de uma tabela (problema) 2 X 2, no 30
sendo possvel, por isso, aplic-las a vrios grupos, como, por exemplo, o caso presente 10 10 8
= 10,79
(3 X 3). Para determinar se h uma diferena significativa na Tabela 10.4, temos de (10,07) (9,44) (8,49)
utilizar a frmula original de x2 , apresentada no infcio deste captulo, isto : 28 (intermediria (28)(32) 896
esquerda) fe = 89 89
15 11
X
2
- (.fo - fe)2 (11,41) (10,45)
5
(9,40)
fe 31 = 10,07
32 30 27 (31)(32) 992
N = 89 (inferior esquerda) fe - 89 89
* N.T.: Com o objetivo de no se perder de vista que o que se testa a independncia entre as = 11,14
variveis, essas hipteses podem ser reformuladas, a fim de obter maior preciso, para:
Ho: As variveis P, M e A guardam rekto de independencia com as variveis X, Y e Z. (intermediria (30)(30) 900
Ha: As variveis P, M e A guardam relao de dependnck com as variveis X, Y e Z. superior) fe 89 89
P = mtodo permissivo; M = mtodo moderado; A = mtodo autoritrio; X = liberals;
Y = moderados e Z = conservadores. = 10,11
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
r------
190 TOMADA DE DECISES
Qui-quadrado e outros Testes Mfoparamtricos 191
= 10,45 PASSO 5: Dividir cada diferena, ao quadrado, pela respectiva freqncia esperada
PASSO 6: Somar esses quocientes para obter o qui-quadrado observado (calculado) entretanto, que os requisitos para o uso de testes no-paramtricos so via de regra
preenchidos com mais facilidade-pelo menos quando comparados com os "corres-
(Jeo - fe)2 pondentes" paramtricos, tais como a estatstica t ou a anilise de varincia. Com isso
fe mente, vamos voltar nossa ateno para alguns dos mais importantes requisitos
oara o uso da prova de significncia chamada qui-quadrado:
1,33
0,00 1. "Comparao"*entre duas ou mais amostras.
1,34 Como procurou ilustrar este captulo, o teste de qui-quadrado usado para,
0,12 atravs da comparao entre um x2 observado e um x2 crtico (tabelado), levar
0,03 o pesquisador a decidir se, numa amostra aleatria, duas ou mais variveis guardam
0,03 entre si uma relao de independncia. Isso torna obrigatrio que tenhamos, no
2,64 uma tabela 2 X 2 (no mnimo 2 linhas, como tambm 2 colunas). Na
0,03 montagem da tabela, importante que o mesmo'sujeito no figure em mais de uma
2,06 casela. A amostra deve ser explorada (com relao As variveis observacionais)
X2 = 7,58 exaustivamente e a distribuio dos sujeitos pelas vrias caselas deve ser indepen-
dente. Assim, se numa amostra aleatria de N = 100 sujeitos, desejarmos pesquisar
a relao entre cor de olhos (claro/escuro) e cor de cabelos (claro/escuro), o mes-
PASSO 7: Achar nmero de graus de liberdade mo sujeito no pode, relativamente a esse par de variveis, figurar em mais de
uma casela. Essa circunstncia torna a utilizao do qui-quadrado em situaes ex-
gl = (1 - 1)(c - 1) = (3 - 1X3 - 1) = (2)(2) = 4 perimentais do tipo antes-e-depois algo restritiva, embora no impeditiva."
2. Dados pertencentes ao nivel nominal de mensuravo.
O pesquisador s necessita de freqncias, isto , do nmero de sujeitos observa-
PASSO 8: Comparar o valor do qui-quadrado obtido (observado) com o do qui-quadra- dos para cada situao.
do tabelado (crtico). Veja Tabela E
3. Amostragem aleatria.
Os sujeitos amostrais devem ter sido extrados aleatoriamente de uma particular
X2 observado (obtido) = 7,58
populao.
X2 tabelado (crtico) = 9,49
gl = 4 4. As freqncias esperadas (tericas) por casela ndo devem set muito pequenas.
P = 0,05 O tamanho mnimo de uma fe depende da natureza do problema. Numa tabela
2 X 2, nenhuma freqncia esperada deveria ser menor que 5. Alm disso,
Necessitamos, portanto, de um valor de qui-quadrado que seja pelo menos igual a aconselhvel que se use a correo de Yates sempre que, numa tabela 2 X 2,
9,49 para podermos rejeitar a hiptese nula. Uma vez que o nosso x2 obtido de ape- qualquer freqncia esperada for inferior a 10. Numa situao em que vrios
nas 7,58, devemos aceitar a hiptese nula e atribuir as diferenas amostrais ao do grupos estejam sendo "comparados" (por exemplo, 3 X 3 ou 4 X 5), no h uma
acaso. No conseguimos descobrir nenhuma prova estatisticamente significante capaz de
sustentar a idia de que as freqncias relativas dos mtodos de educao de filhos
k. regra rigida para o estabelecimento de freqncias tericas mnimas por casela,
embora seja recomendvel que bem poucas contenham menos que 5. Note-se,
diferem para liberais, moderados e conservadores.
* N.T.: 0 termo "comparao", como foi anteriormente salientado, deve ser interpretado. "Corn-
( parao" supae um cotejo entre o resultado obtido (observado) e o resultado terico (tabelado). No
caso de qui-quadrado, a um dado nvel de significncia e com certo nmero de graus de liberdadc, a
REQUISITOS PARA 0 USO DO QUI-QUADRADO "comparao" se faz entre 20 e )&,
In dependentemente do fato de que os testes no-paramtricos no pressupem distfi- ** N.T.: Em Edwards, Allen L. -Statistical Analysis, 3.a ed., Holt, Rinehart and Winston, Inc.,
buio normal de uma particular varivel na populao, eles apresentam, tambm, pgs. 158-159; cita-se o exemplo de um pesquisador que aplicou aos mesmos 90 sujeitos amostrais
uma srie de requisitos que devem ser levados em conta pelo pesquisador desejoso de dois testes: um, antes do tratamento e outro, depois. Apesar de a idia bsica ser a de independncia
dos resultados em face de uma particular varivel (tratamento), o teste de significncia torna obri-
proceder a uma escolha inteligente de algum teste de significncia. O leitor notar,
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressorgatrio conhecer x2 de aderencia, que no estudado neste livro.
194 TOMADA DE DECISES
Qui-quadrado e outros Testes Nto-paramtricos 195
N + 1 27 +
Posio da mediana =
2
=
2
1
- 14. dado da tabela
Acima da Mediana 10 3
No Acima da Mediana 5 9
* N.T.: Como regra prtica, j que este assunto algo controvertido, acrescente-se a tudo N = 27
o que
ficou dito mais o seguinte: a prova de qui-quadrado deve ser evitada sempre que
qualquer fe < 5
c, simultaneamente, (Efe = Ifo = N) < 30. Assim, quando N
< 30, aconselha-se usar a Prova
Exata de Fisher.
** N.T.: 0 exemplo serve apenas para ilustrar o procedimento N.T.: "No acima da mediana" no o mesmo que "abaixo da mediana". "No acima da media-
denominado teste da mediana. Do *
ponto de vista experimental, o delineamento est cheio de impropriedades. na" vai at Mdn =12, isto , o 12 pertence a essa categoria.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
196 TOMADA DE DECISES Qui-quadrado e outros Testes Nb-paramtricos 197
Como vimos, os valores (durao do canto) da tabela anterior, para 2. Dados ordinais.
cada amostra, quan-
do cotejados com a mediana da distribuio, so transformados Para que seja possvel aplicar o teste da mediana, preciso que os dados perten-
em freqncias, origi-
nando um quadro 2 X 2. No problema em foco, 10 dos 15 homens am, no mnimo, ao nvel ordinal. Dados nominais no podem ser usados.
e apenas 3 das 12
mulheres continuaram a cantar por um perodo superior ao representado
pela mediana 3. Amostragem aleatria.
do grupo maior (homens + mulheres).
Dada uma populao, as amostras devem ser extradas aleatoriamente.
PASSO 3: Realizar um teste de qui-quadrado para verificar se o
resultado significante.
Se no houver diferenas ligadas ao sexo com respeito
durao do canto (e ao presu- DUPLA ANLISE DA VARIANCIA POR POSTOS: x2 DE FRIEDMAN
mido embarao que dele decorre), podemos esperar que ambas as amostras
se "quebram"
no mesmo ponto mediano, de sorte que metade dos homens No Captulo 8, introduzimos uma variao da estatstica t passvel de ser usada na com-
e das mulheres caem
acima da mediana. Para determinar se as diferenas obtidas entre parao de dados resultantes da mesma amostra em dois momentos distintos. No esque-
homens e mulheres so
estatisticamente significantes ou apenas resultado de erros de amostragem, ma "antes-e-depois", por exemplo, o grau de hostilidade numa amostra de crianas
fazemos um
teste de x2. poderia ser mensurado em duas ocasies distintas: antes e depois de terem assistido a
um violento programa de televiso.
Homens Mulheres A dupla anlise de variAncia por postos-o x2 de Friedman (x2p)-constitui uma
Acima da Mediana
aproximao no-paramtrica que permite testar diferenas numa mesma amostra de
10 (A) 3 (B)
No Acima da Mediana 5 (C)
respondentes que tenham sido mensurados sob, pelo menos, duas condies distintas.
9 (D)
Em smbolos:
N = 27
12
N(I AD - BC - NI2)2 (/102 - 3N (k + 1)
(A
I
na" (coluna M) e baixo (3) no tratamento "violncia baixa" (coluna B). Prosseguindo E 39 3 41 2 47 1
F 25 3 28 27 2
na lista, o mesmo raciocfnio aplica-se criana B: posto 1 para o escore-hostilidade G
1
38 3 46 2 51 1
maior (coluna M), posto 2 para o escore-hostilidade mediano (coluna A) e posto 3 para H 40 3 47 2 49 1
o escore-hostilidade menor (coluna B). Com relao criana C, o quadro o seguinte: I 45 2 46 1 42 3
posto 1 para o escore da coluna A (39), posto 2 para o escore da coluna B (36) e posto 3 J 29 3 34 2 38 1
para o escore da coluna M (35).* Os postos atribudos a cada criana sob os diferentes
tratamentos figuram na tabela
(B) (M) (A)
Criana Posto Posto Posto
Mveis de Violncia Televisada
Baixa Mediana Alta A 3 2 1
Criana (B) (M) (A) B 3 1 2
C 2 3 1
A 23 30 32 D 3 2 1
B 41 45 43 E 3 2 I
C 36 35 39 F 3 1 2
D 28 29 35 G 3 2 1
E 39 41 47 H 3 2 1
F 25 28 27 I 2 1 3
G 38
40
46
47
51
49
J
__3_ _2 _
1
ER = 28 ER = 18 ER = 14
45 46 42
29 34 38
PASSO 3: Entrar na frmula para obter o xi,
PASSO 2: Somar os pontos relativos a cada tratamento (cada coluna corresponde a
12
um tratamento). Se a hiptese nula estiver correta-e, por isso, no existir diferena Ap
Nk(k + 1)
(R)2 - 3N(k + 1)
significativa entre os tratamentos-,podemos esperar que as somas dos postos sejam
iguais entre si, descartados os erros devidos ao acaso. No exemplo em causa, h trs 12
condies: violncia televisada baixa, mediana e alta. Os postos e respectivas somas
if
(10)(3)(3 + 1)
(282 + 182 + 142) - 3(10)(3 + 1)
totals para cada uma dessas condies (isto , tratamentos) so:
12
= 120 (784 + 324 + 196) - 120
2
Na presente ilustrao no apareceram postos "espelhados" (empatados). No caso de tais postos
ocorrerem (por exemplo, se o escore de hostilidade da criana A tivesse sido precisamente o mesmo
para dois ou mais nveis de violncia), adote-se o procedimento recomendado para postos "espelha-
= 0,10(1.304) - 120 = 130,4 - 120 = 10,4
dos", Captulo 11, sob o ttulo "Coeficiente de Correlao de Postos".
PASSO 4: Achar o nmero de graus de liberdade
* N.T.: Tanto faz que a atribuio de postos se faa, relativamente aos escores, do maior para o
gl = k -
menor ou vice-versa.
= 3 - = 2
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor 1 1
200 TOMADA DE DECISES Qui-quadrado e outros Testes Na-o-paramtricos 201
PASSO 5: Comparar o x, (obtido, observado, calculado) com 0 x2 crtico (tabelado) N= nmero total de dados ou de respondpAtes.,r,,, pc FEDERAL DO
soo.
na Tabela E n = nmero de respondentes por amostra
ERi = soma dos postos por amostra.
ottiLlOr ac,A, 11.i.NTRAEda
(obtido) = 10,4
X2 (tabelado) = 5,99 Ilustrao
gl = 2 Para ilustrar a utilizao da prova de Kruskal-Wallis, considere-se a possvel influncia
P = 0,05 da varivel "idade" sobre a varivel "habilidade (capacidade) para arranjar emprego".
Vamos supor que, para estudar esse problema, tenhamos extrado amostras aleatrias
O x, constitui um valor (de qui-quadrado) que decorre diretamente da soma dos de populaes constitudas, respectivamente, de sujeitos velhos, de meia-idade
e de
postos para todos os tratamentos. Como conseqncia, podemos comparar o 4 obtido jovens, e que a todos tenha sido dado igual nmero de dias (prazo) para encontrar
com o x2 tabelado (Tabela E). Com gl = 2 e ao nvel de significncia de 5%, necessita- emprego. Admitamos que os dados obtidos sejam os seguintes:
mos de um qui-quadrado igual a, no mnimo, 5,99 para podermos rejeitar a hipttese
nula. Como o x?, obtido igual al0,4, rejeitamos a hiptese nula e aceitamos a hiptese NUmero de Dias Antes de Encontrar Emprego
experimental. Acabamos de reunir, com isso, suficientes provas de que a violencia tele- Adultos de Adultos Jovens
visada realmente exerce influncia sobre o comportamento hostil de crianas. H, pois, Adultos Velhos (X1) Meia-idade (12) (13)
diferenas significantes na hostilidade medida que a violencia toma-se mais intensa.
(n = 7)63 (n = 8) 33 (n = 6) 25
Requisitos para o Uso da Dupla Anlise da Varifincia por Postos (x2 de Friedman) 20 42 31
43 27
O uso da dupla anlise da varincia por postos-f de Friedman-implica que as se-
6
58 28 14
guintes condies sejam satisfeitas: 57 51 18
71 64
1. Comparao de uma mesma amostra mensurada sob duas ou mais condies. 13
45 12
O teste de Friedman no pode ser aplicado para testar diferenas entre amos-
30
tras independentes; ao contrrio, ele pressupe que a mesma amostra de res-
pondentes tenha sido mensurada pelo menos duas vezes (ou, ento, que os mem- PASSO 1: Atribuir postos ao grupo total de escores (N = 21) e achar a soma desses
bros de duas ou mais amostras tenham sido aglutinados em funo de variveis postos por amostra. Os postos atribudos aos escores devem obedecer ao seguinte
especficas). critrio: ao posto 1 corresponde o menor escore (6) e ao posto 21, o maior escore (71).
2. Dados ordinais. Na presente ilustrao, tanto 6 quanto 71 representam dias.3
O teste s4.5 pode ser realizado com dados aos quais possam ser atribudos postos.
Xl Posto X2 Posto
3. 0 nmero de respondentes (isto , o tamanho da amostra) no deve ser muito X3 Posto
pequeno. 63 19 33 12
O tamanho mnimo de N depende do nmero de tratamentos (k) aos quais os res- 20
25 7
6 42 13 31 11
pondentes vo ser expostos. Por exemplo, N deve ser igual a ou maior que 10 43 14 27 8 6 1
quando k = 3;j com k = 4, N 5. 58 18 28 9 14 4
57 17 51 16 18 5
7 1 21 64 20 13 3
ANLISE DA VARIANCIA PORPOSTOS: H DE KRUSKAL-WALLIS 45 15 12 2
ER3 = 31
ER1 = 110 30 10
A anlise da varincia de KruskabWallis uma alternativa no-paramtrica anlise que
se faz por recorrncia estatstica F, e pode ser usada para comparar vrias amostras 1R2 = 90
independentes desde que os dados sejam de, no mnimo, nvel ordinal. Para podermos
aplicar a prova de Kruskal-Wallis, devemos calcular a estatstica H como se segue:
3 Nib apareceram postos "espelhados" (empatados) na ilustracao presente. No caso de tais postos
12 (1102 ] ontrotom (por exemplo, se duas pessoas levarem exatamente 24 dias pra encontrax um emprego),
- H n
3(N + 1)
N(N + 1)
onde
f
111110 o procedimento apresentado no Captulo 11, sob o ttulo
"Coeficiente de Correlaco de
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
202 TOMADA DE DECISES Qui-quadrado e outros Testes No-parametrleos 203
21(21
N(N + la
1) L n
nem nvel intervalar de mensurao. O qui-quadrado (x2), o mais conhecido dos testes
( 12 \ 1102 902 312) no-paramtricos, usado em comparaes entre freqncias. Quando as diferenas
+ + 3(21 + 1) entre as freqncias esperadas e as observadas so muito grandes, rejeitamos a hiptese
+ 1)) 7 8 6
nula e aceitamos a hiptese experimental (alternativa), que acena com uma verdadeira
=
t 12 \ t 12100 +
8100 961)
66 diferena na populao. Esse o requisito bsico para que um qui-quadrado observado
462) 7 8 6
seja significante. Existem ainda outros procedimentos no-paramtricos: o teste da
= (0,03)(1.728,57 + 1.012,50 + 160,17) - 66 mediana determina se lid uma diferena significativa entre as medianas de duas amos-
tras; a dupla anlise da varincia de Friedman permite fazer comparaes entre mensu-
= (0,03)(2.901,24) - 66 = 87,04 - 66 = 21,04 raes distintas da mesma amostra (duas mensuraes, no mnimo) e, finalmente, a
anlise da varincia por postos de Kruskal-Wallis d margem a uma comparao entre
PASSO 3: Calcular o nmero de graus de liberdade. vrias amostras independentes.
gl = k - 1 = 3 - 1 = 2 PROBLEMAS
1. Amostras aleatrias de homens e de mulheres foram entrevistadas com o objetivo
PASSO 4: Comparar H com o qui-quadrado crtico (Tabela E). de pesquisar-se o comportamento de "fumar cigarros". Descobriu-se que, de 29
homens, 15 eram fumantes; igualmente que, de 30 mulheres, 20 tinham o hbito
H = 21,04 de fumar. Teste a hip6tese nula de que a freqncia relativa de homens que so
X2 crtico (tabelado) = 5,991. fumantes igual de mulheres que tambm o so. Que indicam seus resultados?
gl = 2 2. Dois grupos de estudantes fizeram exames finais de Estatstica. Somente um grupo
P = 0,05 recebeu preparao formal para o exame; o outro grupo leu o texto recomendado,
mas nunca compareceu s aulas. Enquanto que 22 dos 30 membros do primeiro
Para rejeitarmos a hiptese nula ao nvel de significncia de 0,05, com 2 graus de grupo (os "freqentadores") passaram no exame, apenas 10 dos 28 do segundo
liberdade, nosso H teria que ser igual a ou maior que 5,991. Como obtivemos H = 21,04, grupo (os "ausentes") lograram aprovao. Teste a hiptese nula de que a freqn-
podemos rejeitar a hiptese nula em favor da hiptese alternativa (experimental). Nossos cia relativa dos "freqentadores" que passaram nas provas finais igual freqn-
dados revelam que existem diferenas significativas, por idade, na quantidade de dias cia relativa dos "ausentes" que tambm passaram. Que que seus resultados
necessria para arranjar-se um emprego. indicam?
3. Aplicando a correo de Yates, realize uma prova de qui-quadrado para o seguinte
Requisitos para o Uso da Anlise da Varifincia de Kruskal-Wallis problema 2 X 2:*
A prova de Kruskal-Wallis pressupe as seguintes condies para seu uso adequado:
16 8
1. Comparaedo de tre's ou mais amostras independentes.
A prova de Kruskal-Wallis nib pode ser usada para testar diferenas numa Unica
amostra de respondentes mensurados mais de uma vez. 7 11
2. Dados ordinais.
Essa prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja 4. Aplicando a correo de Yates, realize uma prova de qui-quadrado para o seguinte
possvel atribuir postos. problema 2 X 2:
3. 0 tamanho mnimo de cada amostra deve ser 6.
Quando n > 5 por grupo de respondentes, a significncia de H pode ser determi-
nada por recorrncia Tabela E (qui-quadrados crticos). Para testar diferenas * N.T.: importante salientar duas coisas: (1)-no se faz correo de continuidade (correo de
entre amostras de tamanho inferior a 6, o leitor deve recorrer a tabelas especiais Yates) em tabelas com dois ou mats graus de liberdade; (2)-mesmo em tabelas corn um grau de
encontradas em Siegel (1956). liberdade, s tem sentido aplicar tal correo se a hiptese nula tiver sido refeitada.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Qui-quadrado e outros Testes Nab-paramtricos 205
204 TOMADA DE DECISES
10 1 8
1 2
3 5
4 6
6. Faa uma prova de qui-quadrado para o seguinte problema 3 X 3:
3 3
6 8
20 17 5 5 6
5 8
1 2
3 2
15 16 16
5 6
6 8
14 18 6 4
4
3 3
7. Faa um teste de qui-quadrado para o seguinte problema 4 X 2: Aplicando a prova da mediana, decida se existe uma diferena significativa entre as
medianas desses grupos. Ser que as avaliaes feitas pelos estudantes sofreram
25 6 influncia da varivel "sexo do autor"?
10. Aplicando o teste da mediana, determine se h uma diferena significativa entre as
19 10 medianas das seguintes amostras de escores:
15 15
It 12
7 4
8 20 8 9 7 3
7 5 3 2
6 9 2 2
8. Faa uma prova de qui-quadrado para o seguinte problema 2 X 3: 7 8 3 6
7 9 4 4
8 7 7 5
9 9 4 4
8 10 15 4 7 9 5 4
6 6 4
9 2 3
12 10 9
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
206 TOMADA DE DECISOES Qui-quadrado e outros Testes New-paramtricos 207
11. Uma amostra de 14 crianas, constituinte do grupo "harmonia e identificao", foi 13. Pesquisadores analisaram a varivel "alienao politica" entre trs amostras de uni-
mensurada ern dois momentos distintos: antes e depois de sua participao numa versitrios: bacharelandos em "profisses liberais", em "engenharia" e em "artes".
tarefa de classe cujo objetivo era tomar os alunos mais dependentes uns dos outros Cada amostra forneceu um grupo de escores, conforme abaixo indicado (quanto
na consecuo de uma promoo curricular. mais alto o escore maior a alienao):
Resultaram os seguintes escores-identificao (escores mais altos indicam maior
"harmonia grupal"): X1 (Prof Liberais) X2 (Engenharia) X3 (Artes)
100 101 97
Tarefa Cooperativa 110 90 98
95 92 99
Antes Depois 93 100 100
Tempo 2 106 90 104
Aluno Tempo 1
102 96 103
A 62 75 92
51 53
60 62
43 51 Aplicando a anlise da varincia de Kruskal-Wallis, verifique se h uma diferena
49 52
significativa entre as citadas amostras de universitrios com respeito ao nvel de
45 46
73 62 alienao poltica.
66 68 14. Aplican do a prova de Kruskal-Wallis, verifique se h uma diferena significativa
57 55 entre as seguintes amostras de dados:
63 69
43 45
46 45 Il
67 68 125 100 95 64f/
61 67 100 99 90
122 105 86
127 103 96
115 116 88
Aplicando a dupla anlise de varincia de Friedman (por postos), determine se h
129 98 89
uma diferena significativa entre os resultados obtidos no Tempo 1 e Tempo 2 130
relativamente varivel "harmonia grupal".
12. Aplicando a dupla anlise de varincia por postos-x2 de Friedman-verifique se h
uma diferena significativa entre os escores produzidos por uma amostra de 11
respondentes em trs momentos distintos: T1, T2 e T3 .
Respondente T2 T3
A 60 62 64
53 54 50
59 65 71
65 66 68
55 63 61
71 74 76
57 58 63
77 76 79
63 65 70
.1 54 59 62
63 62 65
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Correlacdo 209
11
tao grfica da relao entre "anos de escola" (X) e "renda" (Y). Observe-se que essa
relao, na Figura 11.1(a), refere-se a homens, enquanto que na Figura 11.1(b), a
mulheres. Note-se, ainda, que, nesses diagramas de disperso, todos os pontos resullam
do "cruzamento" de dois escores-educao e renda-relativos a um particular respon-
dente. (Em outras palavras: a cada respondente correspondem dois escores e estes, em
Correlao
conjunto, do origem a um ponto do diagrama de disperso.) Na Figura 11.1(a), por
exemplo, vemos que a um homem com 4 anos de escolarizao corresponde uma renda
de CrS 68.000,00 (anuais), enquanto que a um homem com 13 anos de estudos, a renda
de CrIl. 170.000,00."
Podemos dizer que a fora de correlao entre X e Y aumenta medida que os
pontos, no diagrama de disperso, mais compactamente se agrupam em torno de urna
linha reta imaginria. Portanto, a Figura 11.1(a) (homens) representa uma correlao
mais forte do que a 11.1(b) (mulheres), muito embora ambos os diagramas indiquem
que a renda tende a aumentar com o aumento dos anos de escolarizao. Tais dados,
Caractersticas tais como orientao poltica, inteligncia e classe social variam de um na verdade, sugerem fortemente que a renda das mulheres (com relao dos homens)
respondente para outro e so, por isso, chamadas varidveis. Em captulos anteriores est menos relacionada com o nvel de escolaridade por elas atingido.
ocupamo-nos com o estabelecimento da presenca ou ausncia de relao entre duas
Variveis quaisquer, que, daqui por diante, chamaremos X e Y; por exemplo, relao SENTIDO DA CORRELAO***
entre orientao poltica (X) e mtodo de educar filhos (Y), entre classe social (X) e
A correlao pode ser classificada, quanto ao sentido, em positiva ou negativa. Uma
inteligncia (Y) ou entre orientao acadmica (X) e uso de entorpecentes (Y). Auxilia-
correldo positiva indica que os respondentes que obtiveram escores altos na varivel
dos pela razo t, pela anlise de varincia ou pelo qui-quadrado, procuramos, pginas
X tendem a obter escores tambm altos na varivel Y. De forma recproca, responden-
atrs, descobrir se uma diferena entre duas ou mais amostras podia ser considerada
tes que obtm escores baixos em X tendem a obter escores tambm baixos em Y (e,
estatisticamente significativa-reflexo de uma verdadeira diferena populacional-e no
nesse caso, a correlao tambm positiva). A correlao positiva pode ser ilustrada a
apenas o resultado de erro de amostragem (ao do acaso).
partir da relao entre escolaridade e renda. Como j vimos antes, respondentes com
muitos anos de escolaridade tendem a apresentar rendas anuais maiores do que aqueles
que freqiientaram a escola por poucos anos.
FORA DA CORRELAO
Diz-se que h correlao negativa quando, com relao aos mesmos respondentes,
Descobrir a existncia de uma relao no esclarece muito a respeito do grau de associa- medida que se obtm escores altos na varivel X, h a propenso de se obterem escores
o ou correlao entre duas variveis. Muitas so as relaes estatisticamente significan- baixos na Y. Reciprocarnente, ocorrer tambm correlao negativa se, em correspon-
tes; poucas expressam correlao perfeita ou exata. Ilustremos: sabemos que peso e dncia a valores baixos na varivel X, existir uma tendncia a valores altos na varivel Y.
estatura so variveis associadas, uma vez que, quanto mais alta a pessoa, maior tende a A relao entre escolaridade (anos de) e renda (anual) no caracteriza uma correlao
ser seu peso. H numerosas excees regra, entretanto. Algumas pessoas altas pesam
muito pouco; algumas pessoas baixas pesam muito. Da mesma forma, uma relao entre
orientao para estudos universitrios e uso de entorpecentes no prenuncia a possibili- * N.T.: Trata-se de um sistema cartesiano de eixos ortogonais.
dade de encontrarmos centenas de no-viciados entre estudantes que pretendam conti- ** N.T.: Em ambos os casos, mas principalmente no primeiro-a julgar pelo valor do salrio mnimo
nuar a vida acadmica ou muitos viciados entre os que no planejam freqentar a vigente-trata-se de empregados com algum grau de especializao.
universidade. ***N.T.: No texto original, o Autor fala em direct-to de correlao. Parece que o termo sentido
mais rigoroso, j que a mesma direco r (reta r) pode ser "percorrida" em dois sentidos (que se
As correlaes, na verdade, variam com respeito sua fora. Podemos visualizar
opem): de A para B e de B para A. Assim:
diferenas, quanto fora de correlao, por meio de um diagrama de disperso, que
um grfico capaz de mostrar a maneira pela qual os valores de duas variveis, X e Y, A
$14.000 814.000 Assim, famlias da classe mdia tan pequeno nmero de filhos: o tamanho da famlia
.0-.3 12.000 12.000 (Y) aumenta medida que a situao scio-econmica torna-se melhor ou pior.
10.000 10.000
6' 8.000 E 8.000 $14.000
-a 12.000
cl 6.000 -a 6.000
z 10.000
4.000 4.000 _
14-)
8.000
I
6.000 60
10
I 12
' 14 14 6 8 10 12 14 4.6
4.000
Anos de Estudo Anos de Estudo o .
40 e;:,
(a) Homens (b) Mulheres
2.000 Z 20
0 1} O
1 1 1 1 1 1 1 1 1 1
4 5 6 7 8 9 10 11 12 13 4 5 6 7 8 9 10 11 12 13
FIGURA 11.1 Diagramas de Disperso Ilustrativos de Diferenas na "Fora da Relao" entre Escolaridade em Anos Escolaridade em Anos
"Escolaridade" e "Renda" (Homens e Mulheres). (a) (b)
negativa, uma vez que respondentes com muitos anos de estudo tido tendem a apresen-
FIGURA 11.2 Diagramas de Disperso: (a) Correlao Positiva entre Escolaridade e Renda; (b) Cor-
tar rendas anuais baixas. Um exemplo mais caracterstico de correlao negativa resulta relao Negativa entre Escolaridade e Reprovaes.
da relao entre escolaridade (anos de) e reprovao nos grupos minoritrios. A repro-
vao tende a diminuir me dida que o nvel educacional aumenta. Portanto, sujeitos com
12
pouca educao formal tendem a apresentar maiores ndices de reprovao, enquanto
que os que freqentaram por mais tempo geralmente repetiram poucas vezes o ano. 10
8
6
CORRELAO CURVILNEA 4
e.
Uma correlao positiva ou negativa representa um tipo de relao linear. Graficamente, 2 - 4 ...*:4.0
os pontos* do diagrama de disperso aglomerar-se-o em torno da linha (reta) imagin-
0
1 1 1 11 11
ria in dicada na Figura 11.2(a). Por outro lado, se uma correlao negativa estiver presente, 1 2 3 4 5 6 7
os pontos do diagrama de disperso circundaro a reta imaginria conforme indica a (Baixa) (Alta)
Situao Scio-econmica
Figura 11. 2(b).
Na maior parte dos casos, os pesquisadores buscam estabelecer correlaes li-
neares, sejam elas positivas ou negativas. importante notar, entretanto, que nem FIGURA 11.3 Relao entre"Situao Scio-Econmica"(X) e "Tamanho da Famlia" (Y): Cor-
todas as relaes entre X e Y do origem, necessariamente, a uma linha reta.** Exis- relao Curvilnea.
tem muitas correlaceies curvilineas, indicativas de que uma varivel aumenta a medida
que a outra tambm aumenta, at ocorrer uma "reverso"; a partir da, uma das vari-
veis comea a decrescer, enquanto que a outra continua a crescer. Em outras palavras, COEFICIENTE DE CORRELAO
uma relao entre X e Y que comea positiva toma-se negativa; uma relao que comea O procedimento que permite trabalhar com correlaes no-lineares (curvilneas)
negativa toma-se positiva. Para ilustrar uma correlao curvilnea, consideremos a situa-se alm do escopo deste texto. Por essa razo, vamos voltar nossa ateno para
relao entre as variveis "nmero de crianas" (tamanho da famlia) e "situao scio- os chamados coeficientes de correlacio linear, que expressam, numericamente, tanto a
-econmica". Como evidencia a Figura 11.3, os pontos do diagrama de disperso tendem fora quanto o sentido da correlao. Tais coeficientes de correlao oscilam entre
a formar uma curva em U-e no uma reta, semelhana dos exemplos anteriores.
-1,00 e +1,00 conforme se segue:
+0,50 < correlao positiva moderada Z y = escore z de um particular sujeito na varivel Y, e dado por
+0,95 < correlao positiva forte N = total de pares de dados (escores), isto , total de "duplas" X e Y.
+1,00 < correlao positiva perfeita
Distribuio X Distribuio Y
Vemos, pois, que valores numricos negativos, tais como
-1,00, -0,95, -0,50 e -0,10,
indicam correlao negativa, enquanto que valores
numricos positivos, como, por
exemplo, +1,00, +0,95, +0,50 e +0,10, so indicativos
de correlapio positiva. Em
termos de grau de associao, quanto mais prximo
de 1,00 em ambos os sentidos,
maior a fora da correlao. Como tal fora independente
do seu sentido, podemos
dizer que -0,10 e +0,10 so iguais quanto fora
(ambos fracos); -0,95 e +0,95
tambm so iguais quanto a ela (ambos fortes).
Respondente A
Correlao Positiva
TABELA 11.1 Relao entre Nivel Educacional do Respondente e do Respectivo Pai. (Nivel Educa-
cional Mensurado em Anos Completos de Freqncia Escola.)
x x- x- Y Y -Y Y - z x zy
Sx Sy
Anos de Eseola
Criana Pais (X) Crianas (Y)
A 12 12 D 16 5,57 1,85 11 1,57 0,79 1,46
B 10 8 E 8 -2,43 -0,81 10 0,57 0,29 -0,24
C 6 6 F 9 -1,43 -0,48 8 -1,43 -0,72 0,34
D 16 11 G 12 1,57 0,52 11 1,57 0,79 0,41
E 8 10 I
E(zx zy) = 5,29
F 9 8
G 12 11
Para ilustrar o procedimento que permite obter zX, Zy e Z.KZy acima, vamos examinar
Para aplicar a frmula do r de Pearson, precisamos, antes, descobrir o valor de cada as respostas do sujeito A, mensuradas das variveis X e Y. J sabemos que X = 10,43
uma das seguintes estatsticas: X, Y, SX e sy. Assim: e que sx = 3,01. Como X -X -
= 12 10,43 = 1,57 para o sujeito amostral
A, verificamos que sen zx = 1,57/3,01 = + 0,52. (Em outras palavras, os 12 anos
y2 de escola do sujeito A caem aproximadamente a meio desvio padro acima da m-
X X2 Y
dia da distribuio.) De modo anlogo, sabemos que Y = 9,43 e que s y = 1,98.
12
10
144
100
12
8
144
64
Como Y -Y = 12 - 9,43 = 2,57 para o sujeito amostral A, verificamos que
sen Zy = 2,57/1,98 = + 1,30. (Em outras palavras, esses 12 anos de escola caem
6 36 6 36 y- EY
16 256 11 121 = aproximadamente a um e um tero desvios padres acima da mdia da distribuio.)
8 64 10 100 Para obtermos o zxzy relativo ao sujeito A, s multiplicar o escore z = +0,52
9
12
81
144 _
8
11
64
121 = _73
7
= -
66
7
pelo escore z = +1,30 (donde: 0,52 X 1,30 = 0,68). Como evidencia a Ultima
coluna, direita, na tabela acima, a soma desses produtos de escores z 5,29.
EX = 73 EX2 = 825 EY = 66 EY2 = 650 Entrando com esses dados na fUrmula de Pearson, obtemos:
= 10,43 = 9,43
r = X(zxz y) 5,29
= + 0,75
7
Sy =
= VII)VC2 X.2
No exemplo acima, o r de Pearson igual a +0,75, o que indica uma correlao positiva
V825 V 650
(10,43)2 (9,43)2 razoavelmente forte entre o nvel educacional atingido pelos filhos e o nfvel educacional
= 7 7
atingido pelos respectivos pais. Em outras palavras, os respondentes cujos pais consegui-
= N/117,86 - 108,78 = N/92,86 - 88,92 ram um nvel alto de escolaridade tambm apresentaram propenso a chegar a um nvel
= N5,--4 alto de escolaridade; os respondentes cujos pais freqentaram a escola durante poucos
= 3,01 = 1,98 anos tambm demonstraram uma forte tendncia a freqentar a escola durante pouco
tempo.
Agora para cada sujeito amostral, calculamos dois escores z: um relativo varivel X,
outro Y; depois, achamos o produto desses escores z: FORMULA PARA 0 CALCULO DO r DE PEARSON
O clculo do r de Pearson a partir de escores z ajuda a relacionar o tpico da correla-
X -X Y - o com nossos esiudos anteriores sobre escores padronizados e curva normal. Entre-
X X -X Y Y - zx zy tanto, a frmula do r de Pearson baseada em escores z, requer muitos clculos que
s
X Sy
consomem bastante tempo. Felizmente, existe uma frmula para o clculo do r de
Pearson que trabalha de forma direta com escores brutos, eliminando-se, assim, a neces-
A 12 1,57 0,52 12 2,57 1,30 0,68
B 10 -0,43 -0,14 8 -1,43 -0,72 0,10 sidade de obterem-se os produtos dos escores z para X e Y. A frmula alternativa para
C 6 -4,43 -1,47 6 -3,43 -1,73 2,54 o r de Pearson
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
216 TOMADA DE DECISES correlaco 217
r =
NEXY - (IX)(EY) a hiptese de que no existe correlaO na populao. Com respeito ao coeficiente de
correlao (linear) d Pearson, a hiptese nula fixa que
V[NIX2 -(X)9[NEY2 - (EY )9
onde r = 0,
= coeficiente de correlao (linear) de Pearson enquanto que a hiptese e perimen (hiptese alternativa, Ha) estabelece que
= nmero de pares de escores brutos ("duplas" formadas de X e Y)
X = escore bruto (na varivel X) r 0.
= escore bruto (na varivel Y)
semelhana do que fi mos em captulos anteriores, testamos a hiptese sele-
A fim de ilustrar o uso da frmula alternativa para o clculo do r de Pearson, cionando um nvel de signifi ia igual a 0,05 ou 0,01,* aplicando, a seguir, a prova
vamos voltar aos dados da Tabela 11.1, onde se procurou estabelecer a relao entre adequada. Para testarmos a ign cncia do r de Pearson, podemos calcular uma esta-
nmero de anos de escola cursados pelo pai (X) e o nmero de anos de escola cursados tstica (razo) t com (N -
) gr au de liberdade, sendo N o nmero de pares de escores.
pelo respectivo filho (Y). A aplicao dessa frmula implica que calculemos primeiro A razo t pode ser obtida hedian te a frmula:
X2, Y2 e XY, conforme se segue:
t - rVN - 2
y2 XY
- r2
onde
12 144 12 144 144
10 100 8 64 80 t razo t (t observado, calculado) para testar a significncia do r de
36 6 36 36
6 Pearson
16 256 11 121 176
10 100 80 N = nmero de pares de escores (compostos de X. e Y)
8 64
9 81 8 64 72 r = o prprio r de Pearson (que est sendo posto prova).
12 144 11 121 132
EX = 73 EX2 = 825 EY = 66 Er2 = 650 EXY = 720 Voltando ao exempli anterior, podemos testar a significncia de um coeficiente
de correlao igual a +0,75 , resultante associao entre nveis educacionais de pais
e respectivos filhos. Assim:
Ento, o r.oeficiente de correlao (linear) de Pearson igual a
7(720) -
(73)(66)
0,7540-
r - A7(8251 - (73)9[7(650) - (66)9
N/1 - (0,754)2
5040 - 4818 222 222
0,754(2,236) ,69 1,69
V(5775 - 5329)(4550 4356) V(446)(194) N/86524
-s/1 -
0,569 431 0,656
2,58
222
= + 0,75
294,15
Ao consultar a Tabela C (fim do livr ), verificamos que, para ser significante, a razo t
deve igualar-se a ou exceder 2,57, ad nvel de significncia de 0,05, com 5 graus de
liberdade. Como o nOsso t calculado (4 = 2,58) maior do que o t tabelado (crtico),
Teste da Significncia o r de Pearson podemos rejeitar a hiptese nula de que r = 0 e aceitar a hiptese experimental de
O coeficiente de correl o (linar) de Pearson d-nos uma medida precisa
da forca e
que r 0. 0 nvel educacional do respondente e o nvel educacional de seu pai esto
do sentido da correlao isiente entre as variveis) na amostra estudada. Se tivermos
ainda querer realmente associados na populao.
extrado uma amostra alea na de uma particular populao, podemos
verificar se a associao pbtida ntre X e Y existe de fato na populao, e no resulta
meramente de erro amostral (= a -o do acaso). * N.T.: Ou qualquer outro nvel de significncia, pois isso depende do rigor com que o pesquisa-
Para testar a significncia de u a medida de correlao, geralmente estabelecemos dor deseja trabalhar.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Correlao 219
218 TOMADA DE DECISES
Felizmente, o processo ilustrado cima para testar a/significncia do r de Pearson, foi A 10 100 1 1 10
simplificado; assim, torna-se desne essrio-a no ser a ttulo de exerccio-calcular a B 3 9 7 49 21
razo t. suficiente, pois, consultar Tabela F, no fim do livro, onde figura uma lista C 12 144 2 4 24
33
de valores significantes do r de Pearso aos nveis de significncia de 0,05 e 0,01,
associ- D 11 121 3 9
entre E 6 36 5 25 30
ados a graus de liberdade que vo de 1 904e for feita uma comparao direta o
F 8 64 4 16 32
nosso valor calculado de r e o valor tabel o (Tabela F), obteremos o mesmo resultado 14
G 14 196 1 1
E
F
6
8
5
4
gl = N -/2 = 10 - 2 = 8
G 14 1
Como indicam os resultados acima, para que fosse possvel rejeitar a hiptese
Para calcular o r de Pearson, procede-se do seguinte modo: nula de que r = 0, ao nvel de significncia de 5% e com 8 graus de liberdade, seria
necessrio que o nosso r calculado fosse, no mnimo, igual a 0,63. Como o r calcula-
PASSO 1: Calcular (1) EX, (2) EX2, (3) IY; (4) EY2 e (5) EXY do igual a -0,92, rejeitamos a hiptese nula e aceitamos a hiptese experimental.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
220 TOMADA DE DECISES Correlao 221
Em outras palavras, nossos resultados sugerem a existncia de correlao entre "edu- Vimos, pginas atrs, que a form de uma correlao entre X e Y aumenta medi-
cao" e "reprovao" na populao da qual nossa amostra foi retirada. da que os pontos do diagrama de disperso concentram-se em torno de urna reta imagi-
nria. Podemos agora identificar essa curva* pelo nome de reta de regresso, que uma
Requisitos para o Uso do Coeficiente de Correlao de Pearson reta interpolatriz obtida a partir da nuvem de pontos do diagrama de disperso. O leitor
A fim de empregar-se corretamente o coeficiente de correlao de Pearson como medi- atento perceber que muitas so as retas que se "acomodam" aos pontos do diagrama,
da de associao entre as variveis X e Y, os seguintes requisitos devem ser levados em mas uma e somente uma constitui a reta de regresso. Isso porque o ajustamento dessa
conta: reta ao conjunto de pontos 6 o melhor possvel, garantindo-se, assim, boas previses de
Y, a partir do conhecimento de X.
1.Correboo* linear-0 r de Pearson s se aplica a correlaes lineares entre
X e Y.
Previso de Y a partir de X
2. Dados intervalares -As variveis X e Y devem ser mensuradas, no mnimo, a
Imaginem um estudo em que se procure estabelecer a correlao entre X = anos com-
ravel intervalar, de sorte que seja possvel trabalhar com escores.
pletos de freqncia escola e Y = renda mensal. Seja uma amostra de seis responden-
3. Amostragem casual-Os sujeitos amostrais devem ter sido extrados aleatoria-
tes, onde r = +1,00, isto 6, onde h correlao positiva perfeita:
mente de uma dada populao. Se assim no for, no ter nenhum sentido a
prova de significncia do coeficiente obtido.
Anos de Renda Mensal
4. Varicveis distribudas normalmente-Para que seja possvel testar a significn- Respondente Escola (X) em Cr$ (17)
cia do r de Pearson, 6 necessrio que ambas as variveis, X e Y, tenham distri-
buio normal na populao. Quando as amostras so pequenas, qualquer A 18 30.000,00
descuido na observncia dessa normalidade de distribuio pode comprometer B 6 10.000,00
seriamente a validade do r de Pearson. Entretanto, esse requisito deixa de ter C 9 15.000,00
D 15 25.000,00
importncia to grande quando o tamanho das amostras igual a ou maior E 12 20.000,00
que 30. F 3 5.000,00
ANLISE DE REGRESSO
Como demonstra a Figura 11.5, podemos marcar os escores acima num grfico
O estabelecimento de uma correlao entre duas variveis pode ter utilidade na previso
e traar por entre os pontos obtidos uma reta mediatriz. Essa mediatriz ser a reta de
dos valores de uma delas (Y) a partir do conhecimento dos valores da outra (X). A tc-
regresso que une os escores de cada respondente da amostra. Tal linha (reta) de regres-
nica empregada em tais previses conhecida por andlise de regresso.
so permite fazer a seguinte previso: um sujeito que tenha cursado a escola durante
18 anos poder ganhar Cr $30.000,00 mensais; um outro, que tenha freqentado apenas
* N.T.: Md.() v o leitor confundir correlaiio com relao de causa e efeito. Duas variveis, X e Y, 3 anos, Cr$ 5.000,00 mensais e assim por diante:
podem estar correlacionadas, mas isso no significa que uma delas seja a causa da outra. Mais formal-
J foi salientado anteriormente que h poucas correlaes perfeitas (+1,00 ou
mente, se Y = f(X), nada obriga, alm da correlao, que exista relao causal. Exemplo: suponha-se
que um pesquisador resolvesse estudar a associao existente entre as seguintes variveis: X = nmero -1,00) que a natureza apresenta. Este fato muito importante porque, como regra
de palavras que uma criana conhece e Y = tamanho do p desta mesma criana. Admita-se, agora, o geral, as previses tornam-se mais acuradas medida que o coeficiente de correlao
seguinte quadro: aproxima-se de -1,00. Quando a correlao entre duas variveis for forte, mas no
perfeita, possvel, ainda assim, construir uma linha de regresso (previso) que se
Nmero do
Nmero de Calado "ajuste** bem" ao conjunto de pontos do diagrama. Isso verdadeiro mesmo que nem
Idade da Palavras (= tam. do pi) todos os pontos da nuvem caiam exatamente sobre a reta (o que, alis, o mais co-
Criana (em anos) Conhecidas (X) (Y) mum); no ficamos impedidos de fazer previses, mas devemos aceitar o fato de que a
10 17
previso ser tanto mais imprecisa quanto mais distante o ponto estiver da linha de
1
2 300 20 regresso. A Figura 11.6 ilustra o caso de uma correlao forte, mas no perfeita.
3 1.000 24
4 3.000 28
5 8.000 30 * N.T.: Curva um nome genrico. Por isso nada impede, como, alis, o presente caso, que,
na regresso linear, a curva seja uma reta.
bvio que a correlao vai ser altfssima e positiva, o que no significa que o tamanho do p possa
ser explicado pela dimenso do vocabulrio ou vice-versa. Mais coerente pensar numa relaro trian- ** N.T.: Esse ajuste conseguido graas aplicao de uma "lei" denominada "Lei dos Mfnimos
gular, onde a prpria idade responsvel tanto pelo crescimento do 136 quanto do vocabulrio. Quadrados". As equaes de regresso so conseqncia direta dessa lei.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
222 TOMADA DE DECISES Correlao 223
Equao de Regresso podemos, a partir da, estabelecer a equao de regresso conforme se segue:
A equao de regresso, em smbolos, resulta na seguinte frmula:
Y' =rHx-r(-'1KyY+Y.
sx sx
= 0 ,85 -
05,
0,4
X - 0,85 (
0
0,4
5
) 10 + 5.000
= valor terico (previsto) de Y (Nota: como se trata de uma previso, = 1,06X + 4.989,4
rpode ser diferente de Y)
r O fim de prever (estimar) o valor de Y para cada X particular, basta entrarmos
= coeficiente de correlao linear de Pearson (r) para a relao entre
as variveis X e Y na frmula com os valores de X. Por exemplo: qual a renda mensal prevista para um
S y = desvio padro (amostral) da varivel Y sujeito que tenha ficado 12 anos completos na escola?
sx = desvio padro (amostral) da varivel X
Cr $35.000
X = um particular valor de X
= media aritmtica dos valores (amostrais) da varivelx 30.000
= media aritmtica dos valores (amostrais) da varivel Y.
25.000
Para ilustrar o uso da frmula de regresso na previso dos valores de Y, vamos 20.000
supor que entre as variveis X = anos de freqncia escola e Y = renda mensal te- 2
4 15.000
nhamos conseguido r = +0,85.
r'') 10.000
Cr$ 35.000
30.000 5.000
25.000 3 6 9
1 12
I 15
1 118
15.000
FIGURA 11.6 Linha (Reta) de Regresso Correspondente Relao entre ol Nmero de Anos Com-
10.000 pletos de Freqncia Escola (X) e a Renda Mensal (Y), onde (r < +1,00)
5.000
3
t
6
III!
9 12 15 18
Entrando com os dados na equao de regresso, vem que:
Yl 1,06(12) + 4.989,4
Anos de Escola (X) 12,72 + 4.989,4
5.002,12
FIGURA 11.5 Linha (Reta) de Regresso Correspondente Relao entre o Nmero de Anos
Completos de Freqncia Escola (X) e a Renda Mensal (Y), onde (r +1,00) Portanto, a previso da renda mensal de algum que tenha 12 anos de escola de
Seja que: Cr$5.002,12.
Da mesma forma, podemos prever que um sujeito que tenha completado 6 anos
r = +0,85 de escola ganhe Cr $ 4.995,76, ou seja:
sy = 0,50
sx = 0,40 = 1,06(6) + 4.989,4
= 10 anos -= 6,36 + 4.989,4
= Cr $ 5.000,00 = Cr $4.995,76
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
224 TOMADA DE DECISES Correlago 225
et,
Anlise de Regresso: Ilustrao PASSO 3: Calcular os devios padres amostrais para X e Y.
O estudo da anlise de regresso pode ser ilustrado com maior profundidade retoman- d>0
do-se um exemplo anterior em que foram examinadas as variveis X = nvel educa- /X2 - 44C, 40
cional conseguido por pais e Y = nvel educacional conseguido pelos respectivos filhos. sx = Al X' si --- 0 <(''
fr
N 2' e
Como vimos no incio deste captulo, tal relao, numa amostra de sete respondentes, = -or (9,43)2
= \/8 5 ( 1 0,43)2
produziu um r de Pearson igual a 0,75. Recapitulemos: 0
= \/117,86 -
108,79 = N/92,86 - 88,93 11"1,
1ANU2 (U)2][NlY2 (IY)2] Yr = 0,50X + 4,21 = 0,50(16) + 4,21 = 8,0 + 4,21 = 12,21
7(720) (73)(66) - 2. Para um respondente cujo pai tenha completado 6 anos de estudos:
-
V[7(825) (73)27[7(650) - (66)27
5.040 -
4.818 Y' = 0,50X + 4,21 = 0,50(6) + 4,21 = 3,0 + 4,21 = 7,21
N/(5.775 - 5.329)(4.550 - 4.356) Concluso: temos condies de prever (estimar) que respondentes cujos pais
tenham concludo 16 anos de estudos cursaram/cursaro 12,21 anos; por igual racio-
222 cnio, os filhos de pais que estudaram 6 anos freqentaram/freqiientaro escola durante
N/294,15 7,21 anos.*
PASSO 2: Calcular as mdias aritmticas amostrais para X e Y , isto , X * N.T.: Observem-se trs aspectos importantes:
e Y.
1. Anlise de regresso no adivinhao. Tambm no um processo de "acertar a mosca".
0 leitor deve procurar perceber que o conjunto de pontos do diagrama de disperso define uma
- /Y
IX tendencia. A reta interpolatriz (isto 6, de regresso) apenas "sintetiza" essa tendncia e permite
X - N
Y
N uma generalizao, sob a forma de equao, como se todos os pontos cassem sobre ela.
2. Do que ficou dito em (1), acima, decorre que:
73 66 a) se Y = f(X) for funeo matemtica, as previses sero pontuais, isto , por ponto, e a pre-
7 7 ciso ser grande;
= 10,43 = 9,43 b) se Y = f(X) for funo estatstica, as previses sero intervalares, isto , os valores de
17' pertencero a um intervalo. Da que (Y' - Y) = erro de estimao.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
226 TOMADA DE DECISES Correlao 227
2 1 1 1
A
2
3
1
\ situao sci o-
2
1
3
3
4
5
3
5
4
-1
o
1
0
1
4 -econrnica 5
maior tempo diante 6 8 -2 4
5
mais alta 4
da TV 7 6 1
6 8 8 7 1
7 6 ED2 = 1 0
8 7
6(10) 60 60
Como podemos observar, o respondente A recebeu o posto 1 com relao ao
nvel scio-econmico, mas posto 2 quanto ao tempo despendido diante da TV; o
rs = 1
8(64 - 1)
= 1
8(63)
= 1
504
=
'
1 - 0,12 = + 0,88
A 110 7
Entrando agora, com os dados acima, na frmula, vem que:
90 10
104 8 os postos 5, 6 e 7
100 esto empatados 6(24,50)
rs
110 : 1
10(100 1) -
110
132
115
140
5
3
4
2 < os postos 1 e 2
1 -
- 990
147
= 1 - 0,15 = + 0,85
2
2
- 1,5
os Y5 crticos. Observe-se que, nes,(e casc:;a consulta leva em conta apenas o nmero de
pares de escores (IV) e no, com4 noutros testes, os graus de liberdade. Neste problema,
N = 10 e, conforme a Tabela , para que um r, seja sigmficante (ao nvel de 0,05),
Por igual raciocnio, relativamente ao QI = 110, o procedimento : preciso que ele obedea se inte condio: r, > 0,648. Como o nosso rs observado
+ 6 + 7 igual a 0,85 (portanto maior que o F., crtico), rejeitamos a hiptese nula de que rs = 0
5
- 6,0 3
e aceitamos a hiptese experimental de que "classificao acadmica" e "QI" so
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
variveis correlacionadas no s na amostra como tambm na popukto.
230 TOMADA DE DECISES
Correlactio 231
Cone lao de Postos: Ilustrao PASSO 2: Calcular ED2. Para tanto, calcular as diferenas entrc os postos (colunas
Vamos resumir o procedimento que permite obter o coeficiente de correlao de postos Xe quadrar estas diferenas (D2) e somar os quadrados resultantes ):
utilizando, para isso, mais um exemplo. Seja o clculo da relao entre o "grau de
participao voluntria em as- X Y D D2
sociaes" (X) e o "nmero de Participao Voluntria
amigos ntimos" ( Y). Supo- em Associaes (X) Nmero de 1 1,5 -0,5 0,25
Respondente Posto Amigos (Y)
nha-se, ainda, uma amostra de 2 3,0 -1,0 1,00 UNIVERSIDADE
cinco respondentes, conforme 3 1,5 1,5 2,25 FEARAL t.g)
A 1 participa 6 4 4,5 -0,5 0,25 BIBLIOTECA CENTRAL PAIIA
o quadro 2 mais 4 5 4,5 0,5 0,25
3 6
4 2 1D2 = 4,00
participa
5 2
menos
PASSO 3: Entrar com o resultado do Passo 2 na formula do coeficiente de correlao
Para determinar o grau de associao entre X e Y, procedemos da seguinte ma- de postos de Spearman:
neira:
6/D2 6(4) 24
PASSO 1: Atribuir postos aos respondente tanto na varivel X quanto na Y. Como
= 1
N(AT2 - 1)
- 1
5( 4)
- 1
120
demonstra o quadro acima, a distribuio de ostos com respeito varivel X-partici-
pao voluntria em associaes-obedece se inte regra: posto 1 para o respondente = 1 - 0,20 = + 0,80
que participa "mais" e 5 para o
que participa "menos".
Nmero de Amig (Y): Posto PASSO 4: Comparar o rs obtido (calculad com ors crtico na Tabela G.
Precisamos, tambm, a- O
Sempre que ocorrer acordo perfeito ou inverso perfeita, torna-se possivel prever,
GAMA DE GOODMAN E KRUSKAL
com preciso total, o posto de um sujeito numa varivel a partir do conhecimen to do
A correlao pode ser interpretada em termos do grau em que os valores de uma vari- posto desse sujeito na outra varivel. No caso de acordo perfeito, por exemplo, sabemos
vel podem ser previstos (ou adivinhados) a partir do conhecimento dos valores da outra que a pessoa que recebe posto 3 na varivel X tambm recebe o 3 em Y. Uma vez que
varivel. Isso pode ser diretamente observado no coeficiente gama de Goodman e a ocorrncia de correlao perfeita raramente ocorre na natureza,
nossa capacidade
Kruskal (G), que uma alternativa ao coeficiente de correlao de postos (1'0. Alis, para fazer previses acuradas sobre uma varivel a partir do conhecimento que temos
muitos pesquisadores do preferncia ao gama quando se trata de medir o grau de as- da outra vai depender da quantidade de acordos ou de inverses na ordenao de
sociao entre variveis mensuradas ao nvel ordinal. 4 postos dos indivduos em ambas as variveis.
A frmula bsica para o clculo do gama :
Coeficiente Gama (G): Ilustrao
G = - Para ilustrar o uso de gama, vamos admitir que estivssemos estudando a relao entre
+ (X), o tamanho da populao negra de reas metropolitanas dos Estados Unidos da
onde Amrica do Norte, e (Y), o respectivo nvel de discriminao em emprego. Tal
estudo
poderia ser levado a efeito, por exemplo, analisando os dados relacionados com popu-
fa = freqncia dos "acordos" laes e renda ora disponveis no U.S. Bureau of the Census.*
= freqncia das "inverses". Suponha-se que tenhamos sido capazes de ordenar e atribuir postos s seis maiores
reas metropolitanas dos EUA relativamente a X = tamanho da populao negra e
Podemos interpretar os acordos e as inverses como uma expresso do sentido Y = nvel de discriminao em emprego. Seja ento o quadro:
da correlao entre as variveis X e Y. Um acordo perfeito indica uma correlao posi-
tiva perfeita (+1,00): tal situao ocorre quando os sujeitos estudados receberam postos Tamanho da Nvel de
exatamente na mesma ordem em ambas as varkiveis. 0 quadro abaixo demonstra esse Area Populao Negra Discriminao em
fato muito bem: um sujeito recebe o posto 1 na varivel X e tambm o posto 1 na Metropolitana (X) Emprego (Y)
varivel Y; um outro sujeito recebe o posto 2 na varivel X e tambm na Y e assim
A 6 4
por diante.
2
2 3
Postos 5
Sujeitos X 4 6
3 1
A 1 1
2 2
Vemos, assim, que a rea metropolitana A apresentou o menor nmero de negros e
3 3
4 4
classificou-se em quarto lugar com respeito discriminao; a rea metropolitana B
5 5 apresentou a maior populao negra e classificou-se em segundo lugar quanto discri-
6 6 minao e assim por diante.**
um outro sujeito que receba o posto 2 em X 4 3 N.T.: Servio de Levantamento de Dados Demogrficos dos EUA.
5 2 N.T.: Observe-se que o menor posto (em ambas as variveis) corresponde
receber o penltimo posto em Y e assim 6 1
*'!`
5. maior populao
ou ao maior ntvel discriminador.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
por diante.
234 TOMADA DE DECISES UNIVERSIDADE FEDERAL DO PARA
111f5L1OTECA CENTRAL Correlao 235
uma ordem catica.* As freqncias dos acordos e das inverses na coluna desorde- PASSO 3: Obter as freqncias das inverses. Para encontrar as freqncias
nada (Y) indicam o quanto essa coluna de postos difere de uma ordenao perfeita, seja das inver-
saes, novamente comeamos com o primeiro posto da coluna dos Ys (isto , o
ela positiva (1, 2, 3, 4, 5, 6) ou negativa (6, 5, 4, 3, 2, 1): posto
que corresponde rea metropolitana B). Desta vez, entretanto, para cada posto,
o
procedimento ser o seguinte: contar o nmero de dados que, na tabela, situam-se
Tamanho da Nvel de acima de um particular posto e que, em valor numrico, siio maiores do que ele.
Area Populao Negra Discriminao em Ini-
Metropolitana Emprego (Y) ciando com o posto que figura no topo da coluna Y, verificamos que, em termos
(X) de
tabela, no ocorre nenhum dado antes dele (isto , antes do posto 2); por isso, entramos
1 2 com um zero na coluna das inverses. Tomando, agora, o segundo posto na coluna dos
2 3
Ys (3), isto , o que corresponde area metropolitana C, contamos o
3 1 nmero de dados
4 6 que o antecedem e so maiores do que ele. Uma simples inspeo da tabela revela-nos
5 5
A 6 4 que antes do posto 3 s figura um dado: o relativo ao posto 2 (rea metropolitana B)
e que, sendo 2 < 3, s possivel entrar com um zero na coluna
das inverses. Pros-
PASSO 2: Obter as freqncias dos acordos. Para obter tais freqencias (fa), comea- seguindo lista abaixo, o prximo posto o que corresponde rea metroplitana F
mos com o primeiro posto no topo da coluna dos Ys (isto , o posto que corresponde (posto 1). Como antes desse posto, 1, na coluna dos Ys, figuram os dados (postos)
A rea metropolitana B). Para cada posto, contamos o nmero de dados situados acima
3 e 2, e sendo (3 > 1) e (2 > 1), entramos com o valor 2 na coluna das
inverses. Ao
dele na tabela, porm que tenham menor valor numrico. 0 nmero de postos acima descer mais um pouco encontramos o posto 6, relativo rea metropolitana E. Obser-
do primeiro (sem levar em considerao seu valor numrico) sempre zero (uma vez vamos que, na tabela, trs dados precedem esse posto: 1, 3 e 2; porm, como nenhum
que, do ponto de vista estritamente "visual", no h nenhum posto antes do primeiro na deles supera, em valor numrico, o 6, novamente escrevemos zero na coluna das inverses.
la bela). Como resultado, entramos com um zero na coluna "acordos" para a rea metro- 0 processo continua at quo se esgotem todos os postos da coluna Y, dando origem aos
politana B. Observando o segundo posto (3) listado na coluna Y(rea metropolitana C), dois seguintes valores na coluna das inverses: 1 e 2 (o leitor poder fazer seus prprios
contamos o nmero de postos que esto acima dele na tabela e que tm menor valor clculos para comprovar).
nurnrico. Vemos que apenas o posto 2 est, na tabela, acima dele (3). E, uma vez que
esse posto (2) menor que 3, entramos com o valor 1 na coluna de acordos. Em conti-
Tamanho da Ntvel de
Area Populao Negra Discriminao em
nuao ao processo, o proximo posto listado (para a Area metropolitana F) 1. Como Metropolitana Emprego (Y) Inverses
(X)
os postos que esto acima dele, na tabela, so 3 e 2-e como ambos (3 e 2) so maiores
que 1-entramos com um zero na coluna de acordos. 0 posto seguinte na coluna dos o
Ys 6 e corresponde rea metropolitana E. Os postos que, na tabela, esto acima dele, o
sift) 1, 3 e 2 e estes, sem exceo, so menores que 6. Em outras palavras, se (1 < 6), 2
0
(3 < 6) e (2 < 6), h 3 postos menores que 6 e, por isso, entramos com o valor 3 na
1
eoluna de acordos. Procedendo de forma idntica com relao aos demais postos da 2
eoluna Y (relativos as areas D e A), vamos encontrar duas vezes o valor 3, que deve ser
levado coluna de acordos. Assim:
A cordos Inverses
Tamanho da Nvel de PASSO 4: Obter Efa e Efi. Uma vez que
Area Populao Negra Discriminao em todos os acordos e todas as inverses 0 0
Metropolitana (A') Emprego (Y) Acordos 0
tenham sido estabelecidos, somamos 1
0 2
1 2 0 separadamente essas colunas, conforme 3 0
2 3 1 a baixo: 3 1
3 1 0 A 3 2
4 6 3
5 5 3
E.t.a = 10 = 5
A 6 4 3
06tica estaria associada aos postos da varivel X. Por outro lado, entenda-se por ordem catica
PDFN.T.:compression,
Se esse procedimento de ordenao tivesse sido feito com relao varivel Y a ordem
OCR, web optimization using a watermarked ,
evaluation
qualquer seqncia numrica que nocopy of leiCVISION
apresente uma de formao. PDFCompressor
236 TOMADA DE DECISES AVERSIDADE t4coiffe4o 237
B1/11, s'
PASSO 5: Entrar com E.t.a e Eft na frmula do coeficiente gama: se, 8 interesse moderado e 11 pouco interesse. Observe-se que postos empatados ocor-
rem em todas as posies. Por exemplo, 29 respondentes empataram suas respostas na
- 10 5 - 5 coluna classe alta, no ponto mais alto da varivel X.
G =
+ 10 + 5 -
15 Observe-se que o quadro acima caracteriza uma tabela 3 X 3, onde existem 9 caselas (3
linhas X 3 colunas = 9 caselas). Para garantir que o sinal do coeficiente gama seja fixado
Um coeficiente gama igual a +0,33 indica a presena de uma correlao positiva com o devido rigor (positivo ou negativo), a varivel X (nas colunas) deve ser sempre
fraca. Essa correlao baseia-se numa dominncia de acordos: o nmero de acordos , disposta em ordem decrescente da esquerda para a direita. Por exemplo, na tabela, a
aproximadamente, 33% maior do que o nmero de inverses entre o tamanho da popu- classe social (X) decresce da esquerda para a direita, "assumindo" os valores "alta",
lao negra (X) e a discriminao em emprego (Y) nos EUA.* "mdia" e "baixa". De modo anlogo, a varivel Y, nas linhas, deve decrescer de cima
para baixo. Assim, nessa tabela, a adeso voluntria a uma associao (Y) varia, no
Procedimento Para Postos Empatados (Espelhados) sentido descendente, assumindo os valores "alta", "moderada" e "baixa".
Como j foi visto com relao ao coeficiente de correlao de postos (de Spearman),
nem sempre possvel evitar postos empatados ao nvel ordinal de mensurao. Na f
PASSO 2: Calcular Zfa. Para encontrar Efa, comece pela casela onde = 15 (canto
verdade, os pesquisadores se vem, com freqncia, s voltas com medidas ordinais, esquerdo superior). Multiplique essa freqncia (15) pela soma de todas as outras
brutas, que do origem a um nmero bem grande de postos empatados. Nos casos em que freqncias do quadro que, com relao ao 15, esto direita e abaixo. Lendo da
um nmero muito grande deles ocorrer, o coeficiente gama toma-se uma medida de esquerda para a direita, observamos que as freqncias que esto abaixo e a direita de
15 so: 10, 8, 7 e 11. Repita-se este procedimento relativamente a todas as caselas que
associao particularmente til. A frmula bsica para o clculo do coeficiente gama
admitam freqiincias nas posies (simultneas) "abaixo e direita". Assim, trabalhan-
pode ser empregada mesmo quando h postos empatados, desde que as freqncias dos do da esquerda para a direita, vem que:
acordos e das inverses sejam calculadas mediante uma "adaptao".
Classe A/Adeso alta 15(10 + 8 + 7 + 11) = 15(36) = 540
Vamos ilustrar o procedimento de obteno do coeficiente gama numa situao Classe B/Adeso alta 8(8 + 11) = 8(19) = 152
postos empatados. Suponha-se que um pesquisador quisesse examinar a relao entre Classe A/Adeso moderada
"classe social" e "adeso voluntria a uma associao". Suponha-se, ainda, que ele
10(7 + 11) = 10(18) = 180
Classe B/Adeso moderada 10(11) = 110
tivesse obtido os seguintes dados aps examinar questionrios distribudos a e respondi-
dos por 80 moradores de uma cidade: entre 29 respondentes da classe alta (A), 15
(Note-se que nenhuma outra casela da tabela admite clculos semelhantes aos que
demonstraram grande interesse, 10 interesse moderado e 4 pouco interesse em aderir acabamos de fazer, uma vez que para as freqncias 7 (I.' linha), 8 (2." linha), 4, 7
voluntariamente a uma determinada associao; entre 25 respondentes da classe mdia e 11 (ltima linha) as posies simultneas "abaixo e direita" no tm
(B), 8 demonstraram grande interesse, 10 interesse moderado e 7 pouco interesse; e, sentido.)
para finalizar, entre 26 respondentes da classe baixa (C), 7 demonstraram grande interes-
fa a soma dos produtos acima. Portanto:
PASSO 1: Redispor os dados numa tabela de freqncias.
Efa = 540 + 152 + 180 + 110
= 992
Classe Socl (X)
Adeso Voluntria a Alta Media Baixa
uma Associao (Y) (A) (B) PASSO 3: Calcular Efi. Para encontrar Efi, inverta-se o procedimento
(C) apresentado no
Passo 2, comeando com a freqncia que figura no topo direito da tabela (7). Desta
Alta 15 8 7 vez, cada valor vai ser multiplicado pela soma de todas as freqncias que, com relao
Moderada 10 10 8 a ele, figuram abaixo e esquerda. Fazendo a leitura da direita para a esquerda, obser-
Baixa 4 7 11
vamos que as freqncias que esto esquerda e abaixo de 7 so: 10, 10, 7 e 4. Como
29 25 26 no passo anterior, repita-se este procedimento at esgotar todas as alternativas posicio-
N = 80 nais. Ento, trabalhando da direita para a esquerda, temos:
G =
- If 992 457 - 535
- + 0,37
1. Correlao linear-0 coeficiente gama (G) s detecta relaes lineares entre
"
+ If,
'
992 + 457 - 1.449 Xe Y.
2. Dados ordinais-As variveis X e Y devem ser passveis de atribuio de postos
Um G = +0,37 indica correkto positiva, moderadamente fraca, entre "classe ou de ordenao.
social" e "adeso voluntria". O resultado que acabamos de encontrar sugere uma 3. Amostragem casual-Para que seja possvel testar a hiptese nula de que G
= 0,
domintincia de acordos: estes excedem as inverses em 37% (Note-se que se o gama preciso que os sujeitos amostrais tenham sido extrados aleatoriamente de
tivesse sido -0,37, o significado concreto desse coeficiente seria: correlao negativa, uma dada populao.
moderadamente fraca e baseada em inverses.)
= (0,37)
992 - 457
80(1 - 0,372) A relao entre "ser fumante de maconha" (X) e "orientao para estudos
riores" (Y) foi testada mediante uma prova de qui-quadrado, conforme se segue:
supe-
= (0,37)
535
= (0,37)
535
X2 - 36[(15)(10). -
(5)(6n2 36(150 - 30)2
-
80(0,86) 68,80 (15 + 5)(6 + 10)(15 + 6)(5 + 10) 5,14
(20)(16)(21)(15)
2
Como o xo e maior que o x,, rejeitamos a hipotese nula de que = 0 e aceitamos a
TABELA 11.4 Uso de Maconha entre Estudantes Orientados e No-Orientados para a Universidade.
Dados Tirados da Tabela 10.3 hiptese experimental de que as variveis X e Y esto, de fato, associadas na populao
da qual se extraiu a amostra de 36 estudantes.
Fumantes No-fumantes
Requisitos Para o Uso do Coeficiente Fi
O emprego do coeficiente fi, como medida de associao entre duas variveis-X e
Orientados para
Y-leva em conta os seguintes requisitos:
15 6 21
a Universidade
1.Dados nominais-S se trabalha com freqncias.
2.Tabela 2 X 2-8 fundamental que os dados possam ser dispostos numa tabela
No-orientados 2 X 2 (2 linhas por 2 colunas). Constitui erro empregar o coeficiente fi em
para a Universidade 5 10 15 tabelas de ordem superior a 2 X 2 (por exemplo: 3 X 3; 4 X 3 etc.).
3. Amostragem casual-A fim de que seja possvel testar a significncia dos coefi-
cientes fi, importante que a escolha dos elementos amostrais tenha sido
20 16 N = 36 aleatria.
Aplicando a frmula acima ao problema em foco, resulta que: Essa hiptese foi testada no Captulo 10 com os dados dispostos numa tabela 3 X 3. A
Tabela 11.5 repro duz esses dados.
/5,14
36
- -10,14 = 0,37
A relao entre X e Y foi testada (no Captulo 10) por qui-quadrado, de acordo
=
com o que se segue:
O coeficiente fi obtido = 0,37) indica a existncia de correlao moderada entre
orientao para a universidade e uso de maconha.
x2
(7 - 10,79)2 (10 - 10,07)2 (15 - 11,14)2
10,79 + 10,07 + 11,14 4-
Teste de Significincia para o Coeficiente Fi
Sem nenhuma dificuldade, felizmente, o coeficiente fi pode ser testado por meio de
qui-quadrado cujos valores crticos esto registrados, em grande nmero, na Tabela E +
(9 - 10,11)2 +
(10 - 9,44)2 +
(11 - 10,45)2
(rim do livro), aos nveis de 0,05 e 0,01. Assim: 10,11 9,44 10,45
TABELA 11.5 Relao entre "Mtodos de Educar Filhos" e "Orientao Poltica". Dados Tirados Teste de Significncia Para o Coeficiente de Contingncia
da Tabela 10.4 Tal como procedemos no caso do coeficiente fi, a determinao da significncia do
coeficiente de contingncia faz-se mediante consulta direta Tabela E, no fim do
X livro. Relativamente situao que acabamos de examinar acima temos que:
Conservadores Moderados Liberais
2
X19
7,58
2
Xc 9,49
Permissivos 14 30 UNIVERSIDADE FEDERAL DO PARA
gl = 4
0,05 B1BLIOTECA CENTRAL
Diante desses resultados (x02 < X2c), somos levados a no rejeitar a hiptese nula de que
Moderados 10 10 8 28
C = 0, descartando, por outro lado, a hiptese alternativa (experimental) de que 0.
Em outras palavras, a relao "mensurada" exprime uma circunstncia da particular
amostra utilizada e no da populao que lhe deu origem.
X2
C =
/89 7,58
+ 7,58
- 7'"
96,58
N/0,08 = 0,28 V - N(le - 1)
onde
() nosso resultado, isto , C = 0,28, indica que a correlao entre "orientao poltica"
e "mtodos de educar filhos" bastante fraca. Essas duas variveis podem estar rela- V = V de Cram&
cionadas, o que no impede que surjam inmeras excees. N = tamanho da amostra
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
C'orrelavo 245
244 TOMADA DE DEC1SES
Concluso: O V de Cramr, igual a 0,20 neste exemplo, indica que existe uma relao
fraca entre as variveis X e Y.
3 8
4 9
RESUMO 1 5
7. Utilizando-se dos dados do Problema 5, estabelea a equao de regresso que per- 11. Os cinco sujeitos abaixo foram "graduados" de 1 a 5 tanto na varivel X quanto na
mite estimar o valor de Y para os seguintes valores de X: (a) X = 10; (b) X = 2. Y. Tomando esses dados por base, calcule o coeficiente de correlao de postos
indique se entre X e Y existe relao significante.
8. Os cinco estudantes abaixo foram ordenados segundo o tempo que levaram para
completar uma prova (Y). Por exemplo, quem terminou em primeiro lugar recebeu
1, quem terminou em segundo, 2 e assim por diante. A seguir, as provas foram
avaliadas pelo professor, que atribuiu a esses alunos as notas (X) constantes do 1 4
quadro abaixo. Teste a hiptese nula de que no existe relao entre X (notas) e 3 2
Y (tempos de prova), isto , calcule o r, (coeficiente de correlao de postos de 2 5
4 3
Spearman) e verifique se ele ou no significante.
5 1
X
12. Cinco sujeitos foram avaliados relativamente a duas variveis: X e Y. Em ambas
53 1
91 2
receberam valores inteiros, de 1 a 5, que podem ser entendidos como postos.
70 3 Calcule o coeficiente gama e verifique se existe relao significante entre X e Y
85 4
91 5
10. Sete sujeitos receberam postos tanto na varivel X quanto na Y. Para esses dados, Consumo de Alcool
calcule o coeficiente de correlao de postos de Spearman e verifique se existe Alto Moderado Baixo
relao significante entre essas variveis. Consumo de Drogas
Alto (f) 5 7 20
X Modera do (f) 10 8 15
Baixo (f) 15 6 10
1 7
3 6
N = 106
2 5
4 3
5 4 14. No Problema 2 do Captulo 10, o X2 = 8,29 para a relao entre "comparecimento
7 2 as aulas" e "notas no exame final de Estatstica". Suponha que N = 58 e calcule
6 1 o coeficiente fi, com vistas a determinar o grau de associao existente entre essas
variveis.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
248
15.
TOMADA DE DECISES
t"
O
*4b.
e
17. Tendo ern mente estabelecer o grau de associao existente entre X e Y num
problema 4 X 3, com N = 100 e X2 = 8,05, calcule: (a) o coeficiente de contin-
gncia; (b) o V de Cramer. de Procedimentos 4Vt14,
18. No Problema 5 do Captulo 10, N = 118 e X2 = 17,75. Qual o grau de associao
existente entre X e Y nesse problema 4 X 2? Calcule: (a) coeficiente de contingen-
cia; (b) V de Cramr. Estatsticos a
19. A fim de estabelecer o grau de associao entre X e Y num problema 3 X 3, onde
N = 138 e X2 = 10,04, calcule: (a) o coeficiente de contingncia; (b) o V de
Cramr. Problemas de Pesquisa
A terceira parte deste livro contm certo nmero de procedimentos estatsticos que
podem ser aplicados a vrios problemas de pesquisa na rea de cincias humanas. Os
Captulos 8, 9 e 10 apresentaram alguns procedimentos distintos para determinar se
diferenas amostrais (calculadas) eram estatisticamente significativas ou se, ao contr-
rio, resultavam de meros erros de amostragem. Os procedimentos apresentados no
Captulo 11 permitem determinar o grau de associao, a correlao entre duas variveis.
Cada procedimento estatstico, conforme foi salientado ao longo deste livro,
possui um conjunto de pressupostos que devem ser satisfeitos para garantir-se sua apli-
cao adequada. Ao selecionar procedimentos, o pesquisador deve, portanto, considerar
certo nmero de fatores, tais como:
1.0 que procura testar? Diferenas significativas, grau de associao ou ambas as
coisas?
2. Relativamente varivel estudada, que nvel de mensurao foi conseguido:
nominal, ordinal, intervalar?
3. As variveis estudadas tm ou no distribuio normal na populao da qual
elas foram extradas?
4. A pesquisa implica o estudo de amostras independentes ou o estudo da mesma
amostra mensurada mais de uma vez?
O Captulo 12 apresenta algumas situaes hipotticas de pesquisa, onde os crit-
rios acima esto especificados. Sugere-se ao leitor que escolha o procedimento estatfsti-
co que lhe parea mais adequado a cada situao, dentre os constantes da seguinte lista
(todos esses procedimentos foram estudados na Parte III do livro):
1. razo (estatstica) t
2. anlise de varincia
3. qui-quadrado
4. teste da medium.
5. anlise da varincia de Kruskal-Wallis
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
250 TOMADA DE DECISES Aplicao de Procedimentos Estatisticos a Problemas de Pesquisa 25 I
A Tabela 12.1 (pg. 252) situa cada procedimento estatstico em funo de alguns
71
69
50
65
%oo.
pressupostos importantes que devem ser levados em conta para garantir-se sua correta 72 70
55 SS
aplicao. Ao examinar as colunas da tabela, deparamo-nos com a primeira deciso vital,
78 51
relacionada com a seleo do procedimento estatstico: nosso intento verificar se 56 33
existe alguma re/act-to entre as variveis? As provas de significncia discutidas nos Captu- 80 59
los 8, 9 e 10 permitem decidir se uma diferena amostral calculada reflete uma real
diferena na populao. Ou, ser que, em lugar disso, o que buscamos medir a fora Que procedimento estatstico aplicaria o leitor para determinar se existe diferena
da relao entre duas variveis? Este um problema de correlao que pode ser solucio- significativa entre esses grupos de alunos relativamente sua disposio para assistir as
nado por meio dos procedimentos estatsticos apresentados no Captulo 11. Os subttu- conferncias?
los das colunas da Tabela 12.1 alertam o pesquisador que decide empregar uma prova de
significncia em vez de um procedimento correlacional para um aspecto deveras impor- Situao de Pesquisa 2
tante: ele deve certificar-se de que est diante de amostras independentes ou, ento, de Um pesquisador, interessado em saber se a idade de um conferencista era capaz de
que seus dados resultam de vrias mensuraes da mesma amostra. influenciar a disposio de um grupo de universitrios para ouvi-lo, decidiu realizar o
As linhas da Tabela 12.1 dirigem nossa ateno para o nvel de mensurao seguinte experimento. Numa situao normal de sala de aula, foi dito a 30 alunos que
em que nossas variveis foram avaliadas. Se tivermos conseguido mensurar nossas vari- a administrao da eseola desejava conhecer suas preferncias com respeito a uma srie
veis no nvel intervalar, nada nos impede de considerar o emprego de um procedimen- de conferncias previstas. Especificamente, pediu-se-lhes que dessem sua opinio quanto
to paramtrico como, por exemplo, t, F ou r. Se, entretanto, tivermos obtido nvel ao professor que "poderia ser convidado". O professor foi descrito a todos os alunos da
nominal ou ordinal de mensurao, nossa escolha fica limitada a algumas alternativas mesma forma exceto num particular: a um tero dos alunos foi dito que o confereneista
no-paramtricas. tinha 75 anos; a outro tero que ele tinha 50 anos; ao ltimo tero, que se tratava de
As solues para as situaes de pesquisa apresentadas a seguir podem ser encon- um jovem de 25 anos. Pediu-se, a seguir, que manifestassem sua disposio para com-
tradas no fim deste captulo. parecer as conferncias. Obtiveram-se os seguintes resultados (onde escores mais altos
indicam maior disposio):
85 6
Situao de Pesquisa 3 76 5
69 10
Para estudar a relao entre soletrao e habilidade para ler, um pesquisador aplicou a
42 11
um grupo de 20 alunos, selecionados aleatoriamente numa populao de graduandos, 53 12
testes especficos para mensurar essas variveis. Obtiveram-se os seguintes resultados 80 3
91 2
(onde escores mais altos indicam maior habilidade): 4
73
74 9
X 14 20
Aluno Soletrao 29 19
Leitura
O 86 7
A 52 56 73 8
90 39 16
81
63 80 13
75
91 15
81 72 72 14
93 50
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
254 TOMADA DE DECISES
Aplicao de Procedimentos Estatisticos a Problemas de Pesquisa 255
Qual procedimento estatstico adotaria o leitor para
determinar o grau de associa-
o entre os escores-leitura e as avaliaes feitas pelo professor? Que procedimento estatstico escolheria o leitor para determinar o grau de as-
sociao entre desempenho acadmico e srie escolar?
Situao de Pesquisa 5
Para pesquisar diferenas regionais relacionadas com "auxlio Situao de Pesquisa 8
a estranhos", um pesqui-
sador espalhou 400 chaves nas proximidades de caixas de Para investigar a influencia da frustrao sobre o preconceito, pediu-se a 10 sujeitos
correios localizadas no nor-
deste, sul, centro-oeste e oeste dos Estados Unidos da America que atribussem adjetivos negativos, tais como preguioso, sujo e imoral, a membros
do Norte. Cada uma das
chaves estava etiquetada com o nome e endereo do respectivo de um grupo minoritrio (uma medida de preconceito). Essa atribuio de adjetivos
"perdedor" (dono). fez-se em dois momentos distintos: antes e depois de terem esses sujeitos experimentais
O nmero de chaves devolvidas de cada regio
(como medida indicativa de "disposio
para ajudar") figura na tabela abaixo: sido submetidos a uma srie de exames difceis e demorados. Entendeu o pesquisador
que os exames assim concebidos teriam condies de criar a situao frustrante deseja-
da. Obtiveram-se os seguintes dados, onde escores mais altos representam maior pre-
Regio
conceito:
Nordeste sur Centro-oeste Oeste
Escores Relacionados com
Devolvidas Preconceito
55 69 82 61 Sujeitos
No-devolvidas 45 31 18
Antes do Depois do
39
Exame Exame
100 100 100 100
Situao de Pesquisa 10
Para investigar a relao entre as variveis "opo profissional" e "salrio inicial" em
Situao de Pesquisa 12
Um pesquisador interessado em saber se a idade de um conferencista era capaz de
graduandos", pesquisadores entrevistaram um grupo de universitrios recm-formados.
S se preocuparam, os pesquisadores, com trs opes ocupacionais-engenharia, influenciar a disposio de um grupo de universitrios para ouvi-lo, decidiu realizar
profis- o seguinte experimento. Numa situao normal de sala de aula, foi dito a 130 alunos
ses liberals e administrao-com o fato de que o respondente estivesse na
situao de que a administraao da escola desejava conhecer suas preferncias com respeito a uma
"primeiro emprego" Os resultados, obtidos de entrevistas com 21 respondentes, figuram
na tabela abaixo: srie de conferncias previstas. Especificamente, pediu-se-lhes que dessem sua opinio
quanto ao professor que "poderia ser convidado". O tal professor foi ento descrito
Salrios Iniciais (em Cr $) a todos os alunos da mesma forma exceto num particular: metade dos alunos foi dito
que ele tinha 65 anos, enquanto que outra metade, que ele tinha 25. Pediu-se, a seguir,
Engenharia Prof Liberais Administragio que manifestassem sua disposio para comparecer as conferncias. Obtiveram-se os
189.000 126.000
seguintes resultados: relativamente aos que achavam que o professor tinha 65 anos,
189.000
221.400 171.000 162.000
22 manifestaram desejo de comparecer, enquanto que 43 expressaram m vontade; com
252.000 180.000 144.000 relao aos que supunham o professor com 25 anos, 38 dispuseram-se a comparecer,
171.000 198.000 167.400 enquanto que 27 mostraram-se pouco inclinados a assistir as suas conferncias.
162.000 153.000 189.000 Que procedimento estatstico usaria o leitor para determinar se existe diferena
153.000 135.000 180.000
135.000 significativa entre o comportamento de "adeso" desses dois grupos de estudantes,
126.000 126.000
quando a suposta varivel controladora da "disposio" a idade do conferencista?
Que procedimento estatstico usaria o leitor para determinar se existe uma dife-
SOLUES DAS PESQUISAS PROPOSTAS
rena significativa entre esses grupos de respondentes com respeito aos seus salrios
iniciais?
Soluo da Situao de Pesquisa 1
(Razo t ou Teste da Mediana)
Situao de Pesquisa 11 A situao de pesquisa 1 consiste ern uma comparao entre os escores de duas amostras
Para investigar a influncia da varivel "opo profissional" sobre a varivel independentes de alunos. A razo t (Captulo 8) empregada quando se trata de fazer
"salrio comparaes entre duas mdias (aritmticas) resultantes de dados mensurados ao nvel
inicial" em graduandos, pesquisadores entrevistaram um grupo de universitrios
recm- intervalar. O teste damediana (Captulo 10) uma alternativa no-paramtrica que pode
-formados em profisses liberais ou administrao. So os seguintes os resultados
co- ser aplicada sempre que suspeitarmos que os escores no tern distribuio normal na
lhidos desses 16 respondentes:
populao ou, ento, quando o nvel intervalar de mensurao no foi atingido.
Salirios Iniciais (em Cr $)
Soluo da Situao de Pesquisa 2
Prof Liberais Administraco (Andlise de Varidncia ou Prova de Kruskal-Wallis)
126.000 A situao de pesquisa 2 representa uma comparao de escores de trs amostras inde-
135.000
171.000 162.000 pendentes de alunos. A razo F (anlise de varincia-Captulo 9) empregada em
180.000 144.000 comparaes entre trs ou mais mdias independentes-desde que o nvel intervalar
198.000 167.400 tenha sido conseguido. A prova de Kruskal-Wallis (Captulo 10) uma alternativa
153.000 189.000 no-paramtrica que pode ser aplicada sempre que tenhamos boas razes para suspeitar
135.000 180.000
126.000 (a) da distribuio no-normal dos escores na populao e (b) do fato de o nvel de
126.000
144.000 mensurao em que foram colhidos os dados ser, no mximo, ordinal.
167.400
Soluo da Situao de Pesquisa 3
(r de Pearson)
Que procedimento estatstico empregaria o leitor para determinar se existe
uma A situao de pesquisa 3 um problema de correlao, uma vez que a soluo consiste
diferena significativa entre os salrios iniciais correspondentes a essas duas amplas
categorias de trabalho e as respectivas opes profissionais? na determinao do grau de associao entre X (habilidade para soletrar) e Y (habilida-
de para ler). O r de Pearson (Captulo 11) pode ser empregado para o estabelecimento
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
258 TOMADA DE DECISES Aplicaco de Procedimentos Estatsticos a Problemas de Pesquisa 259
da correlao linear entre as variveis X e Y, desde que elas tenham sido-ambas-mensu- Soluo da Situao de Pesquisa 7
radas, no mnimo, ao nvel intervalar de mensurao. Se X e Y no tiverem distribuio (Gama de Goodman e Kruskal)
normal na populao, devemos considerar uma alternativa no-paramtrica, tal como o A situao de pesquisa 7 6 um problema de correlao que consiste na determinao
coeficiente de correlao de postos de Spearman (Captulo 11). do grau de associao entre X (escala conceitual) e Y (srie escolar). O coeficiente gama
de Goodman e Kruskal (Captulo 11) emprega-se para o estabelecimento de urna cor-
Soluo da Situao de Pesquisa 4 relao linear entre X e Y quando a ambas as variveis foram atribudos postos, com
(Coeficiente de Correlaecio de Postos de Spearman) vrios deles empatados. No problema em foco, a escala conceitual foi graduada de A a D
A situao de pesquisa 4 um problema de correlao, uma vez que requer o clculo
ou pior e a srie escolar, por seu turno, da 1.a 4.a Ambas as variveis (X e Y) deram
do grau de associao entre X (escores-leitura) e Y (avaliao da habilidade para leitura, origem a "medidas" que, transformadas em postos, resultaram em numerosos empates
feita pelo professor). O coeficiente de correlao de postos de Spearman (Captulo 11) (postos empatados ou "esielhados"). Por exemplo, 54 alunos cursavam a primeira
pode ser empregado na deteco de uma relao linear entre as variveis X e Y-se o srie; 48 estavam na segunda, e assim por diante. O coeficiente de contingncia (C) ou
nvel em que essas variveis foram mensuradas tiver sido, no mximo, o ordinal. O r de o V de Cramer (Captulo 11) representam alternativas para o coeficiente gama, cujo
Pearson no pode ser empregado, pois ele implica a mensurao de Xe Ya nvel inter- clculo pressupe s dados de nvel nominal.
valar, no mnimo. No caso em foco, aos escores-leitura (X) devem ser atribudos postos
de 1 a 20 antes da aplicao da frmula de Spearman.
Soluo da Situao de Pesquisa 8
(Razo t ou Teste de Friedman)
A situao de pesquisa 8 corresponde a uma comparao do tipo "antes e depois",
Soluo da Situao de Pesquisa 5 onde a mesma amostra foi mensurada duas vezes, porm em momentos diferentes.
(Qui-quadrado) A razo t (Captulo 8) pode ser empregada na comparao de duas mdias resultantes
A situao de pesquisa 5 consiste em uma comparao entre as freqncias ("devolu- da mesma amostra, desde que o modelo experimental admita mensuraes em mo-
co" versus "no-devoluo") observadas em quatro grupos regionalmente divididos mentos distintos e que os dados resultantes dessas mensuraes sejam, no mnimo, de
(nordeste, sul, centro-oeste e oeste). A prova de significncia chamada qui-quadrado nvel intervalar. O teste de Friedman (Captulo 10) uma alternativa no-paramtrica
(Captulo 10) usada em comparaes entre freqncias oriundas de duas ou mais (dupla anlise de varincia) que se ajusta bem a modelos experimentais do tipo "antes
amostras. Para o teste de qui-quadrado no se requer mais do que nvel nominal de e depois", e pode ser usado sempre que haja razes para suspeitar de distribuio no-
mensurao. Os dados deste problema podem ser dispostos numa tabela 2 X 4, isto , -normal dos escores na populao, ou quando o nvel de mensurao dos dados no
numa tabela de 2 linhas e 4 colunas. Observe-se que o grau de associao entre "taxa tenha alcanado o intervalar.
de devoluo" (X) e "regio" (Y) pode ser expresso pelo chamado coeficiente C de
contingncia ou pelo V de Cramer (Captulo 11). Soluo da Situao de Pesquisa 9
(Gama de Goodman e Kruskal)
Soluo da Situao de Pesquisa 6 A situao de pesquisa 9 um problema de correlao que implica o clculo do grau
(Coeficiente "fi") de associao entre X (status ocupacional) e Y (classe scio-econmica subjetiva).
A situao de pesquisa 6 um problema de correlao, onde o grau de associao entre O coeficiente gama (Captulo 11) ajusta-se particularmente bem ao problema de de-
X (autoritarismo) e Y (preconceito) deve ser buscado. O coeficiente "fi" (Captulo 11) tectar a correlao linear entre duas variveis sujeitas atribuio de postos com a
6 uma medida de associao passvel de ser empregada quando as freqncias (ou os ocorrncia de grande nmero de empates. Na situao presente, tanto o "status ocupa-
dados de nvel nominal) podem ser dispostos numa tabela do tipo 2 X 2 (2 linhas cional" quanto a "classe scio-econmica subjetiva" foram ordenados segundo o critrio
e 2 colunas).
Neste problema, tal tabela assumiria a seguinte forma: Status Ocupacional (X)
Classe Scio-Econmica
Subjetiva Alto Mdio Baixo
Pavel de Autoritarismo (Y)
Nvel de
Preconceito A utoritrio Alta 5.6 42 15
Nifo-autoritrio
Mdia 122 163 202
Preconceituoso Baixa 12 16 49
350 120
Tolerante 150 325 N = 950 190 221 266
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
260 TOMADA DE DECISES
"alto", "mdio" e "baixo", gerando-se, assim, muitos postos empatados (por exemplo, UNIVERS1DADE. FLT:EVI. Z.30
221 respondentes apresentaram ocupaes de "status mdio"). Para que se possa calcular Eif EL1OTECA CLi.fl7J.!Z AL.
o coeficiente gama, os dados devem ser dispostos numa tabela freqencial, de dupla
entrada, como exemplificado no fmal da pgina anterior.
0 coeficiente de contingncia (C) e o V de Cram& constituem alternativas para
o coeficiente gama, que pressupe s dados de nvel nominal.
Condio Experimental:
Foi Dito aos Alunos
Disposicdo para Que o Professor Tinha
Comparecer 65 Anos (f) 25 Anos (f)
Sim 22 38
No 43 27 N = 130
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Apndice A Multiplican do
Apendice A Reviso de Fundamentos de Matemdtica
Quociente
2,44*
0,02
- -
244
2
= 122
NMEROS DECIMAIS
Low
Ao somar ou subtrair nmeros decimais, tenha o cuidado de escrev-los uns debaixo
0.10
= laloo
dos outros, fazendo coincidir a posio das vrgulas. Por exemplo, para somar 3.210,76,
2,541 e 98,3 procede-se assim: Operaes aritmticas freqentemente produzem respostas com notao decimal;
por exemplo, 2,034; 24,7; 86,001 e assim por diante. A questo que se pe
agora tem
3.210,76 relao com o nmero de casas decimais que devemos adotar nas nossas respostas.
Uma
2,541 regra simples de seguir consiste em realizar todas as operaes com trs casas
decimals
98,3 adicionais e arredondar o resultado de forma que ele contenha duas casas mais do quo
3.311,601 as constantes dos dados originals.
Ilustrando: se os dados originarem-se de um conjunto de nmeros inteiros (por
Para subtrair 34,1 de 876,62, o procedimento anlogo: exemplo, 12, 9, 49 ou 15), realizamos as operaes com trs casas decimais (al
simos) e expressamos nossa resposta com duas decimais (isto , em centsimos).***
Por
876,62 exemplo:
-34,1
842,52
* N.T.: 0 nnmero de casas decimais da resposta vai ser determinado pelo
Ao multiplicar nmeros decimais, cuide para que sua resposta tenha tantas casas niunero de eusus de-
cimais do dividendo aps aplicao do procedimento.
decimais quantas correspondam soma das existentes no multiplicando e no multi-
** N.T.: Uma casa decimal na resposta porque 8,8 tem uma casa
plicador. Exemplo: depois da vrgula.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
*** N.T.: Essa regra "prtica" contraria a orientao dada
pelo prprio Autor, linhas atrs, sobre
264 APENDICES Apndice A Revisdo de Fundamentos de Matemdtica
8$
3,889 = 3,89 Os seguintes nmeros foram arredondados para o
centsimo mais prximo:
1,224 = 1,22
7,761 = 7,76 3,328 = 3,33
4,823 = 4,82
O arredondamento para determinada casa decimal faz-se geralmente do seguinte 3,065 = 3,07
modo: abandona-se o ultimo dgito se ele for menor que 5: 3,055 = 3,06
Menor que 5
NMEROS NEGATIVOS
26,234 = 26,23 Ao somar um conjunto de nmeros negativos, certifique-se
de que o sinal menos ( )
14,891 = 14,89 no foi esquecido no resultado. Exemplo:
1,012 = 1,01
-20 -3
Entretanto, se o dgito abandonado (o ultimo) for igual a ou maior que 5, adiciona-se -12 -9
uma unidade ao primeiro dgito que sobra (no sentido da direita para a esquerda: -6 -4
-38 -16
5 ou mais*
Para somar um conjunto de nmeros dotados de sina1* (alguns com
+ , outros
26,236 = 26,24 com -), agrupam-se primeiro todos os negativos e depois todos
os positivos; da decor-
14,899 = 14,90 rem dois resultados, um negativo (isto , uma soma negativa) e
um positivo (uma soma
1,015 = 1,02 positiva); subtrai-se, a resultado do outro, mantendo o sinal do miniero de
maior valor absoluto.** Exemplos:
Os seguintes nmeros foram arredondados para o inteiro mais prximo:
3,1 = 3
-6 +4 -6 +6
+4 +2 -1 -10
+2 +6 -3 -4
4,5 = 5
4,8 = 5
-1 -10
-3
Os seguintes nmeros foram arredondados para o dcimo mais prximo:
-4
3,11 = 3,1 Para subtrair um nmero negativo, d-lhe antes sinal +
(mais) e siga o procedi.
3,55 = 3,6 mento indicado para a adio. O resto recebe o sinal do nmero de
maior valor absolu.
4,45 = 4,5 to. Exemplos:
4,17 = 4,2
24 -6 recebe sinal + e , por isso, adicionado ao 24. Como o ntimero
divislio de nmeros aproximados. Trabalhar com nmeros aproximados obedece a regras rgidas e
4-6) de maior valor absoluto positivo , o resto (resultado)
tambm vai
no apenas prticas. Entretanto, sugere-se ao leitor uma regra deveras prtica: esquecer o procedi- 30 ser positivo (30).
mento acima!
* N.T.: Melhor seria adotar a seguinte regra: se for mais de 5, "forcar" o dgito anterior de uma
unidade; se for exatamente 5, manter o dgito anterior se ele for par e "forc-lo" de uma unidade * N.T.: Nmeros dotados de Sinal chamam-se nmeros relativos.
Ex.: -5; +8 ; --0,2 etc. Um nil-
se for impar. Exemplos:
1,015 1,02
mero relativo pode ser fracionrio como tambm irracional: -0,8;
-I- I
3 '
- N/3-- ; elC.
-
Ento, 3 + 1 = 4 e 4 2 = (2) dgitos
V5,555 = 2,36 (1) dgito 2 = 0,5 dgito
+40 = +5 Ento, 1 + 1 = 2 e 2 2 = (1) dgito
(+8) X (+5) = +40
+8
No caso de os nmeros terem sinais contrrios, o resultado ser sempre negativo. -V0,328 = \A-21,Yj
* N.T.: Isso s verdade se o nmero for quadrado perfeito. Caso contrrio, jamais se consegue
uma reproduco do nmero original. Exemplos:
a) N/F4-4- = 12. Ento (12) X (12) = 144
b) N7-2- = 1,4142 aprox. (Veja Tabela A). Ento (1,4142) X (1,4142) = 1,9999616
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
UN/VERSOADE FZt 40944
t...ENTI(AL
131BLIOTECA.
TABELA A (continuao)
Apndice B n2
1 1
n2 1 1
nz
1
Vn
86 7396 9.2736 .011628 .1078 136 18496 11.6619 .0857
87 7569 9.3274 .011494 .1072 18769 11.7047 007299
.007353 .0854
131
88 7744 9.3808 .011364 .1066 19044 11.7473 . 007246 .0851
135
89 7921 9.4340 .011236 .1060 139 19321 11.7898 . 007194 .0848
90 8100 9.4868 .011111 .1054 146 19600 11.8322 .007143 .0845
91 8281 9.5394 .010989 .1048 19881 11.8743 .0842
141
92 8464 9.5917 .010870 .1043 20164 11.9164 '007092
007042 .0839
141
93 8649 9.6437 010753 .1037 20449 11.9583 . 006993 .0836
149
94 8836 9.6954 .010638 .1031 141 20736 12.0000 . 006944
.0833
95 9025 9.7468 .010526 21025 12.0416 .006897 .0830
.1026 145
96 9216 9.7980 .010417 .1021 146 21316 12.0830 .0828
97 9409 9.8489 010309 .1015 141 21609 12.1244 .006849
006803 .0825
98 9604 9.8995 .010204 .1010 14$ 21904 12.1655 . 006757 .0822
99 9801 9.9499 010101 .1005 149 22201 12.2066 .006711 .0819
100 10000 10.0000 .010000 .1000 22500 12.2474 .006667 .0816
150
101 10201 10.0499 009901 .0995 22801 12.2882 .0814
151
102 10404 10.0995 .009804 .0990 151 23104 12.3288 006579
.006623 .0811
103 10609 10.1489 .009709 .0985 23409 12.3693 .006536 .0808
153
104 10816 10.1980 009615 .0981 154 23716 12.4097 '006494 0806
105 11025 10.2470 .009524 .0976 155 24025 114499 :006452 .0803
106 11236 10.2956 .009434 .0971 24336 12.4900 .0801
156
107 11449 10.3441 .0967 24649 12.5300 .006410
006369 .0798
151
108 11664 10.3923 .009346
009259 .0962 158 24964 12.5698 ' 006329 .0796
109 11881 10.4403 . 009174 25281 12.6095
0958 159 . 006289 0793
110 12100 10.4881 .009091 :0953 25600 12.6491 .006250 .0791
160
111 12321 10.5357 0949 25921 12.6886 .0788
161
112 12544 10.5830 008929
.009009 :0945 26244 12.7279 006173
.006211 .0786
161
113 12769 10.6301 . 008850 .0941 26569 12.7671 ' 006135 0783
163
114 12996 10.6771 . 008772 26896 12.8062 ' 006098
0937 164 .0781
115 13225 10.7238 .008696 :0933 27225 12.8452 :006061 .0778
165
116 13456 10.7703 .0928 27556 12.8841 .0776
166
117 13689 10.8167 008547
.008621 .0925 27889 12.9228 .006024
005988 0774
161
118 13924 10.8628 .008475 .0921 28224 12.9615 ' 005952
.0772
168
119 14161 10.9087 .008403 .0917 28561 13.0000 .005917 0769
169
120 14400 10.9544 :008333 .0913 28900 13.0384 .005882 .0767
170
121 14641 11.0000 .0909 29241 13.0767 .0765
11.0454 171
122 14884 '008264
008197 .0905 29584 13.1149 005814
.005848 .0762
172
123 15129 11.0905 . 008130 0902 29929 13.1529 005780 .0760
173 .
124 15376 11.1355 . 008065
.0898 30276 13.1909 . 005747 .0758
174
125 15625 11.1803 .008000 .0894 30625 13.2288 :005714 .0756
175
126 15876 11.2250 0891 30976 13.2665 .0754
176
127 16129 11.2694 007874
.007937 .0887 31329 13.3041 005650
.005682 .0752
128 177
16384 11.3137 . 007813 .0884 31684 13.3417 . 005618
.0750
129 178
16641 11.3578 .007752 .0880 32041 13.3791 . 005587 .0747
130 179
16900 11.4018 .007692 .0877 32400 13.4164 .005556 .0745
180
131 17161 11.4455 .0874 32761 13.4536 .0743
132 181
17424 11.4891 007576
.007634 .0870 33124 13.4907 .005525
005495 .0741
133 182
17689 11.5326 . 007519 .0867 33489 13.5277 005464
. .0739
134 183
17956 11.5758 . 007463 .0864 184 33856 13.5647 005435
. .0737
135 18225 11.6190 :007407 .0861 34225 13.6015 :005405 .0735
185
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
274 APENDICES
Apndice B 275
TA BELA A (continuao)
TA BELA A (continuao)
1
1 1 n2 Vn
n2 Vn Vn
286 81796 16.9115 .003497 .0591 336 112896 18.3303 .002976 .0546
287 82369 16.9411 .003484 .0590 337 113569 18.3576 .002967 .0545
288 82944 16.9706 .003472 .0589 338 114244 18.3848 .002959 .0544
289 83521 17.0000 .003460 .0588 339 114921 18.4120 .002950 .0543
290 84100 17.0294 .003448 .0587 340 115600 18.4391 .002941 .0542
291 84681 17.0587 .003436 .0586 341 116281 18.4662 .002933 .0542
292 85264 17.0880 .003425 .0585 342 116964 18.4932 .002924 .0541
85849 17.1172 .003413 .0584 343 117649 18.5203 .002915 .0540
293
294 86436 17.1464 .003401 .0583 344 118336 18.5472 .002907 .0539
295 87025 17.1756 .003390 .0582 345 119025 18.5742 .002899 .0538
296 87616 17.2047 .003378 .0581 346 119716 18.6011 .002890 .0538
297 88209 17.2337 .003367 .0580 347 120409 18.6279 .002882 .0537
298 88804 17.2627 .003356 .0579 348 121104 18.6548 .002874 .0536
17.2916 .003344 .0578 349 121801 18.6815 .002865 .0535
299 89401
350
300 90000 17.3205 .003333 .0577 122500 18.7083 .002857 .0535
I
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
276 APENDICES
Apendice li 217
n2 1
11
Vn 1
Vn 1 1
n
386 148996 19.6469 436
387 .002591 .0509 190096 20.8806 .002294
149769 19.6723 .002584 437 190969 .0479
388 150544 .0508 20.9045 .002288 .0478
19.6977 .002577 .0508 438 191844 20.9284
389 151321 19.7231 439 .002283 .0478
390 .002571 .0507 192721 20.9523 .002278
152100 19.7484 .002564 440 193600 .0477
.0506 20.9762 .002273 .0477
391 152881 19.7737 441
392 .002558 .0506 194481 21.0000 .002268
153664 19.7990 .002551 442 195364 .0476
393 154449 .0505 21.0238 .002262 .0476
19.8242 .002545 .0504 443 196249 21.0476
394 155236 19.8494 444 .002257 .0475
395 .002538 .0504 197136 21.0713 .002252
156025 19.8746 .002532 445 198025 .0475
.0503 21.0950 .002247 .0474
396 156816 19.8997 446
397 .002525 .0503 198916 21.1187 .002242
157609 19.9249 .002519 447 199809 .0474
398 158404 .0502 21.1424 .002237 .0473
19.9499 .002513 .0501 448 200704 21.1660
399 159201 19.9750 449 .002232 .0472
400 .002506 .0501 201601 21.1896 .002227
160000 20.0000 .002500 450 202500 .0472
.0500 21.2132 .002222 .0471
401 160801 20.0250 451
402 .002494 .0499 203401 21.2368 .002217
161604 20.0499 .002488 452 204304 .0471
403 162409 .0499 21.2603 .002212 .0470
20.0749 .002481 .0498 453 205209 21.2838
404 163216 20.0998 454 .002208 .0470
405 .002475 .0498 206116 21.3073 .002203
164025 20.1246 .002469 455 207025 .0469
.0497 21.3307 .002198 .0469
406 164836 20.1494 456
407 .002463 .0496 207936 21.3542 .002193
165649 20.1742 .002457 457 208849 .0468
408 166464 .0496 21.3776 .022188 .0468
20.1990 .002451 .0495 458 209764 21.4009
409 167281 20.2237 459 .002183 .0467
410 .002445 .0494 210681 21.4243 .00179
168100 20.2485 .002439 460 211600 .0467
.0494 21.4476 .002174 .0466
411 168921 20.2731 461
412 .002433 .0493 212521 21.4709 .002169
169744 20.2978 .002427 462 213444 .0466
413 170569 .0493 21.4942 .002165
20.3224 .002421 .0492 463 214369 .0465
414 171396 21.5174 .002160 .0465
20.3470 .002415 .0491 464 215296 21.5407
415 172225 20.3715 465 .002155 .0464
.002410 .0491 216225 21.5639 .002151
416 .0464
173056 20.3961 .002404 466 217156
417 173889 .0490 21.5870 .002146 .0463
20.4206 .002398 .0490 467 218089 21.6102
418 174724 20.4450 468 .002141 .0463
419 .002392 .0489 219024 21.6333 .002137
175561 20.4695 .002387 469 219961 .0462
420 176400 .0489 21.6564 .002132
20.4939 .002381 .0488 470 220900 .0462
21.6795 .002128 .0461
421 177241 20.5183 471
422 .002375 .0487 221841 21.7025 .002123
178084 20.5426 .002370 472 222784 .0461
423 178929 .0487 21.7256 .002119 .0460
20.5670 .002364 .0486 473 223729 21.7486
424 179776 20.5913 474 .002114 .0460
425 .002358 .0486 224676 21.7715 .002110
180625 20.6155 .002353 475 225625 .0459
.0485 21.7945 .002105
426 .0459
181476 20.6398 .002347 476 226576
427 182329 .0485 21.8174 .002101 .0458
20.6640 .002342 .0484 477 227529 21.8403
428 183184 20.6882 478 .002096 .0458
429 .002336 .0483
1
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
278 APENDICES
Apndice B 279
UNIVERSIDADE FEDiRAL
DO PARA
TABELA A (continuao)
TA BELA A (continuao)
BIRK) TEC A CEN 712 A E
1 1
n2 -V n 1
n n2
Arn-
1
n
Vn
486 236196 22.0454 .002058 .0454 536
487 237169 287296 23.1517 .001866 .0432
22.0681 .002053 .0453 537 288369
488 238144 22.0907 23.1733 .001862 .0432
.002049 .0453 538 289444 23.1948
489 239121 22.1133 .002045 .001859 .0431
.0452 539 290521 23.2164 .001855
490 240100 22.1359 .002041 .0452 540 .0431
291600 23.2379 .001852 .0430
491 241081 22.1585 .002037 .0451 541
492 292681 23.2594 .001848 .0430
242064 22.1811 .002033 .0451 542
493 243049 293764 23.2809 .001845 .0430
22.2036 .002028 .0450 543 294849
494 244036 22.2261 23.3024 .001842 .0429
.002024 .0450 544 295936 23.3238
495 245025 22.2486 .002020 .0449 .001838 .0429
545 297025 23.3452 .001835 .0428
496 246016 22.2711 .002016 .0448 546
497 247009 298116 23.3666 .001832 .0428
22.2935 .002012 .0449 547 299209
498 248004 22.3159 23.3880 .001828 . 0428
.002008 .0449 548 300304 23.4094
499 249001 22.3383 .002004 .001825 .0427
.0448 549 301401 23.4307
500 250000 22.3607 .002000 .0447 .001821 .0427
550 302500 23.4521 .001818 .0426
501 251001 22.3830 .001996 .0447 551 303601 23.4734 .001815
502 252004 22.4054 .001992 .0446 552 .0426
503 253009 304704 23.4947 .001812 .0426
22.4277 .001988 .0446 553 305809
504 254016 22.4499 23.5160 .001808 .0425
.001984 .0445 554 306916 23.5372
505 255025 22.4722 .001980 .0445 .001805 .0425
555 308025 23.5584 .001802 .0424
506 256036 22.4944 .001976 .0445 556
507 257049 309136 23.5797 .001799 .0424
22.5167 .001972 .0444 557 310249
508 258064 22.5389 23.6008 .001795 .0424
.001969 .0444 558 311364 23.6220
509 259081 22.5610 .001965 .0443 .001792. .0423
559 312481 23.6432 .001789
510 260100 22.5832 .001961 .0443 560 .0423
313600 23.6643 .001786 .0423
511 261121 22.6053 .001957 .0442 561
512 262144 314721 23.6854 .001783 .0422
22.6274 .001953 .0442 562 315844
513 263169 22.6495 .001949 23.7065 .001779 .0422
.0442 563 316969 23.7276
514 264196 22.6716 .001946 .0441 .001776 .0421
564 318096 23.7487 .001773
515 265225 22.6936 .001942 .0441 565 .0421
319225 23.7697 .001770 . 0421
516 266256 22.7156 .001938 .0440 566
517 267289 320356 23.7908 .001767 .0420
22.7376 .001934 .0440 567 321489
518 268324 22.7596 .001931 23.8118 .001764 .0420
.0439 568 322624 23.8328
519 269361 22.7816 .001927 .0439 .001761 .0420
569 323761 23.8537 .001757
520 270400 22.8035 .001923 .0439 .0419
570 324900 23.8747 .001754 .0419
521 24441 22.8254 .001919 .0438 571 326041
522 272484 22.8473 .001916 23.8956 .001751 .0418
.0438 572 327184 23.9165
523 273529 22.8692 .001912 .0437 .001748 .0418
573 328329 23.9374 .001745
524 274576 22.8910 .001908 .0437 574 .0418
525 275625 329476 23.9583 .001742 .0417
22.9129 .001905 .0436 575 330625 23.9792 .001739 .0417
526 276676 22.9347 .001901 .0436 576
527 277729 331776 24.0000 .001736 .0417
22.9565 .001898 .0436 577 332929
528 278784 22.9783 .001894 .0435 24.0208 .001733 .0416
578 334084 24.0416 .001730
529 279841 23.0000 .001890 .0435 579 .0416
530 280900 335241 24.0624 .001727 .0416
23.0217 .001887 .0434 580 336400 24.0832 .001724 .0415
531 281961 23.0434 .001883 .0434 581 337561 24.1039 .001721
532 283024 23.0651 .001880 .0434 582 .0415
533 284089 338724 24.1247 .001718 .0415
23.0868 .001876 .0433 583 339889
534 285156 23.1084 .001873 .0433 24.1454 .001715 .0414
535 584 341056 24.1661 .001712
286225 23.1301 .001869 .0432 585 .0414
342225 24.1868 .001709 .0413
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
280 APENDICES Apendice B 281
TABELA A (continuao)
TABELA A (continuao)
1 1
1 1
n2 Vn Vn
n
621 385641 24.9199 .001610 .0401 671 450241 25.9037 .001490 .0386
622 386884 24.9399 .001608 .0401 672 451584 25.9230 .001488 .0386
388129 24.9600 .001605 .0401 673 452929 25.9422 .001486 .0385
I1P 623 .001484 .0385
624 389376 24.9800 .001603 .0400 674 454276 25.9615
625 390625 25.0000 .001600 .0400 675 455625 25.9808 .001481 .0385
626 391876 25.0200 .001597 .0400 676 456976 26.0000 .001479 .0385
627 393129 25.0400 .001595 .0399 677 458329 26.0192 .001477 .0384
628 394384 25.0599 .001592 .0399 678 459684 26.0384 .001475 .0384
629 395641 25.0799 .001590 .0399 679 461041 26.0576 .001473 .0384
630 396900 25.0998 .001587 .0398 680 462400 26.0768 .001471 .0383
631 398161 25.1197 .001585 .0398 681 463761 26.0960 .001468 .0383
632 399424 25.1396 .001582 .0398 682 465124 26.1151 .001466 .0383
633 400689 25.1595 .001580 .0397 683 466489 26.1343 .001464 .0383
634 401956 25.1794 .001577 .0397 684 467856 26.1534 .001462 .0382
635 403225 25.1992 .001575 .0397 685 469225 26.1725 .001460 .0382
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
282 APENDICES
Apindice
n2 1 1
Vn n2 Vn
1 1
Vn Vn
686 470596 26.1916
687 .001458 .0382 736 541696 27.1293 .001359 .0369
471969 26.2107 .001456
688 473344 .0382 737 543169 27.1477 .001357 .0368
26.2298 .001453 .0381 738 544644 27.1662
689 474721 26.2488 .001355 .0368
690 .001451 .0381 739 546121 27.1846 .001353 .0368
476100 26.2679 .001449 .0381 740 547600 27.2029 .001351 .0368
691 477481 26.2869
692 .001447 .0380 741 549081 27.2213 .001350 .0367
478864 26.3059 .001445
693 480249 .0380 742 550564 27.2397 .001348 .0367
26.3249 .001443 .0380 743 552049
694 481636 26.3439 27.2580 .001346 .0367
695 .001441 .0380 744 553536 27.2764 .001344 .0367
483025 26.3629 .001439 .0379 745 555025 27.2947 .001342 .0366
696 484416 26.3818
697 .001437 .0379 746 556516 27.3130 .001340 .0366
485809 26.4008 .001435
698 487204 .0379 747 558009 27.3313 .001339 .0366
26.4197 .001433 .0379 748 559504 27.3496
699 488601 26.4386 .001337 .0366
700 .001431 .0378 749 561001 27.3679 .001335 .0365
490000 26.4575 .001429 .0378 750 562500 27.3861 .001333 .0365
701 491401 26.4764
702 .001427 .0378 751 564001 27.4044 .001332 .0365
492804 26.4953 .001425
703 494209 .0377 752 565504 27.4226 .001330 .0365
26.5141 .001422 .0377 753 567009
704 495616 26.5330 27.4408 .001328 .0364
705 .001420 .0377 754 568516 27.4591 .001326 .0364
497025 26.5518 .001418 .0377 755 570025 27.4773 .001325 .0364
706 498436 26.5707
707 .001416 .0376 756 571536 27.4955 .001323 .0364
499849 26.5895 .001414
708 501264 .0376 757 573049 27.5136 .001321 .0363
26.6083 .001412 .0376 758 574564
709 502681 26.6271 27.5318 .001319 .0363
710 .001410 .0376 759 576081 27.5500 .001318 .0363
504100 26.6458 .001408 .0375 760 577600 27.5681 .001316 .0363
711 505521 26.6646
712 .001406 .0375 761 579121 27.5862 .001314 .0363
506944 26.6833 .001404
713 508369 .0375 762 580644 27.6043 .001312 .0362
26.7021 .001403 .0375 763 582169
714 509796 26.7208 27.6225 .001311 .0362
715 .001401 .0374 764 583696 27.6405 .001309 .0362
511225 26.7395 .001399 .0374 765 585225 27.6586 .001307 .0362
716 512656 26.7582
717 .001397 .0374 766 586756 27.6767 .001305 .0361
514089 26.7769 .001395
718 515524 .0373 767 588289 27.6948 .001304 .0361
26.7955 .001393 .0373 768 589824
719 516961 26.8142 27.7128 .001302 .0361
720 .001391 .0373 769 591361 27.7308 .001300 .0361
518400 26.8328 .001389 .0373 770 592900 27.7489 .001299 .0360
721 519841 26.8514
722 .001387 .0372 771 594441 27.7669 .001297 .0360
521284 26.8701 .001385
723 522729 .0372 772 595984 27.7849 .001295 .0360
26.8887 .001383 .0372 773 597529
724 524176 26.9072 27.8029 .001294 .0360
725 .001381 .0372 774 599076 27.8209 .001292 .0359
525625 26.9258 .001379 .0371 775 600625 27.8388 .001290 .0359
726 527076 26.9444
727 .001377 .0371 776 602176 27.8568 .001289 .0359
528529 26.9629 .001376
728 529984 .0371 777 603729 27.8747 .001287 .0359
26.9815 .001374 .0371 778 605284
729 531441 27.0000 27.8927 .001285 .0359
730 .001372 .0370 779 606841 27.9106 .001284 .0358
532900 27.0185 .001370 .0370 780 608400 27.9285 .001282 .0358
731 534361 27.0370
732 .001368 .0370 781 609961 27.9464 .001280 .0358
535824 27.0555 .001366
733 537289 .0370 782 611524 27.9643 .001279 .0358
27.0740 .001364 .0369 783 613089
734 538756 27.0924 27.9821 .001277 .0357
735 .001362 .0369 784 614656 28.0000 .001276 .0357
540225 27.1109 .001361 .0369 785 616225 28.0179 .001274 .0357
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
284 APENDICES Apendice B 288
TABELA A (continuao)
TABELA A (continuao)
1 1 1
n2 Vn n2
1
Vn Vn n
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Apndice B 187
286 APENDICES
1 1
n2 Vn
1
n2 Vn
Vn
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
288 APENDICES Apendice B 289
TABELA A (continuao)
TABELA B Porcentagem da Area sob a Curva Normal Entre X e z.
1 1
n2 Vn .01 .02 .03 .04 .05 .06 .07 .08 .09
Vn
0,0 00.00 00.40 00.80 01.20 01.60 01.99 02.39 02.79 03.19 03.59
986 972196 31.4006 .001014 .0318 0, I 03.98 04.38 04.78 05.17 05.57 05.96 06.36 06.75 07.14 07.53
987 974169 31.4166 .001013 .0318 0.2 07.93 08.32 08.71 09.10 09.48 09.87 10.26 10.64 11.03 11.41
988 976144 31.4325 .001012 .0318 0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.17
989 978121 31.4484 .001011 .0318 0.4 15.54 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79
990 980100 31.4643 .001010 .0318
0.5 19.15 19.50 19.85 20.19 20.54 20.88 21.23 21.57 21.90 22.24
991 982081 31.4802 .001009 .0318 23.89 24.22 24.54 24.86 25.17 25.49
0.6 22.57 22.91 23.24 23.57
992 984064 31.4960 .001008 .0318
993 986049 31.5119 .001007 .0317
0.7 280 26.11 26.42 26.73 27.04 27.34 27.64 27.94 28.23
31.06
28.52
31.33
0.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78
994 988036 31.5278 .001006 .0317 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.89
995 0.9 31.59 31.86
990025 31.5436 .001005 .0317
34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
996 992016 31.5595 .001004 .0317 1.0
36.43 36.65 36.86 37.08 37.29 37.49 37.70 37.90 38.10 38.30
997 994009 31.5753 .001003 .0317 1.1
40.15
998 996004 1.2 38.49 38.69 38.88 39.07 39.25 39.44 39.62 39.80 39.97
31.5911 .001002 .0317 41.77
999 998001 31.6070 1.3 40.32 40.49 40.66 40.82 40.99 41.15 41.31 41.47 41.62
.001001 .0316 43.06 43.19
1000 1000000 31.6228 .001000 1.4 41.92 42.07 42.22 42.36 42.51 42.65 42.79 42.92
.0316
1.5 43.32 43.45 43.57 43.70 43.83 43.94 44.06 44.18 44.29 44.41
1.6 44.52 44.63 44.74 44.84 44.95 45.05 45.15 45.25 45.35 45.45
1.7 45.54 45.64 45.73 45.82 45.91 45.99 46.08 46.16 46.25 46.33
1.8 46.41 46.49 46.56 46.64 46.71 46.78 46.86 46.93 46.99 47.06
1.9 47.13 47.19 47.26 47.32 47.38 47.44 47.50 47.56 47.61 47.67
2.0 47.72 47.78 47.83 47.88 47.93 47.98 48.03 48.08 48.12 48.17
2.1 48,21 48.26 48.30 48.34 48.38 48.42 48.46 48.50 48.54 48.57
2.2 48.61 48.64 48.68 48.71 48.75 48.78 48.81 48.84 48.87 48.90
2.3 48.93 48.96 48.98 49.01 49.04 49.06 49.09 49.11 49.13 49.16
2.4 49.18 49.20 49.22 49.25 49.27 49.29 49.31 49.32 49.34 49.36
2.5 49.38 49.40 49.41 49.43 49.45 49.46 49.48 49.49 49.51 49.52
2.6 49.53 49.55 49.56 49.57 49.59 49.60 49.61 49.62 49.63 49.64
2.7 49.65 49.66 49.67 49.68 49.69 49.70 49.71 49.72 49.73 49.74
2.8 49.74 49.75 49.76 49.77 49.77 49.78 49.79 49.79 49.80 49.8
2.9 49.81 49.82 49.82 49,83 49.84 49.84 49.85 49.85 49.86 49.86
3.0 49.87
4.0 49.997
FONTE: Karl Pearson, Tables for Statisticians and Biometricians, Cambridge Univer-
sity Press, London, pp. 98-111, com a permisso de Biometrika Trustees.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
290 APEND10ES Apendice 11 291
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
292 APE-NDICES
Apindice /9 I
TABELA D (continuao)
TABELA E Qui-quadrado. Valores Crticos aos Nveis de Significncia de 0,05 e 0,01
4o
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
294 APENDICES Apendice II )gi
35 .3246 .4182 26 9 2 1 6 4 2 3 8 7 6 2 6 2 6 4 8 1 0 1
40 .3044 .3932 27 3 7 4 2 2 8 1 7 8 0 6 0 0 0 3 2 2 9 7
45 .2875 .3721 28 0 7 8 0 8 5 1 5 2 6 5 8 7 5 3 0 5 9 6
29 7 4 2 3 3 2 6 0 0 6 5 2 2 3 6 3 9 0 4
50 .2732 .3541 30 1 8 2 7 5 9 5 3 6 5 2 9 9 1 1 7 3 4 3
60 .2500 .3248 FONTE: E. A. Fisher and F. Yates, Statistical Tables 31 4 3 1 8 7 0 6 0 8 6 5 0 1 0 4 0 6 1 5
70 .2319 .3017 for Biological, Agricultural, and Medical Research, 4th 32 8 5 8 0 6 1 4 1 2 0 4 4 1 4 7 6 3 5 1
80 .2172 .2830 33 4 5 8 5 0 4 5 8 3 9 2 8 7 8 9 0 8 4 3
ed, Oliver & Boyd, Edinburgh, Table VI, com a permisso 0 0 4 7 6 4 0
90 .2050 .2673 34 5 0 2 5 4 9 2 2 1 1 5 8
dos autores e do editor. 35 0 8 1 7 0 6 3 3 4 7 6 2 6 8 9 3 4 1 4
36 2 5 9 3 4 6 0 7 5 2 0 0 9 6 0 8 2 2 5
37 2 1 3 1 3 7 8 9 8 4 9 3 8 0 2 2 1 8 1
38 3 8 8 6 8 5 1 3 3 4 6 7 2 6 3 4 8 6 7
TABELA G Valores de rs aos Nfveis de Significncia de 0,05 e 0,01. 39 0 9 9 8 5 9 8 4 4 2 2 1 1 0 1 7 6 1 3
40 2 2 3 5 3 9 7 4 4 2 1 4 0 5 8 2 3 0 8
.05 .01
5 1.000
6 .886 1.000
7 .786 .929
8 .738 .881
9 .683 .833
10 .648 .794
12 .591 .777
14 .544 .714
16 .506 .665 FONTE: E. G. Olds, The Annals of Mathematical Sta-
18 .475 .625
20 .450 591
tistics, "Distribution of the Sum of Squares of Rank
22 .428 .562 Differences for Small Numbers of Individuals," 1938,
24 .409 .537 vol. 9 e "The 5 Percent Significance Levels for Sums gp
26 .392 .515 of Squares of Rank Differences and a Correction,"
28 .377 .496
30 .364 .478 1949, vol. 20, coin a permissfo do Institute of Math-
ematical Statistics.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
296 APENDICES
TABELA H (continuao)
TABELA I Pontos Percentuais da Amplitude t.
NUmero de Colunas
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
35 36 37 38 39 40 Fileira
h = Nmero de Mdias
0 9 7 1 1 9 1 2 7 3 5 8 4 0 4 MSd
8
1 1 0 6 0 3 1
3 7 7 9 1 4 9 9 5 9 2 0 6 gl a 2 3
2
1 1 2 6 6 7 0 2 4 5 6 7 8 9 10 11
5 6 3 7 8 3 3 8 4 3 9 3 9 0 0 9 8 3 5 2
4 7 0 8 6 6 5 9 6 2 7 3
3 5 9 0 1 8 0 9 6 9 4 5 .05 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17
0 9 8 7 3 5 6 8 8 1 2 0 2 3 2 6 4 3 .01 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97
5 1 9 7 5 10.24 10.48
1 8 8 4 7 0 1 7 6 8 2 1 6 3 2 1 8 1 8 3 6 6 .05 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32
1 3 7 8 6 9 5 4 1 7 3 8 7 1 5 6 5 6 4 3 6 7
6.49 6.65
5 9 0 1 5 2 8 6 5 5
.01 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30
7 8 1 8 7 1 2 4 0 4 1 8
2 2 5 5 2 1 8 6 9 8 9 8 0 7 .05 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00
5 8 9 9 4 1 3 4 9 6.16 6.30
I 3 4 2 8 5 0 7 9 8 4 3 5 8 0 9 4 .01 4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17
2 6 8 6 6 4 7 6 6 0 5 10 8.37 8.55
1 5 1 6 4 6 7 6 0 8 7 3 5 2 11 8 .05 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77
8 6 0 1 4 2 9 8 6 8 0 7 6 5 9
5.92 6.05
9 5 7 0 9 8 7 6 9
1 1 3 7 0 3 12 .01 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68
0 6 5 4 0 3 6 5 6 3 5 0 7.86 8.03
2 2 3 4 7 8 0 2 0 8 0 3 4 9 2 13 9 .05 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59
5 7 7 8 6 4 14 5.74 5.87
2 4 6 1 0 5 0 6 1 4 9 4 7 3 9 .01 4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49
1 7 6 4 5 8 15 7.65
6 3 4 8 1 6 9 5 6 2 0 4 6 6 8 10 .05 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46
1 1 9 9 1 1 16 5.60 5.72
9 0 5 1 3 6 9 5 4 1 2 5 4
1
2 9 5 6 2 4 0 17 .01 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21
3 6 7 0 3 5 3 7 4 1 7 4 8 7
7.36
4 3 6 6 3 6 3 0 0 9 4 2 2 5 1 8 4 8 5 7 2
5 3 18 11 .05 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49
9 5 1 9 7 19 5.61
1 0 6 9 0 2 7 3 9 8 4 0 6 9 .01 4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13
8 2 3 2 8 0 4 20
9 1 3 5 7 9 6 2 4 3 4 6 4 9 12 .05 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27
1 3 1 7 5 2 2 21 5.39 5.51
6 4 2 2 2 1 4 5 2 2 8 2 .01 4.32 5.05 5.50 5.84 6.10 6.32 6.51 6.67
3 1 2 6 6 0 1 8 9 22 6.81 6.94
7 2 6 9 0 7 5 3 2 5 6 2 7 6 3
2
8 1 4 1 5 1 23 13 .05 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19
8 8 2 4 4 4 2 9 1 9 8 3 4 4 0 4 5.32 5.43
4 3 0 4 7 I 3 7 4 8 6 7 3 2 6 66 92 6 24 .01 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53
1
7 3 1 6.67 6.79
0 6 4 5 8
0 25 14 .05 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13
3 1 4 8 1 8 3 1 6 4 3 0 2 5.25 5.36
4 2 2 8 3 2 1 9 3 0 1 7 5 9 0 9 1 .01 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41
2 9 8 2 5 8 2 27 6.54 6.66
7 2 0 6 4 0 2 7 3 6 .05 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08
0 8 0 5 6 8 2 4 3 6 1 3 5 2 3 85 97 0 9 2 5 15
1 1
28 5.20 5.31
0 1 7 8 6 2 1 29 .01 4.17 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55
6 1 5 7 9 0 3 5 3 4 2 4 8
5 9
5 6 4 0 6 30 16 .05 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03
1 8 5 2 4 5 1 7 5 3 2 4 6 7 9 9 6 7 2 5.15 5.26
0 3 6 31 .01 4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22
6 3 7 8 6 9 7 2 8 9 0 7 2 9 4 0 8 6 6.35 6.46
5 0 0 0 2 0 8 9 0 1 32
0 6 2 0 4 6 9 6 5 4 9 33 17 .05 2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21
1 9 4 4 2 6 4 2 4 1 0 2 7 9 6 8 7 5 6 9 3 .01 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15
0 0 5 3 8 3 2 7 5 0 4 7 6 4 6 3 0 34 6.27 6.38
6 2
4 7 5 3 35 18 .05 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96
6 2 0 6 0 1 4 8 9 6 5 9 7 3 6 7 6 5.07 5.17
6 3 9 0 3 5 0 9 1 2 0 5 9 7 3 2 5 4 36 .01 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08
5 9 3 0 2 37 6.20 6.31
9 7 3 3 5 4 0 6 4 9 4 7 9 19 .05 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92
1 4 3 9 7 7 1 8 38 5.04 5.14
1 9 6 2 9 4 2 9 7 0 3 8 9 5 7 0 .01 4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02
6 9 7 2 5 39 6.14 6.25
5 9 4 5 8 6 2 3 0 6 2 9 8 6 3 0 4 1 0 7 6 40 20 .05 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11
.01 4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09
FONTE: N. M. Downie and R. W. Heath, Basic Statistical Methods, 6.19
3rd ed., Harper 24 .05 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81
& Row, New York, 1970. Reimpresso com a permisso 4.92 5.01
da Harper & Row. .01 3.96 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5.92 6.02
30 .05 2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92
.01 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85
40 .05 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82
.01 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69
60 .05 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73
.01 3.76 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45 5.53
120 .05 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 4.64
.01 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30 5.37
.05 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55
.01 3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16 5.23
FONTE: E. S. Pearson and H. O. Hartley,Biometrika Tables for Statisticians,
Vol. 1. 3rd ed., Cambridge Press, New York, 1966, com a
permisso dos
Biometrika Trustees.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Lista de Frmulas 299
x = X -X 46
fX-
LISTA DE FORMULAS X = 47
PAGINAS
N - Freqncia acumulada
53
P = f limite inferior / 2 correspondente ao
amplitude do
17 Mediana = real do intervalo + intervalo anterior ao
que contm a mediana X intervalo
me diano
mediano
freqncia absoluta
% = (loc) -f 18 do intervalo mediano
f, DM = 11x1
61
Razo
19
f2
x2
V N 64
Razo de sexo = (100)
f homens
f mulheres 19
= J1X2
N
- X2
66
Taxa de mutao =
(100) tempo2f - tempo lf z
X -X
tempo 1 f 21 0- 90
X = -I- X
escore menor + escore maior 91
Ponto mdio = 25
2 Nmero de vezes que o
dado ou evento pode ocorrer
c% = (100) -N
fa Probabilidade - 92
27 Nmero total de dados
ou eventos
limite inferior X M
abaixcl
do limite escore - do intervalo 112
28
Intervalo de confiana de 95% = X (1,96) 01
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
115 -
Lista de Frtnulas 301
300 APNDICES
- VP(1 - P) 120
DI IS = I 79
Intervalo de confiana de 95% = P (1,96) ap 121 c,4444
(f. - fe)2 6,
4e4; 14e.
I 7/4
fe
z = (5-ci-Tc2)
- o 135
N(AD - BC)2
Crclif x2
(A + B)(C + D)(A + C)(B +'D) 194
07v22
= \ATV 139 O
Crclif
x2 =
(jf -f el - o,so)2 186
t = - Y2 140 fe
(rdif
NOD BC1 NI2)2 - - 197
JIN1s12+N2s22\( 1 1 \ 146 (A + B)(C + D)(A + C)(B + D)
Crdif Nol + N2 - 2 N2)
12
xp
2
Nk(k + 1) (IR)2
i - 3N (k + 1)
197
s =
IND2 (Y1 - .272)2 150
12 x-,1- R 021
SSd = 1X12 + 1X22 + 1X32 + IX42 159 N(N + n j 3(N + 1) 20
r NIXY - (IX)(1Y)
SStotal = 1.(X 161 21
Xtotal)2 V[N1X2 - (IX)2][laY2 - (iY)2]
(IXtotal)
SStotat = IX2total 161
t - r VN - 2 21
IV total
N/ 1 - r2
SS, = [E (INX)2](IXNttoottaailr 162
222
\s x 1
SSd 163 6/D 2
= [ (Le) (1NX)2] I , = 1
N(N2 - 1) 22
SS,
MS, =
gl,
164 Ilkr, V. -V, .
23
'I Vc, + Vi
SSd
MSd Ifa -
-G N(1 164
81d - G2) z
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
302 APENDICES
CIIVIVERSIDADE
240
Apndice FEDinAL
81134177c4 DO
CAIPPAt PAN
C = )(2 242 Classificao de Classes Scio-Econmicas no Brasil
N + x2
Itens e pontuao levados ern conta na classificao scio-econmica dos indivduos no
X2 Brasil (veja Cap. 3):
N(k - 1) 243
Eletrodomesticos Pontos
Geladeira 1
Enceradeira 1
TV (Preto e branco) 1
TV (Cores) 3
Bate deira 3
Liqidificador 1
Mquina de lavar 3
Aspirador de pei 3
Empregadas
1 4
mais de 1 6
Automvel
1 de preo eqivalente ao do VW sedan
(do ano) 4
Mais de 1 automvel ou 1 de valor supe-
rior ao VW 1300 Sedan (do ano) 6
Ginasial incompleto 1
Ginasial completo 2
r Colegial incompleto 2
2 grau 1 Colegial completo
4 4
{Universitrio incompleto 4
3 grau Universitrio completo 8
Captulo 5 Captulo 9
2. (a) Classe A=5, Classe B =3, (b) Clas- 2. F =46,33, gl 2. , rejeitar a biptes
Respostas all
se A =1,67, Classe B =0,83, (c) Clas-
se A =1,89, Classe B =0,96
4. 2,70
nula a 0,05
4. F =4,23, gl =1. , rejeitar a hiptese n
a 0,05
12
aos
nula a 0,05
10. (a) 14, (b) 2,47, (c) 3,25
Captulo 10
2. xn2=a 8,29,,5g1 =1, rejeitar a hiptese
Captulo 6
Problernas Captulo 2
2. (a) 71%, (b) 74%, (c)P =0,71,
2. (a) +0,38, (b) -1,15, (c) -1,69, (d) +2,08,
(e) 0, (f) 0,77, (g) +2,69
4. (a) 5,37%, (b)P =0,05, (c) 7,14%,
(d) P=0,07, (e) P =0,43, (f) P =0,86,
4. X2 :051,50, gl =1, aceitar a hiptese nula
Captulo 4
2. (a) 17,00 e 153,00 (bimodal), (b) 85,00,
(c) 87,12
4. (a) 1, (b)(2_,5 (c) 3
6. (a) 3 e 6, (b) 4, (c) 4,1
8. (a) 6, (b) 4,5, (c) 4,17
10. (a) 12, (b) 7, (c) 7,86
12. (a) +1,0, (b) -0,5, (c) +3,3, (d) 0
14. (a).4, (44,-(c)-4,13
16. (a) 6, (b) 6, (c) 6,26
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
18. (a) 85,5, (b) 82,4 (c) 80,39
Referincin
de dados vado o
lo na
de freqiincias, 5:
definio, 42 defio;
distribuies bimodal i3 Razo t, 14
amost iho, 140-142
amostr,. Aiferentes, 146-
-148
Nvel de confiana, 136-137 estatstica t, 143
Nvel de mensurao, 3-6 graus de liberdade, 143-144
intervalar, 6 mesma amostra mensurada duas vezes,
nominal, 4 148-151
ordinal, 5 requisitos, 151
Nvel de significncia, 136-138
Nvel intervalar de mensurao, 6
Nvel nominal de mensurao, 4
Nu la (hiptese), 127-128
Nmeros negativos, 265-266
Significncia (nvel). Ver nvel de confiana,
Soma de quadrados,
clculos, 161
Ordinal (nvel de mensurao), 5
definio, 158
dentro dos grupos, 160
entre 'grupos, 160
Paramtricos (te'sks), 175-176 ,* total, 161
Pearson (coefiCiente de correlao linear
frmula,-215-21,5
graus de'liberdade, 217 Taxa
requisitos, 218 clculo, 20
significncia, 216-218 definio, 20
Pesquisa, 2-4 Taxa de mudana,
Poder, 176 clculo, 21
Polgono de freqncia, 37-39 definio, 21
construo, 39 central, 42
Polgono de freqncias acumuladas, 38-39 comparao de medids, 47
ogiva de Galtpn, mdia, 45
Porcentagem, mediana, 43
clcialo48 _
moda, 42
Teste da mediana,#94-19,5
dfins Teste de Friedman (dupla anlise de varin-
PoZtc; percentiT,-27-31 cia) 197-200
Tukey (DHS de), 172-174
Quadrado mdie, 163-,165.
QuartiS/29-30 "
Uhicaudal, 97
Qui-quadrado, 176
clculo, 177-180 V
comparao de diversos grupos, 187-
-192 Variabilidade, 59
crtico, 179 amplitude, 60
de aderncia (prova de), 181 comparao de medidas, 71
de homogeneidade (prova de), 177 desvio mdio, 61-63
frmula para clculo, 184-185 desvio padro, 63-71
freqncias esperadas-, 180-181
freqncias esperadas pequenas, 185
freqncias teoricas, 180-181
graus de liberdade, 179 Yates (correo de), 185 N Cham. 310 I L665E
observado, 178 correo de continuidade, 186
requisitos, 192-193 Titulo ESTATISTICA APLICADA A CIENCIAS
teste de significncia, 176
Z (escala), 95
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor