Você está na página 1de 568

PLANEJAMENTO

DE

PESQUISA SOCIAL

Obra publicada com a colaborao da


U N IV E R S ID A D E DE SO PAULO

r e it o r :

P rof. D EM

r.

u s

n t o n io

da

G
r.

ama

f .

S il v a G u l-

VICE-REITOR

EXERCCIO:

P r OP.

M R IO

MARES F

e RRI

EDITORA DA

UNIVERSIDADE

DE

S.

PAULO

COMISSO EDITORIAL:

Presidente Prof. Dr. Mrio Guimares Ferri (Faculdade de Filosofia, Cincias e Letras). Mem bros: Prof. Dr. A. Brito da Cunha (Faculdade- de Filosofia, Cincias e Letras), Prof. Dr. Carlos da Silva Lacaz (Faculdade de Medicina), Prof. Dr. Miguel Reale (Faculdade de Direito), e Prof. Dr. Prsio de Souza Santos (Esc. Politcnica).

RUSSELL L. ACKOFF

PLANEJAMENTO PESQUISA SOCIAL


DE

E D IT R A

DA

E D IT R A H E R D E R U N IV E R S ID A D E D E
SO PAULO

SO

PAULO

1967

Verso portuguesa de Leonidas Hegenberg e Octanny Silveira da Mota, do original ingls The Design of Social Research, de Russell L. Ackoff, publicado pela The University of Chicago Press, Chicago, EUA, Copy right 1953 by the University of Chicago. All rights reserved. Todos os direitos reservados.

Editora Herder So Paulo 1967 Impresso na Repblica do Brasil Printed in Republic of Brazil

Para

lec

cuja pacincia e trabalho datilogrfico tornaram isto possvel

NDICE

Cap. Cap. Cap. Cap.

I II III IV

Cap. V Cap. V I Cap. V II Cap. V III Cap. Cap. IX X

O Significado da Pesquisa e Experimentos Meto dologicamente Planejados ....................................... Formulao do Problema ...................................... Modlo de Pesquisa Idealizada ............................ O Planejamento da Pesquisa Prtica: Amostra gem ........................................................................... A Lgica dos Procedimentos Estatsticos ........... Testes de Hipteses (1) ....................................... Testes de Hipteses (2) Anlise de Varincia e Covarincia .............................................................. Testes de Hipteses (3) e Procedimentos Estimativos ......................................................................... A Fase Observacional do Planejamento da Pes quisa Prtica ............................................................ A Fase Operacional do Planejamento de Pesquisa Prtica .....................................................................

1 18 66 112 179 241 311 347 391 448

A p n d ic e

I II I II IV V VI

Mtodo de Balanceamento de um Grande Nmero de Objstivos ...................................................... ................................. Anlise do Conceito Grupo Social" .................................. Alguns Smbolos de liso Freqente .................................... Ilustrao do Mtodo de Obteno de Amostra de' Extenso Otima ........................................................................................ Tabelas I - X II e Figuras I - V I ................................ Respostas aos Problemas ......................................................

505 508 508 515 520 546

P R E F C IO

Dificilmente ste livro ser de leitura amena ou servir de passatempo. Isto se dever, parcialmente, s imperfeies de estilo, mas, em grande parte, ser atribuivel natureza tcnica do trabalho. As cincias sociais acabam de sair de sua infncia; portanto, livros relativos a essas cincias no precisam mais se restringir a especulaes superficiais ou filosficas, nem reorganizao de fatos sociais familiares. Importante passo no amadurecimento de uma cincia o desenvolvimento de suas tcnicas e mtodos de pesquisa. As cincias sociais j se encontram bastante avanadas tcnicamente; mas no metodologicamente. sse desenvol vimento desigual deve-se (em parte) a no se ter distin guido entre tcnicas e mtodos de pesquisa. J que no existe formulao geralmente ^aceita dessa distino, tomarei a liberdade de propor uma. Tcnica^ | referem-se ao compor tamento e aos instrumentos empregados na/JSrltao. de Q p j?raes de pesquisa; p.~exTr~fazer observaes,registrar~d"cfos, manipul-los, etc.. Mtds" de outr~prte','~rfrm-se ao comportamento e aos instrumentos empregados najsjd&p^e f e v t g ^ f a s fcggftiiaa. | Conse^entemente^^s mtodos so mais geraisque as tcnicas e' as uTTrpssm. No passado, o estudo dos mtodos de pesquisa, tal como definidos acima, realizou-se, principalmente, na rea da filo sofia da cincia. Nessa rea, a abordagem foi especulativa, reflexiva e (em alguns casos) puramente emprica. Recen temente, porm, os prprios mtodos de pesquisa foram obieto de cogitao cientfica. Resultou da, nvo campo cientfico: a metodologia. Neste livro, esforcei-me por apresentar uma (no a) metodologia da pesquisa social. Em outras palavras, pro curei explicitar os tipos de deciso que podem se tornar necessrios no decurso de uma pesquisa e sugerir mtodos,

X II

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

atravs dos quais tais decises sejam tomadas, bem como critrios que permitam avali-las. Sempre que possivel, os mtodos e critrios sugeridos esto baseados em pesquisa metodolgica; quando isso no ocorre, so formulados de modo a se fazerem suscetveis de avaliao cientfica. Minha esperana a de que os pesquisadores sociais venham a proceder a essas avaliaes e a aperfeioar os processos e critrios sugeridos. Como sucede com muitos autores, sinto que ste tra balho est inacabado, na ocasio em que o envio editora. Verifiquei que, nas vrias revises j feitas, modificaes maiores e menores se mostraram necessrias. No tenho dvidas de que nova reviso resultaria em novas modifica es importantes. Mas conclu que as alteraes mais cabveis resultavam de crticas e sugestes provindas de pessoas que haviam lido o manuscrito e, particularmente, de pessoas que haviam aplicado os mtodos sugeridos. Sinto, agora, que tempo de alargar o grupo de pessoas que pos sam provocar novas modificaes e isto se conseguir melhor com a publicao do trabalho. Espero que alguns pesqui sadores sociais, profissionais e estudantes, aceitem o con vite para sugerir novas mudanas e revises. E, o que importa mais, espero que se esforcem para fazer progredir a metodologia da pesquisa social e publiquem os resultados dsses esforos. Considerando que ste livro dificil, ajudaria, talvez, o leitor conhecer o esbo de sua organizao: I. II. III. IV . Introduo Formulao Projeto de Projeto de A. B. C. (cap. i) do problema (cap. ii) pesquisa idealizada (cap. iii) pesquisa prtica

Fase estatstica (caps. iv, v, vi, vii e vni) Fase observacional (cap. ix) Fase operacional (cap. x).

As referncias encontram-se no corpo do livro. Em geral, acham-se entre parnteses; p. ex., (4:15). Quando se encontrarem numa observao j posta entre parnteses, sero usados colchetes; p. ex., [7:xiv]. Em qualquer caso.

P R E F C I O

XIII

o nmero esquerda dos dois pontos refere-se ao livro que tem sse nmero nas Referncias e bibliografia, colocadas no final do captulo. O nmero direita dos dois pontos diz respeito s pginas, quando em rabicos, ou aos cap tulos quando em romanos. As figuras e tabelas no corpo do livro so indicadas por numerais arbicos; as do Apn dice V , por numerais romanos. Ao final de cada captulo, acham-se Tpicos para discusso, Exerccios e Leituras indicadas. O prop sito em vista o de facilitar o uso do livro em salas de aula. Gostaria de sugerir que os Exerccios fssem feitos por grupos de estudantes em trabalho conjunto. Isso dar aos alunos prtica de pesquisas em equipe, como, no futuro, tero que proceder. Ser tambm de grande ajuda (embora no necessrio) o uso de computadores para feitura dos exerccios que aparecem no fim dos captulos vi, vii e viii. Muitos dos exemplos e problemas propostos nas seces de estatstica so fictcios; foram deliberadamente elabora dos para simplificar a parte matemtica. Elementos usados em tais exemplos no devem ser interpretados nem empre gados como dados sociais. O Apndice III contm uma lista de definies dos sm bolos matemticos e estatsticos mais comumente empregados. *

ste livro no trabalho de um s autor nenhum livro o . Muitas pessoas participaram de sua preparao. A maior parte do trabalho mental de que ste livro resultou deveu-se a extensa e intensa cooperao com o Professor C. W est Churchman. Por acaso e no por qualquer motivo essencial coube-me a tarefa mecnica de colocar nossas idias em letra de frma. Mas, mesmo neste aspecto, sua contribuio foi considervel. Leon Pritzker, do United States Bureau of the Census, interessou-se pelo manuscrito, desde o incio. Foi capaz de levantar problemas mais rpidamente do que me era pos svel resolv-los. Afortunadamente, consegui persuadi-lo a ajudar-me a responder algumas das suas prprias questes. Sua influncia patente ao longo de tda a obra, mas, em especial, o ltimo captulo foi escrito com sua colaborao.

XIV

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Ter eu indicado ste trabalho deve-se, em larga escala, em primeiro lugar, ao excitante perodo que passei junto ao Bureau of the Census. Foi um privilgio trabalhar e apren der com pessoas como Morris H. Hansen, William N. Hurwitz, Joseph F. Daly, Benjamin J. Tepping, Harold Nisselson, Eli S. Marks e W . Parker Mauldin. Meus con tatos, nesse perodo, com W . Edwards Deming, foram igual mente estimulantes. Muito devo a Max Bershad, do Bureau, pelo auxlio que prestou no preparo do captulo que trata de amostragem. A mim, porm, somente, cabe a respon sabilidade por quaisquer erros que sse captulo possa conter. Muitas outras pessoas atenciosamente dedicaram tempo e talento a esta obra. Gostaria de destacar Harwey V. Roberts, Martin J. Klein, Chester Topp, Fred Leone e Thomas Baker, que revisaram criticamente o manuscrito, em parte ou no todo, em diferentes estgios de seu desenvolvi mento. Aos inmeros estudantes, cuja imaginao criadora e aguda habilidade crtica serviram de incentivo a esta obra, manifesto a minha gratido; em especial a J. S. Minas e James Bates. Por fim, muito devo aos seguintes editores, publicaes e pessoas que me permitiram utilizar material de seus escri tos: The American Marketing Association (Journal of Marketing); American Psychological Association, Inc. (Psy chological Review); The American Public Health Association (American Journal of Public Health); American Sociological Society (American Sociological Review); American Statistical Association (Journal of the American Statistical Association); The Annals of Mathematical Statistics e C. Eisenhart, F. Swed, C. O. Ferris, F. E. Grubbs, e C. L. Weaver; Biometrika; Columbia University Press; Sra. Earle E. Eubank; The Free Press; Charles Griffin & Co., Ltd.; Harper & Brothers; Harward University Press; Henry Holt and Company, Inc.; Houghton Mifflin Company; McGrawHill Book Company, Inc.; The Macmillan Company; Pro fessor R. A. Fisher, Cambridge, e a messrs. Oliver e Boyd, Ltd., Edinburgh (pela permisso para reproduzir as Tabe las V e V III de seu livro, Statistical Methods for Research Workers); Philosophical Library, Inc.; Princeton Univer sity Press; Public Opinion Quarterly; Rinehart and Com

PREFCIO

XV

pany, Inc.; Royal Statistical Society (Journal of the Royal Statistical Society); Routledge and Kegan Paul, Ltd.; The University of Chicago Press; The University of North Carolina Press; University of Pennsylvania Press; Warwick and York, Inc. (Journal of Educational Psychology); e John W iley & Sons, Inc. . R .L.A. Cleveland, Ohio 16 de Margo de 1953

N O T A DOS TRADUTORES

Os tradutores conservaram, sempre que possvel, a nota o do autor. A fim de facilitar ao leitor a consulta s tabe las, preferiram, tambm, usar a vrgula no lugar do ponto e ste no lugar daquela nas decimais e nas separaes de unidades. Assim, p. ex., em vez do nosso 1,3 ou do nosso 0,7, o leitor encontrar 1.3 ou .7; no lugar do nosso 1.630.000 (um milho seiscentos e trinta mil), o leitor encontrar 1,630,000 (ou, em algumas ocasies, 1600 em lugar de 1,600). H, em outra obra j vertida para o por tugus, trmos ainda no consagrados, como, p. ex., "randmico, adjetivo correspondente a "random; nsse caso demos preferncia a aleatrio. Aqui ou ali, tornou-se obrigatrio acolher palavras que, talvez, desagradem espe cialistas; pela eventual impropriedade de escolha, desculpamse de antemo. L.H. O .S .M .

C a p tu lo

O S IG N IF IC A D O D A P E S Q U IS A E E X P E R IM E N T O S M E T O D O L O G IC A M E N T E P L A N E JA D O S

1. Introduo.
H no muito tempo (h menos de cem anos) cientistas e filsofos sustentavam ser impossvel uma cincia do esp rito e da sociedade ou ser impossvel, pelo menos, uma cin cia experimental do esprito e da sociedade. Argumentavam que o esprito e a sociedade humanos so, essencialmente, incapazes de se ver submetidos a estudo cientfico e, par ticularmente, de carter experimental. Mas, a histria da cincia tem demonstrado, repetidamente, que um setor, con siderado em certo perodo como insuscetvel de tratamento cientfico, vem a ser tratado cientificamente em periodo posterior. Existem ainda filsofos que, repetindo o passado, proclamam ser o esprito e a sociedade, ou, quando menos, importantes aspectos de um e de outra, insuscetveis de investigao cientfica. Mas, o psiclogo e o cientista social avanam e investigam cientificamente o esprito e a socieda de, a despeito do filsofo. queles que afirmam que uma cincia do esprito e da sociedade inconcebvel, podemos dirigir a pergunta formulada por Lewis Carrol em situao similar: Voc tentou?. Investigao cientfica a propsito do esprito e da socie dade pode ser bem ou mal conduzida. Aqui desejamos des cobrir como conduzi-la da melhor maneira possvel. Nosso objetivo no o de sintetizar prticas correntes, nem o de tomar em considerao a maneira como age a maioria dos cientistas. Muitas dessas snteses j existem. Nosso obje tivo , antes, o de patentear como pode ser orientada a melhor investigao possvel em cincias sociais, atravs das^ ltimas conquistas do mtodo cientfico. Em verdade, dese jamos tomar explcita a maneira como a pesquisa deveria ser

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

conduzida e no necessariamente como conduzida. Frente ao caso prtico, o cientista social pode julgar impossvel preencher tdas as condies que estabeleceremos; mas, de grande convenincia que le saiba a que distncia se situa do procedimento timo. Somente quando um cientista reco nhece as deficincias (sejam elas impostas de dentro ou de fora), que le se torna capaz de aperfeioar eficientemente seus mtodos. Desde que neste livro nossa preocupao principal girar em trno da pesquisa e de experimentos metodologicamente planejados, devemos comear esclarecendo o significado de "experimento, pesquisa, planejamento e metodologia". Esclarecer o significado dsses conceitos proporcionar no somente a "amostra das prximas atraes como ser essen cial para a compreenso do por que a pesquisa deve ser pla nejada metodologicamente.

2.

O significado de experimento e de pesquisa.

Antes de tudo, consideremos o significado de "experi mento. Comeamos fazendo algumas observaes bvias, mas importantes: ( 1 ) experimentao uma atividade e ( 2 ) a espcie de atividade que ns chamamos investigao. Nem tdas as investigaes, contudo, so experimentos; mas todos os experimentos so investigaes. O que nos com pete fazer, ento, determinar o que distingue os experi mentos de outros tipos de investigao. Para facilitar a discusso, demos um nome investigao no-experimental; chamemo-la investigao baseada no senso-comum. Inves tigao baseada no senso comum a que levamos a efeito a cada momento, com respeito tanto a questes triviais como a questes importantes. Aplicamo-nos a determinar qual a melhor maneira de ir de casa ao trabalho, onde guardar roupas, como investir economias, etc. . Essas investigaes so, via de regra, no-experimentais. Para converter o senso comum em cincia, devemos saber o que torna cient fica uma investigao e o que transforma uma experincia em um experimento. A investigao experimental tem sido historicamente distinguida da investigao baseada no senso comum, de duas diferentes maneiras: com base ( 1 ) no tipo de proble

SIGNIF.

DA

PESQ.

EXP.

M ET.

P LA N E JA D O S

mas que so investigados, ou sejq. Q nhjpfn: p ( 2 ) ,em como so investigados sses problemas. ou seja, o mtodo, Afirma-se, algumas vzes, que a experimentao diz respeito a problemas menos imediatos ou menos prticos que os investigados pelo senso comum; isto , afirma-se que a cincia e a experimentao preocupam-se apenas com pro blemas de longo alcance. Mas, um momento de reflexo mostra que essa afirmativa no espelha os fatos. A cincia est continuamente enfrentando tda espcie de problemas de importncia imediata e prtica; ela nos diz como curar uma doena, como construir uma ponte, como aumentar uma colheita, etc. . E tambm reconhecemos que o senso comum investiga, com grande freqncia, problemas de largo alcance e de natureza muito geral. Investigaes histricas acrca de problemas ticos e filosficos, por exemplo, tm-se valido antes do senso comum do que da experimentao. Uma das caractersticas de nosso tempo a difundida convico d que qualquer problema que possa ser investigado, com_Bfspectivas de bons frutos, por meios no cientificos , ao menos potencialmente, suscetvel de produzir resultados" melhores. se investigado cientificamente. Parece conveniente buscar a diferena entre a investi gao baseada no senso comum e a experimental, recorrendo, antes ao mtodo do que ao objeto. Uma vez que nos deci damos por sse caminho, o prprio senso comum oferece uma indicao para a diferena; le afirma que a experi mentao investigao controlada. Isso no nos diz qual a diferena entre investigao baseada no senso comum e investigao experimental, mas d um nome a essa diferena e aponta para onde buscar uma elucidao para ela. Use mos de uma analogia para comear nosso caminho. Dizemos que alguns instrutores "controlam suas clas ses e que outros no. Que queremos dizer, fazendo essa distino? O instrutor que no controla sua classe no pode fazer com ela o que deseja. Ter algo sob controle estar apto a dirigi-lo num rumo desejado. Se a classe pode con duzir o instrutor para onde quer, ento ela que o tem sob controle. Ora, muito raro, se alguma vez acontece, que uma classe esteja sob absoluto controle ou em completo des controle. Isso equivale a dizer que o controle pode ser representado numa escala e que podemos classificar os ins

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

trutores de acrdo com o grau de controle por les exercido sbre as respectivas classes. Que significa isso, quando aplicado ao nosso problema? Se o experimento investigao controlada, investigao em que o cientista dirige fatos, de forma que les se orien tem para um objetivo desejado a soluo de um problema. Uma pessoa, cujas aes sejam completamente determinadas pelo meio exterior, no pode controlar sua experincia e, portanto, no pode experimentar. A liberdade de escolha necessria para o controle e, conseqentemente, para a ^experimentao. Que significa dizer que a experincia dirigida para um objetivo desejado? Significa que a atividade desenvol vida eficaz, relativamente quele objetivo. Investigao controlada investigao eficaz. Assim, a experimentao um meio mais eficaz de investigar do que o apoiado no . senso comum. Isto no equivale a dizer que o senso comum seja incapaz de encontrar soluo para problemas; equivale a dizer que no o tanto quanto a experimentao. O senso comum e a investigao experimental corres pondem a nveis diversos na escala que traduz a forma eficaz de conduzir uma investigao. difcil dizer qual o ponto preciso dessa escala em que se passa do senso comum para a>experimentao;, e, na verdade, o problema nem deve ser posto dessa maneira. Mais acertado reconhecer que tda investigao envolve algum senso comum e alguma experi mentao. O objetivo para aue tendemos, em cincia, o de confiar cada v p z mqis no experimento e cada vez menos rio senso comum. O controle, embora necessrio, no suficiente para distinguir a experimentao cientfica da investigao baseada no senso comum. Como deixamos dito, controlar dirigir e devemos ter em conta aquilo a que se dirige um experi mento, antes de podermos cham-lo cientfico. Tempo houve em que se considerava caber cincia a funo de encon trar os meios mais eficientes para atingir qualquer fim. Dste ponto de vista segue-se que cincia lcito buscar os meios mais e mais eficientes para destruir (assim como para preservar) a civilizao. A cincia foi tida por com pletamente "imparcial. Mas, uma contradio nesta manei ra de ver a cincia fz-se aparente e impe-nos reconsiderar conceitos acrca dos objetivos que a cincia pode servir. A

SIGNIF.

DA

PESQ.

EXP.

M ET.

P L A N E JA D O S

contradio a seguinte: segundo essa concepo de cin cia, a um cientista lcito buscar, deliberadamente, meios para a destruio da prpria cincia. Por exemplo, le poder buscar os meios de moldar uma sociedade em que seja vedada qualquer atividade cientfica. Ora, agir assim claramente anticientifico. Ainda que chamemos "experimentao a tal atividade, ela no ser, certamente, "experimentao cient fica". Diramos de tal esforo que le se vale de meios cientficos para alcanar objetivos no-cientficos. A cincia uma instituio histrica em marcha, per seguindo um objetivo distante, um ideal. O ideal da cincia fornecer ao homem meios mais eficazes, no s agora, mas tambm no futuro. Seu objetivo, portanto, o de proporcionar continuadamente meios mais e mais eficazes, aumentando, sem limites, nosso conhecimento. Ela no espera proporcionar o conhecimento absoluto, mas prope-se a per seguir sse ideal indefinidamente. O trmo "experimento , por vzes, usado em sentido mais restrito do que aqule em que o utilizamos at agora. O sentido restrito aplica-se investigao conduzida em situao tal que os objetos e fatos envolvidos podem ser manipulados vontade pelo investigador; isto , situao tal que o investigador pode interferir para influenciar os fatos a serem observados. Muitos dos que fazem esta restrio supem, erroneamente, que a manipulao o nico mtodo de controle, porm, isso no verdade O astrnomo no pode manipular estrias e planetas, mas pode efetuar inves tigaes controladas com respeito a seus movimentos e rela es. Embora le no possa manipular as variveis, pode conhecer seus valores, e sse conhecimento torna-o capaz de utilizar, eficazmente, os resultados das investigaes na perseguio de seus objetivos. De forma semelhante, talvez, no possa o cientista social manipular o grupo de pessoae que le estuda, mas, se le puder determinar as caracterstica^ importantes do grupo, estar em condies de investigar sse grupo de forma controlada. H uma razo histrica justificadora de que a manipu lao seja, algumas vzes, identificada com o controle. Houve poca em que os mtodos de anlise matemtica e estatstica, usados na cincia, s permitiam que se operasse com duas variveis ao mesmo tempo. Em conseqncia, as cincias fsicas (as nicas cincias daquela poca) desenvolveram

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

um conceito de experimento ideal aqule em que se supe manterem-se constantes tdas as variveis, exceto duas. Uma destas, chamada varivel independente, manipulada, de sorte a assumir os vrios valores desejados pelo experimentador. Observaes se fazem, ento, acrca das alteraes que sofre a outra varivel dependente". O local em que tal manipulao feita chama-se "laboratrio". Mas, hoje como veremos com algum pormenor nos pr ximos captulos a dependncia de uma varivel em relao a qualquer nmero de variveis independentes pode ser deter minada com o iiso-da m n dp rna anlise estatstica. Por sse motivo, embora a manipulao j tenha sido necessria para reduzir o nmero de variaveis s duas que podiam ser tra tadas matemticamente, o mesmo hoje no acontece. O desenvolvimento dos mtodos de anlise multivariada afastou a necesidade de manipulao e de laboratrio, per mitindo que o cientista percorra o mundo, buscando sur preender, em seu habitat natural, problemas de complexidade crescente. Conquanto o controle no seja sinnimo de manipulao, alguns cientistas consideram-no til para estabelecer distin o entre as classes gerais de investigao controlada e a especial classe de investigao, na qual o controle conse guido por manipulao. A classe geral chamada "pesqui sa; a classe especial, experimentao". Essa prtica tem trazido a conseqncia infeliz de atribuir investigao no manipulvel um status inferior ao da investigao manipul vel. Seria prefervel chamar experimentao a tda investi gao controlada. Assim, seria posta nfase no na manipu lao, mas, no controle, como acertado. Mas, para no fazer violncia demasiada ao uso cientfico, empregaremos o trmo pesquisa" para designar a classe geral de investi gaes controladas. Nossa preocupao, de ora em diante, estar voltada para a pesquisa planejada metodologicamente. 3. O significado de planejamento.

O problema que desejamos enfrentar agora o de como manter sob controle as varias fases da mvestigaao. Isto pode ser feito planejando a pesquisa. Ainda aqui, tratemos de alcanar o significado de "planejamento por analogia. Dizemos que um arquiteto "planeja um edifcio; uma casa.

SIGNIF.

DA

PESQ.

EXP.

M ET.

P L A N E JA D O S

por exemplo. Projetando uma casa, o arquiteto considera o conjunto de decises que interessam construo. Decide quo mplo o edifcio ser, estabelece o nmero de aposen tos, fixa os materiais que sero usados, etc. Tudo isso le faz antes que se inicie a construo. E procede assim, por que deseja um quadro do todo, antes do incio da constru o de qualquer das partes. Valendo-se dsse "quadro", pode le corrigir enganos e introduzir aperfeioamentos, antes de a construo iniciar-se. Projetar planejar; ou seja, o planejamento o procedimento correspondente a tomar deci ses antes de surgida a situao face qual a deciso deva ser efetivada. um processo de antecipao deliberada, orientado para colocar sob controle uma situao cujo surgi mento se espera. A aplicao dessas observaes pesquisa bvia. Se, antes de levar a efeito uma investigao, prevemos os pro blemas todos que a pesquisa pode envolver e decidimos ante cipadamente como agir, aumentamos nossa possibilidade de controlar o processo da pesquisa. O arquiteto no pode conservar na cabea tdas as deci ses tomadas. Ainda que pudesse, teria dificuldade para perceber como se relacionam. Portanto, registra suas deci ses, empregando smbolos em desenhos, especificaes, etc.; isto , registra e correlaciona as decises tomadas em modelos verbais, grficos ou sob forma de maquete. O modlo arqui tetnico uma representao simblica de tdas as decises tomadas ao projetar-se um edifcio uma representao que exibe a interrelao entre o conjunto dessas decises. O modlo torna possivel, portanto, uma avaliao global do plano em seu todo. Anlogamente, em cincia o planejador pode registrar, mediante o uso de smbolos, as vrias decises tomadas rela tivamente pesquisa. Uma construo simblica dsse tipo, composta de conceitos e imagens, chamada modlo de pesquisa ou experimental". 4. O significado de metodolgico.

H diferena entre tomar uma deciso antecipada mente e ,avaliar as bases da mesma deciso. Tomamos decises numerosas, sem saber quo aceitveis so__asfundamentos em que se apoiam. Nesses casos, ou no temos

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

conscincia do mtodo com que se chega s decises, ou no pretendemos investig-lo. Na medida em que investi gamos, ou tornamos passvel de investigao o mtodo de 'tomar decises-para pesquisa, estamos planejando metodofgicamente essa pesquisa. Enquanto o projeto permite a avaliao das decises para pesquisa antes que elas se efetivem, a metodologia efetua, de fato, a avaliao e possibilita que o mtodo empre gado para chegar s decises seja, por sua vez, avaliado antecipadamente. Quanto melhor o mtodo, tanto melhores de esperar que sejam as decises resultantes. Nenhuma investigao completamente metodolgica ou completamente a-metodolgica. As investigaes variam entre sses extremos. At mesmo a investigao baseada no senso comum pode ter, em certo grau, auto-conscincia metodolgica. Um projeto inteiramente metodolgico outro ideal cientfico inatingvel, mas, de que podemos aproximarnos constantemente. Sumariando, a ppsqnisa metodologicamente planeiada (a) na medida em que fnr .elaborada e avaliada antecipada mente e~ 7 b) .na.medida _em xjue o ntodo de_._tomar decises para pesquisa fr avaliado ou tornado passvel de-avaliao. A representao^.simhlica dsse plano^-& modelo de pes~ __guisa. 5. Por que devemos planejar metodologicamente a pesquisa?

Exposies a respeito da natureza da investigao cien tfica enfatizam, habitualmente, a primazia das observaes no mtodo cientfico. A nfase freqentemente justificada asseverando-se que as observaes vm antes" e que os dados so, ento, classificados e, subseqentemente, anali sados. Essa descrio do mtodo da cincia enganosa, porque no podemos fazer observaes sem c ^ id ij, prviamente, o que, quando, onde, como e porque observar. Observar nunca pode ser processo inteiramente no-planejado, embora possa ser planejado inconscientemente. alta mente desejvel trazer sse planejamento conscincia, de modo que le possa ser avaliado antes de iniciadas as obser vaes. H uma variao considervel no grau de elaborao ou planejamento adotado por diferentes pesquisadores. Alguns

SIGNIF.

DA

PESQ.

EXP.

M ET .

P LA N E JA D O S

nos convidam a chegar s observaes o mais rpidamente possvel, restringindo a um mnimo o projeto pr-observacional. Dizem-nos que um plano para anlise dos dados pode ser desenvolvido depois de colhidos stes, quando podemos ver como so os dados. Os defensores de um "planejamento mnimo sustentam que o tempo requerido para planejar pesquisas no bem gasto. Argumentam mais ou menos assim: o planejamento minucioso de uma pesquisa oneroso e demorado. A acuidade exigida pela maioria das pesquisas pode ser obtida sem se atravessar a fase enfa donha de construo de modelos de pesquisa metodologica mente planejada. Essa argumentao pode ser vlida em algumas situaes de emergncia, mas, certamente, no vlida para a grande maioria das situaes de pesquisa. A argumentao no considera vrios pontos muito impor tantes. 1. Em muitas investigaes, o investigador ignora quo acurados seus resultados deveriam ser para se torna rem teis. Quando isso acontece, le precisa determinar a inacuidade tolervel. Em muitos casos, le pode nem mesmo saber qual o grau de inacuidade que seu mtodo de pesquisa acarretar. Em qualquer dsses casos, le deveria planejar sua pesquisa, se quisesse assegurar resultados teis. Q. .planejamento corresponde a um seguro contra o insucesso; econmico, ao fim de contas, porque est menos sujeito a resultar em investigao infrutfera. O cientista encontra dificuldades no apenas quando deixa de obter resultados suficientemente acurados, mas tambm quando atinge resultados acurados demais. Em .alouns casos, a acuidade necessria pode ser alcanada sem grandes transtornos; grau maior de acuidade envolve difi-* culdades. Se o cientista trabalha visando sse grau maior de acuidade estar despendendo tempo, esforo e fundos de pesquisa. 2 . Em muitos projetos de pesquisa, o tempo gasto em determinar o que significam os dados obtidos muito maior que o tempo exigido para planejar uma investigao que leve a dados cujo significado seja conhecido. A pesquisa atual padece de uma paixo por dados novos; pesquisadores apressam-se em coletar dados, adiando a preocupao de sa ber o que significam at que estejam reunidos, ocasio em que , normalmente, demasiado tarde para aperfeioar a forma

10

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

de colheita. verdade que, em alguns casos, a demora causada pelo planejamento da pesquisa pode resultar na Obteno de dados batidos. Mas, a ausncia de um plano de pesquisa pode produzir maior imperfeio do que o faria numa pesquisa planejada, levada a efeito mais tarde. Por exemplo, imaginemos que nos apressamos a registrar obser vaes, antes de dispormos de instrumentos adequados (como testes ou questionrios). O rro causado pelos instrumentos inapropriados pode ser maior que a inacuidade que resultaria, se tivssemos aguardado melhores instrumentos, embora nosv sos dados se tornassem um tanto batidos. 3. O terceiro ponto menos prtico do que os d precedentes, mas, provavelmente, mais importante. Como dissemos antes, o cientista tem certas obrigaes para com a cincia (e, portanto, para com a sociedade); o direito ao ttulo de cientista apoia-se, em parte, em sua capacidade de desenvolver melhores formas de investigao. Isso vale para tdas as cincias e, particularmente, para as cincias sociais, na atualidade. A esperana de algum futuro para a sociedade e para a cincia, j no cogitando de progresso, pode muito bem depender da extenso com que os cientistas sociais demonstrarem de que forma problemas sociais impor tantes podem ser efetivamente solucionados de modo pac fico e cientfico. O cientista nunca deve contentar-se com os mtodos de que dispe; contente com les, deixa de ser cientista. Como cientista, est obrigado a questionar cada fase do mtodo que utiliza, abrindo possibilidade para melhoras con tnuas. No podemos esperar que os mtodos se aperfei oem por acaso; precisamos aperfeico-los sistemtiramente aceitando como ddiva o_ que a sorte nos oferecer.

6. O significado de investigao.
Muitas anlises frutferas do processo de investigao foram e continuam sendo feitas. Nossa compreenso da investigao aumenta continuamente. Essa compreenso no importante apenas para o cientista que deseja conduzir mais eficientemente suas pesquisas, mas tambm particular mente importante para o cientista social, que deseja estudar a investigao social como fenmeno de cultura. Aqueles que analisaram a investigao em perspectiva cientfica inclina-

T D

Q < > o M co C Q O

2J a o o o

B p ^j S a S o o o> 2 'E j o

w f m
o
m a S s c ti ? c n b i> 5 0 0 o C O

o d X J
CP

T3

a ]
. a ^ 52 5

>* o < J fto 8 5


f| 3
CZ2 * 0 C

d aj O

1 B 3 T3

C Q

Modlo

Diagramtico

d e investigao.

_ Oa j

12

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

ram-se, via de regra, em conceituar a investigao como processo de soluo de problemas. Cientistas sociais tm mostrado intersse pelo processo, do ponto de vista das interaes entre indivduos e ambientes; em outras palavras, inclinaram-se em conceituar a investigao como um processo comunicativo. As duas abordagens tm sido muito frutferas e mais o so quando combinadas. Um modlo. simplificada_in diagrama, do pm rf>.<iso- de investigao, pode ser construdo, de forma a evid^nriar as duas fases, comunicativa e de soluo de problemas (v. Fig. 1). Consideremos, primeiramente, os aspectos comunicati vos dsse modlo. H quatro elementos que se comunicam: (1) o interessado na pesquisa; (2) o cientista; (3) o obser vador; e (4) o observado. No se trata, necessriamente, de quatro indivduos distintos; os elementos representam papis na comunicao. Muitos ou todos sses papis podem ser desempenhados por uma s pessoa. Por exemplo, o cien tista , freqentemente, seu prprio observador; pode ser tambm o interessado na pesquisa. De outra parte, cada papel pode ser representado por um grupo social. Por exemplo, o grupo dirigente de uma agremiao cvica pode patrocinar pesquisa levada a efeito por uma instituio a propsito de alguma caracterstica da populao de uma cidade O importante notar que, sem considerao do nmero de pessoas em causa, seja uma ou sejam milhes, sses papis de comunicao surgem em tdas as investi gaes. As operaes de comunicao abrangem (1) transmis so do problema; ( 2 ) treino e superviso dos observadores; (3) estmulo do observado; (4> resposta do observado; (5) registro e veiculao das respostas; e ( 6 ) relatrio a pro psito da soluo recomendada para o problema. Na pes quisa social, o observado , geralmente, um ser animado, capaz de comunicao e chamado sujeito ou entrevistado. Em algumas pesquisas sociais, os observadores no expe rimentam necessidade de produzir estimulo; basta-lhes obser var as respostas dos sujeitos face a estmulos existentes. o que sucede, por exemplo, quando tcnicas observacio nais de participao ou de "massa so empregadas. Em tais casos, a identidade do observador desconhecida dos sujeitos, que so observados em circunstncias "normais.

SIGNIF.

DA

PESQ.

EXP.

M ET.

P LA N E JA D O S

13

A formulao dos aspectos.comunicativos da investiga o tem um propsito de grande utilidade: aponta as poss veis fontes de rro na pesquisa. Isto se reveste de parti cular importncia no que diz respeito s atuais prticas em cincias sociais, onde muitos projetos de pesquisa recorrem a mtodos baseados em levantamento de opinies. sse recenseamento, freqentemente, exige grande nmero de entrevistadores ou observadores, bem como, grande nmero de entrevistados. A tendncia atual a de acentuar a contribuio do entrevistador para o rro que nasa da investigao. Isto , a maior parte dos esforos para redu zir erros de recenseamento dirigida no sentido de afastar os que so chamados erros do entrevistador. Interpretar a investigao em trmos de comunicao torna claro o fato de que o interessado na pesquisa, os planejadores, os entre vistados, os analistas, entre outros, so tambm possveis fontes de rro. H boa razo para crer, em muitos casos, que sses elementos de comunicao contribuem mais para o rro final do que o entrevistador. importante reconhecer que o rro pode ser introdu zido na observao ou surgir enquanto ela se processa. Veremos, adiante, como os vrios tipos de rro podem mani festar-se antes, durante e depois da coleta de dados. Na investigao, as fases de soluo do problema com preendem: (a) existncia de um problema; (b) formulao do problema e planejamento de um mtodo para resolv-lo; (c) transporte para o ambiente em que as observaes devem ser feitas, ou criao de tal ambiente; (d) registro dos dados; (e) processamento dos dados; e (f) escolha de uma via de ao dirigida no sentido de soluo do problema. Em mui tos projetos de pesquisa, a via de ao sugerida para a mesma pesquisa testada em escala pequena, antes de ser, afinal, usada. Se h motivo para duvidar da aceitabilidade da soluo proposta, ser feito ensaio preliminar, num teste prvio em pequena escala. sse mesmo teste prvio deve ser planejado metodologicamente. Se os resultados do test# prvio no favorecem a soluo proposta, os dados obtidos nesse ensaio vo realimentar um nvo plano, fazendo com que um nvo circuito se abra no caminho da pesquisa. sse processo pode ser repetido at o encontro de uma soluo satisfatria. Tal sistema de realimentao caracterstico do que normalmente se denomina pesquisa "de ao". Supo

14

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

nhamos, por exemplo, que algum se v face ao problema de reduzir o grau de discriminao contra um grupo reli gioso, em certa comunidade. O primeiro circuito da inves tigao pode ser devotado a identificar as razes da discri minao. O circuito seguinte pode ser dedicado a indicar os caminhos possveis de remoo dessas razes e a avaliar a eficcia de cada qual das alternativas. Em outro circuito, pode ser feita a tentativa de submeter a ensaio, em pequena escala, a alternativa que parea mais eficaz, avaliando os resultados. Se stes no forem to bons quanto se esperava, os dados podem ser utilizados em nvo circuito, etc., at que se consiga resultado satisfatrio. Uma vez que a fase de planejamento da investigao implica em tomar antecipadamente tdas as decises que a pesquisa possa exigir, essa fase diz respeito tanto de comu nicao de elementos, quanto de soluo de problemas. Por isso mesmo, em nossa discusso do planejamento de pesquisa, cada fase ser considerada a seu tempo. Essas fases podem ser convenientemente agrupadas sob trs ttulos principais: ( 1 ) a formulao do problema; ( 2 ) o planejamento da pesquisa idealizada; e (3) o planejamento da pesquisa prtica. Na formulaco do-problema^Ji preocupao de espe cificar exatamente aquilo em que o problema consiste. No planeiamentn da pesquisa idealizada, h preocupao por especificar o processo timo de pesquisa, qug_poderia ser seguido se no houvesse dificuldades prticas O planeja mento da~ pesquisa prtica diz respeito Tpassagem do pro jeto ideazdopara um processo de trabalho realizvel. O lanejamento prtico em si, ser examinado em quatro fases: 1 ) o planejamento de amostragem, relativo ao mtodo de seleo dos elementos a observar; ( 2 ) o planejamento esta tstico, relativo quantidade a ser observada e maneira de analisar as observaes; (3) o planejamento observacional, relativo s condies sob as quais devem processar-se as observaes; e (4) o projeto operacional, relativo s tcnicas especficas, atravs das quais os processos indicados no pla nejamento de amostragem, no estatstico e no observacional possam ser realizados. Nenhum dsses planejamentos, nem qualquer dos mo delos resultantes independente; a deciso tomada em uma fase do planejamento pode afetar a deciso a ser tomada em

SIGNIF.

DA

PESQ.

EXP.

M ET.

P L A N E JA D O S

15

qualquer das outras fases. Em conseqncia, as fases dg planejamento geralmente se superpem. Infelizmente, no "possvel apresent-las superpostas. Aqui, teremos em conta as fases do planejamento na ordem em que foram relacio nadas acima. Essa ordem facilita a exposio e tambm ordem conveniente para seguir-se no planejamento da maio ria dos projetos de pesquisa. Antes de passarmos a estudo pormenorizado das fases do planejamento, vrias advertncias devem ser feitas. Estudaremos um particular processo de planejamento com grande mincia. sse no o nico processo de planeja mento possvel. sse particular processo de planejamento mostrou-se frutfero no passado, mas , ainda, suscetvel de considervel melhoria. O estudo do mtodo cientfico , em si mesmo, uma cincia nova e em expanso. Seus resultados devem tambm estar sujeitos exigncia cientfica de aper feioamento contnuo. Isso no significa, entretanto, que um pesquisador deva tomar a liberdade de alterar o processo de planejamento ao sabor de uma inspirao ou com base no senso comum. A vantagem do processo que ser estu dado reside no fato de que mais explicitamente formulado d que suas alternativas. Afastamentos dle s tm cabi mento com base em investigao controlada. Tpicos para discusso.
1. Que constituiria uma prova de que certo objeto (digamos o espirito" ou a "cultura") no pode ser investigado cientificamente? 2. verdadeira a afirmao O senso comum de hoje foi a cincia de ontem? 3. H exemplos, baseados no senso comum de controle sem manipulao? 4. Qual a diferena entre o mtodo cientfico e a tcnica cientfica? 5. Sob que aspectos lhe parece que as seguintes citaes so corretas ou incorretas? "Definiremos cincia como uma srie de conceitos ou de esquemas, conceituais brotados de experimentos e de novas observaes" (:4) "Embora o mtodo cientfico, sob suas formas mais refinadas, possa parecer complexo, le em essncia notvelmente simples. Con siste em observar fatos tais que capacite-m o observador a descobrir leis gerais disciplinadoras dos fatos da espcie em questo. Os dois estgios, o de observao e o de inferncia das leis, so ambos essen ciais e cada qual suscetvel de aperfeioamento quase indefinido" (13:13).

16

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

"Sempre que algum, podendo escolher entre meios diversos para a soluo de um problema, decide-se por um dles e diz, em essncia, vamos tentar e ver, sse algum est se preparando para realizar um experimento. Imaginar eventualidades diferentes quanto ao que possa ser a causa do defeito de um motor de automvel , usualmente, o passo inicial para levar a efeito um verdadeiro ensaio, um experi mento" (6:7). Em experimentao cientfica, mantemos sob contrle todos os fatos que se verificam. Determinamos quando e onde ocorrero. Pre paramos circunstncias e ambientes, atmosferas e temperaturas; poss veis caminhos de entrada e de sada. Retiramos algo que existia ou adicionamos algo que no existia e verificamos o que acontece" (9:55). Brearley classifica a legislao, a reforma social e as comuni dades utpicas numa categoria e chama-lhes experimentos no-contcolados. Giddings tambm considera a legislao e a reforma social como exemplos de experimentos. Contudo, acrescenta que les no so de tipo estritamente cientfico... Por vzes, refere-se a les como experimentos no-controlados. . . (10:11).

Exerccio.
Selecione um relatrio relativamente completo de um projeto de pesquisa social que voc, ou alguma outra pessoa, haja levado a efeito. Divida-o nas diferentes fases comunicativas e de soluo de problemas e identifique os participantes.

Leituras sugeridas.
abundante a literatura acrca do mtodo cientfico e da natu reza da investigao. Indicaremos aqui uns poucos livros, que podem servir de introduo matria: Churchman e Ackoff (4), Dewey (7) e Columbia Associates (5) no pressupem conhecimento de cincia ou filosofia. Churchman (3) e Dewey (8) so introdues mais avanadas. O conhecimento da histria da cincia parte essencial da prepa rao de qualquer cientista. Mencionamos, em seguida, algumas his trias, que acentuam o desenvolvimento dos mtodos: Butterfield (2), Jaffe (11) e Randall (12). Todo cientista social deve estar familiarizado com a histria da psicologia, particularmente da psicologia experimental. Sugere-se Boring ( 1).

Referncias e bibliografia.
1. 2.
B o r in g ,

E. G. A Histoty o[ Experimental Psychology. D. Appleton-Century Co., 1929. B u t t e r f ie l d , H e r b e r t . The Orgins o[ Modem Science. York: Macmillan Co., 1951. York:

New New

SIGNIF.

DA

PESQ.

EXP.

M ET .

P LA N E JA D O S

17

3. 4. 5.
6.

7. 8. 9. 10. 11.

12. 13.

C. W . Theory of Experimental Inference. New York, Macmillan Co., 1948. C h u r c h m a n C . W ., e A c k o f f , R . L. Methods of Inquiry. St. Louis: Educational Publishers, 1950. C o l u m b i a A ss o c ia t e s . An Introduction to Reflective Thinking. Boston: Houghton Mifflin Co., 1923. Co NAN T J. B. Robert Boyles Experiments in. Pneumatics. "Har vard Case Histories in Experimental Science, Case 1. Cam bridge: Harvard University Press, 1950. D e w e y , J o h n . H o w W e Think. Boston: D . C. Heath & Co., 1933. Logic-. The Theory of Inquiry. New York: Henry Holt & Co., 1938. G id d in g s F. H. The Scientific Study of Human Society. Chapel Hill: University of North Carolina Press, 1924. G r e e n w o o d , E r n e s t . Experimental Sociology. New York: King's Crown Press, 1945. J a f f e , H a y m . The Development of the Experimental Method" em Philosophical Essays in Honor of Edgar Arthur Singer Jr., ed. F. P . C l a r k e e M. C . N a h m . Philadelphia: Uni versity of Pennsylvania Press, 1942. R a n d a l l J. H., J r . The Making of the Modern Mind. Boston: Houghton Mifflin Co., 1940. R u s s e l l , B e r t r a n d . The Scientific Outlook. Glencoe, 1 1 1 .: Free Press, 1951. C hurchm an

C a p tu lo

II

FO RM U LA O D O PROBLEM A

1.

A natureza do problema.

Um provrbio velho e sbio afirma "Um problema bem colocado est meio resolvido. Na pesquisa cientfica, elevemos abandonar a idia de que podemos enunciar os problemas sob a forma de simples questes de senso comum; devemos nos preocupar com a formulao de nossas ques tes se esperamos tirar vantagem do esforo empregado em respond-las. Por exemplo, suponhamos que durante uma conversa comum, perguntamos a um amigo Quantas pes soas moram em sua casa?. Provvelmente, le no ter dificuldade para responder e, provvelmente, aceitaremos a resposta sem outras indagaes. Suponhamos, agora, que se est realizando uma importante pesquisa a propsito do problema habitacional. Limitar-se-ia voc a propor a seus entrevistados a simples questo "Quantas pessoas moram em sua casa?. possvel que no. Um momento de refle xo mostra que voc se preocuparia com perguntas tais como: Deve um filho, que est afastado a maior parte do ano. freqentando um colgio, ser includo entre os moradores de uma casa? Deve um pensionista, que viaja durante os dias teis e s ocupa seu quarto nos fins de semana, merecer incluso? E a empregada, que a dorme trs ou quatro noites e passa as outras na casa de sua famlia? Torna-se claro que, quanto mais importante a soluo de um problema, mais cuidadosamente deve le ser enunciado. Quanto mais cuidadosamente le enunciado, mais certeza temos de alcanar uma soluo satisfatria. A fim de aprender como formular, de maneira tima, um problema, devemos, antes, determinar o que um pro blema . Podemos comear identificando os cinco compo nentes de um problema.

FORM ULAO

DO

P RO BLEM A

19

1 . Deve existir uma pessoa ou grupo que tenha o problema. Se esta pessoa ou grupo recorre pesquisa para resolv-lo, ela ou le torna-se o interessado na pesquisa, a que nos referimos anteriormente. N a maioria dos proble mas, h tambm outros participantes. O pesquisador, se diverso do interessado na pesquisa, um participante no problema. E tambm o so tdas as pessoas ou grupos que possam ser afetadas por uma deciso do interessado na pesquisa. 2 . O interessado na pesquisa deve ter algo em vista, algum objetivo ou fim desejado. bviamente, a pessoa que nada quer no tem um problema. 3. O interessado na pesquisa deve dispor de mais de um meio para alcanar seus objetivos. Meios" so vias de ao que tm, pelo menos, alguma eficcia para o alcance do objetivo. Uma via de ao pode implicar no uso de objetos; por exemplo, o uso de uma rgua para medir o comprimento de uma prancha. Objetos utilizados dessa for ma so instrumentos. Uma rgua um instrumento, mas o uso de uma rgua um meio. importante lembrar que meios so padres de comportamento utilizveis na obteno de objetivos. Instrumentos, por outro lado, no so, neces sariamente, objetos; podem ser conceitos ou idias. Por exemplo, uma frmula matemtica, uma definio cientfica, uma linguagem e imagens mentais so tambm instrumentos. Um instrumento qualquer objeto, conceito, idia, ou imagem que possa ser eficientemente adotado na perseguio de um objetivo. Deve haver, pelo menos, dois meios acessveis ao inte ressado na pesquisa. Se le no pode escolher meios, le no pode ter problema. O problema, contudo, pode consistir em tornar disponveis meios diversos. O u seja (com risco de confundir pela redundncia), le deve dispor de meios diferentes para tornar meios diferentes disponveis. 4. A existncia de alternativas de ao insuficiente para gerar um problema; o interessado na pesquisa deve ter alguma dvida quanto alternativa a escolher. Sem essa dvida no pode haver problema. O interessado na pesquisa deve desejar afastar a dvida a respeito da eficincia das alternativas; com efeito, le deve ter uma dvida a propsito da eficincia das alternativas e deve desejar resolv-la.

20

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Todos os problemas, em ltima instncia, se resumem avaliao da eficcia de diferentes meios em relao a um conjunto determinado de objetivos. Isso pode no aparecer claramente, em particular com relao pesquisa dirigida no sentido de obter "informao pura. Discutiremos sse pon to, com algum pormenor, abaixo, mas convm assinalar aqui que a informao um instrumento e seu uso um meio. Por isso mesmo, uma investigao orientada no sentido de obter informao correta ou verdadeira dirigida no sentido de obter instrumentos eficazes. Desde que os instrumentos no podem ser considerados independentemente de seu uso, essa investigao tambm envolve determinao de eficcia de meios diferentes. 5. Deve haver um ou mais ambientes a que o proble diga respeito. Mudana no ambiente pode gerar ou afastar um problema. O interessado na pesquisa pode ter dvidas quanto ao meio mais eficaz em relao a um ambiente, mas no tem tal dvida em relao a outro. Por exemplo, uma pessoa pode ter um problema relativo a decidir que capote usar num dia claro e frio. Mas, chova, e le no ter dvida de que deve usar o impermevel. A diferena de ambientes em relao aos quais um problema pode se dar como existente pode ser ampla. Alguns problemas so especficos de um s ambiente; outros, so muito gerais. Os cinco elementos de um problema so nortanto: ( 1 ) o interessado na pesquisa e outros participantes; ( 2 ) o obje tivo ou objetivos; (3) os diferentes meios de alcanar o objetivo; (4) um estado de dvida do interessado na pes quisa quanto eficcia das alf-err a^Vac. (5) im kian, tes a que o problema di? rpgppitr. evidente que a gravidade de um problema depende da importncia dos objetivos e da eficcia das alternativas. A gravidade dos enganos possveis (i. , no utilizar os meios mais eficientes) tambm depende da eficcia das alter nativas e da importncia dos objetivos. A formulao do problema consiste em tornar explcitas suas vrias componentes e determinar a gravidade de quais quer possveis enganos. O s vrios aspectos de um problema no podem ser enunciados separadamenteTmas devem ser discutidos separadamente. Consideraremos'T3S~partiripntes

FORM U LAO

DO

P RO B LEM A

21

c seus objetivos numa seco. Em seguida, passaremos a considerar as alternativas e as interrogaes a serem levan tadas em trno delas, numa segunda seco. N a terceira, levaremos em conta a eficcia das alternativas e a gravidade dos erros possveis. Finalmente, examinaremos as circuns tncias que rodeiam um problema.

2. Participantes e objetivos.
Deixamos assinalado atrs que um problema s pode existir quando h um ou mais objetivos em vista. Exami naremos, pois, como tornar explcito exatamente o que os objetivos so. Isto , devemos fazer-nos to claros quanto possvel acrca do por que estamos levando a efeito uma pesquisa o que dela pretendemos obter. Muitos pesquisadores sustentam que boa parte do tra balho de pesquisa se orienta no sentido de obter a infor mao pela informao. Asseveram que, em tais casos, o pesquisador no se deve preocupar com os usos aos quais essa informao poder servir. Esta ausncia de preocupa o com aplicaes considerada como sendo a essncia da pesquisa "pura, que, assim, se ope aplicada. certo que a pesquisa de informaes no envolve qualquer objetivo alm do desejo de obter informaes? Imaginemos, por exemplo, um cientista que esteja estu dando o comportamento do eleitor, presumivelmente apenas para descobrir por que alguns, que tm o direito de voto, no o exercem. sse cientista assevera que le no pretende, de forma alguma, interferir no comportamento do eleitor; deseja apenas compreend-lo. Que acontece, quando sua investigao chega a trmo? Uma de duas coisas: ou le publica, ou no publica os resultados. Se le no publica os resultados, a investigao no cientfica, porque a cin cia uma instituio social e no poderia existir se todos os investigadores se negassem a comunicar resultados. A cincia , necessriamente, pblica. Dificilmente se poderia considerar tal procedimento como tpico. mais de esperar que o pesquisador publique os resultados ou os utilize em pesquisas posteriores. Em qualquer dsses casos, le estar tornando a informao disponvel para pesquisa futura. ste, na verdade, um objetivo da pesquisa de informaes. Alm disso, na medida em que o pesquisador um cientista.

22

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

le deseja fornecer informao acurada (i. , instrumento eficiente) para a pesquisa futura. Sua tarefa, portanto, a de selecionar os instrumentos mais eficazes, dentre os que existam, tornando-os acessveis para a soluo da certa classe de problemas. O objetivo o de facilitar a soluo dessa classe de problemas. A pesquisa de informaes, portanto, como qualquer outra, orientada para objetivos. Seu obje tivo de natureza cientfica, mas isto no altera o fato de que orientado para objetivos. A pesquisa pura no na medida em que est livre de preocupao com aplicaes, mas, na medida em que as aplicaes com que se preocupa so cientficas. Como buscar e como formular objetivos? Em geral h trs fontes a levar em conta: ( 1 ) o mreresdo na pesquisa; ( 2 ) o pesquisador; e (3) os que sero afetados pela utilizao dos resultados da pesquisa. Uonsideremo-los cada qual por sua vez. 2.1 Os objetivos do interessado na pesquisa.

Examinaremos o assunto admitindo que o interessado na pesquisa seja diverso da agncia, ou agente pesquisador. A: discusso, contudo, igualmente aplicvel a situaes em que o interessado na pesquisa e o pesquisador so a mesma pessoa ou grupo. A tarefa de alcanar os objetivos do interessado na pesquisa no consiste, em geral, em persuadir um relutante interessado em pesquisa a revelar seus intersses. Antes, na maioria dos casos, implica em auxiliar quem esteja, em princpio, interessado numa pesquisa, a formular objetivos que seu esprito ainda no pde elaborar sistematicamente. Se le formulou seus objetivos, normalmente le os dar a conhecer. Se no formulou, necessrio ajud-lo a expli cit-los to completamente quanto possvel. incuo sim plesmente perguntar "Quais so seus objetivos?. Tcnicas mais elaboradas e frutferas podem e devem ser utilizadas. Uma vez que o pesquisador tenha pelo menos uma idia vaga do problema, le poder formular rpidamente sugestes quanto natureza da pesquisa e quanto aos diferentes resul tados possveis. Estar utilizando essa formulao superfi cial para penetrar os objetivos do interessado na pesquisa. Poder faz-lo empregando mtodos de entrevista em pr-^

FORM ULAO

DO

PRO BLEM A

23

fundidade e propondo ao interessado na pesquisa questes do tipo seguinte: Se a pesquisa evidenciar que tal-e-tal o caso, que far voc?". Quando o interessado na pesquisa responde delineando um caminho de ao, o pesquisador pergunta Por que far isso? Isto , que espera alcanar procedendo assim?. Esta sondagem poder proporcionar informao tanto a respeito das possveis vias de ao (meios) quanto a respeito da motivao do interessado na pesquisa. Suponhamos, por exemplo, que uma organizao poltica solicite a uma agncia de pesquisa que determine porque tantos votantes deixam de comparecer s urnas nas eleies locais. Se o pesquisador perguntasse Por que dese jam essa informao? a resposta provvelmente no seria esclarecedora. Mas se o pesquisador perguntasse "Se a pesquisa mostrar que a razo principal da absteno a dificuldade de atingir os locais de votao, que far voc?" a resposta poderia ser "Agirei junto municipalidade para aumentar o nmero e facilitar o acesso aos locais de vota o. Tal resposta j revela motivao que pode ser mais explorada. De comeos como sses, podemos chegar aos objetivos especficos do interessado na pesquisa. No exem plo do comportamento eleitoral, seria preciso inquirir muito mais, desde que as respostas mencionadas constituem apenas um inicio. Considere-se o caso em que o interessado na pesquisa seu patrocinador (i. , responde por seu custo). Nesse caso, para levar a efeito a pesquisa, devemos saber tambm quanto o patrocinador est disposto a dispender, dentro de que prazo deseja os resultados, a que ponto quer identificarse com a pesquisa, etc.. Isto , devemos saber exatamente que limitaes a organizao patrocinadora impe sbre a pesquisa, sendo que essas limitaes brotam dos objetivos do interessado na pesquisa. A sondagem verbal do interessado na pesquisa deve ser suplementada por sondagem semelhante de outras pessoas familiarizadas com aqule e com seus problemas. Por exem plo, suponhamos que um projeto de pesquisa patrocinado por uma comisso de planejamento municipal e que o diretor dessa comisso relaciona os objetivos da repartio. Outras reparties publicas e organizaes privadas podem ser soli citadas a comentar a lista de objetivos. Se uma dessas outras organizaes opina que a lista no satisfatria, e

24

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

faz-se capaz de sustentar tal opinio, torna-se indicada uma investigao adicional. Em alguns casos ser possivel iden tificar os propsitos do interessado na pesquisa atravs de uma reviso de seu comportamento passado. Por exemplo, as aes passadas de um organismo municipal, como uma comisso de planejamento, podem mostrar claramente se ela deseja ou no deseja conseguir, digamos, um programa de eliminao de reas faveladas. Se ela proclama sse obje tivo sem nunca ter proposto ou apoiado legislao em tal sen tido, o programa no deve ser confiado quele organismo, a menos que haja bons motivos para tal incongruncia. Em suma, tdas as tcnicas para determinar propsitos so apli cveis ao caso e devem ser parte do material de uso dirio do pesquisador. possvel que alguns dos objetivos do interessado na pesquisa entrem em conflito; na verdade, isto acontecer freqentemente. Por exemplo, le pode desejar que o estudo se faa muito economicamente, desejando, ao mesmo tempo, resultados muito precisos. Se o planejador estiver conven cido de que no pode obter a acuidade desejada com o dinheiro disponvel, ento, com o auxlio do interessado na pesquisa, dever determinar a importncia relativa dos obje tivos conflitantes, de modo a poder decidir quais os sacri fcios a serem feitos. Caso o interessado na pesquisa se recuse ou seja inca paz de dar a seus objetivos outra formulao que no uma "manifestao de curiosidade, o planejador deve buscar traduzir, da melhor maneira possvel, o que le julgue serem aqules objetivos. Em tais casos, a ajuda de analistas de personalidade e de grupos altamente desejvel. sses peri tos podem ser capazes de desvendar objetivos de que o prprio interessado na pesquisa no tem conscincia. Somente por medidas dsse tipo pode o pesquisador proporcionar a si prprio os melhores critrios para ulteriores decises rela tivas pesquisa. Ao pesquisador caber, tambm, definir os objetivos nos casos em que o interessado na pesquisa no possa ser identificado claramente. Isso acontece, por exemplo, em algumas pesquisas levadas a efeito por agncias coletoras de dados (e.g. o United States Bureau of the Census). Nessas circunstncias aconselhvel no apenas enunciar

FORM ULAO

DO

P R O B LE M A

25

explicitamente os objetivos, mas dar-lhes publicidade ao mes mo tempo que aos dados, aumentando, dessa forma, as pos sibilidades futuras de determinar quem so os interessados, por meio da resposta que stes dem publicao. Alm disso, pesquisa posterior pode revelar a identidade dos inte ressados e seus objetivos. Poderemos, ento, desejar saber se os objetivos corretos foram os presumidos, e isso pode ser determinado somente no caso de as presunes terem sido explicitamente formuladas, de incio. Se h vrios interessados na pesquisa, seus objetivos podem ser conflitantes. Desde que objetivos conflitantes no podem ser atendidos ao mesmo tempo, sua importncia relativa deve ser determinada, de sorte que o pesquisador possa decidir qual dles tentar alcanar. Desde que, atual mente, no h um meio inteiramente cientfico de determinar a importncia de objetivos, devemos recorrer ao senso comum ou a mtodos semi-cientficos. Qualquer que seja o mtodo que se utilize, le deve ser explicitado a fim de que se sujeite a posterior avaliao; somente encorajando tal avaliao pode ser estimulado o desenvolvimento de mtodos cient ficos para avaliar objetivos. Contudo, no necessrio que o senso comum caminhe s cegas; le dispe da histria da cultura e da tica para ajud-lo. (N a sec. 2.6 examina remos um mtodo semi-cientfico de avaliao de objetivos). Os objetivos do interessado na pesquisa (ou, naquilo que interessa, os do pesquisador) raramente sero enuncia dos em seu todo antes que se inicie alguma outra fase do planejamento. Normalmente, os objetivos sofrero refor mulaes progressivas durante o desenvolvimento do plano. O processo de planejamento torna possvel sse progresso do prprio planejamento; mas, deve-se acentuar que requer participao contnua do interessado na pesquisa no processo de planejamento. Se possvel, o interessado na pesquisa deve ser solicitado constantemente para consulta e discusso, pois, medida que le v o projeto de pesquisa comear a tomar forma, pode descobrir de que modo lhe pos svel e deveria esclarecer seus objetivos. Quer dizer, se o interessado na pesquisa verifica que as decises do planejamento da pesquisa dependem de interesses seus, le procurar dar formulao mais adequada a sses objetivos e o planejador poder dirigir perguntas cada vez mais preci sas ao interessado na pesquisa, com respeito queles mesmos

26

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

objetivos. A possibilidade de contato com o interessado h pesquisa para fins de consulta essencial para a eficcia mxima do planejamento. Uma cautela: os interessados na pesquisa no so ape nas os que a patrocinam: h outros beneficirios dos resul tados da pesquisa. Por exemplo, se os resultados esto destinados publicao numa revista cientfica, os leitores de tal revista so interessados potenciais. Nem sempre possvel conhecer os objetivos dsses leitores, mas, se publi camos resultados de pesquisa para atender a interesses de outros profissionais, sses intersses devem ser considerados. Se no conhecemos sses intersses, devemos fazer presunes explcitas com respeito a les e public-los juntamente com os resultados. Isto necessrio para assegurar uso adequado dos resultados da pesquisa por aqules, a quem sses resultados se faam acessveis. Os que no mantm relao direta com a pesquisa, mas que por ela se vem afetados, so tambm interessados. Ns, contudo, os consideraremos separadamente.

2.2

Os objetivos do pesquisador.

Afirma-se, freqentemente, que o pesquisador deve ser completamente imparcial; ou seja, que le no deve permitir que seus intersses pessoais influenciem as decises relativas pesquisa. Compreendida literalmente, essa afirmao des cabida. A maioria dos pesquisadores, por exemplo, no esco lher deliberadamente um mtodo de observao que possa envolver risco de vida. O desejo do pesquisador de obter prestgio, lucro, auto-educao, etc., comumente influi nas decises relativas ao planejamento, mesmo que no haja conscincia dsse fato. Alguns dos intersses prprios do pesquisador aparecem na maior parte das decises relativas a um planejamento. Conseqentemente, o pesquisador deve formular explicitamente seus prprios intersses. Se, por exemplo, um pesquisador escolhe certo mtodo porque lhe consumir menos tempo do que outro, mesmo sendo menos acurado, le deve tomar claro que o desejo de poupar tempo teve influncia na seleo do mtodo. Somente assim, pode a deciso ser inteiramente entendida e avaliada ulteriormente pelo pesquisador e por outros.

FORM ULAO

DO

P RO B LEM A

27

freqentemente difcil que uma pessoa entenda seus prprios motivos e reconhea como seus interesses podem influir numa tomada de deciso. Por essa razo desejvel contar com a cooperao de outros (particularmente psic logos) nesta fase do processo de planejamento. til sub meter a outros as prprias decises e as razes que as moti varam, pois, somente dessa maneira, podem ser trazidos conscincia intersses de que o pesquisador no tinha per cepo. Quando no estamos conscientes de nossos inte rsses, freqentemente construmos racionalizaes elabora das para explicar nossas decises e essas racionalizaes s por outros podem ser percebidas. E, quando o so, pode o pesquisador sentir-se embaraado, mas, se le tem intersse no aperfeioamento de seus mtodo, -lhe essencial a autocompreenso que pode resultar de uma crtica franca. O pesquisador no apenas uma pessoa; um cie tista e, conseqentemente, os objetivos da cincia devem ser tidos em conta. O objetivo da cincia, como j deixamos indicado acima, no somente o de aumentar o conheci mento, mas, o de aumentar as nossas possibilidades de con tinuar aumentando o conhecimento. A cincia, por sua pr pria natureza, est compelida a aperfeioar-se. Se um pes quisador aspira ao ttulo de cientista", deve orientar suas investigaes de forma que cada qual das incertezas de uma pesquisa concorra para aperfeioar o mtodo de conduzir a pesquisa seguinte. O pesquisador, como cientista, deve pro curar fazer mais do que simplesmente resolver o problema que tem pela frente; no processo com que se defronta, impese-lhe aprender acrca da investigao em si mesma. Em outras palavras, cabe-lhe buscar, descobrir instrumentos e meios mais eficientes para a realizao de pesquisas poste riores. , sse propsito de auto-aperfeioamento da cincia acar reta srias conseqncias para o pesquisador. Se le acre dita, ou tem provas, de que os resultados de sua pesquisa somente sero usados de forma prejudicial para o futuro progresso da cincia, cabe-lhe a obrigao, como cientista, de rio tornar sses resultados acessveis aos que dle se utili zaro mal. Essa responsabilidade se relaciona com o uso dos resultados da pesquisa e dela nos ocuparemos mais adi ante. Mencionamo-la a esta altura para esclarecer a razo

28

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

que impe considerar os objetivos da cincia. certo que muitos negam que tenha o pesquisador qualquer responsa bilidade moral pelo uso que venha a ser feito dos resultados de sua pesquisa. Mas, se (como a Histria tem feito) con cebemos a cincia como uma instituio em marcha, o cien tista tem responsabilidade moral, quando menos, pela mar cha" da cincia. 2.3 Os objetivos daqueles que sero afetados pela pesquisa.

Suponhamos que um produtor de bens de consumo confiasse a um cientista um projeto no qual estivesse impl cito causar dano aos consumidores daqueles bens. Deve riam os objetivos do produtor ser aceitos sem crtica, por estar le disposto a financiar a pesquisa? tolo asseverar que o pesquisador no se deve preocupar com os intersses daqueles que sero adversamente afetados pela utilizao dos resultados da pesquisa. Imaginemos, por exemplo, que o prprio pesquisador esteja entre os que viro a ser atingi dos. Em tal situao, dever le sacrificar, automticamen te, seus intersses pessoais? Nenhum cientista esperaria que outra pessoa o fizesse automticamente; do cientista espera-se que pondere a situao e avalie as alternativas. Atitude idn tica deve ser tomada, ainda que o pesquisador no se encon tre entre os que a utilizao dos resultados da pesquisa afetar adversamente. Pode ocorrer que os objetivos do interessado na pes quisa e os daqueles que sero afetados pelo uso de seus resultados mostrem compatibilidade. Mas, ainda assim, os objetivos de ambas essas partes devem ser considerados. Veremos, adiante, como sses objetivos regulam posteriores decises relativas ao planejamento. A pessoa (ou grupo) que tem o problema (e a que nos referimos acima como o interessado na pesquisa") no o nico interessado; ela (ou le) , to somente, o interes sado imediato na pesquisa. Aqules que venham a efetivar as decises do interessado imediato so interessados inter medirios e aqules que se vem, ao final, afetados por aque las decises so os ltimos interessados. Suponhamos, por exemplo, que uma comisso municipal de educao patrocine uma pesquisa relativa maneira de tratar crianas excep

FORM U LAO

DO

P R O B LE M A

29

cionais. A comisso de educao o interessado imediato (aqule a quem cabe tomar decises). Quaisquer decises que se tomem sero levadas a efeito pelos professores, inte ressados intermedirios. Os alunos, ao final, viro a ser afetados e constituem, portanto, os interessados ltimos. A desconsiderao dos interesses daqueles que sero afetados pela utilizao dos resultados da pesquisa , fre qentemente, muito onerosa. Caso a mencionar o de um grande industrial, que encarregou psiclogos, socilogos e engenheiros industriais de determinarem o tipo de edifcio que deveria ser construdo para abrigar uma fbrica de ins trumentos de alta preciso. Uma das recomendaes resul tantes do estudo foi a de que o edifcio, ou pelo menos o local do trabalho, fsse desprovido de janelas e iluminado por luz artificial, homognea, a fim de assegurar melhores condies para o desempenho das atividades. A fbrica foi construda e, embora a qualidade do produto fsse alta, o nvel de produo era muito inferior ao desejvel. Pesqui sadores foram novamente chamados. Verificaram, entre outras coisas, que estava sendo gasto pelos trabalhadores um tempo acima do razovel nas instalaes sanitrias. E descobriram que as visitas freqentes e prolongadas quelas instalaes deviam-se ao fato de que elas tinham janelas e os trabalhadores desejavam olhar para fora, ver como esta va o tempo e aliviar a sua sensao de claustrofobia. Em conseqncia, fizeram-se aberturas nas paredes inteirias, nelas encaixando-se janelas. Se a soluo do problema, que est sendo considerado, afetar pessoas, sempre importante levar em conta as pos sveis reaes quela soluo. sse ponto foi dramticamente ilustrado durante a guerra, quando as possveis rea es de nossas prprias tropas (interessados intermedirios) e as do inimigo (ltimo interessado) a uma nova ttica ou estratgia tinham sempre de ser consideradas. Em boa por o, a pesquisa social aplicada enfrenta o mesmo problema. Mesmo, porm, na dita pesquisa pura, onde os nicos diretamente afetados so outros cientistas, os intersses dstes devem ser levados em conta. Em tal pesquisa, preten de-se atingir resultados teis a outros cientistas e utilida de no tem sentido independente de intersses.

30

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

2.4

Mtodos de determinao de objetivos.

J se fz referncia aos vrios meios de determinar os intersses dos diferentes participantes. Pode ser til, con tudo, reuni-los e relacion-los. 1 . Questionrio ~ Questionrios tornam-se eficazes quando se pode supor que os participantes conhecem seus intersses e esto dispostos a divulg-los. 2. Sondagem e entrevista em profundidade ste mtodo pode tornar-se til, quando os participantes no tm conscincia de nenhum, ou s tm conscincia de alguns de seus intersses pertinentes. 3. Mtodo da confrontao Se o interessado ime diato um grupo, seus intersses coletivos podem no cor responder a uma simples soma dos intersses considerados isoladamente. Nesta hiptese, os indivduos devem ser ques tionados como um grupo, a fim de determinar como agiriam e por que. O mtodo tambm aplicvel a outros grupos de participantes. 4. Mtodo do comportamento Se os participantes estiveram anteriormente em face de problema semelhante, um exame das aes passadas pode ser o meio de revelar seus intersses. Em alguns casos, podem ser elaborados testes de preferncia para determinar os intersses dos partici pantes. 5. Informantes Pessoas conhecedoras dos partici pantes podem estar capacitadas a fornecer informaes, e dados a respeito dos intersses dles. Um conjunto de par ticipantes pode ter condio para revelar intersses de outros participantes; por exemplo, empregados e empregadores. 2.5 Relao de participantes e de seus objetivos.

sempre de bom aviso registrar os resultados obtidos em cada fase do planejamento da pesquisa. Essa prtica no s evita esquecimentos, como possibilita expor os resul tados a avaliao posterior. Neste caso, desejvel anotar a identidade dos participantes do problema, seus objetivos e a prova da asseverao de que um conjunto de objetivos desejado pelos participantes. Isso pode ser feito sob a forma de tabela, como se mostra na pgina seguinte.

FORM ULAO

DO

P RO BLEM A

31

Quando as mesmas pessoas desempenham diferentes papis, devem ser mencionados separadamente os objetivos referentes a cada papel. Isso tender a evitar que objetivos relevantes sejam esquecidos. 2.6 Importncia dos objetivos.

raro, ainda que alguma vez acontea, que todos os objetivos relevantes sejam compatveis. Conflitos de inte resses so sempre de se esperar. Em conseqncia, neces srio saber quais os objetivos mais importantes, de maneira a poder avaliar uma soluo proposta para o problema. No nosso propsito abordar problemas filosficos relativos aos valores ltimos e nem mesmo sugerir possveis medidas cientficas do valor. Isso j foi feito ( 1 ). Nosso propsito , antes, o de sugerir um mtodo prtico, atravs

Participantes

Identidade

Objetivos Relevantes

Prova da Identida de e dos Objetivos (Se no bvia)

Interessado imediato Interessado intermedirio Interessado ltimo Grupo de pesquisa

do qual o pesquisador e os interessados na pesquisa possam, conscientemente, atribuir pesos aos objetivos includos na pesquisa. Seriam prematuras, neste estgio de desenvolvi mento da cincia, medidas da importncia de objetivos, de acrdo com uma escala bem definida; mas podemos dispor um conjunto de objetivos de forma no-arbitrria.* Um

* A possibilidade de ordenar os objetivos em economia foi vis lizada por Pareto (10). Um modlo matemtico para tal ordenao foi proposto por von Neumann e Morgenstern (8).

32

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

conceito de importncia, no qual a disposio pode ser basea da o seguinte: Dados dois objetivos, O* e O 2, O x mais importante que 0 2, numa dada situao, se, permitido que apenas um dsses objetivos seja perseguido, persiga-se antes 0 1 que 0 2. Quer dizer, se O e vier a ser sacrificado (se necessrio), para permitir que se alcance O i, ento 0 1 mais importante que O a. Isso no esclarece quo mais importante O i do que 0 2, mas diz, apenas, que O x mais importante. O seguinte mtodo de disposio pode fornecer medida da importncia relativa de objetivos: comecemos com um conjunto de objetivos (O i, 0 2, . . . , 0 ). Para fins de ilustrao, consideremos quatro objetivos. (1) Coloquemos os quatro objetivos em ordem de importncia. Seja O x o mais importante, 0 2 o seguinte em importncia e depois 0 3 e O 4 . Demos o valor " 1 ao objetivo mais importante, O i. Chamemos R i sse valor (i. ., R x = 1). Tentativamente, demos valores entre zero e um a a O 2, 0 3 e O 4, de modo que sses valores cor respondam, aproximadamente, importncia rela tiva de cada qual. Chamemos aos valores dados ^2 . R 3 c RiComparemos o objetivo mais importante, O i, com a combinao dos demais: i.. O ! frente a 02 + 03 f- O 4 . (Se apenas lhe fsse possvel obter ou O i ou a combinao 0 2, 0 3 e O 4 , que preferiria voc?). (4.1) Se O t mais importante que a combina o de 0 2, O 3, 0 4, altere, se necessrio, o valor atribudo a O i, R i, de maneira que le se torne maior do que a soma dos valores atribudos aos outros objetivos, (i. ., R i > R 2 f- R 3 (- R)- Passe ao item (5).

(2 ) (3)

(4)

FORM ULAO

DO

P RO B LEM A

33

(4.2)

Se O i menos importante que a combi nao de 0 2, 0 3, O 4 , altere R lt se neces srio, de modo que < Ra + R 3 4" Ri(4.2.1) Compare O x com 0 2 + 0 3. Se O j mais importante do que 0 2 + 0 3, altere R i, se necessrio, de modo que R i > Ra + R 3 e passe ao item (5). Se O i menos importante que O 2 + 0 3, altere /?i, se neces srio, de modo que R i < Ra + R3Repita ( 4.2.1) para O i compa rado com 0 2 + O 4 . Repita (4.2.1) para rado com 0 3 + O 4 . compa

(4.2.2) (4.2.3) (5)

Compare o objetivo seguinte em importncia, O 2, com a combinao de 0 3 e O 4 . Se 0 2 mais importante que 0 3 + O 4 , altere /?2 se necessrio, de modo que R 2 > R 3 + /?4- Se 0 2 menos importante que 0 3 + 0 4, altere se necessrio, de modo que Ra < R 3 j- ^?4- Esteja certo de que R 2 no modificado de forma a contradizer qualquer comparao anterior. Adicione os valores escalonados resultantes, R i f- Ra "f- R 3 1 " R*' Atribua a O x o valor Rx / (/?t -f R 2 + #3 + # 4). a 0-2 o valor # 2 / (#1 + #2 + #3 + # 4). a O 3 o valor Rs / (R i f- Ra R 3 "H ^ 4). a 0 4 o valor R 4 / (/?x + /?2 + /?3 + # 4)

(6) (7)

A soma dsses valores deve ser igual a um.*

* ste mtodo de obteno de medidas de importncia relati assenta-se nas seguintes presunes: a) Aditividade: caso o objetivo O . se mostre mais importan do que a combinao dos objetivos Ob, Oc..........CX, o objetivo O

34

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

No caso de quatro objetivos, o processo, agora, estar terminado. O mtodo se aplica, no obstante, a qualquer nmero de objetivos. Quanto maior o nmero de objetivos em conta, maior o nmero de comparaes exigidas pelo processo. Para fins de ilustrao, consideremos um problema habi tacional e vejamos como ste processo pode ser aplicado ao balanceamento dos objetivos em causa. Simplificaremos ao mximo o exemplo, considerando apenas os seguintes quatro objetivos: 01 = substituir facilidades habitacionais inadequadas por facilidades adequadas. 0 2 = criar interesse da comunidade pela melhoria da rea vizinha. 0 3 = obter economia de tempo, dinheiro e esforo. 0 4 = manter respeito e prestgio da comisso de pla nejamento da cidade. Os passos podem ser os seguintes: (1) ( 2) (3) (4) Os objetivos, em ordem de importncia, so

0 1, O 1 2 , O 3 e O 4. R ! = 1 . 0.
R 2 = 0.5, R s = 0.3 e R 4 = 0 . 2. O j menos importante que 0 2 + 0 3 + O*(4.2) Altere R t de modo que R i 0.9, ento R i < R i 4* H R 4 ' 0-9 <[ (0.5 j0.3 + 0.2).

se r m ado

m a is COm

im p o r ta n t e

do

que

q u a lq u e r

s u b c o n ju n to

do

c o n ju n t o

fo r

Ob, Oc, . . . . On.

b) Transitividade: se um objetivo O , mais importante q outro Ob! e se Ob mais importante do que Oc, ento O . mais importante do que O c. A precauo seguinte pode ser adotada, a fim de validar a). Ao preparar a lista de objetivos que se vai ordenar, deve-se ter a cautela de impedir que dois objetivos separadamente includos na lista, O i e O j, se relacionem de tal modo que ou O i ou O j seja desejado, mas no ambos. Se dois objetivos estiverem assim relacionados (ou no sentido exclusivo), necessrio que figurem como um s objetivo: O i ou O j .

FO R M U L A O

DO

P RO B LEM A

35

(4.2.1)

O i mais importante que 0 2 J- 0 3; nenhuma alterao necessria, desde que R i > R 2 + R 3: 0.9 > (0.5 + 0.3).

(5)

+ 0 . 2 ). (6) Ri -f- Ro -|- R 3 4" Ri 1-0 t- 0 .6 -j- 0.3 -|0.2 .= 2 . 1.


(7) Atribua a a a a Oi o Oa o 03o 04o valor valor valor valor 1.0/2.1 0.6/2.1 0.3/2.1 0.2/2.1 = 0.48 = 0.29 =0.14 = 0 .9 9

O mais importante do que 0 3 + 0 4. Desde que R 2 R 3 + R it altere Ro de modo que R 2 = 0 . 6. Ento i ?2 > ^3 + Ri- de fato, 0.6 > (0.3 + 0.2). O passo (4.2) ainda con tinua vlido, de vez que 0.9 < ( 0.6 + 0.3 + 0.2), mas, o passo (4.2.1) deixa de ser vlido, porque 0.9 = (0.6 + 0.3). Em vista disso, volte a atribuir a R i o valor 1.0. Isso feito, tdas as condies esto satisfeitas: (4.2), porque se tem 1.0 < (0.6 + 0.3 + 0.2); e (4.2.1) pois 1.0 > (0.6 0.3); e (5), 0.6 > (0.3

total =

1.00

Em casos em que o nmero de objetivos grande (diga mos, mais de oito), o procedimento descrito se torna bastante trabalhoso. Isso se deve ao fato de ser grande o nmero de complexas comparaes que se tornam indispensveis. Em tais situaes, um outro procedimento poder ser empre gado; dste outro procedimento se fala no Apndice I. Deve estar claro que a cooperao dos participantes do problema necessria, a fim de chegar ao melhor balancea mento. Nas pesquisas assim chamadas prticas, o pes quisador raramente conhece o bastante a respeito das poss veis conseqncias da avaliao de objetivos feita pelos par ticipantes, de modo a poder arcar sozinho com a responsa bilidade de fazer o balanceamento. conveniente solicitar que o balanceamento seja feito, independentemente, pelo maior nmero possvel de pessoas informadas e interessadas.

36

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

No caso de haver incongruncias na avaliao feita por pessoas diferentes, deve-se procurar, sempre que isso se torne possivel, descobrir a causa das divergncias e con torn-las. Em outros trmos, nos casos de profundas discrepncias, o pesquisador procurar reunir os participantes que estejam em desacordo a fim de dirimir as diferenas. Se, ainda assim, um acrdo inexistir, um rbitro aceito pelas partes conflitantes poder resolver as pendncias. De qualquer maneira, pesquisadores devem consultar colegas que se hajam familiarizado com as aes passadas da pessoa que efetua a avaliao, no intuito de julgar a acuidade de sua atribuio de valores. Para ilustrar, uma comisso de planejamento poder dar como objetivo primor dial a construo de habitaes adequadas, enquanto que pessoas familiarizadas com as atitudes da comisso podero saber que a "manuteno do prestgio , em verdade, muito mais importante para ela. Caso as avaliaes sejam feitas, independentemente, por vrias pessoas e haja apenas diferenas de menor monta nos padres obtidos, a mdia dos pesos de cada objetivo poder servir como valor final que se lhe atribua. As mdias deve ro, tambm, totalizar 1 . 0. sse mtodo de atribuir valores a objetivos sustentado por avaliaes subjetivas. Estas podem, entretanto, ser cor roboradas com testes comportamentais. Nos casos ideais, gostaramos de colocar os avaliadores em situao real e observar as suas escolhas. A acuidade de suas asseres a propsito do que fariam em tais situaes poderia, ento, ser examinada. Todavia, tomando por base as situaes noto-ideais, inferncias razoveis podem ser feitas com res peito quilo que seria o comportamento em situaes ideais. O mtodo descrito possue uma grande vantagem de ordem prtica: possibilita ao pesquisador a identificao de pontos de divergncia, caso existam. Se dois indivduos devessem simplesmente fazer uma lista de itens, colocando-os em ordem de importncia, pouco fundamento haveria para um juzo. No obstante, num processo explcito de atribui o de valores como o que foi descrito os pontos especficos de acrdo e desacordo vm tona. A discusso poder, ento, voltar-se para os tpicos divergentes, de modo a possibilitar, com melhor esperana de bons resultados, o acrdo final.

FORM ULAO

DO

P RO BLEM A

37

3. Meios e hipteses alternativos.


Foi assinalado anteriormente que todos os problemas relativos pesquisa se reduzem pergunta: "Que conjunto de meios alternativos o mais eficiente?. Na formulao do problema , portanto, necessrio tornar explcitos os meios alternativos que estejam em causa. Uma vez que essas alter nativas sejam formuladas, perguntaramos, de cada uma, "Que constituiria prova de que ste meio corresponde alternativa mais eficaz?. A resposta a essa pergunta cons titui uma formulao das condies sob as quais os meios devem ser aceitos como a mais eficiente das alternativas. Um conjunto de condies de aceitao deve ser elaborado para cada qual dos meios alternativos. Os enunciados des sas condies so chamados hipteses. No sabemos qual das hipteses alternativas verdadeira; isto precisamente o que a pesquisa deve determinar. Conseqentemente, a formulao do problema requer que cada meio alternativo seja especificado e que uma hiptese se associe a cada alternativa.

3.1 Os meios alternativos relevantes.


Pode haver dois ou mais meios alternativos numa dada situao problemtica. Mas o imediato problema do inte ressado pode no envolver tdas as alternativas. Por exem plo, pode haver trs alternativas, uma das quais le j sabe ser menos eficaz do que qualquer das outras duas. Seu problema, portanto, no inclui o meio sabidamente menos eficaz. Se o interessado imediato est enganado acrca da ineficcia dsse meio, poder ocorrer que le no encontre a melhor soluo para o problema. ste rro deve ser evi tado, se possvel. O pesquisador deve tentar estabelecer tdas as vias de ao alternativas permissveis nas condies do problema. O consumidor imediato pode no estar ciente de tdas elas. Neste caso, o pesquisador dever entrar em contato com fon tes bem informadas para assegurar-se de que tomou em con siderao tdas as alternativas possveis. ste levantamen to de recursos muito importante, desde que, em alguns ca sos, um problema deixa de s-lo pelo aparecimento de um meio anteriormente ignorado. Na pesquisa de informao, por exemplo, esta pode j estar disponvel, caso em que ser

38

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

evitada uma repetio desnecessria. O levantamento de fontes deve ser to amplo quanto possvel, seja na pesquisa, seja no caso de um problema prtico, no campo de aplicao. Deve-se deixar claro que no podemos decidir quais sejam os meios alternativos a menos que tenhamos uma idia clara dos objetivos. Alm disso, tornamos precisa nossa noo acrca dos objetivos relevantes, decidindo que vias de ao correspondem a meios para atingir sses objetivos. Uma vez que a relao de meios alternativos esteja preparada, deve ser examinada para verificar se qualquer dles pode ser eliminado. Se uma pesquisa anterior ou a experincia passada no deixam dvidas acrca da inefic cia de uma alternativa relativamente s outras, esta deve ser retirada da relao. Constitui responsabilidade do pesquisa dor avaliar criticamente a prova de ineficcia. Se uma d vida razovel permanece aps tal avaliao, a alternativa deve ser mantida para avaliao da mesma. Em alguns casos o pesquisador ter pouca ou nenhuma segurana de haver considerado tdas as alternativas pos sveis. Ao longo da pesquisa, nova alternativa pode exigir considerao. Nesse caso, a formulao do problema deve ser alterada, de modo a permitir que a pesquisa venha a possibilitar a atribuio de um valor a essa nova alternativa.

3.2 As hipteses alternativas.


A pesquisa buscar determinar qual a mais eficiente dentre as vias de ao possveis. A tarefa de formular as hipteses alternativas a de estabelecer para cada qual ds meios alternativos as condies sob as quais le poder ser tido como o de maior eficcia. Isto requer, obviamente, (a) que o pesquisador disponha de medidas de eficcia e (b) que le possa determinar as condies sob as quais aquela medida seria a melhor para cada alternativa. Considera remos ambas essas questes. Antes, verifiquemos de que medidas de eficcia dispe o pesquisador.

3.2.1 Medidas de eficcia.


H numerosas medidas de eficcia em uso nos dias que correm. As seis mais comuns so as seguintes:

FORM ULAO

DO

P RO BLEM A

39

1. 2. 3. 4. 5. 6.

Manter constante o tempo. Medir a porcentagem do trabalho realizado. Manter constante o casto. Medir a porcentagem do trabalho reali zado. Manter constante o esfiro. Medir a porcentagem do trabalho realizado. Especificar o trabalho a ser realizado. Medir o tempo exigido para completar o trabalho especificado. Especificar o trabalho a ser realizado. Medir o custo exigido para completar o trabalho especificado. Especificar o trabalho a ser realizado. Medir o esforo exigido para completar o trabalho especificado.

Por exemplo, a eficcia de um trabalhador na execuo de certo trabalho , algumas vzes, medida em trmos de tempo gasto para realiz-lo (n 4). A medida de eficcia de dois sistemas de produo do mesmo artigo pode ser baseada no custo de produo de cada qual (n9 5). Por outro lado, dois trabalhadores podem ser comparados em funo da porcentagem de trabalho que les completam em dado perodo de tempo (n 1 ). O leitor poder, facilmente, engendrar exemplos em que sejam utilizadas as outras medi das de eficcia. Cada uma dessas medidas, embora til em muitas cir cunstncias, tem suas limitaes. Por exemplo, suponhamos que o objetivo de uma pessoa seja o de praticar exerccios. Nesse caso, dificilmente mediramos a eficcia de meios alter nativos de exerccio em trmos de quo pouco esforo ser despendido. Ou, pode ocorrer que uma pessoa deseje encon trar meios de dispender dinheiro. Nessa hiptese, dificil mente mediramos a eficcia em trmos de quo baixo venha a ser o custo. Finalmente, algum pode empenhar-se em uma atividade, exatamente porque ela lhe absorve tempo. Nesse caso, dificilmente mediramos a eficcia da atividade em trmos de quo pouco tempo ela requer. Nessas hip teses a medida deve ser invertida. As restries apontadas no impedem que essas medidas sejam utilizadas. Indicam, entretanto, a convenincia de uma medida de eficcia inteiramente geral, aplicvel a qual quer situao. Uma dessas medidas gerais a seguinte: A eficcia de uma via de ao para atingir certo objetivo, em circunstncias especificadas, a proba bilidade de que a ao resulte na obteno do objetivo.

40

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Para fins de ilustrao, digamos que represente a via de ao, 0 lt o objetivo e N a circunstncia. Segue-se da definio que, se dispomos de duas vias de ao, numa dada circunstncia, aquela que tem maior probabilidade de permitir o alcance do objetivo a mais eficaz. A medida de eficcia varia entre 0 (o mnimo) e 1 (o mximo), dado que uma medida de probabilidade. A medida de inefi ccia de M-l para O i em N obtida subtraindo de 1 o grau de eficcia. Se a eficcia de para em T V (por exemplo) 0 . 6, sua ineficcia para Ox ( 1.0 . 0 . 6 ), ou 0.4. Consideremos o caso em que desejamos determinar qual de dois meios o mais eficaz, em vista de certo objetivo. Suponhamos que sse objetivo seja "somar corretamente uma coluna de vinte nmeros de cinco algarismos num mi nuto. Suponhamos, ainda, que M x usando o mtodo do papel e lpis e M 2 usando mquina de calcular. Digamos que sse teste deve ser feito relativamente a um indivduo especfico, A. Suponhamos, agora, que a sse A sejam dadas ^dez colunas para somar de um e outro da queles modos. Suponhamos que le calcule corretamente uma soma, no tempo fixado, usando o mtodo do papel e lpis e que calcule corretamente oito somas, nesse tempo, usando a mquina. Conclui-se que a eficcia do mtodo papel e lpis (tal como avaliada a partir dsses dados) se ria 0.1. A eficcia do uso do computador seria 0.8. As eficcias das alternativas no precisam totalizar, necessriamente, 1 . As medidas de eficcia examinadas neste pargrafo no esgotam, de maneira alguma, tdas as possibilidades. Em situaes diferentes, variaes nas medidas aqui exa minadas se imporo com naturalidade. Por exemplo, supo nhamos querer determinar qual de dois textos, a propsito da mesma disciplina, melhor. Podemos decidir que o melhor aqule que permite aos estudantes obter notas mais altas, num teste padro relativo disciplina. Aqui, estara mos usando resultados de testes como medida de eficcia. O resultado do teste uma medida modificada da percen tagem do trabalho realizado em dado tempo. O pesquisador deve explicitar a medida de eficcia que usar e demonstrar sua adequao ao problema em tela.

FORM ULAO

DO

P RO BLEM A

41

3.2.2 Formulao das hipteses.


Uma vez que o pesquisador tenha selecionado a medida de eficcia mais adequada ao problema, est em condies de especificar as condies de aceitao das vias de ao possveis. Suponhamos, por exemplo, que le enfrenta o problema acima referido: selecionar um, dentre dois textos, a ser utilizado por estudantes de certo curso. Suponhamos, ainda, que le decida usar resultados de teste como medida de eficcia. Ento, para cada texto, a condio de aceitao seria algo como a mdia alcanada nos testes com o uso dste texto maior do que a alcanada com o uso de qual quer outro texto". Uma vez que h apenas dois textos em causa, as condies de aceitao podem ser traduzidas pelas seguintes hipteses ( H ): Selecionar o texto A se, H\: a mdia dos resultados do teste, alcanada com auxlio do texto A, fr maior do que a alcanada com auxlio do texto B. Selecionar o texto B se, H 2: a mdia dos resultados do teste, alcanada com auxlio do texto B, fr maior do que a alcanada com auxlio do texto A. claro que um resultado possvel no foi levado em conta o caso de igualdade das mdias. Se admitirmos que as hipteses so as mencionadas e se as mdias dos testes resultarem iguais, no haveria via de ao especfica a sele cionar. Conseqentemente, cabe-nos ou acrescentar outra via de ao ou alterar uma das hipteses. Suponhamos que o texto A seja o de uso corrente. Poderemos decidir, ento, que s mudaremos para o texto B se ste se revelar melhor. A primeira hiptese pode, ento, ser reformulada da maneira seguinte: Hi'. a mdia dos resultados do teste, alcanada com auxlio do texto A , maior ou igual mdia alcanada com auxlio do texto B. As hipteses, agora, esgotam tdas as possibilidades. O exemplo do texto serve para introduzir os passos a seguir na formulao de hipteses alternativas:

42

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(1) (2)

(3)

(4)

Selecionar medida de eficcia que seja aplic vel a tdas as possveis vias de ao. Atribuir a cada via de ao possvel um con junto nico de condies de aceitao, baseado na medida de eficcia escolhida. Reformular as condies de aceitao como hipteses; isto , como enunciados que cubram todos os possveis resultados da pesquisa e que no se superponham. Tornar explcitas as suposies feitas no uso das medidas de eficcia selecionadas. (stes so os pontos de concordncia entre as hip teses).

A comparao de condies de aceitao e de vias de ao e a de hipteses e condies de aceitao necessria, mesmo em pesquisa terica, se desejamos o melhor plane jamento possvel. Em tal pesquisa a eficcia pode ser defi nida em trmos de previsibilidade, conformidade com a teoria e outras medidas similares. Por exemplo, suponhamos que uma teoria possa ser utilizada para prever fatos mais acura damente que outra. A primeira teoria seria, ento, de uso mais eficaz em problemas cuja soluo depende daquelas previses. Como deixamos dito antes, a pesquisa terica ou pura sempre base de pesquisa posterior. Em tdas essas pesquisas, as possveis vias de ao (cientfica), as condies de aceitao e as hipteses devem ser deixadas claras. De fato, se a aceitao de uma hiptese alternativa em vez de outra no fizer qualquer diferena no subseqente compor tamento cientfico, ento, ou o problema, ou sua formulao no tem, cientificamente, sentido. Nos casos em que mais de um objetivo aparece, impe-se generalizao do processo agora descrito. A necessidade de generalizao pode ser patenteada por um exemplo simples. Suponhamos que se consideram apenas dois objetivos, O i e O 2 , e duas vias de ao (meios) e Ca. H, ento, quatro formas possveis de determinar a eficcia, e no ape nas duas. So a eficcia de (1) C i para O i; ( 2 ) C t para 0 2; (3) C 2 para O i; e (4) de Ca para 0 2. Admita-se; ainda, que essas eficcias tenham os valores indicados na seguinte matriz:

FORM ULAO

DO

P RO BLEM A

43

0,

c ,
C2

0.7 0.2

0.3 0.8

Qual o meio mais eficaz? Para responder essa per gunta, a importncia (pso) de O x e de 0 2 precisa ser considerada. Imaginemos que O i seja muito importante e 0 2 pouco importante. Nesse caso, C 1 seria, obviamente, o melhor meio a selecionar. Invertidas as importncias, C 2 seria o melhor meio a selecionar. Essas observaes sugerem a necessidade de avaliar as eficcias, em funo da importncia dos objetivos. Como antes, imaginemos que R i represente o pso de O j e que R 2 represente o pso de O 2. Representemos por E n a eficcia de Ci para O i e por E 12 a eficcia de C para 0 2 . Ento, a eficcia geral ponde rada de Ci, W E ( C i) , pode ser expressa dste modo: W E {C X ) = De modo anlogo, para C 2, tyfE(Co) = R \ E 2 \ f- R 2 E 22 . R iE n + RJBa .

Por exemplo, seja R x igual a 0.6 e seja R 2 igual a 0.4. Temos W E iC i) = W E ( C 2) = (0.6) (0.7) + (0.4) (0.3) = 0.54. ( 0 . 6 ) (0.2) + (0.4) (0.8) = 0.44.

Nessas condies, portanto, Cj seria a via de ao mais eficaz. Imaginemos que as asseres que desejvamos conver ter em hipteses fssem as seguintes: ( 1) ( 2) W E ( C i) W E ( C i) > ^ W E (C s ). W E (C z ).

Substituindo em ( 1 ) podemos obter

44

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

H: R-.Eu

R 12E 12 > R 1 E 21 1 - R2 E22-

Uma vez que os R i e R? podem ser determinados antes de iniciar-se a pesquisa, seus valores podem ser substitudos em H x . Por exemplo, se R x fr igual a 0.6 e R 2 igual a 0.4, ento H n 0.6 E u + 0.4 12 > 0 . 6E2i + 0 .4 22. Simplificando, obtemos:

H i4 . 1.5Eu
H 2: \ .5 E u

l-

E 12

> 1. 5E2 -f-

E22.

De modo anlogo podemos obter a alternativa:


-(- E 1 2

1 . 5 (2i

|- E 2 2

Esta formulao de hipteses deixa claro que so quatro as determinaes de eficcia a levar em conta. Genricamente, se h N 0 objetivos, N e vias de ao, ento preciso fazer NNC determinaes de eficcia para comparar as eficcias gerais ponderadas das vias de ao alternativas. Outra complicao pode originar-se quando mais de um objetivo estiver em foco. Pode tornar-se desejvel usar diferentes medidas de eficcia relativa para cada um dos objetivos, sem que, porm, sejam comensurveis as medidas consideradas. Por exemplo, imaginemos que no problema dos textos haja dois objetivos: O i permitir o melhor treina mento possvel e 0 2 minimizar o preo do livro para o estu dante. "Mdia do teste pode ser utilizada como a medida de eficcia relativa a O i e "preo de venda como a medida de eficcia relativa a 0 2. No possvel adicionar duas medidas, uma em cada escala. Ou uma escala ser adapta da outra, ou ambas sero convertidas para uma escala comum. V ia de regra, mais fcil a converso para uma escala comum. A medida geral de eficcia dada acima probabilidade de produzir um dado objetivo fomece-nos uma escala comum conveniente. O seguinte processo de transformao pode ser empregado:

FORM ULAO

DO

P RO B LEM A

45

A mdia do teste, digamos, pode variar entre 0 e 100. Os valores da probabilidade variam entre 0 e 1.0. Uma transformao grfica pode ser preparada usando "mdias de testes no eixo das abscissas e "probabilidade de produ zir um dado objetivo, no eixo das ordenadas de um siste ma de referncia (ver Fig. 2).

Mdias dos testes

F ig. 2 Transformao das mdias de testes em probabilidades

Decide-se que mdia de teste deve ser equivalente mxima eficcia. Neste exemplo, a deciso bvia: timo o teste cuja mdia 100. Por isso, iguala-se 100, no eixo das abscissas, a 1.0, no eixo das ordenadas: isso equivale a assinalar o ponto de coordenadas (100, 1.0), tal como na Figura 2. Escolhe-se, a seguir, a mdia de teste que seja equivalente mxima ineficincia. Isto j no mais to bvio. O pesquisador pode decidir, digamos, que um texto que conduza, no teste, a uma nota inferior quela requerida para a aprovao do estudante, seja ineficaz. Supondo que a nota exigida para a aprovao seja 60, marca-se o ponto de coordenadas (60,0) , e se unem, por meio de um segmento de reta, os dois pontos, (100, 1.0)' e 60,0). Por meio dste segmento, qualquer valor no eixo das abscissas pode ser transformado em um valor no eixo das ordenandas. Para exemplificar, considere-se a mdia 90.

46

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Trace-se uma linha vertical do 90, no eixo das abscissas, at linha de transformao; e, ento, uma linha horizontal dsse ponto de interseco, at ao eixo das ordenadas. O valor, no eixo das ordenadas, determinado pela horizontal (0.75) o valor transformado de 90. A linha de transformao no , necessriamente, uma reta, pode ser uma curva. A determinao da forma da linha depende de condies especficas do problema. Atualmente, no h meio sistemtico de estabelecer essa determinao. Depende do critrio do pesquisador. A segunda escala de eficcia preo de venda pode, da mesma forma, ser transformada na escala de pro babilidade. Uma vez que isso seja feito, os valores transfor mados das duas escalas originais podem ser adicionados, tal como exigido na formulao explanada acima. Suponhamos, por exemplo, que nos valemos da transformao ilustrada pela Figura 3 para a segunda escala de eficincia. Supo nhamos, ainda, que um dado livro texto permite que o aluno alcance mdia 90 e que seu custo $5.00. As medidas de eficcia transformadas so, respectivamente, 0.75 e 0.50. Faamos o pso do objetivo aprendizagem igual a 0.9 e o pso do objetivo reduo de custo igual a 0.1. Ento, a eficcia geral ponderada do livro texto dada pela seguinte expresso: (0 .9 )(0 .7 5 ) + (0 .1 )(0 .5 0 ) = 0.725

Vejamos o que essas consideraes significam na for mulao de hipteses para o seguinte caso. Um nvo texto de introduo sociologia foi publicado. Desejamos minis trar o curso de introduo to eficientemente quanto possvel (O i) , e desejamos manter o custo do texto para os estudan tes to baixo quanto possvel ( 0 2). A escala de eficcia a ser usada para O i a mdia dos testes (T ); isto , sero comparadas a mdia da classe que se utiliza do antigo livro texto (T i ) e a mdia da classe que se vale do nvo livro texto ( Ta). Faamos cOm que T\ e T'2 representem os valores transformados dessas mdias. A escala de eficcia a ser usada para 0 2 o preo dos livros (K ); isto , faa mos com que represente o custo do antigo texto e o custo do nvo. Faamos tambm com que K\ e K'2 corres-

FO R M U L A O

DO

P RO B LEM A

47

1 .0
0.9

0.8
0.7

c d

CU

0.4 0. 3
0.2
.

0.1

,
0 1 2 3 4

__________
5 6 7 8 9 10 Dollars

Preo de venda de livro texto F ig. 3 Transformao do preo -de livro texto em probabilidade

pondam s medidas de custo transformadas. R L e R 2 con tinuam a corresponder aos pesos de O t e 0 2, respectivamente. Uma enunciao preliminar das vias de ao e de suas cor respondentes hipteses pode ser a seguinte: Continuar a usar o texto antigo se: H ,: RiT\ + R2 K\ ^ R .T ., + R ,K ':

Selecionar o nvo texto se Hy. R 1T'1 + Ro_K\ < R ,T '2 + R.,K'2.

R i e R i e K 'i e K '2 podem ser determinados antes de ser levada a efeito a pesquisa. Suponhamos R i igual a 0.9, R> igual a 0.1, K\ igual a 0.4 e K '2 igual a 0.6. Ento, substituindo em H 1 e H e simplificando, obtemos:
Hn T\

H 2: T\

^ V , + 0.022. < r 2 + 0.022.

A formulao de hipteses multiobjetivas, agora descrita, ou outro procedimento que tenha o mesmo propsito, rara-

48

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

mente so usados na prtica. O planejador da pesquisa inclina-se, geralmente, a eliminar todos os objetivos, exceto o mais importante e a resolver o problema relativo a ste. sse processo, no entanto, no fornece uma soluo para o problema todo do interessado na pesquisa. Somente pode resolver um problema esquematizado e a soluo obtida pode revelar-se ineficaz, num sentido geral. Isto deve ser lembrado quando os ditos objetivos embaraosos so eli minados durante a formulao do problema.

3.2.2.1 Pontos de concordncia entre as hipteses alter nativas.


No h maneira cientfica de escolher uma das hipteses alternativas como vlida, a no ser que haja uma forma de medir a eficcia aplicvel a cada uma das vias de ao alternativas. A aplicabilidade de qualquer medida de efi ccia depende de certas condies vigentes. Voltando ao exemplo do texto, o uso de notas como medida de eficcia pode ser aceitvel apenas quando o mesmo teste minis trado a cada sujeito ao mesmo tempo, e se cada sujeito s dispe de um perodo mximo de tempo, especificado, para completar o teste. Essas condies de aceitabilidade cons tituem os pontos de concordncia entre as hipteses. Falando figuradamente, as hipteses no podem concordar a respeito daquilo que seja vlido, a menos que concordem quanto a um mtodo para a determinao do que vlido. No h meio racional de resolver quaisquer discordncias, a menos que haja acrdo quanto ao mtodo a aplicar. Os pormenores do mtodo de validao so os pontos de con cordncia comuns s hipteses alternativas. Os pontos de concordncia entre as hipteses alterna tivas podem ser ou sabida ou presumidamente vlidos. A validade de pelo menos alguns dos pontos de concordncia ter de ser presumida, de vez que tudo o que sabemos baseado em algumas presunes. Qualquer presuno pode ser investigada e provada, mas no sem que se faam outras presunes. Quaisquer que sejam as presunes fei tas, elas devem ser explicitadas. Pode suceder que uma, ou mais no se justifiquem. Neste caso, freqentemente, poderemos fazer ajustamentos compensatrios nos dados

FORM ULAO

DO

P RO B LEM A

49

que j tiverem sido colhidos, evitando, assim, a necessidade de colh-los de nvo. Suponhamos, por exemplo, que no estudo relativo aos livros texto, presumimos (num estgio posterior do plane jamento) que o efeito daqueles livros sbre as notas inde pendente do sexo dos estudantes. Imaginemos que verifi camos, pelo exame de igual nmero de indivduos de ambos os sexos, que a nota mdia dos estudantes que se valem do texto A 10 pontos superior dos estudantes que utilizam o texto B. Imaginemos, alm disso, que uma investigao posterior mostre que o efeito do texto A no independente do sexo, embora o seja o efeito do texto B. O texto A leva os estudantes masculinos a obter uma nota 5 pontos supe rior que obtm os estudantes femininos. Uma vez que presumimos no haver diferena entre os sexos, podemos ajustar os resultados do primeiro estudo. A conseqncia seria a de que a nota mdia dos estudantes masculinos que se utilizam do texto A 12.5 pontos superior mdia ge ral de notas dos estudantes que se valem do texto B. A mdia de notas de estudantes femininos que utilizam o texto A 7.5 pontos superior. Ento, verificamos que o texto A mais eficiente quando usado por estudantes masculinos, do que quando utilizado por estudantes femininos. Nem tdas as presunes comuns s hipteses podem ser enunciadas neste estgio, que o estgio da pesquisa ocupado com a formulao do problema. medida que o planejamento da pesquisa avana, mais e mais presunes so feitas. Consideraremos essas presunes em fases sub seqentes do planejamento da pesquisa. Mas, j neste est gio, podemos tornar explcitas as presunes relativas ao uso de uma medida comum de eficcia.

3.2.2.2 Hipteses exclusivas e exaustivas.


Se temos duas hipteses, elas devem possuir, ao menos, um ponto de concordncia (digamos, a) e um ponto de discordncia (digamos, b e bf). Podemos, ento, represen tar simbolicamente as hipteses da forma seguinte: H i: ab (assevera que a e b so verdadeiros), t 2: ab' (assevera que a verdadeiro, mas nega b ) .

50

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Nessa formulao, b e b' correspondem a asseres contra ditrias, portanto uma, e somente uma das hipteses pode ser verdadeira, e uma deve ser verdadeira. Pode haver mais de duas hipteses presentes num pro blema de pesquisa. Imagimenos, por exemplo, que deseja mos avaliar trs diferentes livros. Haveria, ento, trs hipteses alternativas que poderiam ser representadas sim bolicamente da seguinte maneira: H i . abx H 2- ab2 H s: ab3 Deve haver uma hiptese para cada via de ao alternativa, no importando qual seja o nmero de alternativas. As hipteses alternativas, por sua vez, devem cobrir todos os possveis resultados da pesquisa; isto , devem ser exaustivas com respeito aos pontos de discordncia a testar. A par disso, as hipteses alternativas no devem superpor-se e devem, pois, ser exclusivas. Isso significa que nunca duas delas podem ser aceitas simultneamente como resultado de qualquer pesquisa. De outra maneira, a pesquisa poderia no indicar qual a via de ao a ser escolhida. As vias de ao alternativas devem tambm ser exclu sivas. Por exemplo, e retornando ilustrao dos dois textos, podemos ter trs vias de ao: (1) (2) (3) Usar somente o texto A . Usar somente o texto B. Usar um nmero igual de textos A e textos B.

Essas vias de ao so exclusivas; os instrumentos no o so. Em outras palavras, o texto A ser usado tanto em (1) como em (3), mas (1) e (3) no podem, ambas, ser escolhidas ao mesmo tempo. Note-se, contudo, que as vias de ao (diferentemente das hipteses) no precisam ser exaustivas; um desigual nmero de textos A e textos B pode ser selecionado. Uma maneira conveniente de nos assegurarmos de que as hipteses so exclusivas e exaustivas recorrer tcnica

FO R M U L A O

DO

P RO BLEM A

51

lgica chamada: expanso Booleana. Imaginemos, por exemplo, que dois so os pontos de concordncia, a e b, e dois os pontos de discordncia, c e d. Podemos, ento, construir a seguinte relao de hipteses alternativas: H i : abcd H 2: a bed' H 3: abc/d H i : abc'd' Note-se que a e b permanecem inalterados ao longo da relao. Se houvesse trs pontos de discordncia, haveria oito alternativas possveis: H i: a bede H 2: abede' H 3: abed'e Hi', abc/de H 5: abed'e' H<$: abc?de' H-j: abc/d'e H aabe'd'e"

Em geral, se h n pontos de discordncia, haver 2" hipteses alternativas, numa classificao exclusiva e exaustiva. Como j indicamos, um ponto de discordncia pode dar lugar a mais do que apenas duas possibilidades. Podemos ter, por exemplo, uma situao em que c est sujeito a assu mir trs valores: c i . A maior que B. Co: A igual a B. c3: A menor que B. Se c constitusse o nico ponto de discordncia, haveria trs hipteses alternativas. Se a pesquisa abrange mais de duas hipteses, con veniente enunciar simbolicamente os pontos de discordncia, para facilitar a construo de hipteses. A intuio no um guia satisfatrio para assegurar excluso e exausto. Ima ginemos, para exemplificar, que temos em vista apreciar trs textos, recorrendo a notas de testes. Para facilitar a discusso, faamos Tlf Ta e T3 corresponderem s notas mdias obtidas por estudantes que se utilizam dos livros, 1, 2 e 3, respec-

52

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

tivamente. As relaes possveis entre duas quaisquer des sas trs notas, podem ser representadas como segue:

Ti = T, Ti > T, Ti < To

T-, = Ta T, > T 3 T2 < T3

Ti = Ts Ti > T 3 Ti < T 3

H 27 formas diferentes de combinar as asseres das vrias colunas. Registrando-as, verificaremos que 14 dessas com binaes resultam impossveis; por exemplo, (7\ = To) (T 2 > T3) (T i < T3). A s treze combinaes compat veis restantes devem ser combinadas em trs hipteses exclusivas e exaustivas. Um dsses conjuntos de hipteses o seguinte: H i: T i ^ To e Ti ^ Ts Ho: 7\ < To e To ^ T3 H a : T i < T3 e T o_ < T s Em outras palavras, o primeiro texto ser escolhido se a nota mdia conseguida por estudantes que dle se utilizam fr igual, ou maior, do que a nota correspondente daqueles que se valem do segundo e terceiro textos. O segundo livro ser preferido se le permitir melhor mdia do que o primeiro e mdia igual ou maior do que a permitida pelo terceiro. O terceiro somente ser aceito se permitir resultados melho res do que os dois anteriores. A vantagem do tratamento simblico da formulao de hipteses deve transparecer dsse exemplo. 3.2.2.3

Problemas de avaliao.

Em relao a alguns problemas podemos deparar com um grande nmero de possveis vias de ao. Por exemplo, se nosso problema resolver uma crise habitacional, as vias de ao alternativas podem consistir em construir uma, duas, ou mais unidades residenciais. H, portanto, um grande nmero de vias de ao, distinguveis pelo nmero de uni dades habitacionais a construir. Ento, se pudermos deter minar quantas unidades so necessrias, poderemos escolher a via de ao mais eficaz. sse um problema de avaliao, dado que a seleo da via de ao mais eficaz depende de

FORM ULAO

DO

P RO BLEM A

53

uma estimativa do valor de uma varivel crtica. Em tais casos no necessrio enunciar explicitamente cada uma das vias de ao alternativas e associar-lhes uma hiptese. Podemos utilizar uma enunciao sintetizada. Por exemplo, as vias de ao alternativas na ilustrao, podem ser indi cadas assim: construir N unidades habitacionais. As con dies de aceitao podem ser assim formuladas: construir Ni unidades habitacionais se iV; unidades habitacionais so necessrias. Ento, as hipteses alternativas podem ser enunciadas desta forma simples: N casas so necessrias e o problema da pesquisa avaliar N. Se a relao entre avaliaes possveis e possveis vias de ao no pode ser expressa como funo matemtica (como o foi no exemplo da unidade habitacional), isso indi ca que aquela avaliao no adequada. Quando se deter mina uma funo capaz de permitir que a mesma via de ao varie dentro de um conjunto de valores estimados, sses conjuntos devem ser especificados sob a forma de hipteses. A avaliao do valor de qualquer varivel est sempre sujeita a rro. sse rro usualmente contornado, expres sando-se as avaliaes como um conjunto de valores e no como um valor singular. Podemos dizer, por exemplo, que o nmero de unidades habitacionais necessrias igual a 1 ,000 100, ou, o que equivalente, que se situa entre 900 e 1,100. A grandeza do conjunto fixada pela estima tiva depende, no apenas dos dados, mas tambm do risco de cometer um rro, que estejamos dispostos a assumir. Ou seja, quanto menor o risco de errar que estejamos dispostos a correr, maior dever ser o conjunto admitido, e vice-versa. No examinaremos os aspectos estatsticos do processo de avaliao mas consideraremos aqui vrios aspec tos no estatsticos que so de muita importncia. Deve ser acentuado, entretanto, o fato de estarmos, ou no, interes sados em problemas de estimativa, j que so bem diversos os mtodos estatsticos empregados em problemas de anlise de dados em uma estimativa e os problemas de teste de hip teses. De outra parte, porm, igualmente importante acen tuar que a lgica empregada nos procedimentos estimativos a mesma que se emprega ao testar hipteses. Em pesquisa que envolva avaliao, devemos tambm indicar as vias de ao associadas a cada possvel resultado da pesquisa, mesmo que o faamos de forma abreviada. Na

54

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

maior parte das pesquisas aplicadas que envolvem avaliao, visvel que as vias de ao podem ser expressas como funo do valor a ser estimado. Em pesquisa de informa es, entretanto, a nica via de ao imediatamente aces svel pode ser a publicao dos resultados da pesquisa. verdade que o material includo no relatrio publicado uma funo dos resultados da pesquisa, mas sse fato bvio e dificilmente merecer meno. Importa lembrar, no obs tante, que os resultados (sejam publicados ou no) desti nam-se, presumivelmente, a ser usados em pesquisa pos terior, talvez pelo prprio encarregado da primeira pesquisa. Pelo menos alguns fatos relacionados com a pesquisa poste rior dependem da avaliao. Vrias propriedades da ava liao afetam as utilizaes que dela podem ser feitas: as condies sob as quais foi realizada, seu grau de acuidade, a confiana que merece, etc. . Para utilizar adequadamente a informao proporcionada pelos processos de avaliao, tdas as propriedades da mesma avaliao devem ser conhe cidas. J fizemos notar que a pesquisa destinada a propor cionar informao deve ter em conta os possveis usos dessa informao. Isso implica saber no apenas para que a informao ser usada, mas tambm como; isto , as vias de ao a que poder ser incorporada. sse ponto pode ser ilustrado com o recurso de uma analogia. Um automvel, como informao, um instrumento. Para projetar um auto mvel eficiente, o responsvel deve conhecer no apenas as finalidades de seu uso, mas tambm as maneiras como ser utilizado: por exemplo, os hbitos dos motoristas e as habi lidades de quem dirige. Em certo sentido, portanto, o pes quisador que se preocupa com pesquisa pura deveria ter em conta os hbitos e habilidades de seus colegas. Pode fa z-lo formulando os vrios tipos de ao aos quais julga poderem ser incorporadas suas estimativas.

4. Possveis enganos.
Em qualquer projeto de pesquisa cientfica, preciso considerar a possibilidade de se chegar a uma concluso errnea. As observaes e as presunes esto sempre sujeitas a rro, rro sse, que acarreta a possibilidade de que a concluso obtida no seja correta. Para enfrentar

FORM ULAO

DO

P RO BLEM A

55

diretamente essa situao, precisamos avaliar os enganos suscetveis de ocorrer, a fim de saber quais os que preten demos evitar. Obviamente, so os enganos mais srios os que pretendemos evitar. Um dos mais importantes resultados da estatstica moderna foi dar-nos um mtodo que nos capacita a escolher um procedimento estatstico que reduz ao mnimo a possi bilidade de cometermos enganos srios. sses mtodos sero examinados no captulo V . Mas, decises relativas pes quisa, diversas daquelas que envolvem procedimentos estats ticos, devem, tambm, ter o propsito de evitar enganos srios. Suponhamos, para exemplificar, que estamos desenvolvendo um mtodo para distinguir entre escolares normais e subnormais, com o propsito de ministrar ensino separado a stes ltimos. Suponhamos ter concordado em que tratar um estudante normal como se le fsse sub-normal, constitui engano mais srio do que tratar um escolar sub-normal como se fsse normal. Isso significaria que devemos esta belecer um critrio de sub-normalidade tal que fsse menos fcil incluir uma criana normal num grupo sub-normal( do que uma criana sub-normal num grupo normal. Para tomar precaues dessa ordem, devemos primei ramente determinar quais so os possveis enganos e quo srios podem les ser. Os enganos possveis e a seriedade de que se revestem, so aspectos do problema; sua definio depende de como se formulem os aspectos do problema que at ste ponto consideramos. O nmero de enganos que um pesquisador pode come funo do nmero de hipteses que est examinando. Se h duas hipteses, dois enganos podem ser cometidos: (1) (2) Aceitar H 2 quando H 1 verdadeira. Aceitar H x quando H 2 verdadeira.

Se h trs hipteses, seis enganos so possveis: (1) (2) (3) (4) (5) (6) Aceitar Aceitar Aceitar Aceitar Aceitar Aceitar H x quando H x quando H 2 quando H 2 quando quando H s quando H2 HA H1 H3 Hx H2 verdadeira. verdadeira. verdadeira. verdadeira. verdadeira. verdadeira.

56

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Em geral, se h n hipteses, o nmero de enganos poss veis igual a n(n 1). Se, por exemplo, as hipteses so quatro, o nmero de enganos possveis igual a 4 (4 1), ou 12. A natureza dos enganos possveis torna-se mais clara quando nos colocamos face a uma ilustrao. No exemplo seguinte sero indicados no apenas os enganos possveis, mas, as possveis conseqncias de cada um.
Objetivo da pesquisa: determinar se h necessidade de alterar as condies de habitao em certa rea urbana e se tal alterao pode ser levada a efeito imediatamente, com o objetivo de planejar e cons truir em local adequado e utilizvel.

Hiptese

Vias de ao

Enganos possveis

Conseqncias possveis

Hi: a necessi C o m isso de A c e i t a r Hi O interesse da comunidade despertado e se reduz, dada dade existe e quando H 3 planejamento a falta de viso; produz municipal pre verdadeira. a a lte ra o intranqilidade na vizi para planos e pode ser rea nhana e prejudica outros construo de lizada imedia projetos. casas. tamente Aceitar Hi Perda de tempo e de recur quando Ha sos para a construo de verdadeira. casas em locais outros, em que so necessrias; perda do prestgio da co misso de planejamento em razo de crtica pblica.

H a Desnecessrio atraso na exe H a: a necessi Atrasa a cria A c e i t a r o de planos quando Hi cuo do plano, custos dade existe verdadeira. adicionais; perda de pres mas os mora e usa ao edu cacional e po dores da rea tgio dos planejadores. ltica p a r a devem, p r i vencer a re meiram ente, sistncia. ser convenci dos disso.

Aceitar

quando Ha verdadeira.

Ha

Perda de tempo e de recur sos para construo de casas em locais outros, onde so necessrias; per da de prestgio dos pia-

FORM ULAO

DO

P RO B LEM A

57

Hiptese

Vias de ao

Enganos possiveis

Conseqncias possiveis

nejadores, mas possibilida de de retirar lies do rro em tempo. H 3 Prolongar indefinidamente um H3: a necessi No p la n e ja r A c e i t a r sofrimento que pode ser ali quando Hi p a r a est a dade no viado imediatamente; per existe verdadeira rea, mas fa da de prestgio, etc.. zer pesquisas para outra Aceitar H 3 Prolongar sofrimento que po deria vir a ser aliviado se quando H a verdadeira fssem tomadas providn cias para vencer os obst culos.

A formulao das possveis consequncias habilita-nos a compreender a natureza dos enganos e fornece base para determinar quo srios so les.

4.1 A gravidade dos enganos.


Atualmente, no h processo cientfico geralmente aceito para ponderar enganos possveis. Entretanto, no intersse de melhor conduzir a pesquisa, exige-se que os enganos possveis sejam ponderados. No podemos resolver um problema ignorando-o e mantendo-nos alheios sua existncia. Des creveremos aqui um mtodo de atribuir pesos aos enganos. No proclamamos que ste seja o melhor mtodo; a nica vantagem que reivindicamos a de ser le explcito. Alguns aspectos do procedimento proposto so defensveis; outros, so arbitrrios, porque, no atual estgio de desenvolvimento cientfico, no sabemos o necessrio para tomar essas posies com melhor apoio. Mas, uma vez que o procedimento explcito, le est exposto a eventual avaliao e aperfeioa mento. Podemos definir o engano como a escolha de um meio que no o mais eficiente dos que existem, para a colimao de um objetivo desejado. A pesquisa uma atividade diri gida a certos fins e, como tal, consiste na escolha de meios

58

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

para os fins almejados. Se os meios escolhidos com base na pesquisa no forem os mais eficazes, a pesquisa se tor nar a causa de um engano. Os dois fatores usados para avaliar uma via de ao so (1) a eficcia da ao relativa a um objetivo e (2) a importncia do objetivo. Por exemplo, se o objetivo da pesquisa trivial, a gravidade da seleo de um meio qual quer no ser grande. Por outro lado, se o objetivo muito importante, ento a seleo de um meio ligeiramente menos eficaz do que o mais eficaz de que se possa dispor sria; quanto menor a eficincia relativa do meio escolhido, mais srio o engano cometido. Consideremos, inicialmente, o processo de ponderar a gravidade de um engano relativo a um objetivo, O i. Diga mos que o engano consiste em aceitar H j quando H j verda deira; em outras palavras, em selecionar a maneira de ao Cj quando Q a mais eficiente. (1) (2) (3) Avaliar ou determinar a eficcia de C, para O i, quando H j verdadeira. Avaliar ou determinar a eficcia de Q para O i, quando H j verdadeira. Subtrair o resultado de (2) do resultado de (1). Esta a ineficcia relativa de C f; em outras pala vras, a perda de eficcia devida ao engano. Essa medida tem 1 como mximo e 1 como mnimo. Avaliar a importncia de O j. (Isto ter sido feito em estgio anterior de formulao do pro blema). Esta medida tambm tem o valor mxi mo 1, mas seu valor mnimo 0. A gravidade dste engano, Sy, , ento igual ao produto do resultado do item (3) pelo resultado do item (4). Os valores mximo e mnimo dessa medida so 1 e 1, respectivamente. Um valor negativo indica no ter havido engano. Isso no uma contradio, como veremos dentro em pouco. Uma vez que (3) fornece um valor numa escala de probabilidades (i.., eficcia) e (4) fornece um valor numa escala de preferncias, seu pro duto (5) medida do que pode ser chamado perda preferencial prevista.

(4)

(5)

FORM ULAO

DO

P RO B LEM A

59

Suponhamos, por valores:

exemplo, ter obtido os seguintes

(D (2) (3) (4) (5)

A eficcia de Q para O x igual a 0.8 (quando H j verdadeira). A eficcia de Q para O i igual a 0.3 (quando H j verdadeira). A ineficcia relativa de Q igual a (0.8 0.3) ou 0.5. A importncia de O x igual a 0.6. A gravidade do engano 5i;- igual a (0.5 X 0.6) ou 0.3.

Para obter uma medida da gravidade de um engano rela tivo a um conjunto de objetivos (O i, 0 2, . . O n), podemos recorrer ao seguinte processo: (1) Determinar a gravidade do engano relativo a O i empregando o mtodo acima descrito. Seja 5 1 a representao dessa medida. Determinar a gravidade do engano relativo a 0 2 empregando mtodo idntico; ou seja, S2. Repetir sse processo para cada objetivo at e incluindo O n. Calcular a soma dessas medidas.

(2)

(3)

S i+
(4)

s, + . . .+

Calcular a mdia S, onde: ^ _ 5. + 5; + - . + S n

S a gravidade mdia do engano, relativo a todos os objetivos, consistente em aceitar H { quando H j verda deira. Qualquer 5 pode ter valor negativo, mas o total dos vrios S, no. Se o total fsse negativo, significaria que Q mais eficaz do que C ,- quando H j verdadeira. Isto indicaria que as hipteses foram impropriamente formuladas e exige-se uma reformulao.

60

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Cada engano possvel deve ser ponderado segundo a maneira descrita. Consideremos, por exemplo, o problema dos dois livros examinado em pginas anteriores. Os dados essenciais da quele problema podem ser sintetizados da seguinte maneira: C i: continuar a usar 0 antigo livro. C 2: adotar 0 nvo livro. T\: nota mdia transformada, alcanada com 0 auxlio do antigo livro. r 2: nota mdia transformada, alcanada com auxlio do nvo livro. H 1\ T 1 ^ T'2 + 0.022. H 2: T' 1 < T'2 + 0.022. o i: ministrar 0 curso de introduo sociologia to eficientemente quanto possvel. Oo: reduzir ao mnimo 0 custo do livro para os estu dantes. (importncia de O i) = 0 . 9 . Ri (importncia de 0 2) = 0.1. Ri K\ (eficcia transformada de Ci para 0 2) = 0 . 4 . K' 2 (eficcia transformada de Cs para 0 2) = 0 . 6 . Ponderemos o engano consistente em selecionar C x quan do Ho verdadeira. Consideremos, inicialmente, sse engano em relao a O i. Digamos que, baseados em experincia passada, estamos razovelmente certos de que a diferena na mdia das notas no ser superior a 10 e de que as mdias no sero superiores a 60. Podemos presumir, ento, que, se H 2 verdadeira, a ineficcia de Ci para O i no ser maior do que 10, que a diferena entre a mdia de notas, a qual, se transformada segundo a indicao feita na Figu ra 2, torna-se igual a 0.25. Uma vez que R i igual a 0.9, a gravidade dsse engano (o mais grave que pode ocorrer) igual a (0.25) (0.9), ou 0.225. A gravidade do engano relativo a O a pode tambm ser calculada. A eficcia de C i e C 2, neste caso, independe de serem verdadeiras H x ou H 2. A ineficcia de C i para 0 2 igual a (0.4 0.6) ou 0.2; em outras palavras< Ci

FORM ULAO

DO

P RO B LEM A

61

menos eficaz para 0 2 ainda quando H 1 verdadeira. Conseqentemente, uma vez que R., igual a 0.1, a gra vidade dsse engano igual a ( 0.2) (0.1) ou 0.02. A gravidade total do engano escolher Ci quando H 2 verdadeira , portanto, igual a (0.225) f- ( 0.02) ou 0.205. A gravidade do outro engano escolher C 3 quando H^ verdadeira pode ser calculada de maneira semelhante. E revela-se igual a 0.245. Conseqentemente, escolher C 2 quando H 1 verdadeira leva a cometer rro ligeiramente mais grave do que escolher C| quando H 2 verdadeira. Ponderando o engano relativo a O i, fizemos certo nmero de presunes para avaliar a eficcia de C t, quando H verdadeira. A necessidade de tais presunes nasceu do fato de que a expresso H 2 verdadeira ambgua. H 2 corresponde assero de que T'n maior do que T\. E ambgua porque no nos diz "quo maior. A eficcia de C] depende, obviamente, de quo maior do que Tj seja T2. Uma vez que no conhecemos de antemo essa diferen a, poderemos obter uma compreenso mais completa do enga no, se considerarmos a eficcia de Ci para cada valor pelo qual T2 possa ser maior do que Ti. No captulo v, veremos como possvel introduzir sse e outros aperfeioamentos na ponderao da gravidade dos enganos.

5. As circunstncias.
At esta altura da discusso, partimos do pressuposto de que o problema se desenvolve em circunstncia nica. Desejamos examinar, agora, a maneira como o problema e a forma de enunci-lo so afetados pela influncia de cir cunstncias vrias. De que modo pode uma alterao de cir cunstncias afetar o problema? Pode afet-lo em qualquer de seus aspectos: participantes, objetivos, sua importncia, meios disponveis, eficcia dstes, etc. A alterao de qual quer um dsses aspectos significar, com efeito, que h um problema diferente para cada circunstncia. Nesse caso, ser necessria uma formulao diversa para cada circuns tncia. As vrias formulaes, entretanto, tero muito em comum. Formulaes similares sero, evidentemente, o re flexo da similaridade do planejamento e processo da pesquisa.

62

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Se uma alterao de circunstncia no afeta qualquer aspecto do problema, ento, verdadeiramente, no houve alterao na circunstncia relativa ao problema. Em alguns casos, pode no haver intersse em desco brir solues diferentes para aplicar s diferentes circuns tncias que se apresentaram. Pode-se preferir buscar uma via de ao que tenha a mxima eficcia geral, embora no tenha essa mesma eficcia quando referida a uma particular circunstncia. Em tal caso, as circunstncias do problema podem ser consideradas em grupo e a eficcia dos meios alternativos pode ser igualada eficcia mdia (ou a qual quer outro valor estatstico adequado), obtida a partir de cada qual das "sub-circunstncias". De outra maneira, a formulao no seria afetada. O planejamento e a execuo da pesquisa sero afetados, dada a generalidade da circuns tncia. Mas isso assunto para posterior exame (cap. ix).

6. Sumrio.
Consideramos todos os aspectos da formulao do pro blema. As decises tomadas em cada fase devem ser re gistradas, de modo a se sujeitarem a contnua reavaliao, sofrendo, se necessrio, modificaes. O registro deve in cluir, no mnimo, as informaes seguintes: 1. Participantes. Devem ser identificados e sua identificao, se no for bvia, ser justificada. 2. Objetivos relevantes dos que participam. Deve ser mencionada a razo de ser dos que no aparecerem como bvios. 3. Ponderao dos objetivos. Devem ser objeto de registro os mtodos utilizados e aqules que os utilizam. Completo registro do mtodo de ponderao deve ser feito. 4. Vias de ao alternativas. O mtodo pelo qual elas se revelam deve ser anotado. Se houver excluso de alguma, deve ser justificada. 5. Condies de aceitao. > Devem ser justificadas, tornando explcitas as medidas de eficcia adotadas e as presunes feitas. 6. Hipteses alternativas. A demonstrao de seu carter exaustivo e exclusivo deve ser feita, se essas pro priedades no forem bvias.

FORM ULAO

DO

P RO BLEM A

63

7. Enganos possveis e suas conseqncias. 8. Gravidade dos enganos possveis. Deve ser includo um registro dos processos pelos quais les so calculados.

Tpicos para discusso.


1. Quais so os vrios participantes de uma prvia eleitoral? Quais so seus respectivos interesses? 2. Que medidas de eficcia poderiam ser aplicadas a: a) b) c) d) programas de eliminao de reas faveladas? campanhas de coleta de anncios para peridicos? estudo graduado em sociologia? explicaes de um conflito racial?

3. Quais so os objetivos da cincia social? Pondere-os, usando os processos descritos neste captulo. 4. Que usos podem ser dados s seguintes informaes e como? a) b) c) medida de segregao religiosa em estabelecimentos p blicos: populao de uma cidade: grupo de pessoas sustentando opinies diversas com res peito religio.

5. importante para as cincias fsicas a seguinte assero do eminente socilogo Louis Wirth? E para as cincias sociais? "No podemos permitir-nos desconsiderar os valores e objetivos dos atos, sem deixar escapar o significado de muitos dos fatos com les relacionados. Em nossa escolha de campos de pesquisa, em nossa escolha de dados, em nossos mtodos de investigao em nossa organizao do material, sem falar da formulao de nossas hipteses e concluses, est sempre manifesta, mais ou menos claramente, de forma impl cita, alguma presuno ou esquema de avaliao". (14:xxii). 6. A seguinte avaliao da cincia social, feita por um de seus eminentes representantes, S. A. Stouffer, justificada? "As respostas rpidas e plausveis em sociologia e psi cologia social so compensadoras em nossa cultura: no se exige planejamento experimental demorado e enfadonho, e, portanto, nossa disciplina no acumulativa. Numa sociedade que recompensa respostas rpidas e dignas de crdito e que no se preocupa acrca da maneira como essas respostas so alcanadas, dificilmente se pode culpar o cientista social por conformar-se com as normas.

64

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Por isso mesmo, muito da cincia social , antes, jornalismo aborrecido e obscuro: poucos dados e muita interpretao". (12: 355).

Exerccios.
1. Escolher um problema no qual trabalhar ao longo do tempo de leitura dste livro, um projeto para o curso. Formular sse problema de acrdo com os procedimentos indicados neste captulo. 2. Ler "Studies of the Postwar Plans of Soldiers: A Problem in Prediction" (13:xv e xvi) e formular o problema discutido, da maneira indicada neste captulo. (Caso o livro indicado no seja acessvel, selecionar outro projeto de pesquisa relativamente amplo, que esteja disponvel).

Leituras sugeridas.
H pouca coisa escrita a respeito da formulao dos problemas de pesquisa. sse aspecto do planejamento de pesquisa usualmente afastado com uma simples frase, ou ignorado. Alguns dos aspectos da formulao do problema so discutidos em outros livros. Por exemplo, a medida de utilidade em economia relacionada com a ponderao de objetivos. Para alguma discusso dste aspecto, veja (2), (3), (8:i) e (11. v). A responsabilidade do cientista social para com a sociedade discutida em (6) e (7). Em (12) encontra-se provocadora discusso da influncia do interesse do cientista social sbre seu prprio trabalho. Uma considerao geral acrca do problema da responsabilidade do cientista pelo uso de seus resultados pode ser encontrada em (4: postscript), (5:xvi) e (9:v).

Referncias e bibliografia.
1.

2.

3. 4. 5. 6.

7.

Science o f Ethics, Philosophical and Phe IX (1949), 663-72. A r r o w , K. J., Mathematical Models in the Social Sciences, em The Policy Sciences, ed. D a n i e l L e r n e r and H. D . L a s s w e l l , Stanford University: Stanford University Press, 1951. Social Choice and Individual Values. New York: John Wiley, 6 Sons, 1951. B o r n , M a x , The Restless Universe. 2 ed. rev. New York: Dover Publications Inc., 1951. C h u r c h m a n C . W ., Theory of Experimental Inference. New York: Macmillan Co., 1948. D a n i e l s , F a r r i n g t o n , Science as a Social Influence in Science and Civilization, ed. R. C . S t a u f f e r . Madison: University of Wisconsin Press, 1949. M e r t o n , R . K.; B a i n , R e a d ; B a r k i n i , S o l o m o n ; C o r t w r i g h t , D o r w i n ; H a u s e r P. M.; S h i l s E. A.; e U l r i c h D . N.,
A c k o ff,

nomenological Research,

R. L., On

FORM ULAO

DO

P RO B LEM A

65

8.

9. 10. 11. 12. 13. 14.

Symposium: Social Research with Respect to Policy Forma tion", Philosophy of Science, X V I (1949), 161-249. N e u m a n n , J. v o n , e M o r g e n s t e r n , O s k a r , Theory of Games and Economic Behavior. 2! ed. Princeton: Princeton Univer sity Press, 1947. O t t o , M a x , Science and the Moral Life.. New York: New American Library (Mentor Books), 1949. P a r e t o , V i l f r e d o , Manuel d'conomie politique. 2 ed. Paris: M .
P . A., Foundations of Economic Analysis. Cam Harvard University Press, 1947. S t o u f f e r , S , A., Some Observations on Study Design", A m e rican Journal of Sociology, LV (1950), 355-61. S t o u f f e r , S . A., e outros, Measurement and Prediction. Prin ceton: Princeton University Press, 1950. W ir th , Louis, "Preface a K a r l M a n n h e i m , Ideology and Utopia, London: Routledge & Kegan Paul, Ltd., 1936. S a m u e ls o n , G
ia r d ,

1927.

bridge:

C a p tu lo

III

O MODLO DE PESQUISA IDEALIZADA


1. O procedimento da pesquisa.

No processo de formulao do problema imediato do interessado, o pesquisador j define o problema da pesquisa: determinar qual a hiptese alternativa vlida ou estimar o valor de uma varivel. Com base na soluo do proble ma de pesquisa, determina-se tambm uma soluo para o problema imediato do interessado. Uma vez formulado o problema da pesquisa, o pesqui sador est em condies de decidir como resolv-lo. O primeiro passo no sentido de encontrar uma soluo deve ser o planejamento de um procedimento de pesquisa ideal; ou seja, o pesquisador deve indicar como gostaria de orientarse para a soluo do problema, se tivesse completa liberdade de ao. primeira vista, tal passo pode parecer impra ticvel. Por que preocupar-se com procedimentos que no podem ser observados? Por que sonhar em vo ou ante cipar o que no se pode atingir? A resposta que, preo cupar-se com condies e procedimentos ideais (ou timos) no , em verdade, nem sonhar em vo, nem desejar o que no se pode atingir, muito importante, se desejamos saber quo bons sero os resultados que vamos obter. As condi es e procedimentos ideais funcionam como um padro, com base no qual, podemos avaliar as condies prticas de pes quisa e determinar suas deficincias. Se essas deficincias so explicitadas, possvel, em muitos casos, determinar seus efeitos sbre os resultados observados e, conseqentemente, ajustar sses resultados, de maneira a eliminar os efeitos das deficincias. A utilizao de um modlo de pesquisa ideal (padro de pesquisa), para o ajustamento de dados de fato, est pre sente em tdas as cincias. Consideremos um exemplo fami-

M O D LO

DE

PESQUISA

IDEALIZAD A

67

liar da fsica: determinao da acelerao de corpos em queda livre. O modlo ideal para determinar tal acelerao exige (entre outras coisas) vcuo perfeito, onde os corpos possam cair livremente. Na verdade, o fsico no pode criar o vcuo perfeito, mas le pode conduzir o experimento de modo a determinar como um corpo cairia se houvesse vcuo perfeito. le determina como a acelerao afetada por variaes da presso atmosfrica, lisa funes matem ticas para relacionar as alteraes de presso atmosfrica e as de acelerao. Em seguida, por extrapolao, determina o que ocorreria em vcuo perfeito e, da, infere a acelerao de um corpo em queda livre. O planejamento da pesquisa idealizada deve consistir na especificao das condies e processos mais eficazes que se possa imaginar para levar a efeito a pesquisa. Isso implica em perguntar: ( P o que devo fazer? (2) para quem? (3) sob que condies? (4) que resultado devo buscar? Mas, espe cificamente, uma formulao idealizada dos seguintes aspec tos da pesquisa faz-se necessria: 1. X : Os objetos a observar. Em pesquisa social, os objetos so, freqentemente, sres humanos, considerados individualmente ou em grupos. Em alguns casos, entretan to, so observadas casas, fazendas, jornais, ou outros obje tos. A reunio de todos os elementos a observar chamada populao. A populao pode consistir em um, alguns ou muitos indivduos, grupos, etc. . 2. N : As circunstncias a observar. A circuns tncia consiste em condies ambientais diante das quais os objetos devem ser observados. Essas condies so as que, real ou potencialmente, afetam o comportamento do objeto, embora sses efeitos no constituam o interesse central da pesquisa. 3. S: O estimulo a observar. O estmulo consiste nas condies prximas, cujos efeitos sbre o comportamento so de intersse central. Pode-se imaginar o estmulo como algo que se acrescenta, retira ou modifica na circunstncia. Cabe pesquisa determinar o efeito se houver algum dessas modificaes, provocadas na circunstncia pelo est mulo, sbre o comportamento do sujeito. 4. R: A resposta a observar. A resposta consiste em alteraes nos sujeitos, devidas aos estmulos.

68

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

As propriedades das respostas a observar so as vari veis dependentes, enquanto que outras propriedades rele vantes da circunstncia e do estmulo so as variveis inde pendentes. A observao das respostas fornecer os dados que permitiro aceitar uma das hipteses alternativas. Por exemplo, se uma hiptese assevera que a mdia do teste de certa populao igual a um nmero especfico, as res postas pertinentes so aquelas dadas ao teste. Com base nessas respostas, o pesquisador poder calcular uma nota de teste e determinar a mdia da populao. Em geral, portanto, o pesquisador dever deixar claro como os dados obtidos a partir da observao de respostas especificadas devem ser utilizados para a escolha de uma das hipteses alternativas. Para darmos uma ilustrao rpida e muito simplificada, suponhamos ter as duas seguintes hipteses alternativas: Hi'. Hy. Um indivduo X prefere usar, para as suas cartas, tinta preta, em vez da azul. X no prefere usar, para as suas cartas, tinta preta, em vez da azul.

As condies e procedimentos da pesquisa idealizada podem ser assim especificados: Colocar ou observar X 1 em uma circunstncia em que haja forte desejo de escrever cartas e no existam desejos conflitantes ( N ) . Tornar dispon vel apenas tinta azul e tinta preta e uma canetatinteiro vazia (S). Observar a cr da tinta esco lhida por X 1 (R) Agora podemos especificar a condio que R deve preencher para que seja aceita uma das duas hipteses em causa. (a) Se a freqncia com que X x escolhe tinta preta maior do que a freqncia com que escolhe tinta azul, aceitar Hj..

M O D ELO

DE

PESQUISA

IDEALIZAD A

69

(b)

Se a freqncia com que X x escolhe tinta preta no maior (i. , igual ou menor) do que a freqncia com que escolhe tinta azul, aceitar H 2-

Tal formulao pode se revelar muito ambgua (ainda que se tome grande cuidado), uma vez que o significado dos conceitos em tela pode no aparecer muito claro. Por exemplo, que significa (na ilustrao acima) escolhe, desejo, prefere e conflitante? Devemos usar apenas uma marca de tinta preta? Que espcie de cartas deve ser considerada, pessoais ou comerciais? Em suma, como pode mos determinar se um procedimento especificado ou no eficiente e adequado? A resposta a interrogaes como es tas o objeto dste captulo. Consideraremos, inicialmente, o problema de determinar que propriedades, objetos e acontecimentos devem ser usados para a formulao do modlo de pesquisa idealizada, e aqule de determinar o tipo de definio que a les deve ser dada. Examinaremos, em seguida, o problema de como essas variveis devem ser usadas para especificar as con dies e procedimentos da pesquisa idealizada.

2. Seleo dos conceitos relevantes.


Um modlo de pesquisa uma construo simblica em que tdas as fases da mesma pesquisa recebem uma conceituao. Conceitos so necessrios para formular o proble ma e para planejar os meios de solucion-lo. Em pesquisa, como em qualquer outro tipo de comportamento, lidamos com objetos, acontecimentos e suas propriedades. No pla nejamento da pesquisa, devemos decidir antecipadamente que objetos, acontecimentos e propriedades importam concei tuar. Em outras palavras, devemos decidir que conceitos so pertinentes ou relevantes para o problema. Uma vez identificados sses conceitos, caber defini-los. Em conse qncia, necessitamos de (1) critrios de relevncia para auxiliar na seleo de conceitos e (2') princpios orientado res para construir definies cientficas,

70

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

2.1 Critrios de relevncia.


A deciso de incluir um conceito de um objeto, acon tecimento ou propriedade no modelo de pesquisa deve depen der de duas consideraes inter-relacionadas: (1) tem o objeto, acontecimento ou propriedade algum efeito sbre a eficcia de qualquer das possveis solues do problema? (2) se tem, sse efeito significativamente amplo com rela o aos objetivos da pesquisa? Suponhamos, por exemplo, pretender determinar qual, de um conjunto de textos, melhor se adapta ao ensino de certa matria. Deve ser tido em considerao o professor? Sabemos que a eficcia de um livro texto depende do professor que dle se utiliza e, mais ainda, que sse efeito pode ser considervel. O conceito professor ser, portanto, relevante nesse estudo. Por motivos semelhantes, tambm relevante a espcie de estu dantes. relevante o sexo do aluno? Podemos no saber at que ponto essa propriedade afeta a eficcia do texto. Nesse caso, melhor jogar no certo e presumir que o sexo tem efeito significativo. Se esta e semelhantes presunes foram explicitamente formuladas, a pesquisa pode des tinar-se a test-las. Se test-las exige mais tempo, dinheiro ou esforo do que pode ser empregado, pelo menos em pesquisa posterior poder ser examinada sua validade. Portanto, podemos tomar decises relativas relevncia de conceitos ou com base em prvio conhecimento ou com base em dvidas que convertemos em presunes que possam ser testadas. Um problema crtico reside na pergunta Como podemos estar seguros de que tomamos em considerao todos os aspectos relevantes do problema? ou, em outras palavras, que segurana temos de estar utilizando tdas as informa es relevantes disponveis? Nenhuma pesquisa jamais penetra em campo inteiramente virgem. Pesquisa prvia j houve, preocupada, ao menos, com uma parte de cada qual dos assim chamados problemas novos. Tda pesquisa, portanto, parte de um desenvolvimento cientfico perma nente e cumulativo. lugar comum dizer que temos muito a aprender na histria da cincia. Mas, a maneira pela qual podemos nos beneficiar mais eficazmente da histria da cin cia no de conhecimento comum.

M O D LO

DE

PESQUISA

IDEALIZAD A

71

Todos sabemos que tm sido escritas histrias da cincia gerais e especializadas. Sabemos, alm disso, que h revistas dedicadas a prticamente todos os setores da cincia. Na maioria dos campos cientficos, encontram-se peridicos que contm sumrios de artigos publicados em muitas outras revistas. H, tambm, bibliografias que rela cionam contribuies importantes para a anlise de problemas cientficos gerais e especficos. O cientista est familiariza do com, pelo menos algumas, dessas publicaes; reconhece que uma biblioteca quase indispensvel para o planejamen to da pesquisa. Essas facilidades, contudo, so to numerosas que o pesquisador no dispe de tempo para conhec-las tdas. Nos casos mais favorveis, pode, quando muito, acompanhar publicaes relacionadas com sua especializao. Mas, fre qentemente, h informaes em outros campos que se mos trariam teis se estivessem prontamente acessveis. dif cil, por exemplo, para o psiclogo, saber se houve desenvol vimentos em fsica que lancem luz relativamente medida da sensibilidade visual. medida que o conhecimento cien tfico aumenta e a pesquisa se faz mais e mais extensa, torna-se impossvel para qualquer cientista, manter-se a par de todos os aspectos da cincia que possam ser relevantes para seus problemas. Mesmo o amplo uso de sumrios de resultados alcanados em outros campos no basta, simples mente porque a maior parte dos cientistas no pode concluir, com base nesses sumrios, se os resultados so ou no apli cveis em seu setor. A conseqncia que, atualmente, nenhum cientista pode estar a par de todos os fatos, leis e teorias potencialmente teis para a seleo de conceitos relevantes. Muitas so as coisas de que no estamos a par e que, no obstante, podem afetar significativamente os resultados de uma pes quisa. Com grande freqncia, os cientistas assumem a res ponsabilidade por decises que les, como indivduos, no esto qualificados para tomar. S o trabalho cientfico em cooperao pode dar a garantia de que tomamos em conside rao todo, ou quase todo, o conhecimento relevante de que dispomos. Freqentemente, s aps ter sido a pesquisa realizada e publicados os resultados, vm-se a conhecer, pelas crticas, conceitos importantes que foram esquecidos.

72

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Muito melhor seria contar com tais crticas no estgio de planejamento, de modo que elas se tornassem instrumento efetivo na preparao da pesquisa em vez de um meio de dar prestgio a crticos catadores de nugas. Um grupo de cientistas que trabalham no mesmo cam po freqentemente no se encontram em condies de con siderar tudo o que relevante para um problema. Portan to, necessria cooperao tanto entre grupos como dentro de um grupo. Para melhor seleo de conceitos relevantes devemos, portanto, entrar em contato com estudiosos de tantos campos diversos quanto possvel. Uma coisa concordar com sse princpio de coopera o entre grupos e outra coisa pratic-lo. Cooperao entre grupos e cooperao interna em um grupo deveriam ser tornados aspectos institucionalizados da tarefa de pla nejamento. H um meio de conseguir cooperao entre grupos e dentro do grupo, que tem produzido bons resultados. Con siste em criar um grupo cooperativo com representantes de todos os campos cientficos e no cientficos que, ao menos parcialmente, se imagine estarem em condies de contribuir para a soluo de um problema em exame. Quando sses grupos trabalham reunidos, sem formalidade ou em semin rio, a inter-relao entre as disciplinas faz-se mais e mais aparente e a aplicao de conhecimentos dos diversos cam pos, ao problema, torna-se evidente. Ainda quando se re vela que cientistas de outras reas no podem auxiliar na soluo de um problema, s assim, atravs de tal procedi mento, est o pesquisador em condies de assegurar a si mesmo que esgotou tda a informao relevante disponvel. Durante a segunda guerra mundial, grupos de cientistas foram associados a unidades militares a fim de lhes fornecer informaes eficientes, e de uso imediato, para enfrentarem problemas crticos que se manifestassem. Esses grupos "operao-pesquisa constituam-se de cientistas especializados em setores muito diversos. Um dsses grupos, por exemplo, inclua um matemtico, um fsico, um psiclogo e um advo gado. Tais grupos eram considerados altamente eficientes. les foram e esto sendo amplamente usados, tanto na In glaterra como nos Estados Unidos da Amrica, tanto em pesquisa de intersse militar como em pesquisas de intersse no militar.

M O D LO

DE

PESQUISA

IDEALIZAD A

73

Em grandes organizaes de pesquisa e em universida des h oportunidade ampla para a formao de grupos de pesquisa cooperativa com especialistas em vrias disciplinas. lamentvel que nossas modernas universidades no este jam retirando todo o proveito possvel das facilidades de que dispem. Em alguns casos, tais equipes foram mantidas temporriamente para examinar problemas especficos (14), mas, at o momento, poucas equipes foram organizadas com carter permanente e institucionalizado. Teme-se, muitas vzes, que o cientista perca a sua individualidade nesse tra balho cooperativo, embora a verdade seja o oposto. O perito num campo no deixa de s-lo por ter recebido aux lio de outros especialistas. Pode parecer um tanto enigmtico que a cooperao de equipes diversas s se mostre efetiva em problemas alta mente especializados; isto , em problemas que parecem situar-se claramente numa s rea da cincia. No h, con tudo, mistrio algum. A explicao est no fato de que a maior parte das pesquisas diz respeito a processos, ou seja, a sistemas de comportamento. cada vez mais conhecido que sistemas anlogos produzem resultados em todos os cam pos cientficos. Consideremos um caso dramtico o de senvolvimento da ciberntica ([19], [33], e [45]). Ciber ntica a cincia do controle e da comunicao no ho mem e nas mnuinas. Os componentes gerais do modelo ciberntico de processos de controle e comunicao podem ser encontrados em equipamentos eletrnicos, no sistema nervoso de um animal, num estabelecimento industrial, numa loja de departamentos, ou na relao entre dois indivduos ou duas naes. Especialistas em cincias diversas contri buram para o desenvolvimento da ciberntica, tal como Norbert Wiener assinala no prefcio de seu livro Cyber netics. O objetivo que tinham em vista era o de formar "uma equipe de cientistas, cada qual especialista em seu prprio campo, mas possuindo conhecimento amplamente coerente e sistematizado dos campos de seus colegas; todos com o costume de trabalhar em conjunto, conhecendo os hbitos intelectuais recprocos e reconhecendo o significado de uma sugesto nova de um companheiro, antes mesmo de esta tomar expresso formal completa. O matemtico no precisa estar em condies de realizar um experimento

74

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

fisiolgico, mas deve estar em condies de compreend-lo e de sugeri-lo. O fisiologista no precisa estar em condies de demonstrar um teorema, porm deve estar capacitado a apreender o significado fisiolgico dsse teorema e a orientar o matemtico quanto a o que pesquisar (45:9). Somente atravs de tal cooperao pde ser desenvolvido sse quadro geral e amplo dos processos de comunicao. Isso contri buiu para realar o fato de que a maioria dos processos e problemas que aparentemente se aplicam apenas a uma cin cia, tm sentido em tdas as outras cincias. Em muitos ca sos, em diferentes campos desenvolveram-se diferentes tcni cas para estudar o mesmo processo. Por isso, h conside rvel auxlio potencial que pode ser retirado de outras dis ciplinas, em razo da diferente maneira de se colocarem diante dsses processos e problemas gerais. A simples reunio de um grupo de especialistas em campos diferentes no garantia de que sse grupo alcance bons resultados. O xito de tais grupos depende, em parte, das caractersticas psicolgicas e sociais de seus membros. As caractersticas que tornam os grupos de pesquisa efi cientes no so, de maneira alguma intangveis. At agora, entretanto, foram pouco investigadas. Muito se tem estudado a respeito de pequenos grupos, por iniciativa de organizaes tais como o Research Center For Group Dyna mics, da Universidade de Michigan, e o Office of Naval Research. Poucos dos resultados at agora obtidos so aplicveis constituio de grupos de pesquisa cooperativa. O Center for Studies of Research Administration da Uni versidade de Columbia, em seu Team Research Project, est atacando de frente o problema. Mas, at agora, somos forados a confiar principalmente na experincia passada e no senso comum para a formao de tais grupos. Sumariando, na busca de informaes relevantes dis ponveis, o pesquisador pode utilizar vrios meios: 1. Obviamente, le tem conhecimento, experincia e intuio da qual partir. 2. Atravs de contatos pessoais, pode-se utilizar do conhecimento, experincia e intuio de outros (tanto cien tistas como no cientistas), seja buscando-os individualmente, seja trabalhando em pesquisa cooperativa ou em grupos de consulta.

M O D LO

DE

PESQUISA

ID E ALIZAD A

75

3. Pode valer-se da bibliografia, direta ou indire mente relacionada com problema em considerao. Familiari dade com a literatura indispensvel. Nas leituras suge ridas, ao fim dste captulo, so relacionadas algumas publi caes nas quais se pode encontrar orientao til para levar a efeito um exame da literatura relativa s cincias psico lgicas e sociais. Seja qual fr a maneira de reunir as informaes dis ponveis, importante que o cientista anote as presunes que faz, as informaes que usa e como as obtm. A enun ciao explcita dsses aspectos da pesquisa facilitar a inves tigao posterior acrca das informaes disponveis de intersse para a soluo de problemas anlogos.

2.2 Critrios de definio.


No basta afirmar a relevncia de um conceito. Deve mos tornar explcitas (1) as condies sob as quais e (2) as operaes pelas quais se pode investigar a relevncia. Por exemplo, se ns escolhemos resultado educacional como uma propriedade relevante, cabe-nos evidenciar sua influncia no processo em exame. Mesmo que decidamos querer cancelar o efeito dessa propriedade na pesquisa, devemos saber como determinar se o efeito foi ou no can celado. A funo da definio cientfica de um conceito , portanto, tornar explcitas as condies sob as quais e as operaes atravs das quais podemos responder perguntas acrca daquilo que conceituado. Definies cientficas devem ser orientadoras; devem dizer-nos como investigar o que conceituado. No bas tante exigir definies que esclaream um conceito; deve mos deixar claro que sentido tem o esclarecimento para a pesquisa. Desde que o propsito d pesquisa responder perguntas, o esclarecimento somente pode consistir em tornar explcito o processo de responder perguntas. Em conse qncia, as definies cientficas no devem ser apenas orientadoras; devem ser orientadoras-da-pesquisa; devem indicar como conduzir investigaes controladas de questes que envolvam o conceito. Para fins de ilustrao, consideraremos separadamente o contedo e a forma das definies cientficas, ainda que, na prtica, sejam inseparveis.

76

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

2.2.1 Contedo das definies.


Por contedo de definies referimo-nos ao signifi cado do conceito definido. Em muitos casos, valemo-nos de conceitos cujos significados j foram enunciados satis fatoriamente. Neste momento, desejamos discutir o proce dimento a ser adotado se no dispomos de uma formu lao adequada. considervel a falta de clareza do signi ficado de muitos conceitos psicolgicos e sociais. (E o mesmo ocorre, embora isso geralmente no seja reconhe cido, nas cincias fsicas). Em relao a alguns conceitos, h tantos diferentes significados quantos so os cientistas que tentaram defini-los. Quando comparamos as definies de um conceito pro postas em pocas diferentes na histria da cincia, ou apro ximamos definies diferentes propostas na mesma poca, verificamos, geralmente, que h um denominador comum presente em tdas as definies. Em outras palavras, se alinhamos as definies, conclumos, freqentemente, que elas se desenvolvem num mesmo sentido. ste significado para o qual as definies de um conceito se dirigem pode ser considerado o significado verdadeiro do conceito. Nunca podemos saber qual o limite dsse processo evolu tivo, mas, podemos aproximar-nos dle mais e mais, com base em esforos acumulados de definir cientificamente. Alguns cientistas sustentam que se deve procurar a defi nio com a qual a maior parte dos investigadores da poca concordaria. Se esta se tornasse uma regra geral, haveria pouco ou nenhum progresso no definir. Devemos buscar aperfeioamento e no aceitao das definies dominantes. Mas s se pode aperfeioar considerando tanto as definies passadas como as atuais. Descrever o processo nesses trmos gerais no de grande auxlio frente a situaes especficas, mas, em ver dade, a anlise de conceitos no tarefa simples. Suge rimos, a seguir, um procedimento para definir conceitos que se tem revelado frutfero: (1) Examinar tantas definies, do conceito, quan to possvel, sejam antigas, sejam atuais. Re correr ao auxlio de outros para conhec-las. Manter presente a cronologia das definiesi

M O D LO

DE

PESQUISA

ID E ALIZAD A

77

(2) (3) (4)

Tentar atingir o ncleo do significado para o qual a maioria das definies parea apontar. Formular uma definio provisria com base naquele ncleo. Verificar se a definio provisria cobre todos os casos que, a seu ver, deva cobrir, relativa mente aos objetivos de sua pesquisa. Quando isso no acontecer, proceda s necessrias revises. Submeter a definio a um exame crtico to amplo quanto possvel. Incluir, entre os cr ticos, tanto cientistas como no cientistas. Fazer revises finais, com base nas crticas fundamentadas recebidas.

(5)

(6)

No Apndice II, a ttulo de ilustrao, usamos essas regras para analisar o conceito grupo social". Os objetivos da pesquisa devem desempenhar papel importante na determinao do contedo de uma definio. Para compreender sse papel, necessrio fazer uma dis tino que, historicamente e ainda hoje, se apresenta como obstculo considervel para a obteno de definies eficientes a distino entre propriedades estruturais e funcionais. Propriedade estrutural a que se refere matria de que uma coisa composta e s modificaes dessa matria. Por exemplo, um dicionrio d a seguinte definio de "livro : uma coleo de flhas de madeira, marfim ou papel amar radas ou colocadas juntas. Note-se que tdas as proprie dades referidas nessa definio tm um carter estrutural. Por outro lado, o mesmo dicionrio oferece definio dife rente: um registro ou narrativa, ou sries de registros e narrativas, escritos ou impressos. Nesta definio, faz-se referncia maneira como o objeto elaborado (escrito ou impresso) e a seu uso (narrar ou registrar). Estas so propriedades funcionais. Propriedades funcionais dizem respeito quilo que produz a coisa definida, quais so os seus produtos e/ou seus usos. Para minuciosa distino tcnica entre stes tipos de propriedade, consultar (10)

e dl).

78

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Antes de definir um conceito devemos decidir se con sider-lo estrutural e/ou funcionalmente. Tal deciso deve basear-se nos objetivos da pesquisa. Suponhamos, por exemplo, estar conduzindo uma pesquisa para determinar o padro de vida de uma comunidade. Podemos decidir que a medida dsse padro o nmero de pessoas por aposento, numa unidade habitacional. Para levar a efeito o estudo, importar definir aposento. Aposento poder ser defini do estruturalmente, como o faz certo dicionrio: "um espao limitado ou isolado por uma diviso. Caber ao pesqui sador indagar de si mesmo se o uso dessa definio na pesquisa trar os resultados desejados idealmente. Neste caso, bvio que no. De acrdo com a definio, uma caixa, um gabinete sanitrio, uma gaveta, etc., seriam apo sentos, embora no devam ser considerados como tais. O pesquisador poderia buscar uma definio mais burilada: um espao limitado passvel de ser ocupado por um ser humano. Mas, ainda assim, muitos gabinetes sanitrios, automveis, cabines telefnicas, etc., satisfariam essas condies. Quan do o pesquisador se detm para analisar os objetivos da pesquisa, le se d conta de que est interessado em espaos que possam ser habitados; ou seja, espaos que possam ser utilizados para certos propsitos. De primordial importncia a funo do aposento e a eficcia com que preenchida. verdade, naturalmente, que a funo do espao depende de suas caractersticas estruturais, mas tambm verdade que aposentos com propriedades estruturais diferentes podem desempenhar igualmente bem uma funo. Pode parecer bvio que, se a pesquisa se preocupa com propriedades funcionais, com elas deve lidar o pesquisador. No obstante, muito se fala em sentido contrrio. Admite-se, geralmente, que as propriedades estruturais podem ser obser vadas com maior acuidade e preciso do que as funcionais. A tendncia, portanto, definir em trmos de propriedades estruturais, de modo que a observao ganhe em acuidade e preciso. Contudo, essa acuidade e preciso pode fornecer dados inteis. verdade que, em alguns casos, exigncias prticas podem requerer, posteriormente, uma traduo, ao menos parcial, de propriedades funcionais em propriedades estruturais, mas, no planejamento da pesquisa idealizada no devemos ter em conta limitaes dessa ordem. Cabe-nos definir os conceitos relevantes em trmos de pro

M O D LO

DE

PESQUISA

ID E ALIZAD A

79

priedades que, idealmente, se mostrem as mais teis para os objetivos da pesquisa. * Alguns cientistas sustentam ser injustificada tda essa preocupao com o contedo das definies. Argumentam dizendo que um cientista tem a liberdade de definir um conceito do modo que bem entender (i. , arbitrriamente), contanto que deixe claro seu significado. Afirmam que uma definio to boa quanto outra, desde que igualmente ex plcita. Mesmo o defensor mais ardoroso das definies arbi trrias no gostaria de ser tomado ao p da letra. Se o fsse, poderamos chegar a definir inteligncia como o nmero de ps que uma cadeira tem, de um modo plena mente aceitvel. Os defensores da definio arbitrria dese jam falar em arbitrariedade at certo ponto; mas falham, ao no indicarem qual seja sse ponto. A defesa da definio arbitrria padece de uma fraqueza crtica, que a especificao de limites no poder afastar: no reconhece que os conceitos cientficos so smbolos de problemas cientficos, com uma histria prpria. Os con ceitos cientficos adquiriram um significado social e cientfico que independe do uso que dle faa um cientista em par ticular. Mesmo onde os cientistas, individualmente consi derados, discordam a respeito do significado do conceito,
* A inclinao pelas definies estruturais em psicologia e cincia social , algumas vzes, defendida recorrendo-se teoria do reduciorJsmo conceituai. A atitude reducionista aparece nas cincias psico lgicas sob forma de behaviorismo molecular (44) e nas cincias sociais entre os que S o r o k i n chama "mecanistas sociais e fisicistas sociais" (35). Baseia-se essa atitude na convico de que h, em ltima instncia, dados, conceitos e operaes simples e que stes so fsicos (i. ., estruturais) em natureza. Os reducionistas buscam reduzir todos os conceitos psicolgicos e sociais a conceitos da fsica (18). O efeito tem sido de diminuir o significado dos conceitos psico lgicos e sociais, cuja transposio para a fsica no clara. Por exemplo, em algumas ocasies os reducionistas sugeriram a eliminao de conceitos tais como "esprito", "conscincia", "disposio", "grupo social" e "sociedade". Os que se opem ao reducionismo assinalam a persistncia dsses conceitos como prova da existncia de problemas psicolgicos e sociais no redutveis a problemas puramente fsicos. Discusso pormenorizada dessa questo pode ser encontrada em (13). Esforos para contestar experimentalmente o reducionismo so rela tados por A m e s e seus colaboradores ([3], [7], e [24]).

80

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

existe alguma coerncia nas definies, alguma semelhana nos pontos centrais do significado que cada cientista est obrigado a tentar captar na definio que prope. Podemos examinar o assunto sob outro prisma. Uma vez que as definies so instrumentos de pesquisa, o pro gresso desta e da cincia dependem, em parte, da obteno de definies cada vez melhores; ou seja, definies que acelerem o desenvolvimento de mtodos para a soluo de problemas velhos e novos. Os conceitos que utilizamos pres tam-se para simbolizar tais problemas; se os conceitos so mal definidos, tambm o so os problemas. Mas, a falta de boas definies no torna o problema menos presente nem lhe diminui a importncia. Se negligenciarmos o fato de que o significado de um conceito repousa em problemas humanos, impediremos a cincia de solucionar sses problemas. Em suma, o uso de definies arbitrrias no s torna casual o progresso no definir, como impe restries severas no pro gresso de outros aspectos da cincia. Uma forma de definio arbitrria, particularmente da nosa, aparece quando um teste criado para "medir" uma propriedade mal definida. Nesse caso, a propriedade de finida como aquilo que o teste mede. A par do crculo vicioso em que tal procedimento importa, note-se que nos impede de aperfeioar nossos mtodos de medir a propriedade. Isto , se uma propriedade aquilo que o teste mede, no h maneira melhor de medi-la. Seja isso o que fr, no uma definio cientfica, pois impede o aperfeioamento.

2.2.2 Forma das definies.


O tipo de definies que se encontra nos dicionrios inteiramente inadequado para os propsitos da pesquisa. Consideremos, por exemplo, uma dessas definies tpicas, como a do conceito psicolgico de trao : uma caracters tica distintiva. Tais definies em nada nos ajudam para a determinao dos traos de um indivduo especfico. O psiclogo profissional mais exigente que o dicionrio, mas, freqentemente, no muito mais esclarecedor quanto a orien tar-nos acrca de como pesquisar traos. Eis aqui dois exem plos de definies de traos dadas por psiclogos:

M O D LO

DE

PESQUISA

ID EALIZAD A

81

Diz-se que um indivduo possui ou caracterizado por certo trao de personalidade quando exibe uma forma, um modo ou tipo de' reao geral e consistente (comportamento), que difere (desvia-se) suficiente mente da de outros membros de seu meio social, tanto na freqncia como na intensidade dsse comportamento, de maneira que sua atipicidade possa ser notada por observadores normais e imparciais, membros do prprio m eio... [43:542], [Um trao ] um siste-ma neuropsquico generalizado e centralizado (peculiar ao indivduo), dotado da capacidade de tornar funcionalmente equivalentes vrios estmulos e de iniciar e guiar formas consistentes (equivalentes) de comportamento adaptativo e expressivo [1:295].

Tais definies podem nos dar alguma viso do significado (contedo) de um trao, mas pouco auxiliam o planejamento de pesquisa que responda a questes a propsito dos traos. No nos dizem o que fazer para determinar se um trao est presente e qual o grau de sua manifestao. As definies podem se tornar orientadoras quando se lhes impe certa forma. A forma imposta depende do que se procura definir, uma propriedade, um objeto ou um aconte cimento. Consideraremos um caso aps outro. Uma definio cientfica de uma propriedade deveria geralmente, tomar a seguinte forma: X tem a propriedade p se, quando X est numa circunstncia N e sob o estmulo S, X exibe (ou tem certa probabilidade de exibir) uma propriedade q ou um comportamento b. Isso equivale a dizer que, ao fornecer uma definio cientfica de uma propriedade, especificaramos o seguinte: X : a classe de coisas (objetos) a que a proprieda de pode ser atribuda. N : o tipo de circunstncia em que X deveria ser observado. S: o tipo de estmulo a que X deveria ser exposto na circunstncia N especificada. R: resposta do sujeito (X ) ao estmulo (S), na cir cunstncia especificada ( N ).

82

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Deve-se notar que os elementos de uma definio cientfica de um conceito so os mesmos que comparecem no modlo de pesquisa idealizada. Uma definio cientfica deve ser, de fato, um modlo de pesquisa idealizada para responder a questes concernentes ao conceito definido. Vamos aplicar sses requisitos formais de definir cien tificamente ao que geralmente considerado como proprie dade fsica simples, a vermelhido. Dizer que um objeto (X ) vermelho (p) exige especificaes mais ou menos como estas: se um objeto colocado num espectroscpio (N ) e iluminado com luz branca (S), ento o espectroscpio registrar, para a luz refletida, um compri mento de onda dentro de certa faixa (R). Conceitos psicolgicos e sociais relevantes devem ser tratados de modo anlogo. Por no ser fcil, em geral se evita essa tarefa. Evitando-a, no podemos estar seguros de que os dados coletados tenham relao com a proprie dade relevante. Recordando que estamos preocupados com a forma das definies cientficas (e no com seu contedo), reconsideremos o conceito de trao e verifiquemos que forma deve assumir a definio dsse conceito. Na definio de qualquer trao particular, devem ser especificados (1) os objetos, (2) a circunstncia, (3) os estmulos e (4) as respostas a observar. Ao definir o conceito geral trao, devemos, portanto, explicitar as restries mais amplas a serem impostas sbre sses quatro aspectos. Um trao de personalidade, escreve Allport, uma forma caracterstica de comportamento mais generalizada que uma reao nica ou um simples hbito (1:119). Alm disso, os traos no tm .. . referncia definida a objetos, "traos somente podem ser gerais e traos no significam "aceitao ou rejeio do objeto ou conceito de valor ao qual se refiram (1:293-94). Traos so necessrios para escla recer a ocorrncia repetida de aes que tm o mesmo sig nificado (equivalncia de resposta), e que se seguem a uma gama definvel de estmulos, portadores de idntico signifi cado pessoal (equivalncia de estmulos). Com base nos trechos citados, comea-se a perceber o sentido que se pretende atribuir a "trao. O problema consiste em seguir essas intenes, dando-lhes forma opera cional. Poderamos proceder da maneira seguinte:

M O D LO

DE

PESQUISA

IDE A LIZA D A

83

1. X : Objetos Qualquer indivduo dotado de estru tura psquica pode exibir traos e, conseqentemente, a popu lao a que se possa atribuir traos h de consistir da classe de indivduos a que se possa atribuir esprito. 2. N : Circunstncia Um trao um tipo de resposta caracterstico ou habitual, relativamente a vrias classes de estmulos. Traos envolvem hbitos com referncia aos quais no importa a eficcia do comportamento; ou seja, es colhas de comportamento que independem da eficcia. De sejamos, portanto, saber como um indivduo responde, carac teristicamente, face a situaes em que a escolha no influ enciada pela eficcia das vias de ao alternativas de que se possa valer. Conseqentemente, podemos especificar N como uma circunstncia em que o sujeito busca um objetivo para cuja colimao poder se valer de um conjunto de meios igualmente eficientes. 3. S: Estmulos Quando nos interessamos por tra os, no nos preocupamos com a maneira pela qual um indi vduo responde a estmulos estruturalmente definidos, tais como: cr vermelha, dureza, pso, etc.. Tais respostas dizem respeito s sensibilidades individuais e no a traos. Ao estu dar os traos, preocupamo-nos com estmulos funcionalmente definidos tais como agresso, cooperao e instruo". Ou seja, traos envolvem respostas tpicas (sensibilidade) a estmulos funcionalmente definidos. 4. R: Resposta Interessam-nos as respostas caracte rsticas, mas, caractersticas em sentido funcional e no estru tural. Poderamos, por exemplo, preocupar-nos com a ex tenso em que um sujeito tende a cooperar com outros ou, com a extenso em que le procura vingar-se daqueles que o ofenderam. Em certo sentido, portanto, traos so res postas funcionais habituais ao estmulo funcional. Essas consideraes podem ser reunidas numa definio operacional de trao. Ou seja, numa definio que especi fique as condies e operaes gerais por cujo intermdio possa ser determinada a presena de traos especficos. Po de-se afirmar que um indivduo portador de um trao espe cfico, T, se (a) quando psto numa circunstncia em que deseja um objetivo, para cuja colimao dispe de meios igualmente eficientes, e (b) quando est sujeito a um est mulo especfico, funcionalmente definido, (c) mostra maior

84

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

probalidade de escolher um tipo especfico de meio funcional mente definido do que outro. Esta definio muito geral, mas orienta a formulao de definies de trao especfico. As definies de trao especfico diferiro apenas no modo de classificar funcional mente estmulos e respostas. Consideremos, por exemplo, o trao agressividade. Ao nvel do senso comum, dizemos que uma pessoa agressiva, quando ela, independentemente de provocaes, entra em conflito com outras. Essa definio pode assumir a forma de uma definio cientfica de trao, da maneira seguinte: Um indivduo X j agressivo, se (1) (2) X x participa de uma circunstncia ao mesmo tempo que outro indivduo ou indivduos, X 2. o comportamento de X 2 no tem efeito sbre a eficcia com que X x pode perseguir o obje tivo O i, que deseja. X i dispe de meios alternativos de eficcia equivalente, integrantes de uma de duas clas ses: (a) meios para atingir O j, cuja utilizao reduz a eficcia de X 2 na perseguio de seu objetivo O, e (b) meios que no reduzem a eficcia de X 2.

(3)

X i agressivo na medida em que escolha meios perten centes classe (a) e no-agressivo na medida em que es colha meios pertencentes classe (b). O grau de agressivi dade de X i pode ser definido como a probabilidade de le escolher um meio do tipo (a). Seu grau de no-agressividade igual probabilidade de le escolher um meio do tipo (b). Definio como esta sugere imediatamente situaes em que se recorre a testes verbais e de comportamento e que for nece critrios para avaliar da relevncia de dados obtidos a partir de qualquer situao sugerida. Neste sentido, tais de finies so orientadora. No captulo ix, veremos como construir um teste a propsito de traos, a partir de uma definio dessa espcie. Basta isso, quanto forma de definies das proprieda des; voltemo-nos, agora, para os objetos e acontecimentos.

M O D LO

DE

PESQUISA

ID E ALIZAD A

85

Definies de objetos e de acontecimentos devem ter forma diversa da requerida para definies de propriedade. Consideremos, inicialmente, a definio de uma classe de ob jetos. Uma coleo de objetos constitui uma classe, se les possuem uma ou mais propriedades em comum. Conseqen temente, uma forma de que uma definio de tal classe pode se revestir a seguinte: Um objeto x membro da classe X, se le tem as pro priedades pi, po. . . pn. As propriedades especificadas devem ser necessrias e suficientes para distinguir membros da classe definida de no-membros da mesma classe. Ou seja, um objeto que no tem essas propriedades no deve ser um membro da classe e todo objeto que tenha as ditas propriedades deve ser um membro. As propriedades definidoras da classe podem ser pro priedades dos membros individuais ou propriedades da cole o; isto , propriedades distributivas ou coletivas. Por exemplo, uma pessoa membro da classe dos homens ou das mulheres em razo de propriedades prprias. O sexo , por tanto, uma propriedade distributiva. Por outro lado, um homem marido no apenas por causa de propriedades pr prias, mas, em razo de propriedades do grupo social, que inclui sua espsa; isto , no pode haver marido, se no houver espsa. Conseqentemente, para definir uma classe caracterizada por uma propriedade coletiva, devem ser utili zadas propriedades tanto coletivas como distributivas. Por exemplo, um marido um homem (propriedade distributiva) casado (propriedade coletiva). Uma classe pode tambm ser definida por denotao ou por conotao. At o momento, temos considerado defini es por conotao: definies que especificam as proprie dades necessrias e suficientes para pertencer a certa classe. Uma classe pode tambm ser definida pela enumerao de seus membros (i. , por denotao). Por exemplo, para definir o corpo docente de certa escola, podemos especifi car as condies necessrias e suficientes para pertencer a le (i. , uma definio por conotao), ou relacionar os no mes dos membros dsse corpo docente (i. , uma definio por denotao). Definies por denotao identificam, se

86

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

paradamente, cada qual dos membros de uma classe, por nome, por nmero ou por colocao. Antes de identificarmos os membros de uma classe, de vemos conhecer as propriedades que os identificam como membros dessa classe. Conseqentemente, uma definio por conotao requisito para elaborar uma definio por denotao. Uma vez que os membros de uma classe te nham sido identificados atravs de uma definio por co notao, pode-se, algumas vzes, evitar repetir o processo de identificao atravs de uma enumerao dos membros da classe, isto , definindo a classe por denotao. Deve-se lem brar, entretanto, que a pertinncia a uma classe pode alterarse; membros de uma classe podem sair ou entrar, surgir ou desaparecer, nascer ou perecer. Enunciar-se uma condio necessria e suficiente de pertinncia a uma classe, conduz, via de regra, a um resultado mais estvel do que a enumera o dos elementos. Conseqentemente, uma definio conotativa sempre necessria como instrumento para verificar a adequao e a propriedade de uma definio denotativa. Ao definir um evento, deve-se lembrar que um evento acontece a algo (X ) e consiste em certa modificao de uma ou mais propriedades de X . A forma geral de uma definio de evento seria, pois, a seguinte: O evento E ocorre se as propriedades pi, p2, . .. , pn do(s) objeto(s) X se alteram, transformando-se em qi, q2.........qn. Para exemplificar, a multido se dispersa quando as pessoas que a compem (X ) deixam de "estar prximas umas das outras (p),para ficarem "afastadas (q). Diramos, tam bm, que uma pessoa se "movimenta quando se desloca de um lugar (pi) para outro (qi). Em muitas ocasies esta mos preocupados com eventos que deixam de ocorrer, como no caso de um indivduo deixar de responder a um estmulo. Tais no-acontecimentos podem ser definidos como o nega tivo de um evento. Uma seqncia de eventos que, reunidos, acarretam certo resultado ou estado especfico, chama-se processo. A matu rao, a educao, a fabricao de um produto, o preparar-se para dormir,- so exemplos de processos. Um processo pode ser definido como uma coleo de acontecimentos que tm,

M O D ELO

DE

PESQUISA

ID E ALIZAD A

87

coletivamente considerados, uma funo especfica (p. ex., produzir um automvel, aprender uma profisso). Sumariando esta discusso a respeito da forma das defi nies, importante observar que os requisitos formais apre sentados destinam-se a permitir que se chegue a definies que orientem procedimentos de pesquisa. Em outras pala vras, ao construir definies segundo as formas especificadas, est se fazendo mais do que dar-lhes carter apenas suges tivo; surgem definies orientadoras. E orientadoras elas devem ser.

3. Valores de variveis fixas e mutveis.


Aps definidas as variveis relevantes (i. , objetos, acontecimentos, e propriedades), importa decidir se seus va lores devem ser mantidos constantes (fixos) ou variar durante o procedimento relativo pesquisa idealizada. possvel que, em alguns projetos de pesquisa, desejemos observar as alteraes nas respostas correspondentes a uma alterao nica na circunstncia, no sujeito, ou no estmulo. Por exem plo, podemos desejar observar a diferena na maneira de um indivduo responder diante da mesma circunstncia fsica (1) quando ningum est presente e (2) quando esto presentes uma ou mais pessoas. Nesse caso, apenas o estmulo ser alterado. Ou ento, podemos pretender observar a diferena de resposta de dois indivduos que se encontram na mesma circunstncia e sob o mesmo estmulo. As diferenas de es tmulo podem ser especificadas atravs da variao de uma ou de muitas propriedades. Qualquer varivel, ou vrias delas, correspondendo ao estmulo, ao sujeito e circunstan cia, podem sofrer modificaes. Por isso mesmo, duas deci ses devem ser tomadas: (1) se deve ser mantido fixo ou alterado o valor da varivel relativa ao procedimento da pes quisa idealizada e (2) se o valor deve sofrer alterao, para que valores deve ser le modificado. Respostas a ambas essas indagaes dependem das hipteses em exame e dos objetivos da pesquisa. Suponhamos que a hiptese exija a determina o do valor de uma propriedade, pi. Suponhamos, ainda, ser de nosso conhecimento que os valores de uma outra pro priedade, p2, afetam os valores de p^ Surgem, ento, duas maneiras de decidir quanto a p2 no modlo idealizado:

88

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(1)

(2)

podemos querer determinar o valor de px para um valor fixo de p2. Em tal caso, os resulta dos obtidos somente seriam vlidos em situa es que se caracterizassem pelo valor fixado de p2. Por exemplo, podemos saber que a renda de uma pessoa (pi) afetada por seu grau de educao (p2); contudo, em alguns projetos, nosso propsito poder ser o de de terminar p! apenas em relao a universitrios com grau de bacharel e nada mais. Ento, fixamos o valor de p2, e os resultados somente sero aplicveis quele grupo. podemos querer determinar como p2 e pi se relacionam; isto , podemos desejar expressar Pi como funo matemtica de p2. Nesse caso, atribuiramos a p2 diversos valores. Por exemplo, se desejssemos saber como educao e renda se relacionam, especificaramos os va lores do grau de educao para o qual obser vaes relativas renda houvessem sido feitas.

Alterar ou no alterar uma varivel e como fix-la ou alter-la depende da variedade de situaes relativamente s quais o problema formulado. Se o problema deve ser re solvido com vistas a uma situao especfica e inaltervel, tdas as variveis sero mantidas constantes num conjunto especfico de valores de variveis. Quanto mais geral o pro blema, maior o nmero de variveis que se alteram e mais amplo o campo de valores dentro do qual as transformaes ocorrem. Nesta situao extrema, poderamos desejar obser var respostas para tdas as combinaes possveis de todos os possveis valores de tdas as variveis. Obviamente, uma formulao clara das situaes do problema a base essencial para decidir como tratar uma varivel. Antes que possamos considerar o efeito da rela entre px e p2 no planejamento do modlo ideal, devemos examinar as maneiras pelas quais pt e p2 podem se relacionar.

3.1 Causa-efeito, produtor-produto e correlao.


H trs tipos de relaes entre propriedades com as quais se preocupa a cincia: causa-efeito, produtor-produto e correlao.

M O D LO

DE

PESQUISA

IDEALIZADA

89

Infelizmente, a relao causa-efeito tem sido tratada, em cincia, de maneira ambgua e, como conseqncia, rara mente se faz uma importante distino entre causa-efeito e produtor-produto. Vejamos qual essa distino. Um X pode ser chamado causa de um Y, se a ocorrn cia de X suficiente para a posterior ocorrncia de Y. Quer isso dizer que sempre que X ocorre, segue-se Y. Assim, a relao causa-efeito pode ser tomada como estritamente determinstica, uma vez que X determina a ocorrncia de Y. claro que neste sentido estrito de causa-efeito, nenhum ob jeto, acontecimento ou propriedade, pode ser considerado, por si mesmo, a causa de outro objeto, acontecimento ou propriedade. O efeito que um objeto, acontecimento ou propriedade tem sbre outro depende, sempre, das circuns tncias e, por isso mesmo, o objeto, acontecimento ou pro priedade nunca suficiente para o efeito. Bater num sino no causa o som, porque, se o sino for percutido no vcuo, som nenhum se ouvir. Conseqentemente, o ato de bater no sino no suficiente para que se produza som; o efeito depende dos valores de outras variveis. Em verdade, a relao causa-efeito no sentido estrito determinstico vlida apenas entre pores amplas da natureza. uma relao estudada, principalmente, em "sistemas mecnicos. Por outro lado, h X, cuja ocorrncia necessria, mas no suficiente, para posterior ocorrncia de Y. Por exem plo, em algumas situaes, bater num sino necessrio para faz-lo soar, pois, o som no se manifestaria caso o sino no houvesse sido percutido mas, o golpe no suficiente. Chamamos a sse tipo de relao produtor-produto. As cincias psicolgicas e sociais preocupam-se antes com rela es produtor-produto do que com relaes causa-efeito. Sob que condies ideais poder um objeto, aconteci mento ou propriedade X ser considerado o produtor de outro objeto, acontecimento ou propriedade Y? Duas condies devem ser satisfeitas: (1) deve haver uma circunstncia (N ) tal que, quando X nela colocado, segue-se Y. Por exemplo, deve haver uma circunstncia em que um aumento no grau de educao seja segui do por uma elevao da renda, para que se

90

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(2)

possa dizer que a educao produtora de maiores rendas. a circunstncia N deve ser tal que, se X nela no ocorre, ento Y no se segue. Assim, deve haver uma circunstncia na qual no ape nas um aumento no grau de educao seja seguido por um aumento de renda, mas ainda em que, se no h aumento no grau de edu cao, no haver aumento de renda.

Se essas duas condies vigem, ento X produtor de Y na circunstncia N. Note-se que um aumento no grau de educao pode produzir aumento de renda frente a algu mas circunstncias, e no frente a outras. Surge, agora, a questo de saber como determinar se um X , de fato, produtor de Y, em dada circunstncia. Um modlo idealizado para tal investigao foi proposto, no sculo passado, por John Stuart M ill (29) e por le cha mado Mtodo de diferena. Disse le o seguinte: Carac terize uma circunstncia que contm X , em trmos de tdas as suas variveis relevantes, A, B, .. ., X . Verifique se Y se segue. Em caso afirmativo, observe uma circuns tncia cujas propriedades sejam as mesmas, exceto X . Se Y no ocorre, ento X um produtor de Y, naquelas cir cunstncias. Diversas variaes dsse modlo foram pro postas, em cincias psicolgicas e sociais. Uma das mais comuns, reza: suponhamos desejar determinar se X pro duz uma alterao (Y ) em um indivduo, ou grupo, de tipo Z. Construam-se, ento, duas circunstncias que sejam exa tamente semelhantes em tdas as suas propriedades, salvo quanto ao fato de que X figura na primeira e est ausente na segunda. Coloque-se um grupo de tipo Z em cada qual dessas circunstncias. O grupo colocado na circunstncia em que X est ausente chamado grupo de "controle. Ento, se a transformao (Y ) ocorre na circunstncia em que X est presente e no na situao em que X est ausen te, X dito o produtor da alterao Y, em Z. Se, nas circunstncias descritas, Y ocorre sempre, ento X , por certo, o produtor de Y, ou seja, a probabilidade de que le produza Y igual a 1. Muitos so os casos, con tudo, em que X no sempre seguido de Y, mas s o

M O D LO

DE

PESQUISA

ID E ALIZAD A

91

algumas vzes. A freqncia relativ a (proporo) de vzes em que Y se segue a X a probabilidade de que X produza. Y. Essa probabilidade pode variar de 0 a 1. Quando a proba bilidade igual a 0, X nunca produz Y e, portanto, no um produtor de Y. A utilizao de uma escala de probabilidade para ca racterizar a relao produtor-produto tem vantagens sbre o uso de uma simples dicotomia produtor e no-produtor. A maioria dos X e dos Y com os quais estamos preocupados ter probabilidade de produo menor do que 1 e maior do que 0. Por exemplo, uma elevao no grau de educao no ser seguida por um aumento de renda em relao a tdas as pessoas, mas apenas para certo nmero delas. Essa proporo a probabilidade de que um aumento do grau de educao produza uma elevao de renda, relativamente populao considerada. Uma possvel fonte de confuso deve ser afastada. O modlo descrito para determinar a relao produtor-produto um modlo ideal. Em psicologia e pesquisa social, en tretanto, freqentemente impossvel, mesmo, aproximao" do ideal. Raramente, ou nunca, podemos combinar circustncias e indivduos da maneira exigida pelo modlo ideal. importante lembrar, entretanto, que no necessrio estar em condies de produzir a situao de pesquisa ideal para ' determinar o que resultaria, se. ela fsse produzida. Como deixamos assinalado anteriormente, dispomos de tcnicas es tatsticas modernas que nos habilitam a determinar o que resultaria naquelas circunstncias ideais, embora no este jamos em condies de produzi-las. Duas variveis podem estar relacionadas sem estar li gadas causualmente, ou por uma relao produtor-produto. Consideremos, por exemplo, o caso de uma pessoa que, ha bitualmente, escova os dentes uma vez por dia, antes de se deitar. Escovar os dentes no condio suficiente nem necessria para que a pessoa se deite e, portanto, no a causa nem o produtor do acontecimento ir deitar-se. E, contudo, os dois acontecimentos, usualmente, ocorrem jun tos. Recorrendo a uma segunda ilustrao, assinalemos que, numa grande cidade, foi observado que pessoas resi dentes em reas sujeitas precipitao de fuligem, esto mais expostas tuberculose do que pessoas residentes em

92

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

reas onde aquela precipitao menor. No obstante, pes quisas mdicas evidenciam que a precipitao de fuligem no necessria, nem suficiente, para a ocorrncia de tuberculose. Portanto, pode ocorrer que duas variveis tendam a alterarse em conjunto, sem, contudo, estarem ligadas casualmente, nem por uma relao produtor-produto. O conhecimento de que duas coisas tendem ou no ten dem a transformar-se conjuntamente pode, no obstante, ser muito til. Por exemplo, quando vemos a pessoa do exem plo acima escovar os dentes podemos predizer, com alguma segurana, que ela se prepara para deitar-se. Ou seja, po demos usar o conhecimento de uma varivel como base para prever o valor da outra. Suponhamos, por exemplo, ter conhecimento de que os homens altos tendem a ser melhores entrevistadores do que os baixos. A altura pode estar ou no estar ligada habi lidade de entrevistar, em trmos da relao produtor-produto. Contudo, se nos couber fazer uma seleo rpida de um entrevistador, saberemos ser mais fcil conseguir bom resultado recorrendo a um homem alto do que a um homem baixo. Podemos no saber porque isso se d e, no obstante, utilizar ste fato. A anlise de correlao habilita-nos a medir a tendn cia que as variveis revelem para alterar ou no alterar seus valores em conjunto. Discutiremos os aspectos tcnicos de tal anlise no captulo vi. Mas, importante colocar, a esta altura, uma advertncia advertncia que repetiremos, desde que, no lev-la em conta, conduz a um dos erros mais comuns em cincias sociais. Estabelecer que coisas tendem a alterar-se ou a ocorrer em conjunto no esta belecer que elas estejam ligadas diretamente, ou mesmo in diretamente, por uma relao produtor-produto. Essa re lao no pode ser inferida da mera correlao. Com base na correlao entre precipitao de fuligem e tuberculose, um pesquisador concluiu que a precipitao de fuligem era uma produtora de tuberculose. Pesquisa posterior revelou que no sse o caso: mostrou que deficincias de alimen tao esto entre os produtores de tuberculose. E revelou, ainda, que as deficincias de alimentao, mais freqentemen te, ocorrem entre grupos de renda baixa. Grupos de renda baixa tendem a viver em reas de aluguel baixo. Os alu

M O D LO

DE

PESQUISA

ID E ALIZAD A

93

guis baixam, entre outras coisas, por causa de precipitao de fuligem na rea. E, assim, precipitao de fuligem e tuberculose esto ligadas acidentalmente e no de modo essencial. Resumindo, portanto, a pesquisa social pode manipular variveis que esto relacionadas como produtor-produto e/ou variveis que esto correlacionadas. Se a pesquisa pre tende determinar se uma varivel , ou no, a produtora de outra, ou se duas variveis esto correlacionadas, deve-se fazer com que essas variveis sofram alteraes no processo da pesquisa. Se tudo o que nos preocupa determinar se um valor de uma varivel V i o produtor de um valor de outra varivel V 2, ento necessitamos de, pelo menos, dois valores de V 1 ( dado que devemos determinar se uma alte rao em V i , ou no, seguida pela no ocorrncia de V 2. Em muitos casos, entretanto, desejamos determinar que mu danas, em V 2 , so produzidas por mudanas em V i. Ou seja, desejamos determinar quo sensivel V 2 a V i. Em tais casos, deveremos recorrer a diversos valores diferentes de V j.

4. Variveis quantificadas e qualificadas.


Depois de havermos decidido se desejamos, idealmente, alterar ou fixar o valor de uma varivel, devemos determi nar os valores da varivel a serem usados. Se fixamos o valor da varivel, basta especificar sse valor. Se decidi mos alterar a varivel, devemos especificar os diferentes va lores que desejaramos, idealmente, utilizar. Os valores que especificamos dependem de considerarmos as variveis em trmos quantitativos ou qualitativos. Variveis qualitati vas so chamadas atributos e, doravante, empregaremos essa terminologia. A expresso varivel ser reservada apenas para variveis quantitativas. Ao nvel do senso comum, clara a distino entre um atributo e uma varivel; a ltima envolve nmeros e a pri meira, no. Se nos referimos a uma pessoa como alta, mdia ou baixa", tratamos a propriedade altura quali tativamente. Se dizemos que a pessoa tem cinco ps e onze polegadas, tratamos a altura quantitativamente. A distino entre quantificao e qualificao no , porm, to simples. Arbitrria atribuio de nmeros a va

94

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

riaes de uma propriedade no quantificao cientfica. Por exemplo, podemos atribuir um nmero ao comprimento de um objeto, num passe de mgica". Isto no ser quan tificao cientfica. A quantificao cientfica requer que um sistema lgico sustente a atribuio de nmeros e que os resultados sejam teis. Em trmos mais gerais, a quantifi cao cientfica um meio de atribuir nmeros a propriedadades, objetos e acontecimentos de modo a proporcionar in formao til. Por exemplo, saber que certa mesa com prida basta para alguns fins, mas no para outros, tais como; cobri-la com vidro ou ajust-la a certo espao. Se sabemos que a mesa tem entre 68 e 69 polegadas de compri mento, esta informao eficaz num nmero de circunstn cias muito maior do que a informao de que a mesa com prida. Se sabemos que a mesa tem entre 68.4 e 68.5 po legadas de comprimento, essa informao ainda mais til do que a anterior. Se fsse possvel uma determinao de comprimento absolutamente precisa e a conhecssemos, esta informao seria inteiramente eficaz em qualquer situao em que fsse de importncia o comprimento da mesa. Assim, eficcia para o uso" a chave da quantificao cientfica e a "preciso da quantificao refere-se a essa eficcia. Quanto mais crtico um problema, mais propensos fica mos a quantificar acuradamente seus vrios aspectos. Isto , quanto mais dipendioso o uso de informao ineficaz, tant mais necessitamos de informao eficaz (i. , acura damente quantificada). Em alguns casos, entretanto, o gasto com a quantificao pode ser maior do que a poupana produzida pelo uso de informao mais eficiente. Por exem plo, ao decidir da convenincia de uma habitao, podemos ter em conta ou o nmero de aposentos de uma unidade habitacional ou a determinao da rea disponvel. Esta ltima talvez constitua informao mais eficiente com rela o a nosso propsito, mas seu custo pode ser despropor cionado ao ganho em preciso. Ou seja, os erros resultantes da contagem do nmero de aposentos podem ser menos custosos do que os resultantes da medida da rea. Recor rendo a um exemplo corriqueiro: um alfaiate, ao medir o comprimento de um brao, preocupa-se em aproxim-lo at o quarto de polegada. No procyra medidas mais precisas, porque elas seriam mais custosas e no produziriam resul

M O D LO

DE

PESQUISA

ID E ALIZAD A

95

tados melhores em relao a seus prprios objetivos e aos de seus fregueses. Idealmente, a deciso de qualificar ou quantificar e de como quantificar ou qualificar deve ser baseada numa com parao sistemtica de custos. Para cada mtodo de efe tuar medidas, dois custos so importantes: (1) o custo da medida efetiva e (2) o prejuzo que se pode esperar devido ao rro produzido pelo mtodo. A partir destes dois custos pode-se calcular o custo total esperado e podem ser com parados mtodos alternativos de quantificao e qualifica o. Aqule que resulte no mnimo custo total esperado deve ser o preferido. Infelizmente, no sabemos o bastante acrca de qual quer mtodo de quantificao ou qualificao em cincias sociais, de modo a fazer tal determinao. Enquanto no o sabemos, podemos utilizar ste mtodo e avaliar to bem quanto pudermos os valores exigidos. Assim fazendo, esta remos estimulando pesquisas dirigidas a determin-los. Em certo sentido, lamentvel que se possa dizer que essa pesquisa ainda no foi levada a efeito no campo das cincias sociais, mas isso no to lamentvel como seria a falha contnua dessa pesquisa. De qualquer maneira, o pesqui sador deve elaborar a justificao melhor possvel, para o mtodo de quantificar ou qualificar de que se valha.

4.1 Tipos de quantificao.


Quais so os mtodos gerais de quantificar uma va rivel? Primeiro, a contagem. Freqentemente e erradamente a contagem considerada um tipo muito simples de quan tificao. Contar requer, porm, que as unidades a contar sejam identificadas e tal identificao pode resultar muito complexa. J nos referimos a um dsses casos: contar os que vivem numa casa. Se viver numa casa ou "resi dncia habitual se define sem ambigidades, a contagem pode no ser complexa; mas, a identificao das unidades a contar parte integrante da operao de contagem. No processo de contagem devemos aproximar as uni dades a serem contadas de elementos do sistema de nmeros reais. Dois erros podem manifestar-se a partir dsse pro

96

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

cesso de aproximao erros que s podemos evitar com planejamento adequado: subestimao e superestimao. A subestimao consiste em deixar de incluir um elemento que deveria ser contado e a superstimao consiste em contar 0 mesmo elemento mais de uma vez, ou contar elementos que no deveriam ser contados. Todos ns j sentimos a dificuldade que existe para contar pessoas que se movimentam continuamente num salo de festas. Por um lado, podemos ter dificuldade em contar cada pessoa uma vez e somente uma. Sabemos que a tarefa pode ser simplificada ordenando as pessoas no salo, de modo a cont-las sistematicamente. Por exemplo, podemos fechar tdas as sadas, menos uma, e fazer com que os pre sentes deixem o salo, pela sada nica, um aps outro. Ou podemos distribuir as pessoas segundo certo esquema. Numerosas tcnicas de contagem so conhecidas. A ques to, para ns, consiste em que, no modlo de pesquisa idea lizada, se necessrio contar uma varivel para determinar seu valor, importa especificar um procedimento de contagcm no processo idealizado. Uma varivel quantificada atravs de contagem pode ser chamada varivel de enumerao. Tal varivel sem pre assumir a forma: o nmero a em A; por exemplo, o nmero de pessoas presentes", o nmero de crianas da famlia, e o nmero de dlares (quantidade de dinhei ro) ganho. Uma varivel de enumerao tal como se nos exemplos dados sempre uma propriedade cole tiva; isto , corresponde sempre a uma soma de elementos. Suponhamos, agora, estarmos preocupados com uma unidade individual e no com uma coleo de unidades. (Quaisquer unidades com que se opera nas cincias sociais podem ser reduzidas a uma coleo de unidades menores. Aqui, porm, preocupa-nos a unidade e no suas partes). A unidade pode variar com respeito a uma ou mais de suas propriedades que so relevantes para a pesquisa. Como possvel quantificar tais propriedades? Um mtodo semiarbitrrio : ordenar os elementos. Por exemplo, se o objeto a , aproximadamente, duas vzes mais longo que o objeto b, podemos referir o comprimento do objeto a como 1 e o comprimento do objeto b como 2. Podemos agir de modo idntico em relao a dois outros objetos c e d; diga-

M O D LO

DE

PESQUISA

ID EALIZAD A

97

mos, atribuir ao comprimento de c o nmero 1 e ao de d o nmero 3. Suponhamos, agora, que desejamos comparar os comprimentos de a e c. Uma nova comparao neces sria; os nmeros que atribumos a seus respectivos com primentos no tm sentido fora do contexto da comparao original. Se a e b e, depois, c e d so comparados a um padro comum de comprimento, torna-se possvel comparar, indiretamente, a e c. O uso de um padro, com essa fina lidade, fornece a medida. Se o padro consiste de um con junto ordenado de unidades (entre outras coisas), le chamado escala mtrica. Uma escala mtrica de com primento, por exemplo, consiste de polegadas ou centme tros ou de mltiplos ou fraes dles. Padres e escalas mtricas tornam possvel comparar coisas por substituio. Podemos determinar, por exem plo, qual de duas mesas mais comprida, ainda que tais mesas se encontrem em diferentes pontos do mundo. As escalas podem ser manipuladas, ainda quando no o possam os objetos por elas aferidos. Uma escala mtrica permite comparaes eficazes at o ponto em que as unidades sejam suficientemente pequenas para permitir distino de diferenas significativas na pro priedade medida. Uma fita mtrica no pode ser eficaz mente utilizada para o fim de medir a diferena entre o dimetro de dois micrbios. Por outro lado, pode ser ine ficaz recorrer a um micrmetro para medir a altura de uma pessoa. Na medida em que a cincia progride, unidades cada vez menores se tornam cada vez mais importantes. Quanto menor a unidade, mais acurada tende a ser a medida. Conseqentemente, do ponto de vista de objetivos cientfi cos de longo alcance, o desenvolvimento de escalas mais seletivas corresponde a um aspecto necessrio do progresso. Muitas so as propriedades que uma escala eficaz deve reunir, mas no nosso propsito enumer-las aqui (ver [9], [15], [16], [37], [38] e [39]). Mas, algumas proprieda des importantes, que afetam a utilidade das escalas psico lgicas e sociais, devem ser mencionadas. Como sabemos que uma rgua pode ser usada para medir o comprimento? Sabemo-lo, porque o comprimento um conceito bem definido e por podermos demonstrar que os nmeros a que chegamos atravs do uso adequado da

98

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

rgua fornecem informaes acrca do comprimento dos objetos, informaes essas que se revelam teis com refe rncia a problemas em que o comprimento de intersse. Se no sabemos claramente o que seja comprimento, no podemos ter segurana quanto sua medida pela escala. Em outras palavras, a utilidade de uma escala est na dependncia de nossa capacidade de definir a propriedade a ser medida. Usando escala em situaes em que nos falte definio clara da propriedade em causa, podemos obter quantidades, mas no necessriamente medidas. Tal o caso de muitas escalas psicolgicas e sociais. Muitas dessas escalas consistem em um conjunto de perguntas ou problemas e de um sistema de avaliao que possibilita atribuir um nmero s respostas do sujeito, ou desempenho. O resul tado de um teste verdadeiro-falso, por exemplo, pode ser determinado subtraindo-se o nmero de respostas erradas do nmero de respostas certas. sse resultado no , neces sriamente, uma medida. uma medida at o ponto em que (a) a propriedade em causa pode ser definida e em que ( b ) o processo de alcanar um resultado pode surgir como fonte de informaes relativas propriedade em foco, informaes essas que se revelam teis para a soluo de pro blemas que envolvam aquela propriedade. Em relao a muitos testes psicolgicos e sociais, a propriedade no bem definida e a ligao entre o teste e a propriedade permanece como intuitiva, no se fazendo demonstrvel. comum que, na prtica da psicologia e da cincia social, se construa uma escala com uma idia apenas vaga da propriedade a ser quantificada. Depois de construda a escala, o pesquisador tenta determinar que propriedade ela mede. Em muitos casos, no encontra respostas; e, se as encontra, por acaso e no por um inteligente plane jamento da pesquisa. O procedimento deve sofrer inverso; deve-se, primeiramente, definir uma propriedade e depois construir uma escala que fornecer (o que possa ser demons trado constituir) medida da propriedade definida. Se a pro priedade fr definida segundo a maneira acima descrita, a prpria definio sugerir meios e mtodos para a obteno de medidas. Na definio de agressividade, por exemplo, o prprio enunciado especificou que a medida da agressi vidade corresponde possibilidade de ser escolhida certa espcie de comportamento. Podemos, ento, elaborar um

M O D LO

DE

PESQUISA

ID E ALIZAD A

99

mtodo para determinar essa probabiildade e, portanto, para medir a propriedade definida. Desde que as escalas dizem respeito a nmeros, julgouse que a utilidade que possam ter est na dependncia de reu nirem certas propriedades matemticas. Muitas anlises de escalas tm sido feitas do ponto de vista matemtico. Da resultou passarem muitos psiclogos e socilogos a se inte ressar mais pelas propriedades matemticas de uma escala do que por sua utilidade. No importa observar estas ou aquelas especificaes matemticas na elaborao da escala; no h garantia de que, por satisfazer tais requisitos, a escala mea a propriedade em questo. O ponto de partida para o estabelecimento da forma de medir uma propriedade deve ser o significado dessa mesma propriedade e no o trata mento matemtico dado construo da escala. Muitos psiclogos e socilogos, embora conscientes das deficincias de suas escalas, ponderam que elas, apesar de tudo, so teis para a previso de certas formas de compor tamento. Afirma-se, por exemplo, que o Q . I . permite pre ver o aproveitamento escolar. Talvez seja assim, mas, ainda, que o seja, nada garante que o Q . I . seja medida da inte ligncia. Em verdade, n h uma definio clara de inte ligncia que possibilite dizr que o Q . I . a mede. bem possvel que o teste Q . I . mea alguma coisa, mas pouco nos ajuda sabermos isso; precisamos saber o que medido. Tcnicas tais como as recentemente desenvolvidas por Thurstone (42), Guttman (41) e Lazarsfeld (41) do algu ma garantia de que as escalas por les propostas estejam medindo alguma coisa, mas, seus prprios mtodos no nos propiciam base para decidir o que essa alguma coisa. O princpio metodolgico bsico aplicvel construo de escalas , portanto, o de que a elaborao de uma escala deve ter como ponto de partida o significado, e no a mate mtica. No captulo ix, elaboraremos uma escala para medir o trao ascendncia-submisso. Veremos ali como o signi ficado do trao fornece base para introduzirmos, na escala, sua posterior relevncia e utilidade. Suponhamos desejar comparar as alturas de sete pes soas, A , B, C, D , E, F, G. Se no dispomos de qualquer outro recurso, podemos alinhar as pessoas, da mais alta para a mais baixa, usando nossos olhos to bem quanto possvel.

100

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Por sse meio, dispomos as pessoas, conforme a altura de cada uma. Podemos, em seguida, escolher a pessoa colo cada no meio, atribuindo sua altura o valor 0. Para a pessoa imediatamente mais alta damos o valor 1, para a seguinte, o valor 2, etc. E, da mesma forma, procede mos em relao s pessoas mais baixas, dando-lhes os valo res 1, 2, etc. Teremos, afinal, a ordenao seguinte:
A
3

B
2

C
1

D
0

E
-1

F
-2

G
~3

Construmos, em verdade, uma escala ordenada de altu ras. Ela poder ser usada de vrias formas, porm, padece de severas limitaes. No sabemos qual a diferena de altura existente entre dois membros do grupo. Sabemos ape nas que um mais alto ou mais baixo que o outro. No sabemos, nem mesmo, se as diferenas so iguais. E muito possvel que "3 seja 6 polegadas mais alto que 2, mas, que 2 seja apenas uma polegada mais alto que 1. No obstante, podemos classificar quaisquer indivduos, com res peito ordem padro estabelecida. No exemplo escolhido, possivel distinguir oito classes. Na primeira, sero inclu dos os mais altos do que A, na segunda, os mais altos do que B, mas no mais altos do que A , etc., at atingirmos a ltima classe aqules que no so to altos quanto G. Muitas escalas utilizadas em psicologia e sociologia so escalas ordenadas dsse tipo. Em bom nmero delas, a propriedade em relao qual a ordenao se processa aparece mal definida, ou nem definida. A utilidade de uma escala de ordenao, tal como a escala mtrica, fun o da relao que existe entre ela e a propriedade a medir. No deve haver diferena entre desenvolver uma escala ordenada e uma escala mtrica: o desenvolvimento deve comear da definio. No exemplo de ordenao usado acima, as comparaes iniciais no foram quantitativas; foram qualitativas. A orde nao, contudo, pode basear-se em comparaes quantitati vas. Por exemplo, se tudo o que se quer e uma ordenao por altura, podemos, ainda assim, medir cada qual dos indi vduos e, ento, orden-los com base nessas medidas. Mesmo quando o projeto de pesquisa pede apenas uma orde nao, , algumas vzes, deselvel basear a ordenao em

M O D LO

DE

PESQUISA

IDEALIZAD A

101

medidas e no em comparaes qualitativas. Tal ordenao ser, provvelmente, mais acurada e dispomos de mtodo efi caz para a verificao da acuidade. A moderna teoria esta tstica habilita-nos a expressar o rro de medida e estamos, assim, dotados de base para aperfeioar o mtodo de medida, assim como o de observao. Isto no equivale a dizer que os julgamentos qualitativos no possam ser feitos de maneira mais acurada, nem a afirmar que a acuidade dos julgamentos qualitativos no pode ser mensurada. Equivale, simplesmente, a dizer que, na maioria dos casos, a quantificao torna pos sveis observaes mais acuradas e dignas de confiana.

4.2 Qualificao.
Atributos, como deixamos dito, so aspectos qualita tivos do problema da pesquisa; em sua descrio no se utilizam nmeros. (Mas isso, como veremos, no quer dizer que a quantificao no possa ser aplicada para determinlos). Por exemplo, um socilogo pode referir-se a um grupo organizado ou desorganizado ou a situaes compe titivas, de cooperao e "conflitantes. Um psiclogo pode referir-se a um indivduo como "egosta, agressivo, honesto, etc. E, para os propsitos de algumas investi gaes, tais descries podem mostrar-se eficientes. Qualquer propriedade que seja suscetvel de quantifi cao, pode tambm ser tratada qualitativamente. Uma qualidade pode ser definida simplesmente como uma exten so ao longo da escala em trmos da qual a propriedade medida. Por exemplo, uma pessoa pode ser dita alta, se tiver mais de 5 ps e 10 polegadas, mdia, se tiver entre 5 ps e 6 polegadas e 5 ps e 10 polegadas e baixas, se tiver menos de 5 ps e 6 polegadas. tambm verdade que qualquer propriedade qualifi cada potencialmente suscetvel de ser expressa em trmos de certa extenso ao longo de uma escala. Nunca seremos capazes de transformar tdas as qualidades em medidas como estas, porm, com o progresso da cincia, mais e mais qua lidades podem se converter em expresses quantitativas equivalentes. Mas, ste no um desenvolvimento unila teral. Na medida em que a cincia desenvolve novas esca las de mensurao, requer tambm novas formas de julga mento qualitativo. Por exemplo, a altura pode ser medida

102

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

como uma distncia vertical; mas isso requer que possamos determinar o que verticalidade. Podemos transformar a verticalidade numa medida, em trmos do ngulo formado por uma linha reta e pelo raio projetado do centro de gra vidade da terra. Isso depende de nossa capacidade de determinar o que reto, etc. A quantificao, em qualquer grau, depende de qualificao. O que qualificado em um estgio pode ser quantificado em outro; mas, em qualquer estgio, requerem-se julgamentos qualitativos. Por isso mes mo, o progresso da cincia funo no apenas de uma crescente capacidade de quantificar eficientemente (i. , de medir), mas tambm, da crescente capacidade de qualificar eficientemente. Uma vez que tenhamos decidido tratar qualitativamente um aspecto do problema, devemos especificar as qualidades alternativas possveis de atribuir a qualquer dos objetos ou acontecimentos a observar. Por exemplo, se vamos quali ficar a propriedade renda anual, devemos classificar a renda como alta, mdia e baixa. Podemos desejar outras classes, alm dessas trs. E, assim, a qualificao se trans forma num problema de classificao, importando especifi car, no modlo de pesquisa idealizada, a classificao que se deseja para caracterizar cada qual das propriedades qua litativas. Se as classes so baseadas em intervalos ao longo de uma escala que v do mais baixo ao mais alto, a clas sificao chamada "estratificao. A estratificao re quer, portanto, a ordenao de qualidades, ao longo de uma escala. A classificao e a estratificao, bem como as defini es, podem ser estruturais ou funcionais em contedo; em conseqncia, fazem-se pertinentes nossas observaes ante riores acrca das definies. Por exemplo, em alguns levan tamentos de opinio pblica, a circunstncia crtica. O procedimento usual conduz a tratar a circunstncia em tr mos fsicos ou estruturais; isto , em trmos de regies geogrficas, em trmos de densidade de populao, etc. Em certo caso, por exemplo, as comunidades foram classi ficadas em (a) cidades grandes (populao superior a 250.000 pessoas); ( b ) cidades pequenas (populao entre 10.000 e 250.000 pessoas); e (c) vilas, etc. (populao infe rior a 10.000 pessoas). Pode ocorrer, contudo, que relativa mente influncia da opinio, essa forma de classificar se

M O D LO

DE

PESQUISA

ID EALIZAD A

103

mostre ineficiente. Uma grande cidade industrial e um peque no vilarejo industrial podem ser mais semelhantes no modo como influenciam a opinio pblica do que o so duas cidades prximas, uma industrial e a outra de estrutura administrativa. A classificao deve (quando possvel) ser baseada em caractersticas que produzem a opinio e no em caracters ticas que so meramente correlacionadas ou no relacionadas com a opinio. Devemos, portanto, classificar segundo um esquema funiconal, focalizando nossa ateno nas caracters ticas que produzem o comportamento que pretendemos observar. Quando classificamos os valores de uma propriedade e examinamos as relaes desta para com o que est sendo examinado, o que, em verdade, estamos fazendo, na maioria das vzes, tentar determinar se os vrios atributos (defi nidos pela classificao) tm efeito sbre a resposta obser vada. J acentuamos anteriormente que, se uma propriedade correlacionada (mesmo em alto grau) com outra, no de corre da, de maneira alguma, que alteraes sofridas pelas primeiras propriedades produzam alteraes nas outras. Consideremos, por exemplo, a maneira como o tempo , algumas vzes, classificado em levantamentos sociais. Utilizamos o relgio para dividir o dia em perodos: das 9 s 11; das 11 s 13, etc.. Entretanto, essas horas podem significar coisas inteiramente diferentes para diferentes pes soas. Realizar entrevistas durante a manh ter eficcia com relao a algumas famlias, em algumas reas, mas no em outras, dependendo da atividade que a entrevista venha a interromper. a atividade em que se est empenhado que influencia as respostas, e no as horas. Somente quando buscamos esta relao produtor-produto e elaboramos clas sificaes funcionais chegamos melhor viso dos atributos, elaboradas.

5. Sumrio.
N a formulao do problema, hipteses alternativas so elaboradas. Tais hipteses consistem de enunciao expl cita das condies sob as quais cada uma das alternativas aceitveis seria escolhida; isto , as condies sob as quais cada qual seria aceita como o meio mais eficiente para alcan ar o objetivo da pesquisa. As condies de aceitao, tal

104

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

como formuladas nas hipteses, representam os resultados de uma possvel pesquisa. No modlo de pesquisa ideali zada, buscamos tornar explcito aquilo que consideramos corresponder aos procedimentos e condies timos da pes quisa e que possam ser efetivados de forma a determinar quais as condies de aceitao e, conseqentemente, qual a hiptese verdadeira. A especificao de um procedimento de pesquisa consiste em determinar o que deve ser feito, para quem, e onde e o que observar. O que deve ser feito o estmulo necessrio. O para quem" a popu lao, ou sujeitos observados. O onde a circunstncia em que os sujeitos devem ser expostos aos estmulos. O que observar a resposta em que estamos interessados. Os estmulos, sujeitos, circunstncia e respostas so complexos de objetos, acontecimentos e/ou propriedades. Devemos decidir que objetos, acontecimentos e proprieda des so necessrios para especific-los. Isso implica em decidir quais so os conceitos relevantes. Decidir se um conceito relevante depende de saber se o objeto, acon tecimento ou propriedade especificados tero algum efeito sbre as respostas a observar. Saber se um objeto, acon tecimento ou propriedade especficos afetaro as respostas depende do conhecimento disponvel ou de presunes que o pesquisador se disponha a fazer. A maneira mais efi ciente de chegar a essas determinaes requer a mxima utilizao das informaes existentes. E isso exige pesquisa exaustiva da literatura e utilizao mxima da assistncia que outros, cientistas e no cientistas, possam prestar. Escolhidos os conceitos relevantes, devem stes ser defi nidos de maneira a indicar como as questes a les relativas podem ser respondidas por pesquisa controlada. O contedo de tais definies depende de duas coisas: o uso histrico do conceito e os objetivos da pesquisa. O contedo deve ser tal que se mostre til especificamente para a pesquisa levada a efeito, contribuindo, tambm, para o desenvolvimento his trico geral do conceito em cincia. A forma como o con tedo apresentado deve tornar explcitas as condies e operaes pelas quais podem ser respondidas perguntas rela tivas ao conceito. Definidos os conceitos relevantes, devemos decidir se devemos manter constante o seu valor durante a pesquisa

M O D LO

DE

PESQUISA

IDEALIZAD A

105

ou se devemos alter-lo. Essa deciso deve se basear na gama de situaes relativamente s quais as concluses da pesquisa devem ser vlidas. Se decidirmos alterar ou fixar qualquer aspecto relevante da situao de pesquisa, devemos decidir tambm se tratlo quantitativamente ou qualitativamente. Essa deciso deve se apoiar numa comparao de custos associada a tratamen tos alternativos da varivel, ou atributo. A acuidade exigida, seja das determinaes quantitativas, seja das qualitativas, deve ser fixada por um procedimento anlogo. Completa-se o modlo de pesquisa idealizada com a especificao dos vrios valores relevantes das variveis e atributos. Mas, como qualquer outra fase do planejamento, esta se encontra sujeita a modificao posterior. Pode tornar-se claro mais tarde, por exemplo, que uma varivel importante foi omitida ou que um atributo deve ser quan tificado. Os procedimentos e condies especificados no modlo de pesquisa idealizada, raramente, ou nunca, podem ser pos tos em prtica. A fase seguinte do planejamento consiste, por isso mesmo, em transformar o modlo ideal em um mo dlo prtico. Os captulos seguintes desta obra sero dedi cados ao exame dessa transformao prtica. Antes de abordar a questo, consideremos alguns dos fatores que nos impedem de alcanar as condies idealizadas. Comecemos considerando o caso em que o pesquisador tem possibilidade de manipular tdas as variveis e atribu tos que esto abrangidos pelo modlo ideal. Mesmo neste caso, aspectos prticos podem impor muitas restries ao pesquisador. O nmero de sujeitos ou acontecimentos que le deseja estudar pode exigir mais tempo, dinheiro ou ener gia do que os disponveis. Em tal caso, le somente poder observar uma parte do todo. Uma vez que essa restrio se tenha imposto, faz-se necessrio o uso de estatstica e amostragem. Conseqentemente, a transformao do mo dlo ideal em modlo estatstico um aspecto necessrio da realizao da pesquisa. Mesmo quando haja apenas um sujeito, acontecimento ou propriedade a observar, o pesquisador est ciente do fato de que as observaes so sujeitas a rro. Necessitar, portanto, de mais de uma observao para cada conjunto

106

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

de valores das variveis. le gostaria de fazer um nmero infinito de observaes de um nico sujeito. Isso , obvia mente, impossvel, de modo que s lhe resta contentar-se com certa amostra das observaes. A amostragem de observaes possveis tambm requer transformao do modlo idealizado em modelo estatstico prtico. Ainda que se manifestassem situaes nas quais o pes quisador pudesse fazer um nmero extremamente grande de observaes a respeito de um sujeito, agir assim, seria, even tualmente, intil. le talvez no necessitasse acuidade to grande quanto a que seria proporcionada pelo nmero ele vadssimo de observaes. Portanto, se le deseja esforarse a-t o ponto necessrio para conseguir o grau de acuidade requerido, e no mais, recorrer, novamente, amostragem de observaes possveis e far uma transformao estats tica de seu modlo de pesquisa idealizada. Em muitas situaes de pesquisa psicolgica e social, a manipulao de tdas as variveis no possvel. E, assim, a pesquisa deve ser conduzida em situaes que diferem da idealizada. Devemos determinar, pois, como poderemos inferir, dos resultados observados numa situao real, aquilo que observaramos se pudssemos criar a situao ideal. Isso requer que tornemos explcita a situao real, que pro curaremos, como a caracterizaremos e como ajustaremos os resultados observados de modo a termos possibilidade de asseverar algo a propsito da situao idealizada. Ainda aqui se far necessria uma transformao estatstica do modlo de pesquisa idealizada e a formulao de operaes de pesquisa a serem, de fato, realizadas.

Tpicos para discusso.

1. Avalie as definies seguintes. Como as aperfeioaria voc caso isto fsse possvel? a) ajustamento: aquilo que leva a um estado de ajustamento, i. ., alguma relao mais ou menos estvel e mutuamente aceitvel entre os participantes" (17:286). b) atitude: "tendncia e vontade de agir que emerge, quando os vrios desejos foram contrastados entre si (17:200). c) comunicao: todos os procedimentos pelos quais um esprito pode influenciar outro. (33:95). d) folkways: "padres de comportamento da vida cotidiana, que geralmente surgem de forma inconsciente num grupo... Parecem, para

M O D LO

DE

PESQUISA

ID E A LIZA D A

107

os indivduos que chegam a pensar a respeito, nada mais do que solues cmodas para problemas imediatos" (20:134). e) instituio social: uma configurao funcional de padres culturais (incluindo aes, idias, atitudes e lastro cultural) que possui certa permanncia e se destina a satisfazer necessidades sociais funda mentais (20:318). f) competio: "processo social em que indivduos, ou grupos rivais, buscam vantagens atravs de favor e preferncia de um pblico (indivduo ou grupo), procurando atingir seus fins recorrendo antes aos interesses e preconceitos daquele indivduo ou grupo, do que a processos de violncia ou intimidao (20:608). g) instituio grupai: funes e status oficiais, padronizados, impessoais, de membros de qualquer grupo social organizado, atravs dos quais o grupo age e reage como um todo (46:211). 2. Parece-lhe adequada a citao seguinte para caracterizar a "pesquisa emprica? Com algumas notveis excees, discusses sociolgicas recentes atriburam apenas uma funo importante pesquisa emprica: exame ou verificao de hipteses. O modlo para correto desempenho dessa funo familiar e claro. O investigador principia com uma con jectura ou hiptese, da tira inferncias e estas, por sua vez, so submetidas a testes empricos que confirmam ou refutam a hiptese" (28:505-6). 3. Que variveis sociais sofrem, usualmente, tratamento qualita tivo? H meio de trat-las quantitativamente? 4. Que variveis sociais sofrem, usualmente, tratamento quanti tativo? Sob que condies podem e devem ser tratadas qualitativa mente? 5. Usando a definio da relao produtor-produto dada no texto, como definiria voc (a) reproduo e (b) coproduo? 6. Quando dizemos que um grupo organizado, referimo-nos a propriedades estruturais, funcionais ou a ambas?

Exerccios.
1. Preparar um modlo de pesquisa idealizada para o projeto do curso (Cf. exerccio 1. do cap. anterior). 2. Usando as indicaes fornecidas por ste captulo, elaborar uma definio cientfica de um dos seguintes conceitos: (a) comunnidade: (b) cultura; (c) propriedade; (d) explorao (exploitation, no sentido de levantamento de recursos naturais", prospeco); (e) empregado (employed, no sentido de "utilizado"). 3. Definir o trao tolerante" e construir uma escala para medi-lo. 4. Projetar um procedimento de pesquisa ideal para determinar se o editorial de certo jornal um produtor da opinio de certa pessoa a propsito do assunto versado.

108

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

5. (a) Selecionar uma escala mtrica usada em cincias socia Determinar, se possvel, o que ela mede. Caso contrrio, explicar a razo da impossibilidade de medir, (b) Proceder da mesma forma em relao a uma escala ordenada, (c) Determinar como um fsico mediria, idealmente, o comprimento de um objeto.

Leituras sugeridas.
As publicaes abaixo constituem guias teis para a familiarizao com a literatura existente. O pesquisador deve conhec-las de perto.

Book Review Digest, The. New York: H. W . Wilson Co. Bulletin of the Public Affairs Information Service. New York: Catalogue of Economic and Social Projects.
Affairs Information Service.

Public

Lake Success, N. Y.: United Nations Department of Public Information, 1949 e 1950. Education Index, The. New York: H. W . Wilson Co. Encyclopedia of the Social Sciences. New York: Macmillan Co., 1931. Encyclopedia of Psychology. New York: Philosophical Library, 1946. Historical Statistics of the United States, 1789-1945. Washington D. C.: United States Department of Commerce, Bureau of the Census, 1949. Index to Labor Articles. New York: Rand School of Social Sciences. International Index to Periodicals. New York: H. W . Wilson Co. M onthly Catalogue, United States Government Publications e Annual Index. Washington D. C.: Superintendent of Documents. Poole's Index to Periodical Literature. Boston: Houghton Mifflin Co. Psychological Abstracts. Washington D. C.: American Psychological Association Inc. Readers Guide to Periodical Literature. New York: H. W . Wilson Co. Review of Educational Research. Washington D. C.: American Edu cational Research Association. Science Abstracts. London: Institution of Electrical Engineers. Social Science Abstracts. Menasha, W is.: Social Science Research Council. Statistical Abstracts of the United States. Washington D. C.: United States Department of Commerce. Bureau of the Census, 1951. Statistical Year Book, 1949-50. Lake Sucess, N. Y.: United Nations Department of Public Information, 1951. Technical Book Review Index. Pittsburgh, Pa.: Special Libraries Asso ciation. Ulrich's Periodical Index. 6" ed., New York: R. R. Bowker Co., 1951. United Nations Publications. Lake Success. N. Y.: United Nations Department of Public Information, 1950. United States 'Quarterly Book Review, The. Washington D. C.: Supe rintendent of Documents.

M O D LO

DE

PESQUISA

IDEALIZAD A

10 9

Para uma bibliografia ampla acrca de aspectos especiais da pes quisa social, ver: A. e H a r r i s o n , S. M., A Bibliography of Social Surveys. New York: Russell Sage Foundation, 1930. P a r t e n , M., Surveys, Polls and Samples. New York: Harper 6 Bros., 1950. S m ith , B. L . L a s s w e l l , H. D.; e C a s e y , R. D., Propaganda, Commu nication and Public Opinion. Princeton: Princeton University Press, 1946.
E a to n ,

Abaixo indicamos artigos e livros que dizem rpspeito a alguns problemas de pesquisa bsica, discutidos neste captulo. No os indi camos porque estejam de acrdo com a opinio do autor, ao contrrio, muitos so indicados precisamente porque se afastam de posies aqui tomadas. a) Conceituao: Eubank (17) e Singer (34). b) Procedimento geral de pesquisa: Burgess (5), Chapin (8), Greenwood (21) e Lundberg (27). c) Quantificao e medida: Arrow (4), Campbell ( 6), Church man (9), Coombs (15) e (16), Lazarsfeld e Barton (26), Reese (32), Stevens (37), (38) e (39) e Stouffer (41).

Referncias e bibliografia.
1. 2. 3.
A llp o r t,

G. W ., Personality: a Psychological Interpretation. New York: Henry Holt & Co., 1937. "A test for Ascendance-Submission", Journal of Abnormal and Social Psychology, X X III (1928), 118-36.

A m es,

4.

5.

6.
7.

8.
9.

minary draft. Hanover, N. H .: Hanover Institute, 1946. , K. J., Mathematical Models in the Social Sciences", cm The Policy Sciences, ed. D a n i e l L e r n e r e H. D . L a s s w e l l . Stanford University: Stanford University Press, 1951. B u r g e s s , E. W "Research Methods in Sociology", em Twentieth Century Sociology, ed. G e o r g e s G u r v i t c h e W . E. M o o r e , New York: Philosophical Library, 1945. C a m p b e l l , N. R A n Account of the Principles of Measurements and Calculations. New York: Longmans, Green & Co., 1928. C a n t r i l , H a d l e y , The " W h y " of M an's Experience. New York: Macmillan Co., 1950. CHAPIN, F. S., Experimental Designs in Social Research. New York: Harper & Bros., 1947. C h u r c h m a n , C . W ., A Materialist Theory of Measurement, e m Philosophy for the Future, e d . R. W . S e l l a r s , V. J. M c G i l l e M a r v i n F a r b e r , N e w York: M a c m i lla n Co., 1949.
A
rrow

A . , J r . Some Demonstrations Concerned with the Origin and Nature of our Sensations: a Laboratory Manual. Preli

110
10.
C

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

11. 12. 13. 14.

15.

16. 17. 18.

19. 20. 21. 22. 23. 24. 25. 26.

27. 28.

29.

, C . W . e A c k o f f , R. L., " A n E x p e r im e n t a l D e f i nition of Personality", Philosohy of Science, X IV (1947), 304-32. "Purposive Behavior and Cybernetics", Social Forces, X X IX (1950), 32-39. Psychologistics", Philadelphia: University of Pennsyl vania Faculty Research Fund, 1946 (mimeog.). M ethods of Inquiry. St. Louis: Educational Publishers, 1950C h u r c h m a n , C . W . , A c k o f f , R . L. e W a x , M . , (eds.), Measu rement of Consumer Interest. Philadelphia: University of Pennsylvania Press, 1947. C o o m b s , C . H., Mathematical Models in Psychological Scaling, Journal of the American Statistical Association, X L V I (1951), 480-89. "Psychological Scaling Without a Unit of Measurement", Psychological Review, L V II (1950), 145-58. E u b a n k , E . E ., The Concepts of Sociology. Boston: D. C . Heath & Co., 1932. F e ig l, H e r b e r t , "Logical Empirism, em Twentieth Century Philosophy, ed. D a g o b e r t R u n e s , New York: Philosophical Library. 1943. F r a n k , L. K ., e outros. "Teleological Mechanism", Annals of the N ew York Academy of Sciences, L (1948), 187-278. G i l l i n , J. L. e J. P., A n Introduction to Sociology, New York: Macmillan Co., 1943. G reenw o o d, E rn e s t. Experimental Sociology. New York: King's Crown Press, 1945. G u i l f o r d , J. P., Psychometric Methods, New York: McGrawHill Book Co., 1936. H e b b , D. O., Organization of Behavior: a Neuropsychological Theory, New York: John W iley & Sons, 1949. I t t e l s o n , W . H. e K i l p a t r i c k , F. P., "Perception, Scientific American. C L X X X V (1951), 50-55. K it t e l , C h a r l e s , The Nature and Development of Operations Research", Science, CV (1947), 150-53. L a z a r s f e l d , P. F. e B a r t o n , A . H., Qualitative Measurement in the Social Sciences: Classification, Typologies and Indices", em The Policy Sciences. Ver (4). L u n d b e r g , G. A ., Social Research, New York: Longmans, Green & Co., 1946. M e r t o n , R. K ., "The Bearing of Empirical Research upon the Development of Social Theory, American Sociological Re view, X III (1948), 505-15. M i l l , - J. S., A System of Logic. 5 ed., London: Parker, Son & Bourn, 1862.
hurchm an

M O D ELO

DE

PESQUISA

ID EALIZAD A

111

30. 31.

P ayne,

Public Opinion Quarterly, X V (1951), 557-62. Proceedings of the First Seminar in Operations Research, N o vember 8-10, 1951. Cleveland: Case Institute of Technology,
1952. graphs, Vol. LV, n. 251.
C la u d e e

S. L., "The Ideal Model

for Controlled Experiments,

32.

R eese,

T . W ., The Application of the Theory of Physical M ea surement of Psychological Magnitudes. "Psychological Mono

New York, 1943.


W arren ,

33.

Shannon,

34.

Press, 1949. S i n g e r , E. A., Co., 1924.


S o lo w ,

Theory of Communication,

W e aver,

Urbana:

University of
R.

The Mathematical
G. Adams

Illinois

M ind as Behavior,

Columbus Ohio:

35. 36. 37.

H e rb e rt,

Operations Research,

38. 39.

40. 41. 42.


43.

44. 45.
46.

Contemporary Sociological Theories, New York: Harper & Bros., 1928. S t e v e n s , S . S ., "On the Problem of Scales for the Measurement of Psychological Magnitudes", Journal of Unified Science, IX (1939), 94-99. On the Theory of Scales of Measurement", Science, C III (1946), 677-80. "Mathematics, Measurement and Psychophysics", em Hand book of Experimental Psychology, ed. S . S . S t e v e n s . New Y ork : J o h n W iley 6 S o n s , 1951. S t o u f f e r , S . A., "Some Observations on S t u d y Design", Ameri can Journal of Sociology, LV (1950), 355-61. S t o u f f e r , S . A. e outros., Measurement and Prediction. Prin ceton: Princeton University Press, 1950. T h u r s t o n e , L. L., The Vectors of Mind, Chicago: University of Chicago Press, 1935. V e r n o n , P., E., The Biosocial Nature of a Personality Trait, Psychological Review, X L (1933), 533-48. W a t s o n , J. B., Behaviorism, New York: Peoples Institute Publi cation Co., 1934. W i e n e r , N o r b e r t , Cybernetics, N e w York: John W i l e y & Sons, 1948. Z n a n i e c k i , F l o r i a n , Social Organizations and Institutions, em Twentieth Century Sociology. Ver (5).
S o r o k in , P itir im ,

105 e segs.

Fortune,

X V III (1951).

a p t u l o

IV

O PLANEJAMENTO DA PESQUISA PRTICA: AMOSTRAGEM 1. Introduo.


O primeiro problema que consideraremos, ao tratar da formulao prtica da pesquisa, ser o da variedade de mtodos para a seleo de uma parte da populao a ser observada. ste procedimento de seleo denominado amostragem. Os aspectos estatsticos da amostragem, quer no nvel terico, quer no prtico, receberam considervel ateno. Vasta bibliografia existe a respeito, estando alguns dos ttu los reunidos no fim dste captulo. A amostragem desen volveu-se de tal modo que inmeros estatsticos confinam seu trabalho a sse tema. O progresso do assunto vem tornando extremamente difcil a possibilidade de algum ser um perito em amostragem e em outro setor da estatstica; mais difcil, portanto, algum ser perito em amostragem e cincia social. Conseqentemente, a finalidade da presente discusso no a de preparar especialistas em amostragem; , antes, a de permitir um dilogo eficiente entre o cientista social e o especialista em amostragem. Ao'longo do captulo a nfase ser dada amostragem feita em populaes de indivduos e no em populaes de observaes realizadas com um nico indivduo. Os moti vos dessa atitude j foram expostos: na pesquisa social, observaes repetidas do mesmo sujeito tendem a aumentar o rro, e no a diminui-lo. Certamente, isso no significa que as observaes repetidas sempre levem a um aumento no rro, devendo, pois, ser evitadas. Ao contrrio, as obser vaes repetidas devem ser feitas sempre que possa haver ajustamento, ou quando sse ajustamento fr dispensvel; isto , quando o efeito da repetio das observaes sbre o

P LA N .

DA

PESQ.

PRTICA:

AM O ST RA G EM

113

valor da caracterstica, que est sob exame, fr conhecido e, portanto, puder ser cancelado, ou quando a repetio das observaes no afetar sse valor. Deve-se enfatizar, con tudo, que a lgica e os princpios bsicos dos mtodos de amostragem so idnticos, quer se trate de amostragem de populao de indivduos, quer se trate de amostragem de populao de observaes sbre um mesmo indivduo.

2. Erros na amostragem e na estimativa.


Para entrarmos no problema da amostragem, considere mos uma populao 'miniatura, bem simples, constituda por seis elementos. Admitamos que os elementos sejam crianas com 2, 3, 4, 6, 9 e 12 anos. Se desejarmos determi nar a mdia das idades da populao (que de 6 anos), pre cisamos, preliminarmente, determinar a idade de cada crian a. Imaginemos, entretanto, que por motivos de ordem pr tica no nos seja possvel determinar a idade de cada ele mento, cabendo-nos, pois, fazer uma estimativa da mdia das idades com base nos dados colhidos em uma amostra da populao. claro que existem vrios modos de sele cionar amostras da populao e que pode variar a quantia de elementos de cada amostra. O problema do projeto da amostragem , portanto, o de determinar a maneira de sele cionar a amostra e sua extenso. Na prtica, sses proble mas de projeto no podem ser considerados independente mente do mtodo de fazer uma estimativa, utilizando os dados obtidos a partir da amostra; ou seja, do procedimento de avaliar. Para fins de exposio, contudo, apenas o pro jeto de amostragem ser considerado neste captulo. Os procedimentos de avaliao constituiro objeto de estudo nos captulos v e viii. A expresso "processo amostragemestimativa ser usada para designar uma combinao do procedimento de amostragem e de estimativa. O planejamento de um procedimento amostragemestimativa orientado para proporcionar uma boa esti mativa de uma caracterstica da populao. O signifi cado de "boa requer cuidadosa anlise. O mesmo se d com o critrio de "bondade que, neste contexto, deve ser tal que permita avaliao quantitativa do procedimento pla nejado. Um plano que possa ser avaliado dessa forma se

114

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

diz um plano "mensurvel". Um plano mensurvel no , necessariamente, bom, mas desejvel, porque sabemos, e no meramente imaginamos, quo bom le e porque o aperfeioamento progressivo do plano se faz possvel quan do dispomos de critrios explcitos e mensurveis. Os critrios mensurveis usados para avaliar os proje tos amostragem-estimativa baseiam-se, geralmente, em dois tipos de custos: o custo da realizao do projeto e o custo que se pode esperar como resultado de possveis erros. De modo geral, considerado melhor o projeto que reduz ao mnimo a soma dsses custos. Os custos de operao no so difceis de compreender. Para compreender os custos atribuveis a rro, faz-se necessria alguma noo de erros de amostragem e estimativa. importante notar que, se utilizados para a avaliao de um projeto, os erros devem ser mensurveis. Consideremos os tipos de rro que podem ser cometidos ao se utilizar um procedimento estimativa-amostragem e examinemos as maneiras de medi-los.

2.1 Acuidade.
Para simplificar, no momento, a discusso do rro de amostragem, admitamos ter decidido, por motivos de ordem prtica, selecionar uma amostra de dois elementos da popu lao miniatura". Alm disso, concordemos em usar a idade mdia da amostra como uma estimativa da idade mdia da populao. Assim, se escolhemos dois elementos cujas idades so 2 e 4 anos, avaliaremos a idade mdia da popu lao da seguinte forma (2 4)/2 ou 3 anos. Em verdade, a idade mdia da populao 6 anos e, por isso, a estimativa imprecisa. Se houvssemos selecionado dois elementos cujas idades fssem 3 e 9 anos, teramos obtidos uma esti mativa perfeita. Acuidade e impreciso de uma estimativa podem ser melhor definidas da seguinte maneira: seja T o valor verdadeiro da caracterstica da populao que est sendo avaliada e seja e o valor estimado daquela caracte rstica. Ento, se e e T so iguais, a estimativa inteira mente precisa. Se e e T no so iguais, a estimativa impre cisa e a impreciso dada por (e T ) . Se ste valor posi tivo, e uma superestimao; se negativo, uma subestimao.

P LA N .

DA

PESQ.

PRTICA:

AM O ST RA G EM

115

2.2 Desvio.
Consideremos, agora, tdas as amostras possveis de dois elementos, que possam ser selecionadas da populao miniatura. Antes de relacionarmos essas possveis amos tras, devemos decidir se o mesmo elemento pode ser esco lhido mais de uma vez na mesma amostra. Se cada indi vduo somente puder ser escolhido uma vez em qualquer amostra, o procedimento de amostragem sem repetio. Se cada indivduo puder ser escolhido mais de uma vez em qualquer amostra, o procedimento ser de amostragem com repetio. Em pesquisa social, amostragem sem repetio , talvez, o procedimento mais comum. Por isso mesmo, dare mos nfase a sse tipo de procedimento, embora quase tda a discusso que vai se seguir seja aplicvel a ambos os tipos de amostragem.
T 1

a bela

A M O STRA S POSSVEIS D E D O IS ELEM EN T O S DA POPULAO: 2, 3, 4, 6, 9 e 12

Amostra 2,3 2, 4 2, 6 2, 9 2, 1 2 3,4 3, 6 3,9

Mdia da amostra 2.5 3.0 4.0 5.5 7.0 3.5 4.5 6.0

Ainostrn 3, 1 2 4,6 4, y 4, 12 6, 9 6, 12 9, 12

Mdia da amostra 7.5 5.0 6.5 8.0 7.5 9.0 10.5

Tdas as amostras de dois elementos que podem ser colhidas, sem repetio, da populao miniatura so indi cadas na tabela 1, juntamente com a mdia de cada amostra. Note-se que apenas uma das amostras (3,9) fornece uma estimativa perfeita da idade mdia da populao. Suponhamos, agora, que dispomos de um mtodo de amostragem tal que torna igual a possibilidade de escolher mos uma qualquer das quinze amostras indicadas na tabela 1. Resultaria, ento, a possibilidade igual de obter qualquer das quinze mdias de amostra como uma estimativa da mdia da

116

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

populao. Com longa repetio, poderamos esperar obter cada mdia de amostra 1/15 das vzes. Se cada qual das estimativas feitas fsse realmente obtida 1/15 das vzes, a mdia das estimativas seria 1/15(2.5 + 3.0 + . . . + 10.5) = 90/15 = 6.0. Este valor (6.0) chamado valor esperado da estimativa fornecida pelo procedimento amostragem-estimativa utilizado. O valor esperado de uma estimativa possibilitada por um procedimento amostragem-estimativa a mdia das estima tivas esperadas com longa repetio do uso do procedimento.* Note-se que, na ilustrao, o valor esperado igual mdia verdadeira da populao. Conseqentemente, dir-se- que o procedimento fornece estimativas sem desvio. Dir-se-ia que um procedimento fornece estimativas desviadas se o valor esperado da estimativa, E (e), se afastasse do valor ver dadeiro da caracterstica a ser avaliada, T. Assim, o desvio igual a [E (e) T}. O desvio de uma estimativa, estri tamente falando, deve-se combinao de procedimentos de amostragem e estimativa. Uma alterao em qualquer dles pode afetar o desvio. Combinemos, por exemplo, o proce dimento de estimativa usado acima, com um diferente pro cedimento de amostragem. Suponhamos que o nvo pro cedimento de amostragem tal que o elemento mais nvo e o elemento mais velho da populao no podem ser esco lhidos na amostra. Para sse caso as amostras possveis e suas mdias so indicadas pela tabela 2. Ora, se temos possibilidade igual de obter cada uma dessas mdias de amostra para uma estimativa, o valor esperado da estimativa fornecido por ste procedimento ser 1/6(3.5 + 4.5 + 6.0 4- 5.0 + 6.5 + 7.5) = 33/6 = 5.5.

* O valor esperado de uma varivel estatstica pode ser m rigorosamente definido como segue: seja T o verdadeiro valor que se est estimando e admitamos que' E (e) representa o valor da estima tiva que se obtm com o procedimento em tela. Sejam ei, eu, . . . , en tdas as possveis estimativas de T e admitamos que pi seja a proba bilidade de que ei venha a ser obtida pelo procedimento, pa representa a probabilidad correspondente para e, etc. Ento

E(e) = piei + p^, + . . . + p,.e

PLAN .

DA

PESQ.

PRTICA:

AM O ST RA G EM

117

Conseqentemente o desvio introduzido pela mudana do procedimento de amostragem, sem alterao do procedimento de estimativa, igual a (5.5 6.0) ou ( 0.5 ).
T
abela

AM OSTRAS POSSVEIS DE D O IS E LEM EN T O S D A POPULAAO: 2, 3, 4, 6, 9 e 12, O N D E 2 e 12 N A O PO D E M SER E SCO LH ID O S


Mdia da amo6tra 5.0 6.5 7.5

Amostra 3, 4 3, 6 3,9

Mdia da amostra 3.5 4.5 6.0

Amostra 4, 6 4, 9 6, 9

Note-se que um processo amostragem-estimativa que fornece estimativa desviada pode, no obstante, oferecer estimativa precisa. tambm verdade, como a tabela 1 evidencia, que um procedimento que fornece estimativa cor reta pode, tambm, oferecer estimativa desviada. Deve ser lembrado que a acuidade se refere ao desvio de uma esti mativa especfica em relao ao valor verdadeiro a estimar, enquanto o desvio se refere ao afastamento do valor espe rado em relao estimativa do valor verdadeiro. Medir desvio implica medir um afastamento do valor verdadeiro da caracterstica a avaliar. Obviamente no se conhece o valor verdadeiro quando se est fazendo uma estimativa. Ento, como se pode medir o desvio? Utilizando mtodos matemticos possvel mostrar que procedimentos vrios so corretos ou sujeitos a desvio e mostrar, tambm, em que medida o so. Ou seja, possvel demonstrar que um dado procedimento fornecer ou no fornecer um valor esperado igual ao valor verdadeiro, seja ste qual fr. A teoria esta tstica e a da amostragem fornecem, portanto, medidas do desvio inerente a um procedimento amostragem-estimativa.

2.3 Variabilidade e preciso.


A medida da acuidade parece tambm exigir conheci mento do valor verdadeiro da caracterstica a avaliar. No h meio de medir diretamente a acuidade de uma estimativa

11 8

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

especfica utilizando apenas a teoria da amostragem. Meios diversos de verificar a acuidade de uma estimativa espec fica sero examinados no captulo ix. Mas, a teoria da amostragem possibilita medida da probabilidade de que um procedimento fornea estimativa com o grau de acuidade ou impreciso que se desejar. Essa determinao depende da variabilidade das estimativas fornecidas pelo procedimento. Para ter uma idia do significado de variabilidade, consi deremos amostras possveis de quatro elementos colhidos da populao miniatura. Estas so indicadas pela tabela 3.
T 3

abela

AM OSTRAS POSSVEIS DE Q U A T R O ELEM EN T O S D A POPULAAO: 2, 3, 4, 6, 9 e 12.

Amostra

M dia da amostru

Amostra

Mdia da amostra

2, 3, 4, 6 2, 3, 4, 9 2, 3, 4, 12 2, 3, 6, 9 2, 3, 6, 12 2, 3, 9, 12 2, 4, 6, 9 2, 4, 6, 12

j
j

1 ; ! ! 1 1

3.75 4.50 5.25 5.00 5.75 6.50 5.25 7.25

i 1

2,4,9,12 2, 6, 9, 1 2 4, 6, y 3. 4, 6, 1 2 3, 4, 9, 1 2 3, 6, 9, 1 2 4, 6, 9, 1 2

6.75 7.25 5.50 6.25 7.00 7.50 7.75

Comparemos agora os resultados da tabela 3 com os da tabela 1. Note-se que as estimativas (mdia da amos tra) que aparecem na tabela 1 situam-se entre 2.5 e 10.5, enquanto as da tabela 3 distribuem-se entre 3.75 e 7.75. As estimativas baseadas em amostras de quatro elementos apresentam menos variabilidade (ou menor disperso, ou difuso) do que as estimativas baseadas em amostras de dois elementos. H muitos meios de medir essa variabilida de, porm, o mais comumente utilizado chama-se rro padro da estimativa. Essa medida ser examinada pormenoriza damente no captulo seguinte. No momento, importante apenas ter em mente que o rro padro medida de varia bilidade de estimativas fornecida por um processo amostragem-estimatjva. J verificamos como o uso de um procedimento amostragem-estimativa, relativamente mesma populao, pode

P LA N .

DA

PESQ.

PRTICA:

AM OSTRAG EM

119

resultar em estimativas de diferente variabilidade; e isto ocorre com mudana na extenso da amostra. H tambm diferenas entre mtodos de amostragem, mesmo quando referentes a amostras de igual extenso, tomadas a partir da mesma populao. Diz-se que o procedimento tanto mais preciso, quanto menor a variabilidade entre possveis estimativas nle baseadas. Preciso aqui usado em sen tido muito semelhante ao que se emprega para referncia a uma escala, que fornece a mesma leitura em repetidas pesa gens de um mesmo objeto. Quanto mais variadas as leitu ras do pso de um mesmo objeto, menos precisa a escala. Preciso absoluta ou perfeita somente seria obtida se tdas as leituras (no caso da escala) ou tdas as estimativas (no caso de um processo amostragem-estimativa) fornecessem exatamente os mesmos valores. Um processo amostragem-estimativa que fornece esti mativa sem desvios pode resultar muito impreciso e um pro cedimento que fornece estimativa desviada, pode ser muito preciso. Isso pode ser ilustrado recorrendo a uma analogia com o tiro ao alvo.* Comparemos cada estimativa de amos tra de uma caracterstica de uma populao a um "tiro" dirigido ao valor verdadeiro de tal caracterstica. Se atira mos vrias vzes, obtemos um padro de tiro. Quatro tipos de padres, que podem resultar do uso de mtodos diferentes de amostragem, so indicados na figura 4. Combinando medidas de desvio e variabilidade de um procedimento, pode-se obter uma medida de confiana para estimativa a partir daquele procedimento. Essa medida ser examinada no captulo viii.

2.4 Custo do rro de amostragem.


Na seo 2 o melhor processo amostragem-estimativa foi definido como aqule que reduz ao "mnimo a soma de (a) o custo de colheita da amostra e de obteno de uma estimativa e (b) o custo do rro. Os conceitos custo do rro" e "mnimo no so simples, mas podemos tornlos mais explcitos agora, quando j examinamos os erros de amostragem.
* Esta analogia devida a Deming adaptada do seu diagrama. (8:19-21). A figura 4

120

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Variabilidade da amostragem

------ desvio -----Valor verdadeiro Valor esperado

Mtodo A: desvio amplo; ampla variabilidade de amostragem (impreciso) Variabilidade da amostragem

------- desvio------Valor verdadeiro Valor esperado

Mtodo B: desvio amplo; pequena variabilidade da amostragem (preciso) Variabilidade da amostragem

Valor verdadeiro e esperado Mtodo C: sem desvio; ampla variabilidade de amostragem (impreciso) Variabilidade da amostragem

Valor verdadeiro e esperado Mtodo D: sem desvio; pequena variabilidade de amostragem (preciso) F ig. 4 Desvio e variabilidade

P LA N .

DA

PESQ.

PRTICA:

AM OSTRAG EM

121

Consideremos uma populao de cinco elementos, cujos valores, ao longo de alguma escala, so, respectivamente, 2, 3, 6, 9 e 10. O valor mdio para a populao 6. Supo nhamos, agora, que desconhecemos sse valor e queremos estim-lo com base nos dados obtidos a partir da amostra colhida na populao. Seria possvel escolher amostras de 1, 2, 3, ou 4 elementos. Quantos devem ser escolhidos? Vejamos como dar uma resposta razovel para essa questo (ver tabela 4). Tdas as amostras possveis de cada extenso relacio nam-se na coluna B. Admitamos estar utilizando um proce dimento de amostragem no qual cada amostra de uma extenso especificada tem a mesma possibilidade de ser escolhida que qualquer outra amostra da mesma extenso. Suponhamos, alm disso, que usamos a mdia da amostra como uma estimativa da mdia da populao. As estimativas resultantes aparecem na coluna C. A impreciso de cada estimativa pode ser determinada subtraindo a mdia verda deira da populao (6) de cada valor estimado. Os resul tados aparecem na coluna D. Suponhamos, agora, que cada rro por superestimao custa $ 3.00 por unidade de rro e cada rro por subestimao custa $ 6.00 por unidade de rro. Os custos resul tantes associados a cada rro (sob condies especificadas) aparecem na coluna E. Mas no sabemos, de antemo, que rro ser cometido. No obstante, conhecemos as possibi lidades de comisso de cada rro. Por exemplo, h cinco amostras possveis de um elemento e de acrdo com o mtodo que estamos usando cada amostra tem igual pos sibilidade (1/5) de ser escolhida. Conseqentemente, cada rro tem a mesma possibilidade de ocorrer. Ento, o pri meiro rro indicado 4 e seu custo, $ 24.00, incidir, aps muitas repeties do procedimento, 1/5 das vzes. Na mdia, sse rro custar 1/5 (24.00), ou seja $ 4.80 por estimativa. sse o custo esperado dste rro particular. O custo esperado de cada rro pode ser computado de modo anlogo. Os resultados so exibidos na coluna F. O total dsses custos para cada extenso da amostra o custo total esperado do rro; isto , o custo mdio do rro em que se incorrer, se o procedimento for usado repe tidamente.

T ab el a

CUSTO TOTAL E SPERA D O D E AM OSTRAS POSSVEIS ESCO LHID A S DA POPU LAAO 2, 3, 6, 9 e 10

V)

(B)

(Cl

Exteno da amostra 1

Amostra 2 3 6 9 1Q

Estimativa 2 3 6 9 10 '

cw Erro -4 -3 0 3 4

(E) < Custo do Custo espera rro do rro $24.00 18,00 9.00 12.00 $ 4.80 3.60 1.80 2.40 $12.60 3.00 $15.60

usto total esperado do rro Custo de uma observao usto total esperado do procedimento 2 2, 3 2,6 2,9 2, 10 3,6 3,9 3,10 6,9 6, 10 9, 10 2.5 4.0 5.5 6.0 '4.5 6.0 6.5 7.5 8.0 9.5 -3.5 2 .0 -0.5 0 1.5 0 0.5 1.5 2.0 3.5 $21.00 12.00 3.00 9.00 1,50 4.50 6,00 10.50

$ 2,10 1.20 0,30 0.90


o :b

0.45 0.60 1.0S $ 6.75 6.00 $12.75

Custo total esperado do rro Custo de duas observaes Custo total esperado do procedimento 3 2,3,6 2,3,9 2, 3, 10 2,6,9 2, 6, 10 2, 9, 10 3, 6, 9 3, 6, 10 3, 9, 10 6, 9, 10 3.67 4.67 5.00 5.67 6.00 7.00 6.00 6.33 7.33 8.33 *-2,33 -1.33 -.oo0.33 0 1.00 0 0.33 1.33 2.33 $14.00 8.00 6.00 2.00 3.00 1.00 4 00 7.00

$ 1.40 0.80 0.60 0.20 030 0.10 0.40 0.70 $ 4.50 9.00 $13.50

Custo total esperado do rro Custo de tres observaOes . Custo total esperado do procedimento 4 2, 3, 6, 9 2,3,6, 10 2, 3, 9, 10 2, 6, 9, 10 3, 6, 9,10 5.00 5.25 6.00 6.75 7.00 -1.00 0.75 0 0.75 1.00 $ 6 .00 4.50 2,25 3,0Q

$ 1.20 Q.9Q 0,45 0.60 $ 3.15 12.00 $15; 1 .5

Custo total esperado do rro uato dP quatro observaOes Custo total esperado .do procedimento

P LA N .

DA

PESQ.

PRTICA:

A M OST RAG EM

12 3

Suponhamos agora que de $ 3.00 o custo de cada observao. Assim, o custo de observao para as dife rentes amostras $ 3.00, $ 6.00, $ 9.00, e $ 12.00, res pectivamente. Se esta quantia adicionada ao custo total esperado do rro, obtemos o custo total esperado do pro cedimento. No exemplo, as amostras de dois elementos so mais econmicas, a longo alcance, relativamente ao pro cedimento amostragem-estimativa. Note-se que o custo de uma contagem global seria de $ 15.00. Clculos semelhantes poderiam ser feitos para outros processos de amostragem-estimativa, aplicveis a esta popu lao. O mtodo que possibilitasse o custo total esperado mais baixo deveria ser o preferido. O procedimento descrito pode ser expresso numa forma geral. Represente e( um rro de estimativa, represente C (e () o custo dsse rro, e represente P (e t) a probabilidade de tal rro ser cometido. Ento, o custo esperado dsse rro C (e ,)P (e) , o produto do custo pela probabilidade. O custo total esperado do rro pode ser ento expresso da maneira seguinte: C ( ei)P (eO + C(e2)P (e 2) + . . . + C (e)P (eft). Se a esta soma fr adicionado o custo das observaes, o resultado ser o custo total esperado do procedimento. Para nos capacitarmos a realizar ste tipo de avaliao do custo de procedimentos amostragem-estimativa neces srio obter estimativas da probabilidade com que ocorrer um rro especifico. Na ilustrao simples dada acima, no houve dificuldade com sse ponto porque tnhamos conhe cimento do valor atribudo a cada elemento da populao. Na prtica, precisamente a ausncia dsse conhecimento que faz necessria a utilizao de um processo amostragemestimativa. Contudo, mesmo sem conhecer o valor de cada elemento da populao, possvel obter estimativas da pro babilidade de comisso de cada rro, recorrendo teo ria estatstica. Verificaremos como pode ser avaliada essa probabilidade e, no prximo captulo, discutiremos com maior ateno os erros e o custo presentes na avaliao de um procedimento. No apndice IV apresenta-se um mtodo para determinar a extenso da amostra que, num

124

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

particular procedimento, reduz ao mnimo o custo total esperado dsse procedimento. Mesmo sem usar tcnicas avanadas para comparao de projetos alternativos de amostragem, freqentemente possvel efetuar escolha razo vel de um plano, tomando em considerao os vrios custos associados sua preparao, operao e anlise. Mas isso, por sua vez, requer familiaridade com as fases operacionais de cada mtodo de amostragem. Estas variam de um plano para outro. virtualmente impossvel, portanto, para qual quer pessoa com pequena experincia de amostragem, fazer estimativas razoveis de custos associados com os mtodos alternativos nesse setor. Os que tenham pouca experincia de amostragem agiro bem recorrendo ajuda dos que a possuem.

3. Amostragem aleatria simples.


Nas ilustraes usadas na seo 2, (tabela 1 e 3) admitimos que cada possvel combinao de dois (ou quatro) elementos tinha igual probabilidade de ser escolhida. Um procedimento de amostragem para o qual seja vlida essa condio se diz amostragem aleatria simples. Em geral, um procedimento de amostragem aleatria simples de n ele mentos aqule para o qual tda possvel combinao de elementos da populao tenha uma probabilidade de ocorrn cia igual, probabilidade essa que maior do que zero. Seguese dessa definio, que numa amostragem aleatria simples cada elemento da populao tem alguma e igual possibilidade de ser escolhido. A amostragem aleatria simples , em certo sentido, o tema bsico de tda amostragem cientfica. Todos os outros mtodos de amostragem cientfica so variaes sbre sse tema variaes planejadas, principalmente, para aumentar a eficcia da amostragem (i. ., reduzir custo e/ou erros). A compreenso de qualquer dessas variaes mais refinadas pressupe a compreenso da amostragem alea tria simples. Se os pesquisadores sociais chegassem a saber como escolher e utilizar amostras aleatrias simples, muitos especialistas em amostragem julgariam completo o grande trabalho de educao dos pesquisadores sociais em matria de amostragem.

P LA N .

DA

PESQ.

PRTICA:

A M OST RAG EM

125

Nos exemplos usados acima (tabelas 1 e 3), observouse que amostras aleatrias simples podem quando combi nadas com adequados procedimentos de avaliao forne cer estimativas precisas. Um grande nmero de procedi mentos de avaliao pode ser combinado com amostragem aleatria simples para fornecer estimativas precisas de uma grande variedade de caractersticas da populao. Alguns dsses procedimentos sero apresentados no captulo viii. E, como indicado acima, a ausncia de desvio pode ser matemticamente demonstrada. A amostragem aleatria simples goza de importante propriedade relativa variabilidade: decresce a variabilidade das estimativas obtidas a partir de tais amostras, na medida em que a extenso da amostra aumenta. Essa propriedade pode ser ilustrada voltando ao exemplo da populao minia tura e comparando as estimativas obtidas com base em amos tras de vrias extenses. Tdas as amostras possiveis e as estimativas correspondentes aparecem indicadas na tabela 5. Cada estimativa que difere da mdia verdadeira da popu lao (6 anos) por no mais do que uma unidade (ano) est marcada com um asterisco ( *). Na parte inferior de cada coluna das mdias de amostra dada a porcentagem das mdias da coluna marcada com um asterisco. * Na medida em que a extenso da amostra cresce, cresce tam bm a porcentagem das estimativas que se desviam por no mais do que uma unidade, da mdia da populao.

3.1 Nmeros aleatrios.


Como pode ser escolhida uma amostra aleatria sim ples? Por um momento, demos rdeas nossa imaginao. Suponhamos que todos os elementos de uma populao este jam colocados em uma urna e completamente misturados; ento, retiramos um dles. Identificamos a pessoa, fazemos as observaes necessrias, recolocamo-la na urna e repe timos a operao. Torna-se aparente, ento, que a proba bilidade de escolher qualquer dos elementos igual pro babilidade de escolher outro. Isto , se ns misturssemos

* Esta no medida comum de variabilidade. Empregada aq em virtude de1 sua simplicidade, para fins de exposio.

126

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

abela

AM OSTRAS POSSVEIS D E UM, DOIS, TRS, Q U A T R O E C IN C O ELEM ENTOS D A POPU LAO: 2, 3, 4, 6, 9 E 12

4 Am rtPira 2, 3, 4, 6 2, 3, 4, 9 2, 3, 4, 12 2, 3, 6, 9 2, 3, 6, 12 2, 3, 9, 12 2, 4, 6, 9 2, 4, 6,12 2, 4, 9, 12 2, 6, 9, 12 3, 4, 6, 9 3,4,6,12 3, 4, 9, 12 3, 6, 9, 12 4, 6, 9, 12 Mdia 3.8 4.5 5.2* 5.0* 5.8* 6.5* 5.2* 6.0* 6.8* 7.2 5.5* 6.2* 7.0* 7.5 7.8

5 Amostra 2,3,4, 6,9 2, 3, 4, 6, 12 2, 3, 4, 9, 12 2, 3, 6, 9, 12 2,4, 6, 9, 12 3, 4, 6, 9, 12 Mdia 4.8 5.4 6.0* 6.4* 6.6* 6.8* ,

ostra Mdia Aniosfrn Mdia Am 2 3 4 6 9 12 2 3 4 6* 9 12 2,3 2, 4 2,6 2, 9 2, 12 3, 4 3, 6 3, 9 3, 12 4, 6 4,9 4, 12 6, 9 6, 12 9, 12 2.5 3.0 4.0 5.5* 7.0* 3.5 4.5 6.0* 7.5 5.0* 6.5* 8.0 7.5 9,0 10.5

Amostra Mdia 2,3,4 2, 3, 6 2,3,9 2, 3, 12 2, 4, 6 2,4,9 2, 4, 12 2,6,9 2, 6, 12 2,9, 12 3, 4, 6 3,4,9 3,4, 12 3, 6,9 3, 6, 12 3,9, 12 4, 6, 9 4, 6, 12 4, 9, 12 6, 9, 12 3.0 3.7 4.7 5.3* 4.0 5.0* 6.0* 5.7* 6.7* 7.7 4.3 5.7* 6.3* 6.0* 7.0* 8.0 6.3* 7.3 8.3 9.0 50% t

17%t

33%+

67%t

83%f

desvio no maior do que uma unidade (ano) da mdia da populao porcentagem das mdias de amostra que apresentam desvio no maior do que uma unidade da mdia da populao.

os elementos entre uma e outra retirada, poderamos espe rar, a longo alcance, retirar cada qual dos elementos com igual freqncia. Mas essa expectativa no ser justifica da, a menos que disponhamos de um engenhoso sistema de mistura, pois (entre outras coisas) os elementos mais pesa dos tendero a acomodar-se no fundo e nos lados da urna e no seria to comum retirar um dles quanto retirar ele mentos mais leves, que tendem a ser impelidos para cima e para o centro da urna. Se ns misturssemos bolas de pesos diferentes, por exemplo, as mais pesadas tenderiam a colocar-se no fundo e nos lados da urna devido sua

P LA N .

DA

PESQ.

PRTICA:

AM O ST RA G EM

127

maior fra centrfuga, em razo do movimento giratrio imposto urna. Conseqentemente, podemos imaginar um procedimento mais eficaz: (1) atribuir a cada elemento da populao um nmero nico (i. , dois elementos quaisquer, recebem nmeros diferentes); (2) registrar cada nmero em fichas idnticas com respeito a pso, forma, tamanho, etc.; (3) colocar as fichas numa urna e mistur-las bem; e (4) fazer com que uma pessoa retire, s cegas, uma ficha da urna. Em circunstncias tais, (quando as fichas so "idnticas e bem misturadas), a probabilidade de reti rar uma ficha qualquer a mesma que a de retirar outra. Uma vez que cada ficha representa um elemento da popu lao, teramos a mesma probabilidade para cada um. Se uma ficha, depois de retirada, fsse recolocada na urna, misturada com as outras, cada ficha teria, de nvo, a mesma probabilidade de ser escolhida. Em cada retirada, feita dsse modo, a questo se repete. sse procedimento nos daria a amostra aleatria simples. Na prtica, ns no dispomos de meios para saber se uma populao foi, ou no, bem misturada; em conseqncia, no sabemos se a seleo , ou no, perfeitamente ao acaso, ou aleatria. Para sab-lo, muito mais se precisaria conhe cer a respeito da populao do que, de ordinrio, acontece. A questo de ordem prtica resultante , pois, esta: sob que condies podemos admitir que a populao foi bem mistu rada e que o procedimento de seleo tal que cada elemento tem alguma, e a mesma oportunidade de ser escolhido que qualquer outro? Teorias matemticas nos permitem tornar explcitos os enunciados que indicam as caractersticas de observaes selecionadas ao acaso. O u seja, podemos assegurar que pro priedades as observaes teriam se dispusssemos de um procedimento perfeito de mistura e seleo. Imaginemos, ento, que projetamos um aparelho para misturar fichas, ou certa mquina para a formao de uma seqncia de nme ros. Podemos testar * o aparelho ou a mquina, cons tatando se os nmeros que nos fornecem so os que espe raramos obter por intermdio da teoria. Por exemplo, de acrdo comi a teoria, poderamos esperar obter tantos nme
* 147-66). Discusso mais pormenorizada pode ser encontrada em

(2

128

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

ros pares quantos mpares; poderamos esperar que cada algarismo ocorresse tantas vzes quanto os demais. Se os nmeros fornecidos no satisfazem sses e outros requisitos ditados pela teoria, no admitimos que seja adequado o o mtodo de mistura e seleo; se satisfazem, o mtodo pode ser aceito, pelo menos com o carter de mtodo provisrio, e os nmeros que nos fornece recebem o nome de nmeros aleatrios. Listas extensas de nmeros aleatrios tm sido prepa radas graas ao auxlio de mtodos bem complexos. Os mtodos so, de hbito, to complicados que no tem sido possvel estipular a teoria fsica de sua origem. sses nme ros costumam ser apresentados em colunas, em pginas con secutivas*, como sucede com esta lista parcial, tomada para ilustrao:
42827 41519 38273 48225 56506 29280 73184 52677 48663 22635 70203 84612 91905 65290 27841 51213 26689 23027 02427 58903 78569 30877 33891 85998 56560 96336 05928 51511 30909 53662 60281 37989 31641 11528 28947 79288 65869 87251 27370 11169 20145 58210 84041 28896 49788 88449 32256 04495 02050 42025

Podemos empregar as listas de nmeros aleatrios da seguinte maneira: cada elemento da populao associado a um nmero (um nico), de um modo qualquer. Por exemplo, um elemento pode estar associado ao nmero 72, outro ao "89, etc. . Determina-se o nmero de algarismos do maior dsses nmeros. Consultamos, a seguir, qualquer pgina dessas listas, comeando em qualquer ponto de qual quer coluna, dando ateno ao nmero de algarismos em que estamos interessados. Por exemplo, se temos 200 ele mentos numa populao, assinalamos qualquer combinao de trs colunas, ou conjuntos de trs algarismos consecutivos, ou trs linhas, etc.. Suponhamos que se utilizem os trs
* Tabelas de nmeros aleatrios encontram-se em (30) e (52). (11),

(27

P LA N .

DA

PESQ.

PRTICA:

A M OST RAG EM

12 9

ltimos algarismos em cada conjunto de cinco. medida que caminhamos de cima para baixo na coluna (comeando com 827), assinalamos todos os nmeros menores do que 201. Continuamos, at alcanar tantos nmeros quantos os itens que desejamos na amostra. A amostra consistir, ento, dos elementos da populao com nmeros correspondentes aos escolhidos. Usando, por exemplo, os nmeros acima, obteramos a seguinte seqncia:
184, 027, 169, 145, 0 4 1, 0 5 0 , 0 2 5 , ...

Isto significa que os elementos com nmeros 184, 27, 169, etc., so escolhidos para constituir a amostra,** e esta seria uma amostra aleatria simples.

3.2 Amostragem sistemtica.


Amostragem sistemtica uma variao da amostragem aleatria simples. Requer que a populao, ou uma relao de seus elementos, seja ordenada, de modo tal que cada elemento da populao possa ser univocamente identificado pela posio. De modo geral, satisfariam essa condio uma lista de membros de uma sociedade, o guia das ruas de uma cidade, um sistema de indexao por cartes, uma fila de pessoas. Comumente lidamos com uma lista de identificao dos elementos e no com a populao mesma. Qualquer sis tema simblico univocamente identificador de cada elemento da populao chamado sistema de referncia daquela popu lao. Consideremos um sistema de referncia consistindo de um sistema de indexao por cartes no qual h um, e somente um carto para cada elemento. Suponhamos que h 1000 cartes (por conseguinte, 1000 membros da populao) e que desejamos uma amostra de 100. Podemos escolher alea toriamente um nmero entre (e incluindo) 1 e 10, digamos 6. Ento podemos escolher os elementos cujos cartes esto nas posies seguintes: 6, 16, 26, 36, . . . , 986, 996. Esta seria amostra aleatria sistemtica ou, como mais comu mente chamada, amostra sistemtica.
** Os nmeros no precisam, de incio, ser consecutivos. Caso no o sejam, omitem-se os nmeros no associados da tabela de nme ros aleatrios.

130

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

De modo geral, uma seleo sistemtica pode ser mani pulada desta forma: se a populao contm N elementos e a extenso da amostra desejada n, calcula-se o valor da razo: N /n . Se essa razo no um nmero inteiro, faz-se a aproximao para o inteiro mais prximo. Seja m 0 nmero inteiro assim obtido, que chamado intervalo de amostragem. Escolha-se aleatoriamente* um nmero entre 1 em ; chame-se x sse nmero. Forme-se, afinal, amostra dos elementos identificados pelos nmeros: x, x f- m, x f- 2m, . .. , x + ( n 1) m. claro que, se N /n um inteiro, ste procedimento tal que cada indivduo tem possibilidade igual de ser esco lhido.** Por exemplo, se desejamos amostra de cinco em vinte e cinco cartes, N /n = 25/5 = 5. Agora importa esco lher um nmero de 1 a 5 , aleatoriamente. Selecionado sse nmero, podemos especificar o resto da amostra. H, ento, cinco amostras possveis de ser colhidas, cada qual com a mesma probabilidade:
(1 ) (2 ) (3 ) (4 ) (5 ) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 22 23 24 25

Cada elemento aparece em uma e somente uma dessas amos tras possveis e, de vez que as amostras tm igual probabibilidade de ser selecionadas, o mesmo acontece com os elementos. Uma vantagem dsse procedimento que pode ser usado para assegurar que amostras sejam representativas ou pr ximas disso, com respeito a uma propriedade relevante. Imaginemos, por exemplo, desejar determinar o pso mdio de um grupo de estudantes. Suponhamos, alm disso, saber que pso e sexo esto relacionados. Gostaramos de esco

* Somente dsse modo que a probabilidade de selecionar cad nmero entre' 1 e m ser a mesma. ** Se N /n no fr um inteiro, isto no ser verdade, a menos que a extenso da amostra possa variar.

PLAN .

DA

PESQ.

PRTICA:

AM O ST RA G EM

131

lher amostra representativa com respeito ao sexo. Podemos consegui-lo com uma relao em que homens e mulheres sejam agrupados. Por exemplo, suponhamos que a popu lao de 25 e contm 10 mulheres relacionadas em pri meiro lugar (de 1 a 10^. Os 15 homens seriam, ento, relacionados de 11 a 25. Cada amostra possvel de 5 ele mentos conteria dois quintos de mulheres e trs quintos de homens, propores iguais s que se encontram na populao como um todo. A representao proporcional relativa a uma propriedade relevante tende a reduzir a variabilidade das estimativas. A reduo ou o aumento da variabilidade das estima tivas fornecidas pela amostragem sistemtica depende da maneira como a populao ordenada.* Pode ser dispen dioso ordenar a populao de maneira a reduzir a variabili dade das estimativas. Muito freqentemente pode-se dispor de relaes ordenadas com base numa propriedade que, sabi da ou presumidamente, no se correlaciona com a caracte rstica a ser investigada. Por exemplo, a lista de nomes pode ser ordenada alfabticamente e essa ordem pode no estar correlacionada com a caracterstica em exame, digamos, a renda. Assim, a populao pode se presumir "inteiramente misturada com relao renda. Nessas condies, uma amostra sistemtica forneceria resultado equivalente ao de uma amostra aleatria simples. Se a populao no est inteiramente misturada com respeito caracterstica em estudo, a variabilidade das esti mativas ser afetada. sse fato se ilustra recorrendo populao miniatura. Suponhamos que essa populao seja ordenada de maneira que as idades se sucedam na seguinte ordem: 2, 3, 4, 6, 9, 12. Suponhamos, agora, dese jar obter amostra de trs, por seleo sistemtica. As duas amostras possveis so (a) 2, 4, 9 (com mdia de 5 anos) e (b) 3, 6, 12 (com mdia de 7 anos). Ambas (e con seqentemente 100 por cento) dessas amostras desviam-se da mdia da populao (6 anos) por no mais do que um ano. Uma comparao entre ste resultado e o obtido com amostragem aleatria simples para amostras da mesma exten

* Falando estritamente, depende do que se chama "correlao e srie na ordenao pertinente.

132

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

so (Ver tabela 5, onde apenas 50 por cento das mdias de amostra apresentam desvio de no mais do que um ano) mostra que a variabilidade foi reduzida. Suponhamos, con tudo, que a populao esteja ordenada da seguinte maneira: 2, 6, 3, 9, 4 e 12. As duas possveis amostras sistemticas so, neste caso, (a) 2, 3, 4 (com mdia de 3 anos) e ( b ) 6, 9 e 12 (com mdia de 9 anos). Nenhuma (e conse qentemente zero por cento) dessas mdias desvia-se da mdia da populao por um ano ou menos. Nesse caso, portanto, a variabilidade foi aumentada em relao quela fornecida por amostragem aleatria simples. Note-se, entretanto, que em nenhum dos casos de amos tragem sistemtica as estimativas so precisas. Para discusso detalhada da amostragem sistemtica, veja-se (31) e (32). Procedimentos de seleo sistemtica, diversos dos estudados aqui, so examinados em (41:266-70).

4. Variaes da amostragem aleatria simples e da amos tragem sistemtica.


Em algumas situaes, no prtico recorrer nem s amostras aleatrias simples nem s amostras sistemticas. A dificuldade pode surgir do fato de que no haja meio pr tico de obter completa relao dos membros da populao. A amostragem aleatria simples, que no requer informaes concernentes s caractersticas dos elementos da populao, pode conduzir o pesquisador a ignorar tais informaes, ainda quando disponveis e relevantes. Em casos tais, freqentemente desejvel dividir (ou fazer uso de divises existentes) a populao em subgrupos ou classes, utilizando essas divises no decorrer do projeto de amostragem. Suponhamos, por exemplo, ter uma populao de dezes seis elementos. Podem les ser divididos em quatro grupos de quatro elementos cada um (ver fig. 5). Cada elemento da populao pode ser identificado pela combinao de dois nmeros: o nmero do grupo ou e o nmero do quadrado (1, 2, 3 ou 4). Pode, agra, a amostra dessa populao ser escolhida em dois estgios: (1) selecionan do um ou mais nmeros de grupo e (2) selecionando um ou mais nmeros dos quadrados daqueles grupos escolhidos no primeiro estgio. No primeiro e segundo estgios pode-se

(I, II, III

IV)

PLAN .

DA

PESQ.

PRTICA:

AM OS T RAG EM

13 3

I 1 3 1 3 III Fig. 5 2 4 2 4

II

! 1 ! 2 i 3 4
1 2 4 IV 3

Diviso de uma populao de 16 elementos em 4 classes de igual extenso

levar a efeito uma contagem completa (i. , escolhem-se todos os nmeros possveis), ou recorrer amostragem aletria simples, ou amostragem sistemtica. Se realizada conta gem completa em cada estgio, torna-se bvio que se fz completa contagem da populao. H trs meios possveis de selecionar, em dois estgios, amostra desta populao subdivida (Ver tabela 6).
T 6

abela

TIPOS

D E A M O ST RA DE

D O IS ESTGIOS

Primeiro estgio (seleo de grupos)

Segundo estgio (sei. de elementos)

Nome do plano de amostragem Amostragem aleatria em dois estgios Amostra estratificada Amostragem agregada

Amostra *

Amostra *

Contagem completa Amostra *

Amostra * Contagem completa

Amostragem aleatria simples ou variao dela.

Qualquer plano de amostragem que envolva mais de um estgio um plano de amostragem de mltiplo estgio. Pode existir, naturalmente, qualquer nmero de estgios de

134

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

amostragem; quanto maior o nmero dsses estgios, maior nmero de amostras. Em geral, se a populao ou qualquer de seus subgrupos dividida em classes exclusivas e exaustivas, e de cada classe se retira uma amostra, esta amostra diz-se estratifi cada. Se o ltimo estgio de qualquer nmero de estgios envolve uma contagem completa, o procedimento de amostragem agregada. Finalmente, em amostragem que envolva mais de dois estgios, podem ser combinadas a amostragem estratificada e a agregada, tendo-se a amostra agregada estratificada. Se a amostragem aletria simples ou uma de suas varia es empregada em amostragem de um estgio, ou se qualquer dsses procedimentos, ou contagens completas, so usados em cada estgio de um procedimento de mltiplos estgios, a amostra resultante chamada amostra de pro babilidade, ou aleatria. Em tais amostragens, a probabili dade de escolher qualquer elemento da populao pode ser calculada e, em conseqncia, os erros podem ser medidos. As amostras relativamente s quais essa probabilidade no pode ser calculada, ficando a critrio pessoal, so chamadas amostras de apreciao. Examinaremos vrios tipos de amos tras de apreciao depois de trmos considerado os tipos comuns e a possibilidade de combinaes de contagens com pletas e de amostras de probabilidade. 4.1 Grupos e subgrupos da populao.

A populao consiste de um conjunto de elementos, alguns dos quais pretendemos observar. sses elementos so chamados unidades ltimas, ou elementares, da popula o. (A populao tambm, algumas vzes, chamada universo). Na amostragem em dois estgios, as unidades ltimas devem ser agrupadas de maneira tal que cada uma e tdas figurem em um e apenas um dsses grupos ou uni dades de amostragem. Uma unidade de amostragem pode ter qualquer nmero de ltimas unidades, inclusive nenhuma; mas reunidas, as unidades de amostragem devem esgotar a populao. As unidades de amostragem podem ser defini das em trtnos de qualquer propriedade ou propriedades que permitam atribuir a cada unidade colocao numa e apenas

P LA N .

DA

PESQ.

PRTICA:

AM OSTRAG EM

135

uma dessas unidades. Por exemplo, as unidades ltimas podem ser agrupadas por idade, sexo, local de residncia, ocupao, renda, local de nascimento, estado civil e inmeras outras propriedades. Se fazemos a amostragem em trs estgios, as unidades ltimas em cada unidade de amostragem podem ser subagrupadas duas vzes. Os grupos mais amplos so chama dos unidades de amostragem primria; os subgrupos so chamados unidades de amostragem secundria. Se h mais de dois estgios, cada unidade ltima deve estar em condi es de ser colocada em uma e apenas uma unidade de amostragem, em cada estgio. Portanto, cada unidade lti ma deve ser includa em (n-1) unidades de amostragem, onde n representa o nmero de estgios de amostragem. Suponhamos desejar amostragem dos empregados de uma emprsa que mantm duas fbricas. A fbrica A e a fbrica B podem ser consideradas como unidades de amos tragem primria. Podemos, depois, dividir os empregados de cada fbrica de acrdo com as seces; estas seriam as unidades de amostragem secundria. No h restries quanto ao nmero possvel de unidades de amostragem pri mria ou secuidria, exceto as que dizem respeito conve nincia e eficcia. Razes de convenincia, eficcia e custo, resultaram em uso crescente de unidades de amostragem geogrficamente definidas (e. g., quarteires, bairros, distritos, municpios, etc.). Ao longo de nossa discusso, teremos em conta algumas das vantagens dessa diviso geogrfica, par ticularmente quando se trata de levantamento de opinies. Seja qual fr a propriedade que sirva de base para agru par ou classificar a populao, deve ela ser definida opera cionalmente no sentido apontado no ltimo captulo. Isto , a definio das unidades de amostragem deve oferecer diretivas operacionais que tornem possvel a colocao precisa e nica de cada unidade ltima na unidade de amostragem adequada. A amostragem de probabilidade pressupe esta colocao; sem ela, as estimativas fornecidas por tais amos tras podem ser grosseiramente errneas. A propriedade em que se apoia o sub-agrupamento da populao pode ter ou no ter relao com a propriedade ou propriedades em estudo. Suponhamos, por exemplo, que nos dispomos a observar as atitudes polticas dos elementos de

136

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

uma populao. Se classificssemos os elementos da popu lao pela renda, estaramos esperando correlao entre a renda e as atitudes polticas. Por outro lado, se agrups semos os elementos da populao pelo ms dos respectivos nascimentos, no estaramos esperando correlao entre a renda e o ms de nascimento. Veremos que na amostragem estratificada particularmente vantajoso usar classificaes baseadas em propriedades que se correlacionam com as in vestigadas.

4.2 Amostragem com probabilidades variveis.


H um importante tipo de amostragem aleatria que pode e deve ser aplicado na seleo por mltiplo estgio, quando duas condies se apresentam: (1) a propriedade investigada correlaciona-se com alguma funo da extenso da populao e (2) a extenso de cada unidade de amostra gem conhecida. A primeira condio requer esclarecimento. Suponhamos desejar investigar a renda total de certa popula o. Em geral, espera-se que a renda total de uma populao cresa com o crescimento da populao; assim, a renda total da populao correlaciona-se com o seu tamanho. Isto ser verdadeiro, em geral, para qualquer caracterstica da popu lao que seja igual ou proporcional soma de propriedades dos elementos da mesma populao. Se tratamos com uma propriedade correlacionada com alguma funo do tamanho da populao, desejvel estabelecer um procedimento de amostragem tal que a probabilidade de selecionar qualquer unidade de amostragem seja associada quela funo da extenso. Em outras palavras, devemos estabelecer o proce dimento de amostragem de modo a ter maior possibilidade de selecionar uma unidade de amostragem ampla e no uma pequena. sse procedimento tende a reduzir a variabili dade de estimativas de caractersticas da populao que es tejam correlacionadas com a extenso dessa populao (ver [19]). Suponhamos desejar estimar a renda total de todos os elementos de todas as sees da American Legion de certa cidade. Podemos obter listas dos membros de cada seo, determinando, assim, o nmero de membros de cada uma. Para propsitos ilustrativos, admitamos alguns nmeros con

P LA N .

DA

PESQ.

PRTICA:

AM OSTRAG EM

137

venientes. Admitamos que quatro sees tenham 100, 200, 300 e 400 associados, respectivamente. Suponhamos estar interessados em amostragem de duas sees apenas. Pode ramos selecionar dois nmeros quaisquer entre 1 e 4, mas tal seleo no permitiria adequao entre probabilidade e extenso. Queremos que a probabilidade de selecionar o primeiro grupo seja igual a
Extenso da classe 100

--------------- = -----------------= --- - :


Extenso da populao 100 + 200 + 300 + 400 10

0.10

De maneira anloga, a probabilidade de selecionar o segun do, terceiro e quarto grupo ser de 0.20, 0,30 e 0.40, res pectivamente. Isso pode ser feito usando-se uma tabela de nmeros aleatrios como segue: se retiramos um nmero de 1 a 100, o primeiro grupo entra na amostra; se tiramos um nmero entre 101 e 300, o segundo grupo entra na amostra; se tiramos um nmero entre 301 e 600, o terceiro grupo entra na amostra; se tirarmos um nmero entre 601 e 1000, o quarto grupo entra na amostra. Tal procedimento for necer a desejada probabilidade de escolher cada grupo. O mtodo pode ser facilmente generalizado para cobrir qual quer nmero de grupos e quaisquer probabilidades. A probabilidade de escolher uma unidade de amonstragem pode ser adequadamente relacionada a outras proprie dades da unidade de amostragem. A propriedade ideal da unidade de amostragem, para sse propsito, a de disper so ou difuso dos valores da caracterstica em exame, dentro da unidade de amostragem. Isto , h vantagem em au mentar as possibilidades de seleo daqueles grupos cujos membros difiram muito entre si. As razes disso so de ordem tcnica, no havendo porque consider-las aqui (ver [17] e [19]). O que nos interessa que, se conhecemos muito acrca das propriedades das unidades de amostragem, essa informa o pode ser de grande eficcia para selecionar a amostra aleatria. O rro de tal amostragem pode ser considervelmente reduzido usando o que aprendemos a propsito de unidades de amostragem. particularmente desejvel, em tais casos, consultar um especialista em amostragem.

138

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

5. Amostragem aleatria de mltiplo estgio.


A amostragem aleatria de mltiplo estgio envolve o uso de um tipo de amostragem aleatria em cada um de seus estgios. Consideremos o caso em que so utilizadas a amostragem simples, a aleatria, e a amostragem aleatria sistemtica. Suponhamos desejar uma amostra da popula o de professores pblicos, em certa cidade. O Ministrio da Educao fornece-nos uma lista mimeografada de nomes. A lista consiste de, digamos, 100 pginas, com aproximada mente 20 nomes por pgina. As pginas so numeradas e constituem as unidades de amostragem. Os nomes no so numerados, mas ordenados alfabticamente; les consti tuem as unidades ltimas da amostragem. Suponhamos desejar uma amostra de 50 professores. A amostra poderia ser selecionada da maneira seguinte: poderamos decidir escolher 5 professores de cada 10 pginas. Escolhe-se um nmero qualquer, entre 1 e 10, digamos 8. Escolhem-se as pginas 8, 18, 28, 38, 48, 58, 68, 78, 88, 98,. Em cada qual dessas pginas escreve-se um nmero diante de cada nome relacionado. Ento, usando uma tabela de nmeros aleat rios, selecionam-se 5 nomes de cada uma das dez pginas. sse procedimento corresponde a uma combinao de amos tragem aleatria sistemtica e simples. Poderamos, natural mente, inverter o procedimento, e retirar uma amostra aleat ria simples das pginas e uma amostra sistemtica dos nomes nas pginas escolhidas. Em resumo, podemos usar qualquer combinao de amostragem aleatria simples e sistemtica. A variabilidade de estimativas fornecidas por amostra gem aleatria de mltiplo estgio pode ser maior do que a das estimativas fornecidas por amostragem aleatria simples, para uma amostra de igual extenso. Isso pode ser demons trado voltando-se populao miniatura. Suponhamos que essa populao esteja dividida em trs unidades de amos tragem primria: (a) 2, 12; (b) 3, 9; (c) 4, 6. Conside remos amostras de dois elementos retiradas de duas unidades de amostragem primria. o que se mostra na tabela 7 Note-se que apenas 17 por cento das estimativas se desviam por no mais do que um ano da mdia da popula o, enquanto que, no caso de amostragem aleatria sim ples, o nmero correspondente era 33 por cento (Ver ta bela 5).

P LA N .

DA

PESQ.

PRTICA:

AM OSTRAG EM

139

abela

POSSVEIS AM O STRA S ALEATRIAS DE D O IS ESTGIOS D E D O IS ELEM ENTO S DE DUAS O U TRS U N ID A D E S DE A M O ST RA G EM PRIM RIA: 2, 12; 3, 9; E 4, 6.

Amostra 2, 3 2, V 2, 4 2, 6 12, 3 12, 9

M dia da amostra 2.5 5.5* 3.0 4.0 1.5 10.5

Amostra 12, 12, 3, 3, 9, 9, 4 6 4 6 4 6

Mdia da amostra 8.0 9.0 3.5 4.5 6.5* / .o

n%t

* **

Desvia-se por no mais do que uma unidade (ano) da mdia da populao. Porcentagem das mdias de amostra que no se desviam por mais de uma unidade da mdia da populao.

A variabilidade das estimativas obtidas a partir de amos tragem aleatria de mltiplo estgio depende da composio das unidades de amostragem primria. Veja-se, por exem plo, a tabela 8, onde os resultados so obtidos para uma subdiviso diferente da mesma populao "miniatura, usan do-se o mesmo procedimento utilizado para obter os resulta dos que aparecem na tabela 7. Os resultados obtidos na tabela 8 no so mais variveis do que os obtidos por amos tragem aleatria simples. A variabilidade obtida por amos tragem aleatria de mltiplo estgio nunca pode ser menor do que a obtida por amostragem aleatria simples, no caso de amostras de igual extenso, mas pode ser maior. Para procedimentos de avaliao que fornecem estimativas preci sas, quando combinados com amostragem aleatria de mlti plo estgio, ver (8: v). Note-se, tambm, que o procedi mento usado nas tabelas 7 e 8 exato. Uma vantagem da amostragem aleatria de mltiplo est gio reside no fato de que no se requer lista completa da populao. Imaginemos, por exemplo, que selecionamos, no primeiro estgio do procedimento, duas das quatro unidades

140

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

primrias de amostragem. Listas de unidades ltimas so mente sero necessrias para as duas unidades primrias que foram selecionadas.

abela

POSSVEIS A M O STRA S A LEAT RIA S DE D O IS ESTGIOS DE D O IS ELEM ENTO S D E DUAS O U TRS U N ID A D E S DE A M O ST RA G EM PRIM RIA: 2, 3; 3, 9; E 9, 12.
Mdia ' S da amostrage 3.0 4.0 5.5* 7.0* 3.5 4.5 Mdia Srda ainostrae 6.0* /. 6.5* 8.0 7.5 9:0 33%t

Amostra 2, 2, 2, 2, 3, 3, 4 6 9 12 4 6

Amostra 3, 9 3, 12 4, 9 4, 12 6, 9 6, 12

* Ver tabela 7. t Ver tabela 7.

Quando se tem em vista reduzir ao mnimo a variabili dade das estimativas, desejvel obter a amostra de tdas as unidades de amostragem. Na prtica, porm, o custo do preparo das listas aumenta quando cresce o nmero de uni dades de amostragem, de modo que alguma limitao se impe. Se as unidades de amostragem so geogrficamente definidas, ento, medida que aumenta o nmero de uni dades, maior mobilidade exigida, notando-se que, por esta rem dispersas as unidades, menor ser o nmero de obser vaes em cada local. A disperso das unidades respon svel, ainda, por dificuldades de superviso e controle operacional. Ao projetar-se, ento, a amostragem aleatria de mltiplo estgio, o problema o de balancear o custo esperado dos erros de amostragem e dos outros erros resul tantes do emprgo do processo, comparando-o com o custo de operao de todo o processo. sse problema pode ser melhor compreendido quando se examina o custo de operao da amostragem aleatria de mltiplo estgio. Seja:

P LA N .

DA

PESQ.

PRTICA:

A M OST RAG EM

141

m = nmero de unidades de amostragem selecio nadas rij = nmero de elementos selecionados da j-sima unidade de amostragem Ci = custo geral de preparao e obteno de amos tra a partir de uma unidade de amostragem co = custo adicional para obteno de uma obser vao de um elemento C = custo total da operao Assim, o custo total de operao do procedimento pode ser expresso da maneira seguinte: C = Cim { -C o (n! f- no . . . f~ nm) Decorre dessa equao que o custo de obteno da amostra aumenta medida que aumenta o nmero de uni dades de amostragem selecionadas (m) e o nmero de ele mentos selecionados a partir das unidades de amostragem (nj). verdade, tambm, no obstante, que aumentando m e nj, o rro decresce. O problema de planejamento de amostra aleatria de mltiplo estgio , ento, o de obter um balanceamento timo entre os custos de operao e de rro. Os mtodos para reduo do custo de obteno de amos tra, com rro prefixado ou para reduo do rro, face a um custo prefixado, constituem objeto de discusso em (8:v).

6. Amostragem estratificada.
Na amostragem estratificada, seleciona-se uma amostra de cada subgrupo da populao em pelo menos um dos es tgios do procedimento. A base para delimitar os subgru pos ou strata pode ser encontrada em uma ou em vrias pro priedades. Podemos ter dois strata simples tais como ho mem e mulher, ou grande nmero dles, tal como idade no ltimo aniversrio. Se mais de uma propriedade usada para definir os strata, faz-se necessrio uma matriz de classificao. Por exemplo, se combinamos autctone e aliengena com homem e mulher, resultam quatro

142

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

strata: homem-autctone, mulher-autctone, homem-aliengena e mulher-aliengena. As propriedades usadas como base da estratificao podem estar ou no estar correlacionadas com a caracters tica da populao que se investiga. Teoricamente, h van tagem em existir essa correlao. Considere-se, por exem plo, o caso em que a populao de trabalhadores especiali zados dividida em dois grupos, homens e mulheres. Supo nhamos desejar determinar que certa porcentagem dessa po pulao exerce uma, de um conjunto de profisses. claro que o sexo influncia a escolha da profisso. Admitamos, ainda, conhecer a porcentagem da populao total que cons tituda por homens e a que constituda por mulheres. Po demos, ento, selecionar, de cada grupo, uma amostra aleat ria que seja proporcional em extenso aos subgrupos de homens e mulheres. sse procedimento trar a garantia de que a amostra representativa com respeito ao sexo. Por exemplo, se 70 por cento da populao total constituda por homens e 30 por cento por mulheres e se 70 por cento da amostra de homens e 30 por cento de mulheres, estamos certos de que a amostra representa a distribuio do sexo na populao. Tal amostra chamada amostra estratificada proporcional.

6.1 Amostragem estratificada proporcional.


Se podemos dividir uma populao de acrdo com diver sas propriedades relevantes, podemos estratific-la de acr do com cada uma delas. Quanto maior a porcentagem das propriedades relevantes com respeito s quais podemos es tratificar e a partir das quais podemos colhr amostras pro porcionais, menor o rro a esperar. H uma dificuldade prtica para colhr de cada stratum uma amostra proporcional sua extenso. Para recorrer a ste mtodo, devemos conhecer a proporo da populao pertencente a cada stratum. Casos haver em que no dis poremos dessa informao. Mesmo, porm, que disponha mos, ela pode ser desatualizada e, portanto, no mais apli cvel. Algumas caractersticas da populao alteram-se muito rpidamente; por exemplo, a renda. Se baseamos uma amostra estratificada proporcional em porpores errneas, a variabilidade das estimativas maior do que seria, se uti-

P LA N .

DA

PESQ.

PRTICA:

AM OSTRAG EM

143

lizssemos propores corretas. Por sse motivo, devemos ter cautela quanto s propriedades em que apoiarmos a clas sificao, e quanto aos dados relativos sua distribuio na populao. Pode requerer considervel tempo, esforo e dinheiro, estratificar uma populao de maneiras diversas daquelas em que j a encontramos estratificada. Conseqentemente, a "estratificao extensiva adicional, alm de introduzir alguns critrios bvios fcilmente acessveis, dificilmente resultar em aumento substancial de preciso das estimativas das ca ractersticas gerais da populao, tais como distribuies em idade, sexo e outras classes (21:664). A amostragem estratificada habilita o pesquisador a es tabelecer comparao entre as propriedades dos strata, assim como a avaliar as caractersticas da populao. Os obje tivos da pesquisa freqentemente so tais que uma compa rao entre as propriedades dos subgrupos da populao essencial ou, pelo menos, vantajosa. Por exemplo, pode mos pretender determinar no apenas o Q I mdio dos estu dantes de uma universidade, mas tambm, comparar a mdia dos Q I das vrias faculdades da universidade. Por estima o podem ser obtidas estimativas separadas para cada faculdade, assim como uma estimativa para a populao total (ver 49). Independentemente da natureza dos strata, , de modo geral, conveniente e econmico retirar amostra de strata bem definidos e para os quais se disponha de listas de identifi cao, especialmente se a populao no est dispersa e os custos de viagem no so elevados. O custo de preparao e obteno de amostra estrati ficada (C ) inclui o custo de preparao da amostra (ci) e o custo de uma observao (co) e depende do nmero de observaes por stratum (%) e do nmero de strata (m). AsSim, C = C xj- C 2 (nt )- n2 j- . . . + nm). Se h disponvel uma lista estratificada da populao, o custo Ci diminudo. Preparar uma nova lista pode ser. entretanto, desejvel, desde que o custo adicional esteja su jeito a ser mais do que compensado pela reduo do custo

144

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

do rro. De qualquer forma, possvel combinar o conhe cimento da populao com a anlise de custo para estabelecer um procedimento de estratificao timo.
Para verificar como a estratificao pode afetar a varia bilidade de estimativa, voltemos populao "miniatura. Com propsito de ilustrao, suponhamos que a populao esteja dividida em dois strata: (2,3) e (4, 6, 9, 12). Limite mos nossa ateno s amostras de trs elementos que podem ser obtidas combinando escolhas aleatrias de cada stratum. Retiramos arbitrriamente um ou dois elementos de cada stratum, de modo a obter um total de trs elementos. sse procedimento estratificado, mas no um procedimento de amostragem estratificada proporcional (i. , amostragem estratificada no proporcional). As amostras possveis, ao mesmo tempo que as mdias de amostra, aparecem na ta bela 9.
T abela 9

POSSVEIS AM O STRA S ESTRATIFICADAS D E TRS E LEM EN T O S D O S STRATA: (2 3) E (4, 6, 9, 12).

Amostra 2, 3, 4 2, 3, 6 2, 3 ,9 2 ,3 , 12 2 ,4, 6 2, 4, 9 2, 4, 12 2, 6 ,9

Mdia estimada t 3.5 4 .8 6.8* 8.8 4.0 5.0* 6.0* 5.7*

Amostra 2, 6, 12 2, 9, 12 3 ,4 ,6 3 ,4 ,9 3 ,4 , 12 3 ,6 ,9 3, 6, 12 3, 9,12

Mdia estimada t 6.7* 7.7 4.3 5.3* 6.3* 6.0* 7.0* 8 .0

* Desvia-se por no mais do que uma unidade (ano) da mdia da populao. t A mdia da amostra no pode ser utilizada para obteT uma estimativa precisa da mdia da populao em amostragem estratificada no proporcionada. Uma estimativa precisa pode ser conseguida tomando-se a mdia da amostra de cada stratum, multiplicando-a pela extenso do stratum e dividindo a soma dsses valores pe-la extenso da populao. Por exemplo, na primeira amostra relacionada (2, 3, 4), a estimativa assim calculada:

PLAN .

DA

PESQ.

PRTICA :

AM O ST RA G EM

145

Podemos observar que 9 em 16, ou 56 por cento, das estimativas desviam-se por no mais do que um ano da mdia da populao. Comparando sse resultado com as amos tras aleatrias simples de trs elementos da mesma popula o (tabela 5), verificamos que, em amostragem aleatria simples, apenas 50 por cento da mdia das amostras situa-se a menos de um ano da mdia da populao. H, portanto, menos variabilidade no procedimento de amostragem estra tificada do que na amostragem aleatria simples, relativa mente a amostras da mesma extenso. Resultado semelhan te seria encontrado para outros procedimentos de estratifica o, embora no para todos, como veremos. Para verificar o efeito da seleo proporcionada sbre a variabilidade da amostragem, recorramos aos mesmos strata e extenso de amostra utilizados na tabela 9. Mas agora, desde que o stratum (2, 3) contm 2/6 ou 1/3 da populao, escolheremos apenas 1/3 de 3, ou 1 elemento dste stratum, e 2/3 de 3, ou 2 elementos do segundo stratum. As amos tras possveis e as estimativas (que so mdias de amostras) aparecem na tabela 10.
T abela 10

POSSVEIS A M O STRA S EST RAT IFICADAS P R O P O R C IO N A IS D E TRS E LEM EN T O S D O S STRATA: (2, 3) E (4, 6, 9, 12)

Amostra 2,4,6 2, 4, 9 2, 4, 12 2, 6,9 2, 6, 12 2, 9, 12

Mdia estimada 4.0 5.0* 6.0* 5.7* 6.7* 7.7

Amostra 3,4,6 3, 4, 9 3, 4, 12 3, 6, 9 3, 6, 12 3, 9, 12

Mdia estimada 4.3 5.3* 6.3* 6.0* 7.0* 8.0

* Desvia-se por n5o mais do que uma unidade (ano) da m da populao.

Na tabela 10, 8 em 12, ou 67 por cento das mdias de amostra desviam-se por no mais do que um ano da mdia da populao. Comparando sse resultado com os obtidos nas tabelas 5 e 9, nota-se que a variabilidade dos resultados da amostragem estratificada proporcional menor do que

146

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

a da amostragem aleatria simples ou da estratificada no proporcional. Apenas 50 por cento das amostras aleatrias simples de trs elementos e 56 por cento das amostras estra tificadas no proporcionais situavam-se dentro do limite de um ano. Dividamos, agora, a populao em diferentes strata da mesma extenso (2, 12) e (3, 4, 6, 9) e escolhamos outra vez uma amostra estratificada proporcional de trs ele mentos. As amostras possveis e as mdias estimadas apa recem na tabela 11
T abela 11

A M O STRA S ESTRATIFICADAS P R O P O R C IO N A IS D E TRS ELEM EN TO S D O S STRATA: (2, 12) E (3, 4, 6, 9)


Mdia estimada 6.3* 7.0* 8.0 7.3 8.3 9.0

Am ostra 2,3,4 2, 3, 6 2, 3, 9 2, 4, 6 2,4,9 2, 6, 9

Mdia estimada 3.0 3.7 4.7 4.0 5.0* 5.7* 1

Amnstra 12, 3, 4 12, 3, 6 12,3, 9 12, 4, 6 12, 4,9 12, 6, 9

* Desvia-se por no mais do que uma unidade (ano) da md da populao.

Observa-se que, quatro em doze, ou apenas 33 por cento das mdias da amostra, situam-se dentro do limite de um ano. Aqui, a variabilidade , portanto, maior do que nas tabelas 5, 9 e 10. Isto evidencia que a amostragem estra tificada proporcional no necessriamente melhor, com respeito variabilidade, do que os mtodos anteriormente considerados. A diferena entre os dois exemplos de amos tragem estratificada proporcional importante. Demonstra o fato de que a variabilidade de resultados obtidos por sse procedimento depende do grau de homogeneidade dos stra ta. Isto , quanto mais amplamente dispersos esto os valo res no stratum, maior o rro de amostragem: e, reciproca mente, reduzida a disperso, reduz-se a variabilidade. Nas ilustraes, por exemplo, o uso do stratum (2, 3) produziu resultados menos variveis do que os fornecidos pelo stratum (2, 12). O primeiro mais homogneo do que o ltimo.

P LA N .

DA

PESQ.

PRTICA:

A M OST RAG EM

147

De vez que os resultados que figuram na tabela 11 so ainda mais variveis do que os fornecidos por amostras aleatrias simples da mesma extenso (tabela 5), faz-se claro tambm que, embora a amostragem estratificada proporcionada pos sa apresentar menor variabilidade do que a amostragem aleatria simples, isso no acontece de forma necessria. Sempre que possvel, portanto, a estratificao deve ser pla nejada de maneira a fornecer os strata mais homogneos.

6.1 Distribuio tima.


A quantidade de elementos de amostra retirada de um stratum pode ser tornada proporcional a propriedades do stratum, outras que no a extenso; ou proporcional a uma combinao de propriedades, incluindo a extenso. Um exa me dos resultados obtidos na tabela 11 sugere que a disper so de valores num stratum afeta a variabilidade das estimativas. natural, pois, usar essa propriedade como base para determinar a extenso da amostra a ser colhida no stratum. A distribuio tima um procedimento que tem sse objetivo. Nesse procedimento, a extenso da amostra colhida em cada stratum proporcionada tanto extenso, como disperso de valores de um stratum. O uso cuidadoso dsse mtodo envolve alguns conceitos estatsticos ainda no apresentados. Uma aproximao ao mtodo pode, contudo, ser utilizada para ilustrar a sua maneira de operao. Um modo de medir a disperso de valores em um stratum recorrer oscilao de valores. A oscilao sim plesmente a diferena entre o menor e o maior valor dum stratum. A idia bsica contida no mtodo aproximado de distribuio tima a de "oscilao balanceada de um stra tum. A oscilao balanceada o produto do nmero de elementos de um stratum pela oscilao. A proporo de certa amostra situada num particular stratum igualada razo da oscilao balanceada do stratum para a soma das oscilaes balanceadas de todos os strata. Por exemplo, se temos dois strata contendo ni e ^ elementos com oscilaes R 1 e R 2, respectivamente, a proporo da amostra distribu da para o primeiro stratum :
ii.R + iiiR-i

iRi

148

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Para o segundo stratum, a proporo correspondente : niR Voltemos, agora, populao miniatura" e apliquemos sse mtodo para determinar que proporo de amostra de quatro elementos deve ser retirada dos strata: (2, 3, 4) e (6, 9, 12). claro, neste caso, que tanto ni como n2 so iguais a 3 e que R i = (4 2) = 2 e que R2 = (12 6) = 6 . Segue-se que a proporo da amostra que deve ser de res ponsabilidade do primeiro stratum :
(3 )(2) (3) (2) + (3) (6)
1 4'

A proporo da amostra de que o segundo stratum se deve encarregar :

(3 ) ( 6) ( 3 ) ( 2) + ( 3 ) ( 6 )

3 4

'

Uma amostra de quatro elementos deve ser escolhida. Por tanto, o nmero de elementos a escolher do primeiro stratum (1/4) (4), ou seja, 1, e o nmero de itens a retirar do segundo stratum (3/4) (4\ ou seja, 3. A tabela 12 exi be os resultados obtidos com sse mtodo.

T abela

12

D IST RIB U I O T IM A (A P R O X IM A D A ) D E A M O ST RA D E Q U A T R O ELEM EN TO S D O S STRATA: (2, 3, 4) E (6, 9, 12)

Amostra 2,6,9,12 3,6,9,12 4,6,9,12

Mdia estimada 5.5* 6.0* 6.5*

* Desvia-se por no mais do que 0.5 unidade (ano) da md da populao.

PLAN .

DA

PESQ.

PRTICA :

A M O ST RA G EM

149

Comparemos, a seguir, os resultados obtidos na tabela 12 com os que se obtm mediante amostragem estratificada proporcional, mantendo iguais tdas as condies. Notando que ambos os stratus so de mesma extenso, amostras de dois elementos sero selecionadas de cada um dles. Os resultados aparecem na tabela 13

T abela

13

AM O STRA S ESTRATIFICADAS P R O P O R C IO N A D A S D E Q U A T R O ELEM E N T O S D O S STRATA: (2, 3, 4) E (6, 9, 12)

Amostra 2,3, 6, 9 2, 3, 6, 12 2,3,9, 12 2, 4, 6, 9 2, 4, 6, 12

Mdia estimada 5.00 S.75* 6.50* 5.25 6.00*

Amostra 2,4,9, 1 2 3,4, 6, 9 3, 4, 6, 1 2 3, 4, 9, 12

Mdia estimada 6.75 5.50* 6 25* 7.00

* Desvia-se por no mais do que 0.5 unidade (ano) da m da populao.

A vantagem da distribuio tima se torna clara quando comparamos as tabelas 12 e 13. No caso de distribuio tima, 100 por cento das estimativas desvia-se por no mais do que 0.5 unidade da mdia da populao, enquanto que a porcentagem correspondente, no caso de amostragem estrati ficada proporcional, de 56 por cento. Quando se pre tende o mesmo limite de acuidade (0.5 unidade) para as amostras de quatro elementos na tabela 5, observa-se que apenas 33 por cento das amostras aleatrias simples levam a estimativas dentro de tais limites. A distribuio tima pode reduzir a variabilidade das estimativas, mas requer conhecimento prvio ou investigao preliminar da disperso de valores em cada stratum. sse conhecimento, muitas vzes, no existe e pode depender de custo que a reduo do rro no justifica. Para mais elu cidaes, ver (5), (8), (9) e (55).

150

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

6.3 Amostragem estratificada no proporcional.


procedimento empregado na tabela 9 foi o de amos tragem estratificada no proporcional. Tem vantagens quan do a comparao de strata um aspecto importante da pes quisa. Essa comparao resulta mais eficiente quando as amostras retiradas de cada strata so de igual extenso. A menos que os strata sejam de igual extenso, amostras de mesma extenso levam a amostra estratificada no propor cional. A preciso de quaisquer comparaes entre os strata est limitada pela menor amostra retirada de cada strata. Conseqentemente, quando uma comparao de strata se torna premente, amostras de igual extenso permitem qu a comparao se torne mais precisa. De modo geral, uma amostra estratificada em que o nmero de elementos retirados dos strata independente de sua extenso, amostra extratificada no proporcional. Por tanto, a obteno de amostras de igual extenso de todos os strata, apenas um tipo de procedimento no propor cional. A extenso das amostras empregadas pode ser de terminada, para fins de tabulao ou para fins analticos, sem levar em conta a extenso dos strata. Boa ilustrao de tal procedimento dada por Parten:
A estratificao por estados necessria no caso das eleies presidenciais, porque o cdigo eleitoral fixa como determinante as maiorias em cada estado e no a maioria nacional. Alguns estados so conhecidos como "estados certos; uma previso satisfatria nesses estados pode ser obtida com amostras relativamente diminutas. Os estados duvidosos", de outra parte, requerem nmero relativamentegrande de casos para que se avalie, de modo preciso, a tendncia dos votos. Se a pessoa encarregada das previses fizer um juizo correto na sua classificao de "estados certos, poder distribuir eficientemente a sua limitada amostragem, concentrando-a em estados para os quais a necessidade de preciso m aior... Se forem incorretos os jizos a respeito das caractersticas dos strata, os resultados podem ser desas trosos, a menos que ajustes de ltima hora possam ser feitos [41:230].

7. Amostragem agregada. Como foi indicado em seo anterior, algumas popula es no permitem, ou tornam extremamente difcil, que se identifiquem seus elementos. No obstante, pode ser rela tivamente fcil identificar alguns subgrupos da populao. Em tais casos, uma amostra dsses subgrupos pode ser colhi

PLAN .

DA

PESQ.

PRTICA:

A M OST RAG EM

151

da como na amostragem aleatria de mltiplo estgio, e uma contagem completa pode ser feita dos subgrupos selecionados, ou agregados. O agregado uma unidade geogrfica ou social, embora possa ser definido por outras propriedades. Agregados tpicos so quarteires, famlias, organizaes, agncias, unidades habitacionais, edifcios, fazendas, etc.. Assim, por exemplo, num levantamento da populao de uma cidade, podemos dispor de um mapa indicando cada quarteiro e no dispor de uma relao atualizada dos seus moradores. Pode-se, ento, colhr uma amostra dos blocos e fazer a contagem completa de todos os que residem na queles quarteires. Consideremos uma ilustrao de amos tragem agregada proposta por Hansen e Hurwitz:
Para obter amostra aleatria de moradores ou pessoas, necessita-se apenas colhr amostra de quarteires e, em seguida, proceder ao censo dos quarteires escolhidos. As fases so: 1. NumeTar os blocos em srie. Os blocos devem ser numerados em alguma seqncia conveniente, em tda a cidade, embora haja alguma vantagem em disp-los numa seqncia geogrfica, de modo a conseguir certa "estratificao" geogrfica na seleo da amostra. 2. Determinar a extenso da amostra requerida. Naturalmente, a extenso da amostra necessria depender da acuidade exigida, bem como do mtodo de amostragem. A acuidade dos resultados que se espera com a utilizao de certo mtodo de amostragem e a extenso da amostra podem ser estabelecidas com aproximao, anteriormente colheita da amostra. Admitamos, no interesse da simplicidade, ter-se determinado que, para o plano em considerao, uma amostra de 500 quarteires fornecer estimativas das vrias caractersticas que se desejam estudar na populao, em trmos dignos de confiana. 3. Colhr amostra de quarteires. Se h, digamos, 5.200 blocos na cidade, a amostra de 500 blocos pode ser obtida, nela incluindo-se 1 quarteiro de cada 10.4. Para alcanar sse resultado, escolhe-se numa tabela de nmeros aleatrios, um nmero entre 1 e 104, dividindo-o por 10. Anota-se sse nmero e a le soma-se, sucessivamente, 10.4, registrando cada resultado. Arredonda-se cada um dos nmeros da seqncia assim obtida, igualando-o ao inteiro mais prximo e incluindo na amostra os quarteires que tenham sses nmeros. Assim, se 17 o nmero aleatrio encontrado, dividindo-o por 10, tem-se 1.7. A seqncia de nmeros ser No arredondados 1.7 (1.7 + 10.4) = 12.1 (12.1 + 10.4) = 22.5 Arredondados

12 22

152

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

4. Faz-se, ento, um censo dos 500 blocos selecionados, rec lhendo-se as informaes desejadas. O censo nos dar, para os quarteires-amostra, o nmero total de pessoas que nles reside, bem como o nmero de pessoas dotadas de caractersticas especficas, ao lado de outras informaes desejadas. Uma estimativa da proporo de pessoas com tais caractersticas pode ser obtida a seguir, calculando-se a razo dsses dois nmeros dados pela amostra [21:662-63].

A amostragem agregada, como a amostragem aleatria de mltiplo estgio, vantajosa quando elevado o custo de preparao de uma lista de tda a populao. Na amos tragem agregada, basta preparar a lista dos agregados da populao e no a de todos os indivduos. Apenas os indi vduos dos agregados selecionados que precisam ser refe ridos.
Por exemplo, obter amostra aleatria simples das crianas matri culadas nas escolas pblicas dos Estados Unidos da Amrica, em pri meiro de maro de 1950, exigiria um relacionamento de cada criana. Para colhr amostra agregada, bastaria preparar uma relao das escolas e uma relao das crianas apenas das escolas selecionadas, para compor a amostra [36:87].

Nos casos em que as unidades a observar esto muito dispersas, economias considerveis resultam da seleo de agregados geogrficamente definidos. Os indivduos so, assim, agrupados de modo que a necessidade de locomoo reduzida. Se, por exemplo, o agregado um quarteiro, o observador ou entrevistador pode realizar um grande n mero de entrevistas em pequena rea. Se o mesmo nmero de entrevistas fsse objeto de seleo ao acaso, muito pos sivelmente estariam amplamente dispersas e, conseqente mente, aumentaria o intervalo de tempo entre as entrevistas e aumentaria a necessidade do entrevistador se locomover para realizar cada entrevista. Embora as amostras agre gadas reduzam o custo de campo, tendem a fornecer estima tivas mais variveis do que os outros tipos de amostragem apresentados. A amostragem agregada oferece, tambm, vantagem quando desejamos avaliar propriedades de subgrupos da populao. Por exemplo, num censo por amostra, pode ser nosso objetivo no apenas avaliar a populao total de uma cidade, mas avaliar tambm a populao mdia por unidade habitacional. Uma amostra agregada na qual as unidades

PLAN .

DA

PESQ.

PRTICA :

A M O ST RA G EM

153

habitacionais (ou grupos delas) formem unidades de amos tragem, propiciar dados nos quais a estimativa adicional de sejada pode basear-se. Outra importante vantagem da amostra agregada a de que, em certas circunstncias, ela pode ser utilizada repe tidamente. Em muitos projetos de pesquisa necessrio ob servar alteraes na populao, ao longo de certo tempo. Se o intervalo de tempo extenso, alguns dos indivduos utiliza dos na primeira amostra podem deslocar-se do ponto com o qual foram identificados na amostra. Se a unidade habita cional em que viviam tratada como um agregado, os novos ocupantes podem substituir os anteriores como parte da amos tra. O ocupantes de certo conjunto de agregados transforformam-se, dessa maneira, numa unidade ( panei ). De fato, alteraes dos indivduos pertencentes ao agregado po dem, em alguns casos, ser utilizadas como base para avaliar modificaes correspondentes na populao total. Seria o caso, por exemplo, de um estudo a propsito de imigrao ou de qualquer outra caracterstica da populao suscetvel de mudana em perodos que medeiam entre observaes ou entrevistas. Em numerosos casos de levantamento peridico, recorrese a amostras agregadas. Em algumas ocasies, parte dos agregados fixados altera-se ao proceder-se a cada uma das observaes. Ao final, os agregados originais aparecem to tal, ou parcialmente substitudos. A eficcia das amostras agregadas pode ser elevada, em muitas situaes, atravs de recurso a um dos trs mtodos seguintes ou a combinaes dles. 1. Estratificao dos agregados os indivduos sit dos nos diferentes agregados podem ter caractersticas rele vantes variadas. Em tal caso, a classificao dos agregados com respeito a essas caractersticas e a seleo de agregados de cada classe reduziro o efeito dessa diferena sbre o rro de amostragem. Se, por exemplo, utilizamos quarteires como agregados e sabemos que as caractersticas da populao variam de bairro para bairro, poderemos adotar o seguinte procedimento. Numerar os quarteires de cada bairro em sucesso. Se, por exemplo, o bairro A tem 25 quarteires, atribumos nmeros de 1 a 25 a sses quarteires; se o bairro B tem 35 quarteires, atribumos nmeros de 26 a 60 a sses

15 4

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

quarteires; etc. Procede-se, em seguida, a uma seleo sis temtica de quarteires e a amostra resultante ser estratifi cada, no sendo o intervalo de amostragem maior do que 0 menor nmero de quarteires contido em qualquer bairro. Isto , ter sido feita uma seleo com representantes de todos os bairros. Os agregados podem ser estratificados, alternativamente ou cumulativamente, em relao extenso, isto , o nmero de indivduos que contenham. Se, por exemplo, os agrega dos so quarteires, devemos identificar:
antes de colhr a amostra, os blocos que tenham populaes agre gadas muito grandes, digamos, quarteires que incluam aproximada mente 50 unidades habitacionais. de importncia particular a identifi cao de grandes quarteires que apresentem caractersticas fora do comum, tais como: grandes hotis, hospedarias, hospitais, cadeias, esta belecimentos militares, etc. sses grandes blocos podem ser objeto de amostragem separada, diversa da que se faz para os demais blocos da cidade... No necessrio conseguir identificao precisa dsse grupo de grandes quarteires em funo de alguma definio de grandes." quarteires. Se deixamos de incluir certos grandes quarteires no grupo,5 a amostra dos remanescentes ainda refletir sua contribuio para a mdia ou total, mas diminuir o grau de confiana no resultado da amostra. [21:663].

Quanto maior o agregado, maior a variabilidade das esti-1 inativas resultantes, relativamente a uma extenso de amostra fixada. Conseqentemente, a estratificao, que reduz essa variabilidade, torna-se mais importante na medida em que aumenta a extenso dos agregados. 2. Reduo da extenso do agregado se recorremo por exemplo, a meio quarteiro, um quarto de quarteiro, o qualquer outra frao dle, poderemos selecionar maior n mero de agregados sem alterar a extenso total da amostra. Dessa forma, os agregados estaro mais amplamente distri budos por tda a populao e pode-se esperar que forneam melhor representao da populao total. Determinar nmero timo de quarteires a escolher depende:
dos custos relativos de vrias operaes, da amplitude da variabilidade de caractersticas apresentadas por diferentes blocos (a chamada "va riao inter-blocos") e por diferentes unidades dentro do mesmo bloca (a chamada "variao intra-bloco). Se, quanto s caractersticas a serem estimadas, existe variao relativamente grande entre diferentes blocos, ento, como se poderia, intuitivamente, esperar, a teoria acon-

P LA N .

DA

PESQ.

PRTICA:

AM OSTRAG EM

155

selha a utilizao de maior proporo de blocos e de menor razo de sub-amostragem do que seria necessria, se fsse relativamente pequena a variao entre os blocos [21:664-65].

H teorias estatsticas que permitem auxiliar a determi nao da extenso tima das fraes de um agregado (ver [8:191 e ss.] e [33]). Pode-se conseguir considervel economia recorrendo a sses mtodos. Na amostragem agregada, o custo de preparao e obten o da amostra funo do nmero de agregados escolhidos e de sua extenso. Depende, tambm, do custo geral por agregado (i. , preparao de listas e/ou mapas e do acesso e retorno do agregado) e do custo por observao. Seja: Ci c2 m n C Ento:
C = m(ci + c-n)

= = = = =

custo geral por agregado custo adicional por observao nmero de agregados na amostra nmero mdio de observaes por agregado custo de preparao e obteno da amostra

Desta ltima equao resulta claro que aumenta o custo na medida em que aumenta o nmero de agregados e/ou o nmero mdio de observaes por agregado. Com sses acrscimos, entretanto, decresceu o rro de amostragem e seu tusto. Mas, a melhor maneira de fazer baixar o custo do rro depende de saber se h maior variao entre agregados ou intra-agregados. O problema de planejamento , por tanto, o de conseguir o melhor balanceamento entre os custos de operao e de rro. Em geral, conveniente escolher agregados que tenham, tanto quanto possvel, a mesma extenso. Quando o agregado frao de uma unidade fcilmente identificvel (tal como um quarteiro), unidades no fracionadas podem ser escolhidas para compor a amostra; em se guida efetua-se o fracionamento, incidindo apenas sbre as unidades escolhidas. sse procedimento considervelmente mais econmico que o do fracionamento de cada unidade, efetuado antes da escolha das unidades.

156

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

3. Sub~amostragem Em vez de fracionar um ag gado grande, mas conveniente (tal como um quarteiro), a amostra pode ser retirada do agregado. Isso reduziria o nmero mdio de observaes por unidade de amostragem. Por exemplo, se se escolhem unidades habitacionais alterna das (e no tdas), possvel selecionar um nmero maior de quarteires sem aumento dos custos de operao. Isto , a amostra aleatria simples ou sistemtica de unidades (tais como edifcios, unidades habitacionais ou famlias) pode ser colhida de cada um dos blocos selecionados. Neste caso, o edifcio, a unidade habitacional ou a famlia, torna-se um agregado nvo e menor. freqentemente possvel combinar estratificao e subamostragem para se obter amostra muito eficaz. Hansen e Hurwitz sugerem a seguinte aproximao para determinar a razo de amostragem tima (razo da extenso da amostra para a extenso da populao) que pode ser usada nesses casos.
a) adotando uma razo de amostragem geral e uniforme em todos os strata; b) determinando a razo de amostragem do bloco e a razo da sub-amostragem no stratum de "blocos pequenos como segue: para problemas em relao aos quais a homogeneidade intra-blocos no alta, tome-se uma razo de sub-amostragem tal que, em mdia, crca de 5 familias sejam includas em cada quarteiro-amostra; se h grande homogeneidade intra-blocos, tome-se nmero menor de famlias digamos de 1 a 3 por bloco-amostra; e, c) fazendo a proporo dos quarteires a serem colhidos do stratum de "grandes blocos" iguais a:

p.VWW.
onde P. corresponde proporo de quarteires a serem escolhidos no stratum dos pequenos blocos, N i corresponde a uma estimativa do nmero mdio de familias por bloco no stratum dos "grandes blocos" e N . corresponde a uma estimativa do nmero mdio de famlias por bloco no stratum dos "blocos pequenos. Como ilustrao, admitamos que se pretende colhr uma amostra de 5 por cento das residncias da cidade e que o nmero mdio esti mado de famlias por bloco, no stratum dos "pequenos blocos, , aproximadamente, 25 e, no stratum dos "grandes blocos , aproxi madamente, 100. Admitamos que no h homogeneidade intra-blocos. Para conseguir uma mdia de crca de 5 famlias por bloco, a partir do stratum de "pequenos blocos", a razo de sub-amostragem 5/25 = 20

PLAN .

DA

PESQ.

PRTICA :

A M OST RAG EM

157

por cento. Como a porcentagem final de unidades habitacionais a serem includas na amostra deve ser a mesma nos dois strata, e igual a 5 por cento, devemos retirar 25 por cento dos blocos do grupo de "pequenos blocos" (j que 20 por cento das unidades habitacionais, em 25 por cento dos blocos nos fornecem a desejada razo geral de amostragem de 5 por cento). A proporo de blocos a considerar no grupo dos "grandes blocos" seria de 25 V 100/25 = 50 por cento

caso continuemos adotando a regra agora dada; e a razo de subamostragem para o stratum dos grandes blocos" seria de 10 por cento (porque 10 por cento das unidades habitacionais em 50 por cento dos blocos so necessrias, a fim de dar a desejada razo geral de amos tragem de 5 por cento). A Introduo da sub-amostragem pode tornar possvel obter, com amostra de talvez 3 por cento das famlias, a acuidade que resultaria de amostra de 10 por cento, caso fssem enumerados todos os blocos. Esse decrscimo na extenso da amostra, sem sacrifcio do grau de confiana, no raro, quando usamos uma aproximao satisfatria do projeto timo e pode, alm disso, resultar em considervel economia de tempo e dinheiro. [21:665-66].*

A principal dificuldade no uso da amostragem agregada advm do fato de que cada indivduo da populao deve ter condies para ser colocado em um, e somente um, agregado. Isso requer identificao efetiva dos indivduos e dos agrega dos e da relao entre uns e outros. A colocao dos indi vduos em agregados no precisa ser levada a efeito anteci padamente; de fato, ela usualmente feita, no campo, pelos observadores. Isso no , entretanto e de maneira alguma, trabalho fcil. Por exemplo no recente Bureau of the Census Post Enumeration Survey, cada indivduo da populao dos Estados Unidos da Amrica devia ser potencialmente passvel de colocao em alguma rea residencial, definida em funo do dia l de Abril de 1950. Foi extremamente difcil faz-lo, desde que surgia o complexo conceito local de residncia habitual. Por exemplo, freqentemente no fcil dizer qual o local de residncia habitual de uma pessoa que viaja a negcios. E, contudo, essa parte mvel da po pulao importante e deve ser possvel coloc-la em algum dos agregados. Para evitar erros de colocao, o conceito local habitual de residncia e noes correlatas tiveram de

* Para identificao das hipteses relativas ao custo que se acha implcitas neste mtodo, ver (19: 428).

158

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

ser cuidadosamente definidos conforme preceituam os prin cpios expostos no ltimo captulo. Determinar caractersticas de populao a partir de da dos conseguidos por amostra agregada no procedimento estatstico simples. Fazem-se necessrios vrios tipos de ajustamento dos dados. Para que sejam feitos sses ajus tamentos, requer-se assistncia de estatsticos especializados. Uma discusso dsses pormenores tcnicos pode ser encon trada em (8: 189 ss.), (17) e (34).

8. Amostragem repetida (ou mltipla).


At ste ponto da discusso de amostragem por estgio, a deciso quanto maneira de colhr a amostra em qualquer estgio tomada antes que se processe qualquer dos estgios da amostragem. tambm possvel, no obstante, colhr amostra de uma populao, analis-la e utilizar a informao resultante para planejar uma segunda amostra da mesma po pulao. Tal procedimento chamado amostragem dupla. Na amostragem dupla, os dados obtidos na segunda amostra podem ser combinados com os obtidos na primeira amostra, para aperfeioar a eficcia de estimativas das caractersticas da populao. Uma ilustrao da amostragem dupla encontra-se na seguinte citao de Hauser e Hansen:
sse mtodo foi aplicado no "Consumer Purchases Study, em 1936. Um ligeiro esbo foi usado para levantamento de extensa amostra de residncias, de modo a obter informaes acrca de sua constituio e tipo e acrca do nivel de renda. Os resultados da pri meira amostra foram utilizados para a colheita de amostra final, alta mente estratificada, no que dizia respeito a tipo e nvel de renda. O questionrio final, longo e pormenorizado, dirigia-se a classes parti culares e o ganho adicional resultante da estratificao introduzida pela amostra preliminar foi compensador [24:30],

Alm de facilitar a estratificao, a amostragem dupla suscetvel de vrias outras utilizaes. Em amostras norepetidas, ou singulares, uma deciso final s tomada de pois de completados todos os estgios, e no antes disso. Mas, na amostragen dupla, segundo Deming,
toma-se, de incio, amostra pequena: se os resultados so decisivos, no se faz necessrio prosseguir na investigao. Mas, se os resul tados no forem decisivos, uma amostra adicional dever ser tomada. Os resultados da primeira amostra proporcionaro quase sempre as estimativas necessrias. . . com base nas quais, a segunda amostra pode

PLAN .

DA

PESQ.

PRTICA :

AM O ST RA G EM

159

ser planejada muito economicamente e feita nem demasiado pequena, nem demasiado grande, de maneira a proporcionar evidncia positiva e suficiente para uma deciso racional [8:548-49].

Depois de ser colhida uma primeira amostra pequena, se os resultados no so decisivos, a amostra seguinte pode tambm ser pequena. Os resultados da primeira e segunda amostras podem combinar-se. Se no so decisivos, outra amostra ser colhida, etc.. Cada amostra pode ser selecio nada de modo tal que, por exemplo, fazer observaes dos elementos que ela inclue corresponda a um dia de trabalho. Clculos sero feitos ento, para determinar se necessria outra amostra. Tal procedimento chamado amostragem de grupos por seqncia. Pode ser usado de maneira vantajosa quando o tratamento dos dados relativamente simples e amostras adicionais podem ser colhidas muito rpidamente ou esto antecipadamente preparadas. O mtodo de amostragem por seqncia agora examina do sugere a seguinte pergunta: seria possvel realizar apenas uma observao de cada vez e decidir se os resultados, at quele ponto, so decisivos? Tal procedimento realizvel e est em uso. chamado, simplesmente, amostragem em seqncia. Na amostragem em seqncia, o tamanho da amostra no antecipadamente fixado, mas, os resultados de cada observao servem de base para determinar se uma observao adicional se far necessria para chegar a uma de um conjunto de concluses especificadas. De modo ge ral, ste processo requer observaes em menor nmero do que os processos de amostragem singular, ou dupla, com re lao a um rro prviamente estabelecido. Em alguns ca sos, bastar recorrer metade da extenso da amostra re querida pela amostragem singular para atingir resultados igualmente satisfatrios, utilizando a amostragem em se qncia. O procedimento em seqncia no pode ser utilizado em todos os casos. As condies gerais para que sua aplicao seja possvel so as seguintes: (a) a amostragem aleatria poder ser realizada para qualquer extenso de amostra ou de sub-grupos de amostras e (b) o nmero de observaes po der ser aumentado indefinidamente em qualquer estgio do procedimento. A condio (a) no se aplica naqueles casos em que haja dvida quanto possibilidade de poder repre sentar-se a populao por meio de amostra diminuta. Ou

160

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

seja: a amostragem em seqncia no procedimento que se deva usar quando se deseja estratificao, ou amostragem de mltiplo estgio. Por exemplo, se estamos interessados em examinar um grupo de pessoas sob o prisma de suas pre ferncias com respeito a certo artigo, devemos ter certeza de que examinamos pessoas de vrias profisses, de vrios nveis de vida, etc., antes de chegar concluso. Por isso mesmo, no aplicaremos a amostragem em seqncia, ou, pelo menos, no o faremos at que uma amostra mnima seja obtida. A condio (b) no se aplica, se no possvel adicionar ele mentos amostra, depois de iniciada a pesquisa. Isto ver dade para a maior parte dos levantamentos sociais, de vez que, freqentemente, muito difcil ou muito dispendioso au mentar o nmero de elementos durante o processamento do trabalho. A despeito dessas restries, muitos so os casos em que sse mtodo aplicvel nas cincias sociais. Por exem plo, em certo projeto fz-se necessrio determinar se a por centagem de internados numa instituio pblica para trata mento de doenas mentais, portadores de determinada carac terstica, era significativamente diversa de 1.5 por cento. Para cada paciente havia nos arquivos um grande envelope contendo, entre outras coisas, seus antecedentes mdicos. Essa histria clnica era, geralmente, muito longa, requerendo tempo considervel para uma leitura completa. Nesse caso, em que a amostra era colhida nos arquivos e podia ser au mentada sem maior dificuldade, os mtodos de seqncia revelaram-se extremamente eficazes. Em geral, os procedimentos em seqncia s se aplicam quando as observaes podem ser feitas uma de cada vez, ou em grupos, sem muita perda de tempo entre elas. Isto sig nifica, na maioria dos casos, que os sujeitos ou dados relati vos quelas observaes devem ser concentrados em rea rela tivamente pequena e, por isso mesmo, fcilmente acessvel. Os indivduos devem ser identificveis de maneira precisa, de forma que no haja dificuldade em saber qual o selecio nado em cada coleta. Com efeito, sse mtodo requer ca pacidade de) manipular eficientemente os elementos da amos tra, sejam stes indivduos, grupos ou registros. evidente que condies satisfatrias de amostragem em seqncia po dem aparecer mais fcilmente na pesquisa social em que es

PLAN .

DA

PESQ.

PRTICA:

A M OST RAG EM

161

tejam envolvidos registros ou populaes muito pequenas e concentradas. A anlise de dados obtidos por amostragem em seqn cia difere dos procedimentos aplicveis amostragem sin gular. Uma discusso de anlises adequadas aos procedi mentos em seqncia pode ser encontrada em (1 :iii), (9:278-88), (10 :xvii), (44) e (53).

9. Amostragem por tipicidade.


Os procedimentos de amostragem probabilstica at agora examinados implicam ou em contagem completa, ou em amostra aleatria em cada estgio do procedimento. Porque todos sses mtodos tm sido baseados em amos tragem aleatria, lcito dizer que les tendem para a representatividade. Podemos determinar, para cada qual dos procedimentos, a probabilidade de que uma estimativa das caractersticas de uma populao, feita com base nesses pro cedimentos, se desvie do verdadeiro valor da caracterstica em foco, dentro de um intervalo prefixado. Isso no ver dade para todos os mtodos de amostragem. Em alguns casos, h, bem definidos, subgrupos de uma populao que parecem ser representativos da mesma popu lao. Em outros casos, consideraes de ordem prtica tolhem o uso de amostragem de probabilidade, e o pesquisador busca, por outras vias, uma amostra representativa. Isto , le busca um subgrupo que seja tpico, em relao popu lao como um todo. Tal subgrupo utilizado como "ba rmetro da populao. Restringem-se as observaes a le e as concluses obtidas so generalizadas para o total da populao. um tipo de procedimento baseado no senso comum. Por exemplo, por vrios anos acreditou-se, com respeito a eleies presidenciais nos Estados Unidos da Amrica, que "a nao acompanha o Maine. A crena revelou-se mal fundada, mas, em certa poca, expressou a convico de que o comportamento eleitoral no Estado do Maine era tpico da nao inteira. Uma prvia eleitoral que se restringisse a observaes no Estado do Maine estaria colhendo amostra por tipicidade (ou por tendncia). A amostragem por tipicidade muito precria porque, acrca da populao e do procedimento de escolha, devem ser feitas hipteses muito mais ousadas do que as exigidas pela amostragem de carter probabilstico. Por exemplo,.

162

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

para escolher uma cidade tpica, a fim de proceder a um estu do que interesse Nao, o pesquisador buscar uma cidade cuja distribuio de renda seja similar da Nao como um todo, cujas indstrias sejam as tpicas da Nao como um todo, etc. . Em verdade, le seleciona uma comunidade que tpica, relativamente a um conjunto de propriedades A , B, . . . , N e dai infere que a comunidade tpica em relao caracterstica X que est sendo investigada. Ora, no se pode concluir que por ser tpica em relao a A , B, . . . , N , a cidade seja tpica relativamente a X , salvo se A, B, . . ., N determinarem completamente X . Nenhum pesquisador imagina que as propriedades que utiliza como orientadoras de sua escolha determinem completamente o valor que est investigando. No mximo, assevera que so altamente correlacionadas; isto , que os valores, de X tendem a alterar-se como se alteram os valores de A , B, . .. . N. Alm disso, mesmo que a correlao admitida seja verda deira, a cidade escolhida pode ser atpica relativamente maneira como X se relaciona com A , B, . . N. Conse qentemente, outra presuno se requer, a de que, na cidade escolhida, a relao entre A , B, . . ., N e X tpica. Presunes dessa ordem costumam ser muito discutveis e sua validade requer pesquisa que vai alm do escopo da maio ria das instituies que se dedicam ao assunto. A amostragem por tipicidade tem ainda outra deficin cia: erros de amostragem e desvios no podem ser computa dos para tais amostras. Por sse motivo, a amostragem por tipicidade deve se restringir s situaes seguintes: (1) os erros possveis no apresentam gravidade e (2) a amos tragem probabilstica prticamente impossvel. Dads obtidos de amostras por tipicidade, no mximo sugerem, ou indicam, concluses, mas, em geral no podem ser utilizados como base de procedimentos estatsticos comprovadores. A aplicao da amostragem por tipicidade ou, como algumas vzes chamada, por tendncia * a estudos rela tivos ao soldado norte americano descrita por Stouffer da forma seguinte:
A seleo de unidades (militares) envolveu amostragem por tipi cidade ao invs de amostragem estritamente aleatria. Se uma viso panormica dos alistados fsse necessria, o procedimento padro seria o de selecionar as unidades de forma que cada setor estivesse repre sentado em propores to prximas das corretas quanto possvel.

P LA N .

DA

PESQ.

PRTICA:

AM O ST RA G EM

163

Dentro de cada setor, houve esforo para escolher unidades em vrios estgios de treinamento, ou com vrios tipos de experincia no exrcito, observando propores corretas, tanto quanto isto podia ser feito, com base nos dados disponveis. Por exemplo, entre soldados de infantaria, alguns seriam dos "Replacement Training Centers, outros, de divises recentemente ativadas, outros, ainda, de divises preparadas para o prximo embarque. A proporo de homens em cada tipo de unidade pde ser grosseiramente calculada e a amostra foi planejada de modo a se manterem essas propores [50:715].

Para discusso mais completa da amostragem por tipicidade, ver (8:9-11 e 23) e (37:219, 236-38).

9.1 Amostragem por quotas.


Um dos mtodos de amostragem mais comumente usa dos em levantamentos de mercado e em prvias eleitorais, o mtodo de amostragem por quota. Nesse mtodo, com binam-se aspectos de amostragem probabilstica e de amos tragem por tipicidade. Usualmente, le abrange trs fases: (1) classificao da populao em trmos de propriedades que se sabe, ou se presume, serem relevantes para a caracte rstica a estudar; (2) determinao da proporo da popu lao que deve ser colocada em cada classe, com base na constituio conhecida, presumida ou estimada, da populao; e (3) fixao de quotas para cada observador ou entrevis tador a quem tocar a responsabilidade de selecionar inter locutores ou entrevistados, de modo que a amostra total observada ou entrevistada contenha a proporo de cada classe tal como determinado em (2). Aos observadores ou entrevistadores so atribudas quotas; em outras palavras, so les instrudos para obser var ou entrevistar um nmero especificado de indivduos de cada classe. Os indivduos a serem observados ou entre vistados no so identificados pelo planejador da pesquisa. Cabe ao observador ou entrevistador selecionar os sujeitos, isto , os indivduos que pertencem classe especificada. Conseqentemente, o observador ou entrevistador tem a palavra final na seleo dos sujeitos. A derradeira seleo por tipicidade, muito embora o estgio inicial seja similar ao de amostragem estratificada proporcionada. A seleo por tipicidade, entretanto, substitui a seleo aleatria no ltimo estgio.

164

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

A amostragem por quotas pode conduzir a erros graves. Em primeiro lugar, o estabelecimento de quotas pode fazer-se de maneira no proporcional verdadeira distribuio de propriedades na populao.
Os dados para fixao de quotas devem ser avaliados a partir de resultados de censos prvios e de certas fontes momentneamente acessveis. Quando se esto operando transformaes drsticas na economia, tais como a depresso da ltima dcada. . . as quotas esti madas podem conduzir a rro srio. Assim, rumos errneos podem ser impostos seleo de amostras, com possibilidades de graves en ganos (24:27).

Em segundo lugar, muito depende do observador ou entre vistador, muito mais do que na amostragem probabilstica. De maneira geral, pode-se presumir que o observador ou entrevistador preencher suas quotas da maneira que lhe seja conveniente, agindo assim intencionalmente ou no.
Como resultado, embora a amostra contenha as quotas adequadas de cada classe da populao, pode conter tambm muitas pessoas da mesma nacionalidade, nvel educacional e interesses semelhantes aos do enumerador [entrevistador ou observador] e, ao mesmo tempo, muito poucos apartamentos de terceiro andar, ou moradias isoladas, ou famlias em que muitas pessoas trabalhem [24:27],

Em outras palavras, os selecionados em cada classe podem ser no representativos dessa mesma classe. Alm disso, cabe ao observador, e no ao pesquisador, classificar os sujei tos e, uma vez que raramente le to bem informado quanto o pesquisador, no que diz respeito ao planejamento total da pesquisa, est sujeito a introduzir um desvio no procedi mento de classificao. Dois desvios, portanto, podem ser introduzidos pelo observador desvio de classificao e des vio por seleo no-aleatria dentro de cada classificao. Pode ocorrer que os resultados da amostragem por quota no impliquem em rro grave, mas ser sempre extremamente difcil fazer tal demonstrao. A dificuldade reside em que, na melhor das hipteses, s poderemos conhecer amostra por quota que seja representativa de algumas (mas nunca de tdas) caractersticas relevantes da populao. Em conse qncia, no teremos garantia de que a amostra seja repre sentativa, com respeito s propriedades que esto sendo objeto de medida. E de vez que no se recorre amostragem

PLAN .

DA

PESQ.

PRTICA :

AM O ST RA G EM

165

aleatria em nenhum dos estgios, os erros de mtodo no podem ser determinados por procedimentos estatsticos.
Essas especificaes [de amostragem por quota] no podem for necer estimativas de amostra em relao s quais o risco de rro seja suscetvel de medida, pois no propiciam seleo de modo que evidencie a probabilidade com que ela se faz [15:185]. Essa [dificuldade] pode ser esclarecida atravs de um levanta mento hipottico, por meio do qual se pretenda determinar os hbitos de leitura da populao. Admitamos que, em tal levantamento, estejam sob controle a idade, sexo, cr e nvel de renda da populao. Os entrevistados escolhidos para efeito de amostra podem corresponder a propores adequadas relativamente a cada grupo de idade, sexo, cr, e renda, mas, ainda assim, se a representao fr inadequada no que diz respeito ao nvel educacional, os hbitos de leitura da amostra podem no ser representativos dos hbitos de leitura da populao. Se controlarmos tambm os nveis educacionais, podem surgir outros pontos de discrepncia. vista de suas limitaes e dos riscos de graves desvios, ste tipo de planejamento de amostra deve ser, sem dvida, evitado, sempre que se possa recorrer a outros de preo razovel [24:28-29].-

10. Populacionamento versus amostragem.


N a formulao de um problema, especificamos uma populao, no a amostra. N o planejamento prtico de pesquisa orientada no sentido de solver aqule problema, pode-se escolher amostra da populao especificada, de modo que, partindo de tal amostra, se retirem inferncias aplicveis a tda a populao. No podemos colher amos tra de maneira eficaz, a menos que disponhamos de uma populao bem definida. Em um bom nmero de casos, os pesquisadores sociais estudam, de forma completa, uma pequena populao e, tendo alcanado concluses a respeito dela, generalizam tais concluses, estendendo-as a popula es mais amplas. Partem do que consideram constituir uma amostra e buscam uma populao relativamente qual essa amostra possa ser tida como representativa. sse populaeionamento (como oposto amostragem) e as generaliza es que nle se apoiam situam-se entre os erros metodo lgicos mais comumente cometidos nas cincias sociais. No dispomos de mtodos seguros que permitam partir dos representantes para determinar o representado. Para fazlo, necessitar-se-ia de informao completa acrca de tdas as propriedades relevantes, tanto das populaes potencial mente selecionveis, como da amostra. Houvesse dispo

166

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

nibilidade dessa informao e no seria necessrio partir da amostra. E. S. Marks previne, eloqentemente, contra o populacionamento e a generalizao imprpria:
A questo de definir uma populao fundamental, e tem rece bido, em muitos estudos estatsticos, ateno inadequada. Com fre qncia demasiada, os que se dedicam pesquisa retiram amostras e concluses a partir de populaes diferentes. Cometamos com um estudo a propsito da "relao entre a ordem de nascimento e senti mentos de insegurana; conseguimos de cinquenta a cem sujeitos, atravs de um amigo servial, que, por acaso, superintendente de escolas em uma cidade de localizao conveniente e conclumos que "sentimentos de insegurana no so correlacionados com a ordem de nascimento. Nada tenho contra essa concluso que, eventualmente, ser verdadeira para muitas populaes mas ela nada tem a ver com os dados colhidos. De um grupo de casos reunidos sem consi derar a populao que representam, nada se pode concluir acrca de qualquer populao, que no a efetivamente observada. .. .Nossas dificuldades para obter inferncias corretas a partir de amostras decorrem de ambio demasiada. No nos limitamos a relatar nossas concluses, dando-as como aplicveis nossa prpria escola ou universidade ou comunidade local insistimos em discutir os resul tados obtidos como se aplicveis a cada populao humana. Se nossa amostra se restringe a uma escola, grupo de escolas, comunidade, cidade ou estado, nossas concluses estatsticas devem sujeitar-se a restries semelhantes... Conjecturas acrca de sua apli cabilidade a outras populaes podem ser inteiramente adequadas e talvez extremamente valiosas, mas devem ser chamadas conjecturas e no inferncias estatsticas [36:87].

A importncia dessa advertncia no pode ser subesti mada, de vez que a generalizao imprpria um rro muito comum. Por exemplo, num recente estudo scio-psicolgico, de pessoas portadoras de lcera (42), Ruesch e seus colaboradores selecionaram (com base em casos que pude ram observar) quarenta e dois pacientes dos quadros da marinha e vinte civis. O seguinte quadro de observaes tpico:

Porcentagem d o s elementos da mari nha, portadores de lcera Filho mais velho.. Filho mais nvo.. 19 33

Porcentagem de ci vis, portadores de lcera 15 20

PLAN .

DA

PESQ.

PRTICA :

AM O ST RA G EM

167

Dsses dados, a seguinte concluso foi retirada: Ulcerosos tm maior nmero de irmos mais velhos porque so os ltimos nascidos na familia (42:45). Essa concluso, considerando~se os dados fixados, inteiramente injustificada, pois no h meios de saber se o grupo observado amostra aleatria da populao total de portadores de lcera. Em outro estudo, levado a efeito pelo "Harper Hospi tal, de Detroit, em 1950, foram examinados, de modo anlogo, vinte e um portadores de lcera. Dles, 38 por cento eram filhos mais velhos e 19 por cento filhos mais moos. A despeito da aparente contradio entre sses dados e os de Ruesch, nenhuma concluso pode ser tirada, nem mesmo acrca da contradio relativa populao de portadores de lcera. Em verdade, tudo que se pode dizer que os dois estudos disseram respeito a populaes (no amostras) que diferiam quanto ao ponto em tela. Erros como o cometido por Ruesch e seus colaborado res no ocorreriam se o problema da pesquisa fsse for mulado segundo a maneira exposta no captulo ii, e se um procedimento de pesquisa ideal fsse planejado conforme as linhas indicadas no captulo iii. Alm disso, uma con versa, mesmo casual, com um especialista em amostragem, evitaria erros do gnero.

11. Sumrio.
Neste captulo consideramos as vrias maneiras de sele cionar uma parte da populao total poro que pode ser observada de maneira a propiciar informaes concer nentes populao total. Para fins prticos, bem como para propsitos puramente cientficos, faz-se necessrio uti lizar procedimentos de seleo cujos erros sejam mensur veis. Um procedimento deve ser suscetvel de caracteriza o relativamente a desvio e variabilidade. O procedimento que satisfaz fundamentalmente essas condies o de amos tragem aleatria simples, mtodo em que cada qual dos elementos tem igual possibilidade de ser selecionado. A amostragem aleatria simples realizada com o auxlio de nmeros aleatrios, enquanto a amostragem sistemtica variao do mesmo procedimento, que tem ponto de partida aleatrio, para selecionar elementos num intervalo prefixado.

168

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Dividindo a populao em subgrupos, podemos escolher a amostra em estgios. Se a amostra aletria selecionada em cada um dos estgios, temos uma amostra aleatria de mltiplo estgio. Se uma contagem completa das unidades de amostragem feita num estgio que no o ltimo, temos uma amostra estratificada. Se a contagem completa feita no ltimo estgio, temos uma amostra agregada. A proba bilidade de selecionar qualquer dos subgrupos pode ser feita proporcionalmente a alguma funo da extenso do subgru po, e o nmero de unidades escolhidas de qualquer dos sub grupos pode tambm ser feito proporcionalmente a alguma funo anloga. A amostragem proporcional tende a redu zir os erros de amostragem. Estratificao e agregao po dem combinar-se para fornecer amostras eficazes, particular mente quando qualquer delas, ou ambas, se baseiam em pro priedades geogrficas (i. ., em amostragem por rea). A amostragem por rea reduz a complexidade do preparo de listas de amostragem e permite a agregao de sujeitos de modo que les apaream em grupos. Na amostragem dupla, a primeira amostra pode ser utilizada para fornecer informao possvel de se usar para o planejamento de eficiente segunda amostra. Tal amostra gem pode tambm ser utilizada para reduzir o nmero de observaes requeridas, em mdia, como base de uma con cluso. Quando a amostragem dupla generalizada, resulta em amostragem de seqncia, mtodo de colhr um elemento ou conjunto de elementos de cada vez, usando os dados obtidos para decidir se continuar ou no continuar com a amostragem. Todos os mtodos de amostragem, baseados exclusiva mente em escolha aleatria, e contagens completas, condu zem a amostras probabilsticas. Fornecem erros mensur veis. Isso no verdade quanto a amostras por tipicidade, que se apoiam em critrio do pesquisador, e no em mtodos de seleo controlados. A base ltima para a escolha de um procedimento de amostragem deve ser a reduo ao mnimo dos custos de obteno da amostra, e o custo esperado dos erros que podem resultar do emprgo do mtodo. Assistncia especializada deve ser requerida para proceder a tais avaliaes; estas,

P LA N .

DA

PESQ.

PRTICA:

AM OSTRAG EM

169

em

geral, exigem um conhecimento tcnico de que o pesqui sador no dispe. A tabela 14 sintetiza, de maneira muito esquemtica, a descrio das vantagens e desvantagens dos vrios procedi mentos de amostragem examinados.
14

T a b e la

A M O ST RA G EM

Tipo de amostragem A. Aleatria simples

Descrio breve

Vantagens

Desvantagens

A tribuir a cada 1. elemento da po pulao um n mero n ic o ; sele cionar Itens de 2 . amostra u tilizan do nmeros alea 3. trios

Requer mnimo conhecimento a n tecipado da po pulao Livre de poss veis erros de classificao F a c ilita a a n li se de dados e o clculo de erros

Despreza o co nhecimento da populao, que o pesquisador pos sa ter P ara a mesma e x t e n s o da amostra, os erros so mais amplos do que na amostragem estratificada Se o intervalo de amostragem se relaciona a um a ordenao peridica da po pulao, pode ser i n t r o d u zida va ria b i lidade crescente. Estim ativas de rro tendem a ser altas, se h efeito de estra tificao

B. Sistemtica

Usar ordem natural ou ordenar a po pulao ; selecio nar ponto de par tid a aleatrio en tre 1 e o inteiro mais prximo razo da amos tragem (N /n ) ; selecionar itens em intervalos de amplitude W/n.

Se a populao ordenada com respeito a pro priedade r e l e vante, d como efeito a estrati ficao e, por tanto, reduz a variabilidade, em comparao com A. Sim plifica a co lheita de amos tr a : permite ve rificao fcil

C. Aleatria de mltiplo estgio

Quando h pelo 1. Listas de amos 1. Erros tendem a ser maiores do menos dois est tragem, identifi gios, usar um a que em A ou B, cao e num era para a mesma o necessrias form a de amos-

170

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

T ab ela

14 (C ont.)

Tipo de amostragem

Descrio breve

Vantagens

Desvantagens

tragem aleatria em cada qual dos estgios

apenas para ele mentos das u n i dades de amos tragem selecio nadas 2. Se as unidades de amostragem sa o definidas geogrficamente, caem os custos de campo (l.., viagem)

e x t e n s o da amostra Os erros crescem com o decrs cimo do nmero de unidades de amostragem es colhidas

1. Com proba Selecionar unidades 1. Reduz a bilidade pro de amostragem bilidade porcional l com probabilida de proporcional extenso extenso

va ria 1. F a lta de conhe cimento da ex tenso de cada unidade de amos tragem, a n t e s que a seleo faa crescer a variabilidade Requer inform a o a c u r a d a acrca da pro poro de po pulao em cada s t r a t u m , sob pena de aum en to do Srro Se no h lis tas estratifica das disponveis, prepar-las pode ser dispendioso; possibilidade de classificao er rnea e, pois, de aumento da va riabilidade

D. Estratificada 1. Proporcional

Escolher de cada 1. A s s e g u r a unidade de amos representativldatragem, em est de com respeito gios que no o propriedade ltimo, amostra que d a base aleatria propor para classificar cional extenso as unidades; g a da unidade de rante, pois, me amostragem nor variabilida de que A ou C 2. Decresce a pos sibilidade de dei x ar de incluir elementos da populao por causa do pro cesso classificatrio 3. C a r a c t e r s t i c a s de cada stratum podem ser ava-

PLAN .

DA

PESQ.

PRTICA :

A M O ST RA G EM

171

T a b e la Tipo de amostragem

14 (Cont.)

Descrio breve

Vantagens

Desvantagens

liadas feitas es 2. Colocao tim a

e, pois, compara

Mesma que a de 1, 1. P ara a mesma e x c e t o que a e x t e n s o da amostra proamostra, menor poraional va ria variabilidade que bilidade nos stra em 1 ta, bem como extenso dles

. Requer conheci mento da va ria bilidade das ca ractersticas re levantes dentro dos strata

3. No propor Mesma que a de 1, 1. Mais eficiente 1. Menos eficaz do cionada do que 1 para exceto que a ex que 1 para de comparao de tenso da amos term inar carac strata ou quan tra no pro tersticas da po porcional ex do erros diferen p u la o ; i. ., tenso da un ida tes so timos maior variab ili de de am ostra para diferentes dade para a gem, mas ditada mesma extenso strata por consideraOes da amostra analticas ou de convenincia E. .Agregada

maiores, Selecionar unidades 1. Se os agregados 1. Erros de amostragem para extenses so definidos Pior algum a form a geogrficamente, semelhantes, do de amostragem possibilitam os que os que ocor a le a t ria ; as u n i m ais baixos rem em outras dades ltim as so custos de campo amostras probag rupos; selecion- 2. Requer relacio bllsticas las aleatoriam en namento de In di 2. Requer capaci te e fazer conta vduos apenas dade para colo gem completa de nos agregados car cada ele cada qual mento da popu escolhidos lao em um s 3. C a r a c t e agregado; Inca r s t i c a s dos agregados, pacidade para assim ag ir pode bem como as da populao, po resultar em d u dem ser av a lia plicao ou omis so de indiv das 4. suscetvel de duos utilizao em

172

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

abela

14

(C o n t.)

Tipo de amostragem

DesciHo breve

Vantagens

Desvantagens

amostras subse qentes, de \ ez que seleciona dos so os agre gados e no os indivduos, e a substituio de indivduos pode ser permitida F. Agregada eBtratiflcada 1. Desvantagens da amostragem es tratificada e des vantagens da agregada 2. U m a vez que as propriedades dos agregados podem variar, os bene fcios da estra tificao podem dim inuir e tor nar i n t i l a amostra para fu tura pesquisa

Selecionar aleat- 1. R e d u z a v a riabilidade da riamente os agre gados de cada amostragem por simples agrega unidade de amos tragem o

G. R epetitiva: m ltipla ou em seqenela

D uas ou mais amos 1. Levam a estima 1. Tornam comple xa a superviso tras de qualquer tivas das carac do trabalho de tipo i n d i c a d o tersticas da po campo acim a so esco pulao que sim lhidas, empregan plificam fi efi 2. E x i g e m mais clculo e anlise do-se os resulta ciente planeja do que a amos dos de amostras mento de coleta tragem no re anteriores para de nova amos petitiva orientar a colhei tra, reduzindo, pois, o rro da 3. Amostragem em ta de outras e, seqencia pode mesmo, determi estimativa final ser usada ape nar se so neces 2. A longo prazo, nas quando srias reduz o nmero amostras peque de observaes nas so reprerequeridas sentativas e

P LA N .

DA

PESQ.

PRTICA:

AM OSTRAG EM

173

T a b ela

14 (C ont.)

Tipo de amostragem

Descrio breve

Vantagens

Desvantagens

quando o nme ro de observa es puder ser aumentado, de a c r d o com as convenincias, em qualquer es tgio da pes quisa H. Por tipicidade Selecionar um sub 1. Reduz custo de 1 . V ariabilidade e grupo da popula preparao da desvios das esti o que, luz das amostra e do mativas no po informaes dis trabalho de cam dem ser contro ponveis, possa ser po, pois unida lados ou medi considerado como des ltim as po dos dem ser escolhi 2. Requer genera representativo de tda a popula lizaes arrisca das de modo que o ; fazer conta fiquem prximas das ou conside gem completa ou rvel conheci umas das outras mento da popu s u b a m o s t r a g e m dsse lao e do sub grupo grupo Belecionado Classificar a popu 1. Como acima 1. Introduz desvios lao mediante 2. Introduz algum devidos fi. classi uso de proprie efeito de estra ficao que o dades pertinentes ; observador faa tificao determinar a dos sujeitos e & porcentagem da eeleo no alea amostra a reco tria em cada lher d e cada classe classe ; fixar) quo tas para cada observador

1. Por quotas

Tpicos para discusso.


1. Suponhamos que os elementos de uma populao de cinco pessoas tm 20, 21, 22, 22 e 25 anos de idade, respectivamente. Quantas amostras aleatrias simples, de extenso trs, com substituio, podem ser selecionadas? Qual o valor esperado das mdias da amostra?

174

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Como avaliaria voc a soma das idades do grupo, a partir de amostra de trs? Qual o valor esperado da soma estimada? 2. Que mtodos usaria voc para obter uma amostra nos casos abaixo e por que? a) Crianas de menos de um ano de idade, nascidas em deter minada cidade. b) As palavras dste livro. c) Os livros de uma biblioteca. d) Os hotis de uma cidade. e) As casas de uma cidade. f) Homens de uma cidade, casados duas vzes. g) Garonetes de um municpio. h) Turmas de alunos que assistem aulas em certa universidade, em hora especificada. i) Automveis que passam por determinado cruzamento entre meio dia e meia noite. 3. Suponhamos que se deseja a amostra de uma populao de estudantes para determinar se tm pais nascidos no estrangeiro. Deve-se selecionar estudantes cujos ltimos nomes comecem com "S"? Resul taria da uma estimativa imprecisa? 4. Como pode ser planejada uma amostra para determinar com que freqncia palavras da lngua inglsa so usadas nos Estados Unidos? 5. Se se desejasse uma amostra das tropas do exrcito dos Estados Unidos, que espcie de agregados se poderia usar? Quais seriam as vantagens e desvantagens dessas espcies? 6. Defina os trmos seguintes: (a) amostra aleatria simples: (b) desvio; (c) amostra probabilstica; (d) amostra aleatria de ml tiplo estgio; (e) amostra estratificada; (f) amostra por tipicidade; (g) amostra por quota; (h) populacionamento. 7. Indique alguns problemas de pesquisa social, de carter cr tico, em relao aos quais a amostragem por seqncia possa ser usada.

Exerccios.
1. Planejar trs diferentes tipos de amostra para o problema que voc formulou ao fim do captulo ii e para o qual preparou um modlo idealizado ao fim do captulo iii. 2. Selecionar uma amostra sistemtica de treze palavras dentre aquelas que aparecem no enunciado dste problema. Determinar, na amostra, o nmero mdio de letras por palavra. essa uma estimativa precisa do nmero mdio de letras por palavra, na populao? Mostrar que a estimativa precisa ou imprecisa. 3. Uma populao est dividida nos seguintes strata: (1,4) e (9,11,15,20). Selecionar uma amostra estratificada proporcional de trs elementos, e determinar que porcentagem das amostras possveis for nece estimativas que se desviam por no mais do que uma unidade da mdia da populao. Selecionar uma amostra aleatria simples de trs elementos a partir da mesma populao e comparar a variabilidade dos resultados obtidos com a dos alcanados por amostragem estrati ficada proporcionada.

PLAN .

DA

PESQ.

PRTICA :

AM O ST RA G EM

175

4. Selecionar uma amostra (com probabilidade proporcional extenso) de duas dentre quatro unidades primrias que contenham 329, 473, 615 e 178 pessoas, respectivamente. Usar os nmeros aleatrios referidos na seco 3.1 tste captulo. 5. Suponhamos ter duas urnas: a urna (1) contm uma bola branca e quatro bolas vermelhas e a urna (2) contm trs bolas brancas. Suponhamos usar o mtodo seguinte para obter amostras de duas bolas: selecionar uma bola da urna (1). Se fr branca, selecionar uma bola da urna (2), mas, se fr vermelha, selecionar outra bola da urna (1). Forneceria sse mtodo uma estimativa precisa da pro poro de bolas brancas e vermelhas da populao?

Leituras sugeridas.
Para aqules que acabam de ser introduzidos no estudo da amos tragem, recomenda-se, para contato mais profundo com a matria, que leiam: Hansen (12) e (13); Hansen e Hauser (15): Hansen e Hurwitz (20) e (21); e Stephan (47) e (48). Uma nova introduo teoria da amostragem e respectivas aplicaes exposta por Hansen, Hurwitz e Madow (23). Aqules que tm conhecimentos avanados de estatstica e/ou matemtica, devem familiarizar-se com Cochran (5), Deming (8) ou Yates (55). Para conhecer desenvolvimentos e tendncias recentes, ver Cochran (4), Hansen e Hurwitz (17) e (19), Mahalanobis (35) c Yates (54). Para discusso pormenorizada de alguns planejamentos de amos tragem, ver Cornell (6), Hansen e Hurwitz (18), Hansen, Hurwitz c Gurney (22), Mahalanobis (33) e (35), "Sampling Staff (43).

Referncias e bibliografia.
1.
C
hurchm an

2. 3. 4. 5.
6.

7. 8.

Dunn Laboratory, Frankford Arsenal, 1951. W . G., "The Use of Analysis of Variance in Enume ration by Sampling", Journal o[ the American Statistical Asso ciation. X X X IV '(1939), 492-510. Sampling Theory when the Sampling Units are of Une qual Sizes", ibid.. X X X V II (1942), 199-212. "Recent Development in Sampling Theory in the United States". Washington, D. C.: International Statistical Insti tute, 1947. (mimeogr.). "Sample Survey Techniques. Raleigh: North Carolina State College, 1948. (mimeogr.). C o r n e l l , F. G., "A Stratified Random Sample of a Small Finite Population", Journal of the American Statistical Association, X L II (1947), 523-32. D e m i n g , W . E., On Training in Sampling", Journal of the Am e rican Statistical Association, X L (1945), 307-16. ----- Some Theory of Sampling. New York: John W iley 6 Sons, 1950.
Cochran,

, C . W ., Statistical M anual: Methods of Making Experimental Inferences. 2 ed. rev., Philadelphia: Pittman-

17 6

p la n e ja m e n t o

de

p e s q u is a

s o c ia l

9. 10.

ix o n

Analysis.

W . J. e M a s s e y , F . J., Jr. Introduction to Statistical New York: McGraw-Hill Book Co., 1951.
C h u r c h ill; H a s ta y , M. W . e W a llis ,

E is e n h a r t ,

11 .

is h e r ,

12 .

13.
14 .

15 .

16 .

17. 18.
19

20. 21 .

22.

23.

24.

25.

26. 27.

Ltd., 1943. M. W . Sampling Human Populations. Washington, D. C.: International Statistical Institute, 1947. (mimeogr.). "The Use of Sampling in Opinion Surveys". Washington, D. C.: United States Bureau of the Census, 1947 (mimeogr.). H a n s e n , M. H . e D e m i n g W . E. "Some Census Aids to Sam pling", Journal of the American Statistical Association, X X X V III (1943), 343-57. H a n s e n M. H . e H a u s e r P. M. Area Sampling Some Principles of Sampling Design", Public Opinion Quarterly. IX (1945), 183-93. H ansen M. H . e H u r w i t z W . N. "Relative Efficiencies of Various Sampling Units in Population Inquiries", Journal of the American Statistical Association. X X X V II (1942), 89-94. - "On the Theory of Sampling from Finite Populations", Annals of Mathematical Statistics, X IV (1943), 333-62. A New Sample of the Population", Estadistica, II (1944), 483-97. . "On the Determination of Optimum Probabilities in Sampling", Annals of Mathematical Statistics, X X (1949), 426-32. "Dependable Samples for Marketing Surveys", Journal of Marketing, X IV (1949), 362-72. ----- "Modern Methods in the Sampling of Human Popula tions, American Journal of Public Health, X LI (1951), 662-68. H a n s e n M . H .; H u r w i t z W . N.; e1 G u r n e y , M a r g a r e t . Pro blems and Methods of Sample Survey of Business", Journal of the American Statistical Association, X L I (1946), 173-89. H a n s e n M . H .; H u r w i t z W . N.; e M a d o w , W . G. Sample Survey M ethods and Theory. New York: John W iley & Sons, Inc., 1953. H a u s e r , P. M. e H a n s e n , M. H . "On Sampling in Marketing Surveys", Journal of Marketing, IX (1944), 26-31. H e n d r ic k s , W . A. The Relative' Efficiencies of Groups of Farms as Sampling Units", Journal of the American Statistical Association, X X X IX (1944), 366-76. H il g a r d , E. R. e P a y n e , S. L. Those Not at Home Riddle for Pollsters, Public Opinion Quarterly, V III (1944), 254-61. H o r t o n , H . B. Random Decimal Digits. Washington, D. C.: Interstate Commerce Commission, 1949.
H ansen,

F . Statistical Tables for Biological. Agricultural and Medical Research. London: Oliver & Boyd,
rank

Book Co., 1947. R. A. e Y a t e s ,

Techniques of Statistical Analysis.

New York:

McGraw-Hill

W.

A.

P LA N .

DA

PESQ.

PRTICA :

AM O ST RA G EM

177

28.

J f.SSEN,

Station Research Bull. 30 4 . Ames, 1942. M. G . e S m i t h , B. B. "Randomness and Random Sam pling of Numbers Journal of the Royal Statistical Society, C l (1938), 147-66. 30. Tables of Random Sampling Numbers. "Tracts for Computers", N'; 24. Cambridge: Cambridge University Press, 1940. 31. M a d o w , L. H. "Systematic Sampling and Its Relation to Other Sampling Design", Journal of the American Statistical Asso ciation. X L I (1946), 204-17. 32. M a d o w W . G. e L. H. On the Theory of Systematic Sam pling, Annals of Mathematical Statistics, X V (1944), 1-24. 33. M a h a l a n o b is , P. C. A Sample Survey of the Average Acreage under Jute in Bengal", Sanky, IV (1940), 511-30. 34. On Large Scale Sampling Surveys, Philosophical Tran sactions of the Royal Society, Ser. B. Biological Sciences, C C X X X I (1941), 329-451. 35. "Recent Experiments in Statistical Sampling in the Indian Statistical Institute", Journal of the Royal Statistical Society, CIX, Parte IV (1946), 325-78. 36. M a r k s , E. S. Some Sampling Problems in Educational Re search", Journal of Educational Psychology. X L II (1951), 85-96. 37. M o s e r , C. A. The Use of Sampling in Great Britain, Journal of the American Statistical Association, X L IV (1949), 231-59. 38. N e y m a n , J e r z y . "On the Two Aspects of the Representative Method, Journal of the Royal Statistical Society. X C V II (1934), 558-606. 39 . Contributions to the Theory of Sampling Human Popu lations, Journal of the American Statistical Association, X X X III (1938), 101-16. 40. N o r d in , J. A. "Determining Sample Size, Journal of the A m e rican Statistical Association, X X X IX (1944), 497-506. 41 . P a r t e n , M. B. Surveys, Polls, and Samples. New York: Harper & Bros., 1950. 42. R u E S C H , JllR G EN , et al. Duodenal Ulcer. Berkeley: University of California Press, 1948. 43. S a m p l in g S t a f f . A Chapter in Population Sampling. Washing ton, D. C. : United States Bureau of the Census, 1947. 44. S t a t is t ic a l R e s e a r c h G r o u p . Sequential Analysis of Statistical D ata : Application. New York: Columbia University Press, 1946. 45. S t e p h a n , F . F . "Representative Sampling in Large-Scale S u r veys", Journal of the American Statistical Association, X X X IV (1939), 343-52. 46. Stratification in Representative Sampling, Journal of Marketing, V I (1941), 38-46. 47. "History of the Uses of Modern Sampling", Journal of the American Statistical Association, X L III (1948), 12-39.
29.

R . J. Statistical Investigation of a Sample Survey for Obtaining Farm Facts. Iowa State College Experimental

K endall,

178

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

Sampling", American Journal of Sociology, LV (1950), 371-75. 49. S t o c k , J. S. e F r a n k e l , L. R. The Allocation of Sampling among Strata, Annals of Mathematical Statistics, X (1939), 288-93. 50. S t o u f f e r , S. A., et al.. Measurement and Prediction. Princeton: Princeton University Press, 1950. 51. T e p p in g B. J.; H u r w it z , W . N.; e D e m in g , W . E. "On the Efficiency of Deep Stratification in Block Sampling", Journal of the American Statistical Association, X X X V III (1943), 93-100. 52. T ip p e t t , L. H. C. Tables of Random Sampling Numbers. Tracts for Computers", N'' 15. Cambridge University Press, 1927. 53. W a l d , A b r a h a m . Sequential Analysis. New York: John W ile y 6 Sons, 1947. 54. Y a t e s , F r a n k . A Review of Recent Statistical Developments in Sampling and Sampling Surveys", Journal of the Royal Sta tistical Society, C IX (1946), 12-32. 55. Sampling Methods for Censuses and Surveys. London: Chas. Griffin Co., Ltd., 1949. 48.

C a p tu lo

A LGICA DOS PROCEDIMENTOS ESTATSTICOS 1. Introduo.


Se amostra de uma populao de indivduos ou aconte cimentos utilizada em pesquisa, importa dispor de um mtodo que permita tirar concluses (i., fazer inferncias) acrca das caractersticas da populao, a partir das caractersticas da amostra. A grande vantagem das amostras probabilsticas permitir que se faam tais inferncias com margem de rro mensurvel. Os mtodos de realizar tais infern cias so de carter estatstico. Assim, amostragem e infe rncia estatstica so inseparveis: surgem como duas fases do mesmo processo. O modlo dos procedimentos estatsticos tem complexa feio matemtica, tal como vrios outros aspectos da cincia moderna, que "cresceram com o desenvolvimento do pen samento matemtico. O cientista dedicado pesquisa veri ficou que instrumentos matemticos so extremamente teis para introduzir preciso nos mtodos e teorias da cincia, sendo, pois, natural que os estatsticos de hoje em dia faam amplo uso daqueles instrumentos. A lgica existente por detrs dsses procedimentos matemticos pode ser enten dida sem qualquer treinamento matemtico avanado. Tudo que se requer compreenso das idias bsicas. Embora a essas idias tenham sido dados rgidos significados matem ticos pelos especialistas em teoria estatstica, nossos prop sitos no exigem que delas nos aproximemos por ngulo matemtico estrito. Tanto quanto possvel, consideraremos os conceitos da moderna estatstica de maneira no-tcnica.

2. A funo da estatstica.
Na introduo aos problemas de amostragem, assinala mos que tais amostragens so de duas espcies: (1) amos-

180

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

tragem de uma populao de observaes que podem ser feitas acrca de um indivduo singular e (2) amostragem de uma populao de indivduos ou acontecimentos. N a quela ocasio, acentuamos que a pesquisa social diz respeito, geralmente, a populaes do ltimo tipo e, conseqentemente, concentramo-nos nas aplicaes da amostragem s popula es de indivduos e acontecimentos. nfase no mesmo pon to caracterizar a exposio neste captulo, mas preciso, de nvo, lembrar que mtodos idnticos so aplicveis a ambos os tipos de problema. No necessrio considerar a amostragem de uma populao de elementos e a amostragem de uma populao de observaes acrca de um elemento, como uma escolha "ou isto ou aquilo. possvel retirar amostra de obser vaes de amostra de elementos. Mas, como j deixamos anotado, se sujeitamos repetidamente um elemento huma no ao mesmo estmulo, a primeira resposta pode afetar a segunda, a segunda pode afetar a terceira, etc. . Por exem plo, se submetermos a mesma pessoa ao mesmo teste Q . I . vrias vzes, de esperar que os resultados variem, porque, durante o teste, a pessoa sofre alteraes que afetam suas respostas subseqentes; isto , ela aprende. A menos que disponhamos de alguma forma sistemtica de corrigir essas variaes do sujeito, o fato de proceder a mais de uma obser vao no elevar a acuidade. Em geral, portanto, obser vaes repetidas da resposta do mesmo sujeito ao mesmo estmulo somente concorrero para aumentar o grau de acui dade se (1) conhecermos o efeito da estimulao repetida e pudermos ajustar as observaes ou (2) se cada qual das respostas no fr afetada por respostas prvias, isto , se as respostas sucessivas forem independentes. Veremos adiante como possvel realizar um teste de independncia. Desde que uma observao jamais inteiramente acura da, natural que, idealmente, desejemos realizar mais de uma observao, admitindo que uma melhor estimativa (do verdadeiro valor das caractersticas observadas) poder ser feita dessa maneira. Mas, o nmero de observaes pos sveis infinito e no podemos realiz-las tdas. Por isso mesmo, uma das funes da estatstica capacitar-nos a avaliar, to bem quanto possvel, a propriedade verdadeira

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

181

(ou as propriedades verdadeiras) de um indivduo, a partir de amostra probabilstica de observaes independentes. Se pudssemos realizar tdas as observaes independentes possveis, a estatstica far-se-ia desnecessria; os mtodos estatsticos se impem apenas porque devemos nos limitar a observaes em nmero menor do que o idealmente desejado. Se presumssemos serem inteiramente acuradas nossas observaes acerca de cada qual dos elementos de uma populao e se observssemos cada qual de seus membros, tambm poderamos dispensar os mtodos estatsticos. Mas, se observamos apenas uma amostra da populao, ainda que tdas as observaes sejam perfeitamente acuradas, necessi taremos da estatstica para a formulao da melhor estima tiva possvel acrca das caractersticas da populao. Estimativas estatsticas a propsito de caractersticas de indivduos ou de grupos esto sempre sujeitas a rro. As vantagens de recorrer a tais estimativas so, contudo: (1) a de que elas podem ser feitas com o menor rro possvel e (2) a de que tal rro mensurvel. Possibilitando-nos a medida do rro, os mtodos estatsticos nos proporcionam critrio explcito, em cujos trmos pode ser medido o pro gresso cientfico. muito comum, por exemplo, definir o progresso cientfico em trmos de reduo de rro. Mas devemos nos precaver para no pensar no rro como um conceito puramente estatstico; a estatstica pode ajudar a medir o rro, mas no pode, ela prpria, defin-lo. Para definir rro, devemos recorrer especificao no-estatstica de "enganos, com que j nos preocupamos anteriormente. Em pginas seguintes dste mesmo captulo, compararemos os conceitos de engano" e "rro e mostraremos como podem ser usados para responder s perguntas: Que erros podem ser tolerados? Como analisamos os dados da amostra e, a partir dles, tiramos inferncias? A funo da estatstica , portanto, a de habilitar-nos, com base nas caractersticas de amostra, a inferir, da melhor maneira possvel, as caractersticas da populao. Requisito necessrio para o uso da estatstica o de que a amostra utilizada como base para a inferncia, seja uma amostra pro babilstica.

182

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

3. Discrepncia de dados.
Fizemos notar, ao discutir a amostragem, que possvel aperfeioar a estimativa de uma propriedade de um indi vduo, aumentando o nmero de observaes independentes ou ajustadas, que dle se faam. Esperamos que essas observaes mantenham concordncia, mas no esperamos que sejam tdas idnticas. Na verdade, se tdas as obser vaes* independentes ou ajustadas, levadas a efeito acrca do mesmo indivduo, produzirem exatamente o mesmo resul tado, desconfiaremos delas tanto quanto desconfiaramos se no revelassem qualquer concordncia entre si. Isso ver dadeiro, mesmo para o caso das cincia fsicas. Se, por exemplo, devssemos pesar o mesmo objeto diversas vzes e obtivssemos, tdas as vzes, o mesmo resultado, nossa tendncia seria a de concluir que o instrumento no permite leituras suficientemente acuradas, isto , que o instrumento impreciso, ou que nossas leituras esto sendo feitas incor retamente. Para alguns fins podero bastar leituras imper feitas e no nos incomodaremos com a completa concordn cia de resultados; mas, quando importa sermos to acurados quanto possvel, empenhamo-nos em desenvolver instrumen tos de observao mais e mais precisos. No momento, vem ao caso acentuar que, ao fazermos observaes repetidas a propsito do mesmo sujeito, no esperamos alcanar resul tados idnticos; e, se os alcanamos, atribumos a concor dncia a falhas dos instrumentos ou do observador. Com efeito, quando o objetivo aumentar a acuidade, insistimos na discrepncia das observaes, mas buscamos, constante mente, reduzir a extenso da discrepncia (p. ex.( estendendo mais e mais as casas decimais). Quando fazemos uma ou mais observaes acrca de certo nmero de diferentes sujeitos, de se esperar, tam bm, discrepncia. Por exemplo, no esperamos que todos os membros de um grupo tenham o mesmo Q . I . , a mesma renda anual, o mesmo pso, ou que sejam nascidos no mesmo ano. Surgem, portanto, discrepncias entre as observaes acrca do mesmo, assim como acrca de vrios sujeitos. Como podemos responder perguntas a respeito de proprie^ * A menos que se indique explicitamente o contrrio, o trmo observaes ser usado, dste momento em diante, para referncia s observaes independentes ou ajustadas.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

183

dades de indivduos ou grupos em que tal discrepncia existe? sse o ponto em que a estatstica nos socorre; em verdade, ela s necessria e aplicvel quando a dis crepncia existe.

4. Padro dos dados.


Suponhamos estar interessados em estudar o pso mdio dos estudantes de sexo masculino, que freqentam certa universidade. Dificilmente, iremos esperar que todos os estudantes tenham pso igual. Mas, poderemos esperar algum padro de pso. Podemos esperar, por exemplo, que haja muito poucos pesando menos de 100 libras e poucos pesando mais de 200. Poderemos verificar, tambm, que a maior parte dos estudantes pesa em trno de 150 libras. Se escolhermos uma amostra aleatria simples de 270 estu dantes, poderemos obter resultados tais como os que apa recem na tabela 15.
T a b e la

15 M A SCU LIN O

PESOS D E 270 ESTUDAN TES D O S E X O

Pso (em libras) 100-109 . . .t 110-119 . . . 120-129 . . . 130-139 . . . 140-149 . . . 150-159 . . . 160-169 . . . 170-179 . . . 180-189 . . . 190-199 . . . 200-209 . . . 210-219 . . . Total

Fre qncia 1 1 6 38 80 83 39 17 2 2 0 1 270

Freqncia relativa * 0.004 .004 .022 .141 .296 .307 .145 .063 .007 .007 .000 0.004 1.000

* A freqncia relativa igual freqncia da classe dividida pela freqncia total. Assim, na primeira classe, a freqncia relativa igual a 1/270 ou 0.004. t sse intervalo inclui pesos iguais ou maiores do que 99.5 libras, porm menores do que 109.5 libras; isto , "at, mas no incluindo, 109.5 libras".

184

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

A tabela mostra a distribuio de freqncia dos dados. stes so distribudos de forma a colocar em evidncia o padro, da maneira mais eficaz. Na tabela, se v que ape nas 1 dos 270 estudantes pesa menos de 110 libras e que somente 1 pesa mais do que 208.5 libras. A maioria dos estudantes tem os pesos respectivos situados entre sses extremos e, em verdade, mais de metade dles pesa entre 140 e 160 libras. Essa constatao sugere que h, nos dados levantados, um padro bem definido e sugere tambm como usar sses dados para predizer os pesos de estudantes no recenseados. de esperar que, mesmo pesando muitos outros estudantes, poucos dstes acusariam menos de 100 libras. Essa predi o baseia-se no apenas no fato de que somente 1 dos 270 estudantes se aproximou daquele peso, mas ainda, no fato de que a distribuio de pesos mostra que h tendn cia definida para pesar mais.

5. Distribuio de dados.
Dada a maneira como foi feita a distribuio, os dados obtidos com a pesagem dos estudantes do sexo masculino evidenciam um padro definido. A distribuio de dados revela-se muito frutfera para predio em vrios campos. Por exemplo, na ilustrao relativa a estudantes universi trios mencionada acima, pode ser de grande importncia a fixao do pso normal ou mdio, para determinar se certo estudante apresenta pso acima do normal ou abaixo do normal. Por outro lado, um mdico aplicado a efetuar uma srie de medidas do mesmo objeto estar, geralmente, inte ressado em conhecer o valor em trno do qual a maioria dos dados se aglomera, pois le admite que, recorrendo a sse valor central, cometer antes erros pequenos do que grandes. le assevera que sse valor central situa-se nas proximidades do valor verdadeiro, que o procurado. Seja qual fr o motivo que tenha levado a colecionar dados, indubitvel ser extremamente importante o padro dsses dados. E tambm claro que, se fsse pesado um maior nmero de estudantes escolhidos ao acaso, no deve ramos esperar o mesmo tipo de padro; poderamos verifi car que h maior nmero de estudantes cujos pesos se apro

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

185

ximam do valor central do que havamos encontrado entre os 270 originais, ou poderamos verificar que alguns pesam menos do que qualquer dos inicialmente recenseados. Pa rece razovel, entretanto, esperar que, aumentando o nmero de observaes aleatoriamente escolhidas, o padro dos da dos se torne mais e mais estvel e tanto a experincia como a teoria justificam essa espectativa. Acompanhemos um exemplo em que mais e mais dados so coligidos e verifiquemos como se desenvolve o padro. Decidir at onde caminhar neste campo uma questo de ordem prtica, mas suporemos que o pesquisador se acha disposto a efetuar grande nmero de observaes acrca do pso de estudantes, a fim de se sentir cada vez mais se guro a respeito do padro dos dados. Os dados originais acrca dos pesos j foram apre sentados na tabela 15. Para acompanhar o desenvolvimen to do padro dos dados, conveniente construir um grfico, tal como o que aparece na Figura 6. sse tipo de grfico chamado histograma e muito til para registrar dados desta espcie, porque mostra claramente a natureza do padro. Na base do histograma, situa-se a escala que corres ponde aos vrios pesos. Essa escala foi dividida em inter valos convenientes, que se combinam com os intervalos da Tabela 15. Ao longo do eixo vertical do histograma est assinalado o nmero de estudantes cujo pso se situa em determinado intervalo. Quanto maior a extenso vertical da coluna que se levanta sbre certo intervalo, maior o nmero de estudantes cujos pesos se colocam dentro daqule intervalo. Um rpido olhar ao histograma o bastante para se perceber que os dados tendem a crescer no meio, caindo muito bruscamente em direo a ambos os extremos. Se o nmero de observaes aumenta, faz-se difcil uma comparao direta entre as formas do nvo e do velho histo grama, por causa das diferentes alturas das colunas. As comparaes tornam-se mais fceis, se, em vez de assinalar o nmero (freqncia) de estudantes cujos pesos se situam em determinado intervalo, assinalarmos a freqncia relativa. A freqncia relativa de estudantes cujos pesos se situam em determinado intervalo , to somente, a proporo de estu dantes observados, cujos pesos se situam naquele intervalo.

18 6

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

No exemplo, h 80 dos 270 estudantes, cujos pesos se colo cam no intervalo 140-49... libras; a freqncia relativa de estudantes com pesos no intervalo 140-49. . . libras 80/270 ou 0.296. Isso pode tambm ser expresso, falando-se em 29,6 por cento.

90 80

70' 60

d
cr

40 30

20

)0
o
99.5

i
1 09 .5

- -------------------- 1. .. a =1
119.5 1 29 .5 139 .5 1 49. 5 159.5 169. * 1 79 .3 189.5

n---- l. 1 _
199 .5 209.5 219.5

Pso em libra9

F ig. 6 Pesos de 270 estudantes do sexo masculino

O histograma que aparece na Figura 6 pode ser recons trudo em trmos de freqncia relativa. O resultado apa rece na Figura 7. Note-se que os dois histogramas corres pondem ao mesmo padro exatamente; a nica diferena que, no ltimo, o eixo vertical representa a freqncia telativa e no a freqncia absoluta (i., o verdadeiro nmero observado). Suponhamos, agora, que mais 730 estudantes, aleatoria mente escolhidos, foram pesados, de sorte que o nmero total sobe a 1.000. A tabela 16 mostra os resultados para sses 1.000. Como antes, podemos construir um histograma para apresentar os dados sob forma de freqncias relativas. sse histograma aparece na Figura 8.

LGICA

DOS

PROCED IM ENTOS

ESTATSTICOS

187

0 .30

Freqncia relativa

0 . 20

0 .1 0

99.5

1 09 .5

119.5

1 29 .5

1 39 . 5

149.5

159.5

1 69 .5

179.5

1 89 .5

1 99 .5

209.5

2 19 .5

229.5

Peso em libras

F ig. 7 Pesos de 270 estudantes do sexo masculino.

T abela

16

PESOS DE

1.000 ESTUDANTES D O S E X O M A SCU LIN O

P SO (em libras) 90- 99 . . .* 100-109 . . . 110- 19 . . . 120- 29 . . . 130- 39 . . . 140- 49 . . . 150- 59 . . .

Freqncia relativa 0.001 .001 .008 .042 .135 .276 0.278

Pso (em libras) 160- 69 . . . 170- .7 9. . . 180- 89 . . . 190- 99 . . . 200-209 . . . 210- 19 . . .

Freqncia relativa 0.172 .072 .012 .002 .000 0.001

* libras.

"90-99..." =

"de 89.5 libras at, mas no incluindo, 99.5

188

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

0. 30

0 . 20

89i5

,5

109 ,5

H9.5

1.29,5

1 39. 5

M 9.5

159,i

149. S

179 .5

189 .5

199.5.

209.5

219.5

rso em libras

F ig. 8 Pesos dc 1.000 estudantes do sexo masculino

Note-se que, neste nvo histograma, a disperso dos dados maior do que era com respeito s 270 observaes originais: alguns estudantes pesam menos do que qualquer dos previamente pesados. As freqncias relativas dos pesos, entretanto, permanecem aproximadamente as mesmas. Nas observaes originais, ningum pesava menos de 100 libras, de modo que a freqncia relativa era, naturalmente, 0.000. Na amostra maior, apenas um estudante pesou menos de 100 e mais de 90 libras e, assim, a freqncia relativa 1/1.000 ou 0.001. Comparaes semelhantes podem ser feitas para qualquer dos outros intervalos e mos traro que as freqncias relativas no diferem amplamente. Em verdade, pois, os dois padres de dados o que aparece na Figura 7 e o que aparece na Figura 8 no diferem muito. Mas transparente que o histograma da Figura 8 "mais regular que o da Figura 7. Essa dife rena de regularidade torna-se mais clara, quando ten tamos burilar o histograma. Podemos faz-lo, subdividindo os intervalos. Por exemplo, em vez de determinarmos as

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

189

freqncias relativas para intervalos de 10 libras, suponha mos que as determinemos para intervalos de 5 libras. Nesse caso, obteramos os resultados que aparecem nas tabelas 17 e 18, projetados nas Figuras 9 e 10.

0 .30

x=r
9 9.5 109.5 119.5 129.5 139.5 149.5 159.5 169.5 179.5 189.5 199.5 209.5 219. S

Pso em libras

F ig . 9

Pesos de 270 estudantes do sexo masculino

o .io .

99.5

109.5

119.5

129 .5

1 39. 5

149.5

1 59. 5

169.5

179.5

189.5

199.5

209.5

219.5

PGso em libras

F ig .

10

Pesos de

1.000 estudantes do sexo masculino.

190

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

T a b e la

17

PESOS DE 270 ESTUDANTES D O S E X O M ASCULIN O

Pso ( em lib ra?! 105- 9 110-14 115-19 120-24 125-29 130-34 135-39 140-44 145-49 150-54 155-59

Freqncia relativa 0 004 .0 0 4 .0 0 0 .011 .011 .0 3 0 .111 .1 1 8 .1 78 .1 47 0 .1 5 9

Fso (e m lib ras) 160- 64 . 165- 69 . 170- 74 . 175- 79 . 180- 8 4 . 185- 89 . 190- 94 . 195- 99 . 200-204 . 205- 9 . 210- 14 . . . . . . . . . . . . . . . . . . . . . . .

Freqncia relativa 0 .0 7 4 .0 7 0 .0 4 5 .0 1 9 .0 0 7 .0 0 0 .0 0 4 .0 0 4 .0 0 0 .0 00 0 .0 0 4

...
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

T a b e la

18

PESOS

DE 1.000 ESTUDANTES D O S E X O M A SCU LIN O

Pso ( em libras) 95- 99 . . . 100-104 . . . 105- 9 . . . 110- 14 . . . 115- 19. . . 120- 24 . . . 125- 29 . . . 130- 34 . . . 135- 39 . . . 140- 44 . . . 145- 49 . . . 150- 54 . . .

Freqncia relativa 0.001 .000 .001 .003 .005 .017 .025 .057 .078 .125 .151 0.145

Pso ( em libras) 155- 59 . . . 160- 64 . . . 165- 69 . . . 170- 74. . . 175- 79 . . . 180- 84 . . . 185- 89 . . . 190- 94 . . . 195- 99 . . . 200-204 . . . 205- 9 . . . 210- 14 . . .

Freqtlncia relativa 0.133 .103 .069 .050 .022 .011 .001 .002 .000 .000 .000 0.001

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

191

Note-se que, subdivididos os intervalos dessa maneira, as 270 observaes produzem um padro mais irregular que as 1.000 observaes. Suponha-se que continuemos a sub dividir os intervalos e a elevar o nmero de observaes. Ento, se, por exemplo, pesssemos 10.000 estudantes e estabelecssemos intervalos de 2 1/2 libras, teramos um histograma tal como o que nos mostra a Figura 11.

.2. o
.? ~

0 0 5
0.0 4 0.03
0 . 02

.5

- -r-rff
99.5 109.5

TtTfr-w-,.
129.5 139.5 H 9.5 159.5 169.5 179.5 189.5 199.5 2 09. 5 219.5

119.5

P C so cm libras

F ig. 11 Pesos de 10.000 estudantes do sexo masculino

A sucesso de grficos torna claro que os histogramas podem ser levados a aproximar-se de curvas suaves pela reduo dos intervalos e aumento do nmero de observaes. A curva suave limite, naturalmente, s poderia ser traada se os intervalos decrescessem em tamanho para alm de qual quer limite e a amostra total crescesse sem limite. Mas, as Figuras 6-11 bastam para evidenciar que, coligindo-se maior nmero de dados, o histograma revela definida ten dncia para aproximar-se de uma curva suave, tal como se mostra na Figura 12,

192

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Pso em libras

F ig . 12 Curva suave para pesos de estudantes do sexo masculino

No sabemos, em verdade, se os dados reunidos ceriam como limite a curva que aparece na Figura 12. Talvez o padro dos dados no se aproxime de nenhuma curva suave especfica. Mas veremos que a curva que aparece na Figu ra 12 extremamente til para apoiar predies e decises; adiaremos, por agora, a questo de saber se existem, "ver dadeiramente, na natureza, curvas tais e nos ocuparemos com verificar os usos que delas podemos fazer. A curva suave mostrada na Figura 12 chamada curva de freqncia relativa; o limite de que se faz apro ximao por meio da reunio de mais e mais dados e da sub-diviso indefinida dos intervalos. A equao matem tica que descreve a curva de freqncia relativa tem o nome de funo de distribuio.* Nem tdas as curvas de frequncia relativa tm o aspecto da que aparece na Figura 12. Por exemplo, ela apresenta padro muito diferente da que diz respeito aos dados de um censo a propsito da distribuio de mulheres por nvel de renda e que mostrada pela tabela 19 e projetada no histo grama da Figura 13. Uma possvel curva suave, relativa
* Mais precisamente, esta equao chamada uma funo densidade de probabilidade. O trmo distribuio (ou funo de distri buio) aplicado, em sentido tcnico, equao que1 descreve a curva cumulativa de freqncia. Mas, como qualquer das funes pode ser deduzida da outra, a distino perde interesse para ns.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

193

a sses dados, apresentada pela Figura 14. Revela essa curva uma decidida tendncia para cair para a direita. Isso de se esperar de dados como stes; h grande nmero de mulheres que tm baixo nvel de renda e, conseqente mente, a curva de freqncia relativa que diz respeito renda sobe, a princpio, muito bruscamente. Mas, h "disperso mais ampla no lado direito da curva de distribuio. Os dados coligidos a propsito de pso de estudantes do sexo masculino distribuam-se simtricamente, de vez que a curva caa de maneira igualmente acentuada, para a direita e para a esquerda de seu pico. Mas, os dados referentes s ren das anuais so inclinados para a direita, significando isso que a curva cai muito mais rapidamente para a direita que para a esquerda. Se temos uma curva com pico e se a fre qncia decresce mais vagarosamente para um lado que para o outro, diz-se que tal curva inclinada para o lado em que decresce em menor proporo.

T a b e la

19 E

D IST RIB U I O DE MULHERES DE Q U A T O RZE A N O S MAIS, POR N IV E L DE RENDA, EM 1947


(Tamanho da amostra =
Nvel de Renda Perda 1-S 499 . . S 500-S 999 . . $1,000-S1,499 . . SI,500-S 1,999 . . S2,000-S2,499 . . S . . . . . 12.000) Freqncia Relativa 0.002 .29S .195 .160 .156 .104 .038 .021 .009 .006 003 .003 .003 0.003

S2,500-S2,999 . . . S3,000-33,499 . . . S3,500-S3,999 . . . S4,000-54,499 . . . S4,500-S4,999 . . . S5.000-S5.999 . . . S6.000-S9.999 . . . S10000 em diante

19 4

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Freqncia relativa

F ig. 13 Histograma da tabela 19

F ig. 14 Tipo de curva aproximada, relativa figura 13.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

195

Outros tipos de padro de distribuio aparecem na Figura 15, com os nomes geralmente usados para designlos. Na exposio que vai se seguir, limitar-nos-emos s funes simtricas, convindo lembrar que, na prtica, essa restrio no se imporia.

Distribuio retangular

F ig. 15

Tipos de padro de distribuio

Talvez a distribuio simtrica usada mais comumente seja a que se chama normal. Essa distribuio goza de pro priedades que a tornam de uso fcil para efeito de predio, como adiante mostraremos. A distribuio normal apresenta sempre padro semelhante ao que aparece na Figura 12.

196

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Tem apenas um pico, simtrica e, quanto mais nos afas tamos do pico para qualquer dos lados, mais a curva se aproxima do eixo horizontal.* Para discorrer a propsito da distribuio normal e de outros tipos de distribuio, ser conveniente introduzir alguns termos relativos ao assuntoi. Isso nos poupar o incmodo de repetir muitas palavras, quando desejarmos expressar certa idia referente a padro de distribuio. Para introduzir sses trmos, suporemos conhecer a funo de distribuio, tal como ilustrada pelas curvas suaves das Figuras 12, 14 e 15. 6. Probabilidade.

Dissemos antes que, em vez de assinalar o nmero de estudantes cujos pesos se situassem em um intervalo, deveramos assinalar a freqncia relativa dos pesos em cada intervalo. Observado sse plano, ao seu limite, quan do atingirmos a curva suave, teremos projeo da propor o da populao total que se situa em qualquer intervalo. Em outras palavras, a distribuio tem uma propriedade til: se conhecemos a distribuio, podemos determinar exatamente que proporo dos estudantes tem pesos que se situam em qualquer intervalo especificado. Vejamos o que significa essa propriedade. Suponha mos que a figura 12 a curva regular limite da distribuio de dados obtidos por amostra aleatria extremamente grande e suponhamos tambm que essa curva regular corresponde ao que chamamos uma funo de distribuio normal. Podemos ento determinar, como veremos agora, qual a exata porcentagem de estudantes que pesam, por exemplo, entre 130 e 140 libras. Essa frao, quando computada matemticamente, corresponde a 0.0902 (ou 9.02 por cen-

* As propriedades no bastam para definir a curva normal; es vem definida rigorosamente pela equao

onde x = 3.1416 e e = 2.7183; | x e a sero definidos a seguir. X a abcissa, a medida ou resultado marcados no eixo horizontal; Y a ordenada, a altura da curva, correspondente a um dado valor de X.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

197

to). Denominamos essa frao: a probabilidade de que o pso de um estudante, aleatoriamente escolhido, venha a situar-se dentro dsse intervalo. Assim, a probabilidade de que o pso de um estudante aleatoriamente escolhido se coloque dentro de certo intervalo diferente da freqn cia relativa dos pesos; a freqncia relativa baseia-se em um nmero limitado de observaes acerca dos pesos de es tudantes, enquanto a probabilidade se apoia na curva regu lar da funo de distribuio que somente pode ser obtida depois de observado um nmero indefinidamente grande de estudantes. As probabilidades so indiscutivelmente muito teis, porque nos capacitam a fazer predies muito acuradas acrca da populao de estudantes do sexo masculino, por exem plo, poderamos dizer qual a probabilidade de que qualquer estudante aleatoriamente escolhido viesse a ter pso situado dentro de qualquer intervalo especificado. Se conhecemos a funo de distribuio normal, como possvel determinar essas probabilidades? A determinao das probabilidades equivale, como se pode ver nas figuras, determinao de certa rea sob a curva da freqncia relativa. A poro hachureada na figura 12 representa a rea de 130 a 140 libras sob a curva de freqncia relativa; essa rea apenas uma parte da rea total sob a curva. Em verdade, ela corresponde a 0.0902 da rea total; isto , a poro da rea total que se situa entre 130 e 140 libras equivale probabilidade. Dispomos, agora, de uma maneira grfica de represen tar as probabilidades. Podemos representar a probabilidade de que um acontecimento venha a se realizar, por meio de uma rea sob a curva da freqncia relativa. Temos ne cessidade de alguma tcnica, entretanto, para determinar a extenso dessas reas. Podemos nos utilizar das tcnicas matemticas do clculo integral, quando se trata de curva suave, tal como as que aparecerem nas figuras 12, 14 e 15. Mas, no caso de distribuio normal, as reas foram prepa radas e tabuladas de maneira muito conveniente. Para usar essas tabelas e, conseqentemente, para aplicar dados nor malmente distribudos determinao da probabilidade de acontecimentos, devemos considerar, antes, algumas impor tantes propriedades das funes de distribuio.

198

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

7.

Medidas de tendncia principal.

Uma forma de descrever o padro dos dados represen tados pela curva da figura 12 dizer que a curva atinge seu nico pico a 152.5 libras. O valor, no eixo horizon tal, diretamente abaixo do pico da curva chamado moda da distribuio. A localizao da moda importante na descrio de dados dessa espcie, pois, atravs dela, pode mos dizer onde se situa a maioria das observaes. A moda verdadeira chamada medida de tendncia principal, porque descreve o ponto, em trno do qual, os dados tendem a aglomerar-se. No caso de distribuio nor mal, h uma e nica moda verdadeira, sendo a distribuio chamada unimodal. Distribuies com duas ou mais modas (polimodais) so, algumas vzes, encontradas na prtica. A moda no a nica, nem mesmo a mais importante medida de tendncia principal. Muitas outras medidas fo ram sugeridas. Por exemplo, a mediana; isto , o valor no eixo horizontal (abscissa), cuja ordenada separa ao meio a rea, sob a curva que representa a funo de distribuio. Em outras palavras, h igual probabilidade de que uma observao venha a cair num ou noutro lado da mediana. Em distribuies simtricas unimodiais, a moda e a mediana se confundem. Para nossos propsitos, a medida de tendncia principal mais importante a mdia aritmtica, ou simplesmente, a mdia. A mdia de uma distribuio de dados assemelha-se muito ao centro de gravidade de um objeto e, em verdade, usamos tcnicas similares para avaliar ambos. O centro de gravidade de um corpo o ponto no qual a massa dsse corpo est efetivamente concentrada. Se suspendermos uma barra de ao pelo seu centro de gravidade, ela se equi librar perfeitamente. Podemos usar dessa analogia fsica para nos auxiliar a apreender o conceito de mdia. Supo nhamos ter uma curva suave representando o padro de um conjunto de dados, tal como aparece nas figuras 12, 14 e 15. Suponhamos, agora, que recortssemos a figura limi tada pela curva suave e o eixo horizontal Suponhamos que a figura fsse rgida, por ter sido traada, por exemplo, num pedao de papelo; suponhamos que o papelo fsse recortado de maneira semelhante da figura. Poderamos, ento, colocar uma lmina de faca perpendicularmente ao eixo

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

199

horizontal, no ponto onde a figura de papelo se equilibra. Se o papelo fr feito de material uniforme, o ponto do eixo horizontal em que a figura se equilibra, a mdia verdadeira, ou "mdia da populao da distribuio dos dados. Indicaremos a mdia verdadeira, ou da populao, pela letra grega Se procedssemos dessa maneira relativamente curva que aparece na figura 12, verificaramos que a figura se equilibra no ponto em que a moda est localizada. Isto sempre verdade para distribuies simtricas unimodais e, portanto, para a funo de distribuio normal: a mdia, a moda e a mediana localizam-se no mesmo ponto do eixo horizontal. Note-se, entretanto, que se uma barra de ferro de forma irregular ela no se equilibrar, necessriamente, pelo ponto de maior volume ou, para usar um trmo j consagrado, pela "moda de sua massa. O halteres, por exemplo, tem duas "modas de massa, uma em cada extremidade e, no entanto, se equilibram num ponto no centro da barra. De maneira idntica, um conjunto de dados no se equi libra, necessriamente, no ponto em que se localiza o pico. Isso aparece claramente da figura 14. O pico se localiza em $ 255; mas, se ns cortarmos a curva que aparece na figura 14 e tornarmos rgida a flha de papel, o equilbrio se dar no pela moda, mas, por um ponto direita da moda. De maneira semelhante, distribuies bimodais se equilibraro, geralmente, por um ponto situado entre os dois picos. 8. Clculo da mdia.

A mdia verdadeira, ou mdia da populao de uma dis tribuio de observaes s pode ser determinada se conhecer mos a prpria funo de distribuio; mas a funo de dis tribuio s pode ser determinada quando j se fizeram tdas as observaes possveis. Na prtica, necessitamos, ento, de alguma tcnica definida para calcular a mdia verdadeira com base em um nmero finito de observaes; isto , com base em amostra. sse clculo no precisa ser absoluta mente exato; em verdade, raramente esperaremos que o seja. Mas, em linguagem comum, o clculo deve "beirar o valor verdadeiro.

200

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Ora, h numerosas maneiras de calcular a mdia verda deira da distribuio, a maioria das quais pode ser utilizada na prtica. Poderemos, por exemplo, adotar o valor que se situe a meio, caminho entre a mais alta e a mais baixa leitura obtida. sse ponto a meio caminho, num procedi mento a longo prazo, viria a situar-se muito prximo do va lor verdadeiro da mdia, quando a distribuio de freqn cia (projetada com base em certa amostra) fsse simtrica. Ou, de outra forma, para tais distribuies simtricas, po demos admitir que a mdia verdadeira se confunde com a moda da amostra, pois, como fizemos notar anteriormente, a moda e a mdia so as mesmas nas curvas de distribui o simtrica. O clculo da mdia verdadeira, que mais freqente mente usado, com tipos vrios de amostragem aleatria, e isso porque traz importantes vantagens prticas, obtido adicio nando-se os valores de tdas as observaes conseguidas a partir da amostra e dividindo a soma pelo nmero total de observaes feitas; equivaler, pois, mdia aritmtica dos valores observados. * Convm simbolizar essa operao. Seja xi, x2, X3, etc., a primeira, a segunda, a terceira, etc., observao. Seja X; uma observao qualquer do conjunto. O ndice i corresponde a qualquer um dos nmeros ndices, 1 , 2, 3, etc.. Introduzimos o smbolo 2 para representar
n
a

operao de adio e fazemos com que

x,-

denote

a soma dos n valores observados, do primeiro at o ensimo (o ltimo). Isto ,


n

X { = * i + *2 + *3 + , .

+ *.

Representemos com x a estimativa acima referida da mdia verdadeira, n; ento,

* A mdia aritmtica o "centro de gravidade dos valores observados e pode, pois, ser utilizada como estimativa do "centro de gravidade da populao.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

201

Essa frmula atesta que x corresponde soma dos valores observados, dividida pelo nmero total de observaes. Notese que x apenas uma estimativa da mdia verdadeira, ( .1; mcLia da amostra, enquanto que (t a mdia da populao. Deve-se assinalar que essa estimativa da mdia da po pulao, se baseada em amostra aleatria ilimitada, no apre senta desvio. Em outras palavras, o valor esperado das es timativas (x) revela-se igual mdia da populao (^i), seja essa populao finita ou no, e seja a amostra colhida com ou sem substituio. O mtodo descrito adequado para calcular x a partir de um conjunto de observaes no grupadas (i. , no clas sificadas). A nota 1, ao fim deste capitulo, descreve um mtodo para computar x a partir de um conjunto de dados grupados, ou classificados, tal como o caso dos pesos dos estudantes. 9. Medidas de disperso.

As medidas de tendncia principal no constituem os nicos meios de descrever o padro de um conjunto de dados. Isto aparece claramente na Figura 16a. Temos aqui, duas curvas de freqncia relativa, ambas simtricas e ambas apre sentando exatamente as mesmas mdias de populao (i). Mas as observaes relativas curva B no se aglomeram em trno da mdia to densamente como se d com as rela tivas curva A. Diz-se que, quanto mais um conjunto de observaes se aglomera em trno da mdia, menos dispersas e mais precisas so essas observaes; quanto menos se aglo merem em trno da mdia, mais dispersas e menos precisas sero. Podemos ter duas populaes, ambas com a mesma mdia, porm com diferentes disperses. Por exemplo, o Q I mdio numa pequena cidade pode igualar a mdia nacional, mas devemos esperar que o Q I na pequena cidade seja menos variado do que o Q I da nao. Por outro lado, podemos ter duas populaes com diferentes mdias, mas com disper so idntica em trno das mdias respectivas, tal como se mostra na Figura 16b. Para descrever um padro de observaes possveis, de vemos, portanto, saber onde se situa a mdia e saber, tam bm, algo a respeito da disperso das populaes.

202

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

b ) Mdias diferentes, disperses iguais

F ig . 16

Comparao entre distribuies normais

Muitos so os meios de medir a disperso. Uma de tais medidas pode ser a oscilao dos valores possveis, isto , distncia entre o maior e o menor dos valores poss veis. Surgiro casos em que no haver valores possveis mais altos e mais baixos (i. , stes podem tender para mais ou menos infinito). Uma medida que se impe com natu ralidade baseia-se no fato de que, quanto mais dispersos os dados do conjunto, mais parecem as observaes desviar-se de sua mdia. Uma boa medida de disperso poderia ser conseguida, em razo disso, tomando a mdia dos desvios da mdia que revelam as observaes. Mas, a soma dos des vios que, em relao mdia, apresenta um conjunto de observaes, sempre igual a zero. Por exemplo, a mdia aritmtica de 2, 4, 6, 8, 10 e 12 7. Os desvios em rela o mdia so - 5, - 3, - 1, 1, 3 e 5. O total desses desvios igual a zero. Essa dificuldade pode ser evitada tornando positivo o sinal de todos os desvios, ou elevando-os ao quadrado. (Os quadrados dos desvios sero todos po

LGICA

DOS

PROCED IM ENTOS

ESTATSTICOS

203

sitivos). O procedimento consistente em elevar ao quadrado os desvios e tomar a mdia dsses quadrados fornece uma medida de disperso chamada varincia. A raiz quadrada da varincia outra medida de disperso; chama-se desvio pa dro. A varincia e o desvio padro no so, de modo algum, as nicas medidas de disperso em uso, mas so, provavelmente, as de mais amplo emprgo. O desvio padro pode ser representado grficamente, numa funo de distribuio normal, como a distncia da mdia aos pontos de inflexo, pontos, em ambos os lados da curva, nos quais a curvatura se altera. Se fizermos passar duas ordenadas por sses dois pontos, a rea por elas deter minada corresponderia a 68.26 por cento da rea total sob a curva (ver Figura 17).

F ig. 17

Representao grfica do desvio padro

Quanto mais densamente as observaes se aglomeram em trno da mdia, menor o desvio padro. Se o desvio pa dro fsse zero, tdas as observaes se situariam exatamente no mesmo ponto e no haveria disperso. A curva relativa aos pesos dos estudantes, que aparece na Figura 12, foi tra ada de forma que o desvio padro correspondesse a 20.5 libras. Suponhamos que a mdia da populao, ou mdia verdadeira (f.i), dos dados relativos a pso, fosse 152.5 libras.

204

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Ento, pelo prprio significado da expresso desvio padro, 68.26 por cento dos pesos de estudantes aleatoriamente es colhidos se colocaria, num procedimento de longo alcance, dentro de 20.5 libras da mdia, que 152.5 libras; ou seja 68.26 por cento se situaria entre 132.0 e 173.0 libras. 10. Estimativas do desvio padro.

O desvio padro de uma funo de distribuio, tal como o descrevemos, s pode ser obtido se contarmos com um n mero infinito de observaes da populao. Conseqente mente, e tal como se d no caso da mdia, devemos encontrar uma maneira de calcular o desvio padro com base em amos tra aleatria de observaes. A melhor forma de avaliar o desvio padro de uma dis tribuio por amostragem aleatria simples consiste em de terminar a raiz quadrada da soma dos quadrados dos desvios das observaes em relao mdia, dividindo-a pelo nmero de observaes menos um. Isto , podemos calcular o desvio padro estimado realizando, com os dados, as seguintes ope raes : ( 1) (2) (3) (4) calculando o desvio de cada observao em relao mdia estimada, x elevando ao quadrado cada qual dos valores obtido na operao ( 1 ) somando todos os nmeros obtidos na ope rao ( 2 ) dividindo o total obtido na operao (3) por (n 1 ) * isto , uma unidade menos do que o nmero total de observaes calculando a raiz quadrada do resultado al canado na operao (4)

(5)

O desvio padro da populao, ou desvio padro verda deiro, representado pela letra grega a e a estimativa do desvio padro obtido pelas operaes acima enumeradas representado pela letra latina 5. O desvio padro estimado, s, pode ser expresso pela frmula seguinte:

* (n 1) representa os graus de liberdade de s. O concei e seus empregos so explicados na seo 5 do prximo captulo.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

205

,-Jy
n 1 Cabe ao leitor constatar que essa frmula corresponde s instrues dadas acima. O clculo do desvio padro de acrdo com as instrues anteriormente fornecidas , algumas vzes, de grande com plexidade. O valor da mdia estimada, x, pode ter vrias casas decimais, de sorte que os nmeros obtidos na primeira operao apresentam vrios algarismos e, conseqentemente, os quadrados dos nmeros, pedidos pela operao ( 2 ) so de clculo trabalhoso. Por essa razo, o conjunto de ope raes enumerado abaixo, capaz de fornecer exatamente o mesmo valor para s, pode ser usado sempre que o conjunto de operaes referido parea complicado: ( 1) examinar os nmeros e imaginar qual ser, em nmeros redondos, a mdia (no importa quo mau seja o palpite ) subtrair o valor imaginado de cada qual das observaes, mantendo os sinais positivos e negativos elevar ao quadrado todos os nmeros obtidos na operao anterior, ( 2 ). adicionar todos os quadrados da operao (3) e dividir a soma por (n 1 ) adicionar todos os nmeros obtidos na ope rao ( 2 ), dando ateno aos sinais positivos e negativos, e elevar ao quadrado o resultado. dividir o quadrado obtido na operao (5) por n (n 1) subtrair o nmero obtido em ( 6 ) do nmero obtido em (4) calcular a raiz quadrada do resultado obtido em (7). (O resultado obtido na operao (7) , s2 e se denomina varincia estimada, ou da amostra. Assim, a varincia da popula

(2)

(3) (4) (5)

(6) (7) ( 8)

206

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

o o2, o quadrado do desvio padro da po pulao, 0.). O nmero de operaes neste procedimento maior do que no precedente, mas elas so muito mais simples de efe tuar, de vez que os nmeros so de manipulao mais fcil. O leitor poder constatar que a frmula para s, de acrdo com as oito operaes acima indicadas, a seguinte: seja x0 a mdia imaginada; ento:

12
J \

O; - -to)!
i i

[2

(*' ~ v) ]
0 1)

Essas operaes so ilustradas a seguir, a propsito de um conjunto de pesos de estudantes universitrios.

C LCU LO D A V A R I N C IA E D E S V IO P A D R O D E U M C O N JU N T O D E PESO S D E E ST U D A N T E S U N IV E R S IT R IO S
D
a d o s o r ig in a is

( x i)

142, 156, 184, 169, 153, 172, 135, 162 (1) (2)
*

mdia imaginria, x0 = 160 subtrair 160 de cada observao

Pode-se demonstrar que:

n-\

[ (.,-.)] j t n (n F) ~\ n- j
0 temos:

Alm disso, para .v =

is(* .-* ,)* [(-.)r Ir* ? (>t


n1 ( 1 ) \ 1 h (u 1 )
caso se dis

Esta ltima expresso mais fcilmente manejvel, ponha de mquinas de clculo.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

207

(Ti -

X q)

IS
4 +24 + 9 7 -25

+12

+2
y (.Ti ~ To) = 7

(3)

elevar ao quadrado os nmeros obtidos em (2)

(t , -

T o)5

324 16 576

8 1
49

144 625 4

n
^ (T i To)2 = 1 ,8 1 9

(4) (7) (8)

1,819/7 = 259.9 49/56 = 0.9 259.9 - 0.9 = V259X) = 16.1 259.0 = s2

(5) e (6). ( - 7 ) 7 ( 8 ) (7) =

As mesmas operaes podem ser reunidas na frmula seguinte:


1 " j

( t

x)*
1

]'

1 C

J
n ( n 1)

1 ,8 1 9
*

(-7)
OC 00

ii-

O mtodo para calcular s para dados agrupados des crito na nota 1, ao fim do captulo.

00

208

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

s2 uma estimativa precisa de a2, se s2 fr calculado a partir de amostra aleatria simples, colhida de uma populao infinitamente extensa, ou a partir de uma populao finita, com substituio. Se, entretanto, a amostra fr colhida sem substituio, s2 no estimativa precisa de o2. Uma estima tiva precisa de o2 em amostragem sem substituio :

onde N a extenso da populao e neira acima descrita. Note-se que, (N 1) / N tem por limite 1. Por tando de populaes muito amplas, efeito sbre o valor de s2. 11.

s2 computado da ma crescendo N, o trmo isso mesmo, em se tra sse trmo tem pouco

Distribuio de mdias estimadas.

Em trmos de funes de distribuio de observaes, podemos formular o que se contm na fase estatstica da in vestigao cientfica. Nessa fase estamos sempre interessa dos nas propriedades verdadeiras da funo de distribuio, que no conhecemos, porque utilizamos apenas as amostras da populao total. O problema de inferncia estatstica , ento, o de fazer asseres acrca das propriedades da dis tribuio desconhecida, com base na informao propiciada pela amostra e nas hipteses que desejamos estabelecer para equacionar o problema. Os fundamentos lgicos da abordagem estatstica dsse problema revelam-se na forma como o problema estatstico apresentado. Utilizando o senso comum, podemos perguntar, a mdia verdadeira (|x) de uma populao igual a (diga mos) 100?. Mas, em estatstica, perguntamos Se a mdia verdadeira da populao igual a 100, que possibilidade te remos de obter um dado conjunto de observaes?. Se h grande possibilidade de obtermos as observaes especifica das, poderemos aceitar a hiptese m - = 100; caso contrrio, a hiptese ser rejeitada. Assim, a tarefa da anlise esta tstica a de determinar a probabilidade de obteno de um conjunto de observaes qualquer, admitindo como verdadeira uma hiptese especfica.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

209

Suponhamos que, baseados numa teoria psicolgica, che gamos concluso de que o resultado mdio de adultos nor mais, em certo teste psicolgico, 100. Desejamos determi nar se essa concluso , ou no, vlida e, por isso, fazemos dela uma hiptese: n = 100. Nosso objetivo testar a hiptese e, para isso, construmos a situao de pesquisa, selecionamos uma amostra aleatria de 100 adultos, subme temo-los ao exame e determinamos os resultados. Deseja mos saber, agora, se essas 100 observaes corroboram a hiptese. Se a hiptese fsse verdadeira, perguntamos, que possibilidade teramos de conseguir o conjunto de observaes que conseguimos? Dessa maneira, buscamos determinar se os resultados corroboram ou refutam a hiptese. Suponhamos que a mdia da amostra, x, 101.2, com desvio de 1.2 do valor que esperaramos, se a hiptese fsse exatamente confirmada. sse desvio, em si mesmo, nada significa, pois no conhecemos a possibilidade de ocorrncia de tal desvio entre a mdia da amostra e a mdia da popula o, quando esta ltima igual a 100. A determinao dessa possibilidade ou probabilidade depende, como veremos, da disperso das observaes. Podemos, agora, reformular o problema estatstico, apre sentando-o da maneira seguinte. Suponhamos que um cien tista devesse aplicar testes de inteligncia a um grande nmero de amostras, cada uma delas constituda de 100 adultos. Isto , o pesquisador colheria resultados em grupos de 100 e reuniria um grande nmero dessas amostras de 100. Para cada grupo, le calcularia a mdia estimada (ou da amostra), tal como fizemos para o primeiro grupo. Agora, o que dese jamos saber : qual o padro de distribuio das mdias estimadas? No esperamos que essas mdias estimadas coincidam exatamente, tal como no esperamos que observa es individuais mostrem exata concordncia. Por isso mes mo, igualmente ao que se referia s observaes, podemos preparar uma distribuio da freqncia e um histograma das mdias estimadas. Quanto maiores as amostras que tomarmos, tanto mais prximos tenderemos a ficar do verda deiro padro de distribuio das mdias estimadas. No , porm, necessrio chegar-se a tais extremos. Quando conhecemos ou podemos fazer estimativas boas

210

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

acrca dos valores de ^ e de a para a funo de distribuio de uma varivel numa populao, possvel empregar tcni cas matemticas para determinar o padro de distribuio das mdias estimadas. Em particular, um dos pontos conve nientes que aparece ao se tratar com variveis normalmente distribudas numa populao o de que as mdias estimadas, calculadas a partir de amostras aleatrias tiradas dessa po pulao, tambm se distribuem normalmente. * Os padres normais, contudo, no so precisamente iguais. O padro de distribuio das mdias estimadas tem mdia verdadeira igual do padro de distribuio da varivel; ou seja, | i ~ = j.1, A diferena entre as duas distribuies est no fato de que as mdias estimadas no tm a mesma disperso das variveis. Isto , a. , a varincia da distribuio das
X

mdias estimadas, menor que o2, a varincia da distribuio da varivel (para amostras de extenso maior que um); isto , < o2 para n > 1. O mesmo, est claro, se verifica para o desvio padro. A semelhana e a diferena entre a distribuio das m dias estimadas e a prpria varivel pode ser mais fcilmente compreendida por meio de um exemplo. Imaginemos ter obtido trs amostras de duas observaes cada uma:
Amostra 1 2
8
X

Amostra 2 4
10

Amostra 3 6
12

Nesse caso, a mdia da primeira amostra, xt igual a (2 j- 8)/2, ou 5. De modo analgo se obtm x3 igual a 7 e x3 igual a 9. Calculemos, agora, a mdia dessas mdias de amostras. (A mdia das mdias de amostras pode ser representada em smbolos por x).
i = 5 2 = 7 x3 = 9 x = 21/3 = 7

* Pode-se mostrar que a distribuio das mdias estimadas, par uma populao em que a varivel de interesse no se distribua normal mente, tende para a normalidade quando a amostra (empregada para fazer as estimativas) aumenta sua extenso.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

211

A varincia de amostra, s? , de tais mdias de amostras pode ser facilmente obtida. igual a 8/2 ou 4.
X

Agrupemos, agora, as seis observaes originais a fim de calcular a mdia (x) e a varincia (s2).
(Xi-x)

-5 +1 -3 +3 -1 +5

Ui - T 25 1 9 9 1 25 70

Ento, x = 42/6, ou 7; e s2 = 70/5, ou 14. Note-se que a varincia estimada das mdias da amostra (s= ) menor do que a varincia estimada das observaes originais da varivel (s2), mas que x e x so iguais. sse fato pode ser tambm ilustrado por meio de um exemplo do senso comum. Imaginemos que se tenha feito o registro da idade de cada estudante de uma universidade. No nos surpreenderia ver que as idades variavam de crca de 15 at crca de 65 anos. Suponhamos, a seguir, que os alunos estivessem todos em aula, em certa hora, e que deter minssemos a idade mdia de cada classe, quela hora. No esperaramos, por certo, que as mdias cobrissem to ampla gama de idades; isto , no esperamos tanta disperso entre as mdias das classes como entre os indivduos. Podemos representar sse aspecto da distribuio de mdias estimadas, graficamente. Na figura 18 aparecem as curvas de distribuio de um conjunto original de observaes e de mdias estimadas calculadas com base em amostras de, respectivamente, 10, 100 e 10,000 observaes. Notar-se- que a curva de distribuio relativa s obser vaes originais apresenta disperso mais ampla que as outras. O padro de distribuio das mdias estimadas de grupos de 10, 100 e 10,000 observaes aparecem tambm. Essas curvas demonstram o que significa a assero de que a mdia estimada mais "precisa do que as observaes.
X

212

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

A. B. C. D.

Dados distribudos norm alm ente Mdias e3timadas de amostras de 10 Mdias estimadas de amostras de 100 Mdias estimadas de amostras de 10.000

F ig. 18 Padres de distribuio

Se tomamos em conta 10,000 observaes, as mdias estima das se colocaro, geralmente, muito prximas do valor real, muito embora as observaes originais mostrem larga disper so. A relao entre a disperso das observaes originais e a disperso das mdias estimadas pode ser expressa em trmos matemticos precisos. Seja x uma estimativa da mdia computada a partir de amostra aleatria simples, colhi da ou de uma populao infinitamente grande, ou de uma populao finita, com substituio. Seja o2 a varincia ver dadeira da distribuio da varivel na populao e o.' a

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

213

varincia verdadeira da distribuio das mdias estimadas. Ento, pode-se mostrar que:

onde n igual extenso da amostra a partir de que x calculada. Assim, se fazemos uma estimativa da mdia com base em 10 observaes, a mdia estimada tem uma varincia de o2 / 10 e um desvio padro de o/VlO. Podemos elevar a preciso da estimativa da mdia, aumentando a extenso da amostra para, digamos, 100 observaes. Nesse caso, a va rincia da estimativa o2 / 100 e o desvio padro o /10. Se x representa uma estimativa da mdia, calculada com base em amostra aleatria irrestrita, colhida de uma popula o finita, com substituio, teremos:
N n a5 N- 1 n '

onde N igual extenso da populao. Assim, se fazemos uma estimativa da mdia, com base em 10 observaes, de uma populao de 50 elementos, a mdia estimada apresen tar varincia igual a:
50-10 50-1 < r f 10

O desvio padro, ou varincia, da mdia estimada, ou o! corresponde variabilidade do mtodo de amostragem com respeito a tais estimativas. Em outras palavras, me dida da variabilidade (do mtodo de amostragem) a que nos referimos no captulo iv. o* e ; so portanto, medidas de erros de amostragem.
* t

O mtodo exposto acima para calcular

s2/n uma estimativa dsse valor, sem desvio. N n s2 ----------- uma estimativa sem desvios, dsse valor.

214

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

sse rro aplicvel a amostras aleatrias simples e , con seqentemente, medida especfica de rro de amostragem aleatria simples relativa a estimativas da mdia. Outros mtodos existem para calcular erros correspondentes de outros mtodos de amostragem e de outras estimativas (ver [4]). 12. Testes de hipteses concernentes mdia.

Tornemos, agora, ao exemplo do pesquisador que est buscando verificar a hiptese de que o nvel mdio de inte ligncia numa populao determinada de adultos igual a 100. Desejamos saber se a mdia da amostra, x, de 101.2, suscetvel de ocorrer, quando a mdia verdadeira, [i, exatamente 100. Como dissemos, isso depende no apenas do valor da mdia estimada, x, mas tambm de sua preciso (do rro de amostragem); isto , de o- . Supo nhamos que a varincia verdadeira da varivel na populao. (o2), venha a ser 25.00. Dizemos, ento, que a varincia verdadeira das mdias (o~ ) de grupos de 100 observaes
X

25.00/100, ou 0.25. Devemos decidir agora se a mdia estimada "confirma o valor hipottico de exatamente 100. A base para responder a essa questo pode ser encon trada na distribuio das mdias estimadas. Isso pode ser feito determinando-se quo vivel a possibilidade de que se obtenha um resultado de 101.2 no teste, se a populao tem mdia 100 e a verdadeira varincia de 0.25. Se a possibilidade de obteno da mdia estimada estar assim afastada do valor hipottico pequena, estaremos inclina dos a concluir que as observaes no corroboram a teoria. Por outro lado, se o desvio da mdia de amostra em relao mdia hipottica de fcil ocorrncia, ns nos inclinara mos por afirmar que as observaes esto em concordncia com a hiptese. Fizemos notar anteriormente que as mdias da amostra, calculadas com base em dados retirados de uma populao normal apresentam-se distribudas normalmente. Admita mos, ento, que a populao, constituda de resultados de mdias estimadas de teste, est distribuda normalmente em

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

215

trno de mdia 100 com varincia de 0.25. O desvio padro seria igual a \/0.25 ou, 0.5. A partir dessa informao, podemos construir a figura 19.

93.5

99. Q

9 9.5

100.0

100.5

101.0

101.5 Resultados da m edia da amostra

F ig .

19

Por motivo de convenincia, a abscissa foi dividida em o unidades. Podemos determinar quantas o unidades a mdia da amostra, x = 101.2, est afastada da mdia hipottica, | i, = 100, dividindo a diferena entre elas por o;. . sse valor representado pelo smbolo z.

z--- v.
X

- m |

1101.2 100 | _ 1-2 _ 0 ,n

o.s

o.s

A expresso | jc ji| significa "valor absoluto da diferena entre x e |i; isto , a diferena independente de sinal. Se (i = 101.2 e x = 100, teremos 1 100 101.2 | o que seria ainda igual a 1.2. Agora podemos localizar jc na curva que aparece na figura 20. Uma vez que x maior do que |i, ficar, na curva, direita de [i.

216

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

FiG.

20

A rea hachureada direita de x, na figura 20, cor responde probabilidade de obter uma mdia de amostra que seja maior do que 101.2. Para diz-lo em outras palavras, corresponde probabilidade de obter uma mdia de amostra que esteja ainda mais direita, no sentido do eixo positivo, da mdia hipottica, do que 2.40 al unidades. Se avanamos 2.40 unidades para a esquerda de |i, atingindo a outra rea hachureada (ver figura 20), ento, a soma dessas reas hachureadas iguais corresponde probabilidade de obter uma mdia de amostra que se desvie da mdia hipottica (seja em sentido positivo, seja em sentido negativo) por mais do que 2.40 a i unidades. Como podemos determinar a proporo da rea total sob a curva normal que, na figura 20, deva ser hachureada? Recorrendo equao da curva normal, podemos determinar essa proporo de rea assinalada direita, calculando a rea sob a curva, para abscissas maiores do que 2.40. O mesmo pode ser feito para a rea assinalada, esquerda, calculando a rea sob a curva normal, para abscissas meno res do que 2.40. sses clculos, entretanto, no se fazem necessrios, de vez que os resultados so fornecidos por

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

217

tabelas de fcil acesso. A tabela I, no Apndice, d as propores para os vrios valores de z. Acompanhamos a primeira coluna at encontrar z com valor 2.40. Ento, horizontalmente, na segunda coluna, ao lado de 2.40, estar indicada a proporo da rea (isto , 0.0082) da curva normal, para abscissas maiores do que 5, (uma vez que 3 c maior do que ji). A entrada na terceira coluna d-nos a proporo da rea sob a curva para abscissas menores do que x (i. , 0.9918). Note-se que sses valores totalizam 1 .000. O total das duas reas assinaladas na figura 20 2 X 0.0082, ou 0.0164. Agora podemos dizer que, se a mdia verdadeira fsse igual a 100 teramos, em procedi mento de longo alcance, conseguido mdia de amostra, com base em 100 observaes aleatrias, desviando-se de 100 por mais de 2.40 unidades, 1.64 por cento das vzes. Em conseqncia, se a mdia da populao fsse 100, e sua varincia fsse 25, poder-se-ia esperar mdia de amostra, com base em 100 observaes, que se desviasse por 1 .2, 1 .64 por cento das vzes. O fato de que obtivemos mdia de amostra de 101.2 pode ser interpretado, ou no sentido de que a mdia da populao 100 e que desvios mais amplos do que os observados ocorrem com uma probabi lidade de 0.0164, ou no sentido de que a mdia da popu lao no igual a 100. Jamais poderemos estar absolu tamente certos de uma ou de outra coisa, mas h um meio sistematizado de tomar a deciso 'melhor. Com efeito, devemos decidir quo provvel h de ser a ocorrncia de ura desvio maior-do-que-o-obtido para deliberarmos aceitar a hiptese = 100. A probabilidade escolhida com sse objetivo denomina-se nvel de significncia, e representada por a. Veremos, na seo 14 dste captulo, como tomar aquela deciso. Suponhamos, no momento, que escolhemos um nvel de significncia de 0.05. Perguntamos agora: "so suscetveis de ocorrer, entre x e [ x , pelo menos 5 por cento das vzes, desvios maiores do que o obtido? Se o forem, aceitaremos a hiptese; caso contrrio, ela ser rejeitada. No exemplo acima verificamos serem suscetveis de ocorrer desvios maio res do que 1.2 apenas 1.64 por cento das vzes; rejeitara mos, portanto, a hiptese jj, = 100.

218

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

sse procedimento pode ser exposto de outra maneira. O nvel de significncia corresponde soma de duas reas iguais nas extremidades da distribuio normal. Cada uma dessas duas reas igual a 0.05/2, ou 0.025 (Ver figura 21). Com base na tabela 2 do Apndice, podemos determinar o valor correspondente de zo.os. 1.960. No exemplo acima, z era igual a 2.40. Se z maior do que z o.o5> rejeitamos a hiptese (como o faremos aqui); caso contrrio, ela seria aceita.

F ig. 21

Se usssemos um nvel de significncia igual a 0.10, o correspondente valor zo.w seria 1.282. Nesse caso tambm rejeitaramos a hiptese ^ = 100. Se, por outro lado, toms semos um nvel de significncia igual a 0.01, o valor cor respondente z o.oi seria 2.576 e aceitaramos a hiptese. O procedimento que acabamos de descrever nada tem de definitivo. Apesar de tudo, a hiptese poderia ser ver dadeira; estamos apenas acentuando que, se ela fsse verda deira, o resultado obtido seria um acontecimento altamente improvvel. O resultado no impossvel, pois pode surgir qualquer desvia de um valor esperado ou previsto, se os pa dres de distribuio so normais. Mas nossa credibilidade tem um limite. Se algum adivinha qual a carta que foi retira

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

219

da de um baralho, podemos pensar que isso aconteceu apenas por acaso. Mas, se a mesma coisa se repete por vrias vzes sucessivas, abandona-se a idia de que se esteja adivinhando por acaso. Pode-se admitir que todos os acertos se deveram ao acaso, mas isso to improvvel que a explicao no satisfaz mais. H, como veremos, muitas maneiras de testar hipteses, mas os princpios lgicos em que tdas se assentam so semelhantes ao que apareceu na ilustrao agora dada. O que desejamos no momento, entretanto, examinar o modlo estatstico ligado ao processo de inferncia que acabamos de delinear. Estamos aceitando e rejeitando hipteses com base num procedimento especfico, mas certamente desejamos conhecer o raciocnio que sustenta o processo, antes de acolh-lo como base aceitvel de inferncia. O argumento o seguinte: suponha-se que a hiptese a ser testada verdadeira, e que as observaes tm dis tribuio normal. Suponha-se que tomamos uma amostra aleatria simples de observaes e que o valor resultante de z maior do que o de za, correspondente ao nvel de significncia. Dizemos ento que, se a hiptese verdadeira, obtivemos um resultado extremamente improvvel. Em con seqncia, no se deve aceitar a hiptese. Esse padro de argumento semelhante (mas no idn tico) ao que os lgicos chamam "silogismo hipottico destru tivo (modus tollens). Em caso de silogismo hipottico destrutivo argumentamos da seguinte maneira: se certa hip tese verdadeira, deve tambm ser verdadeira certa conse qncia (p. ex., se tdas as cadeiras tm quatro pernas, no h cadeiras com cinco pernas). Suponhamos agora, que a conseqncia falsa (i. ., suponhamos que haja cadeiras com cinco pernas). A lgica formal nos diz, ento, que podemos sustentar ser falsa a hiptese (i. ., seria falso que tdas as cadeiras tm quatro pernas). No caso estatstico argumentamos: se a hiptese verdadeira, devem ser ver dadeiras certas concluses (i. ., devem resultar certos valo res para z ) . Mas, se a concluso muito improvvel, a teoria estatstica diz-nos que rejeitemos a hiptese. Note-se que a teoria estatstica no nos diz que a hiptese seja falsa; diz-nos, simplesmente, que rejeitemos a hiptese, com base em que sua aceitao conduzir a concluir que as obser vaes so disparatadas. A hiptese pode, apesar de tudo,

220

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

ser perfeitamente verdadeira, e os resultados obtidos corres ponderem a acontecimentos raros, que inevitvelmente ocor rem, se repetimos suficientemente o processo. Em verdade, se o valor de z apenas ligeiramente superior a 1.96, de acordo com o procedimento indicado acima, rejeitaremos a hiptese crca de 5 por cento de vzes em que e/a verda deira. Isto , se repetssemos o procedimento usado na ilus trao colhendo muitas amostras de 100 resultados de testes, 5 por cento das vzes rejeitaramos a hiptese (fi = 100), quando ela fsse verdadeira. Note-se que nada se afirma aqui acerca da probabilidade da hiptese A hiptese, ou verdadeira, ou falsa. O nico ponto em que se consi deram probabilidades no que diz respeito s observaes. Se usssemos o nvel de significncia 0.10, rejeitara mos a hiptese crca de 10 por cento das vzes em que ela verdadeira. Poderia parecer, por isso, que devemos sem pre preferir o nvel de significncia 0.05 ao nvel de signi ficncia 0.10, de vez que menor a possibilidade de cometer rro. Mas isso no necessriamente o que acontece; pois no apenas desejamos aceitar uma hiptese quando verda deira, mas tambm, desejamos rejeit-la quando falsa. Dese jamos saber tambm, por exemplo, quando falsa a hiptese, sendo o resultado mdio igual a 100. E, como veremos, aumentar a possibilidade de aceitar uma falsa hiptese quando usamos o nvel de significncia 0.05. do que quando recorremos ao nvel de significncia 0.10. Assim, num procedimento de pesquisa idealizada, apre ciaramos estar em condies de fazer duas coisas: gosta ramos de rejeitar uma hiptese, sempre que falsa, e aceit-la, sempre que verdadeira. No podemos esperar perfeio em qualquer dos sentidos; por conseqncia, estaremos sempre sujeitos a dois tipos de rro: rro de tipo I: o rro de rejeitar a hiptese quando verdadeira. rro de tipo II: o rro de aceitar a hiptese quando ela falsa. O nvel de significncia especifica o rro de tipo I para os procedimentos acima expostos. O nvel de signi ficncia indica as probabilidades de cometer um rro de tipo I,

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

221

quando o procedimento utilizado como base para aceitar ou rejeitar a hiptese. Diferente, porem, o rro de tipo porque seu signi ficado depende de que seja falsa a hiptese em questo. Mas hipteses podem ser falsas de muitas maneiras. Se algum diz que lhe deve $ 3.00 quando deve, em verdade, $ 3.05, a assero falsa, mas, por quantia (que, ordinriamente, consideraramos) desprezvel. Mas, se diz que lhe deve $ 3.00 quando deve, em verdade, $ 30.00, est come tendo engano mais srio. E coisa semelhante ocorre na pesquisa cientfica. Se predizemos que o resultado mdio de um teste ser 100, e le fr 101, a hiptese mostra-se falsa, mas no muito falsa. A diferena pode no ter importncia. Mas, se a mdia verdadeira 110 e ns acei tamos 100, as conseqncias podem ser muito srias. O procedimento descrito pouco adequado para a iden tificao de pequenos graus de falsidade da hiptese, pres tando-se, porm, para a identificao dos grandes graus. Em geral, se recorremos a ste e a procedimentos anlogos, haver muita probabilidade de que aceitemos uma hiptese ligeiramente falsa mas no de que seja acolhida uma hip tese com grau de falsidade substancial.

II,

13. Curvas caractersticas de operao.


Podemos traduzir a situao relativa ao rro de tipo de maneira precisa, atravs de uma curva caracterstica de operao (ver [7]). A figura 22 mostra uma curva de tipo C O relativa ao teste* bilateral z que escrevemos acima. O eixo horizontal representa as vrias possibilidades ver dadeiras que nos dispomos a considerar como alternativas para a hiptese. Para utilizar essa curva, a hiptese, H 0, enunciada de forma que a mdia verdadeira seja igual a a (i. ., H 0: | i = a). No caso referido acima, a hiptese era p. 100. Os valores alternativos que | x poderia ter (X) so representados ao longo da abscissa. As unidades de X so dadas em trmos do desvio padro verdadeiro da popu lao (i. , a unidades). Desvios de a, que corresponde

II

* O teste denominado "bilateral" porque as duas reas, sb e sob z, em ambos os lados da curva de distribuio, devem ser levados em conta.

222

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

a zero, na abscissa, podem ser tanto positivos como nega tivos. As curvas, portanto, tm, realmente, forma de sino. Mas, porque so simtricas, os desvios positivos e nega tivos podem ser representados num s quadrante. Podemos, pois, ignorar o sinal do desvio do verdadeiro valor de em relao a a. Assim, o afastamento de uma unidade do ponto zero da escala corresponde a um acontecimento em que a mdia verdadeira da populao (|i) est afastada de um des vio padro (o) do valor que a hiptese assevera (a). Por exemplo, se o desvio padro verdadeiro das leituras do con junto de dados acima 5, uma unidade ao longo do eixo horizontal corresponde situao natural possvel em que o resultado mdio do teste , de fato, 95 ou 105. Duas unidades, corresponderiam possibilidade de que a mdia verdadeira fsse 110 ou 90, etc.. A curva traada na figu ra 22 representa a probabilidade com que aceitaremos a hiptese, para cada valor possvel que a mdia verdadeira venha a assumir. Quando a hiptese , de fato, verdadeira (e, portanto, p. = a), se ns utilizarmos o nvel de significncia 0.05, a curva passar pelo ponto de probabilidade 0.95. Isto significa que, sendo a hiptese verdadeira, de 0.95 a probabilidade de que venha a ser aceita e, con seqentemente, de 1 0.95, ou 0.05, a probabilidade de que venha a ser rejeitada. Na medida em que nos deslo camos para a direita e consideramos os possveis erros de tipo II, a probabilidade de aceitao principia a reduzir-se. Observe-se que o comportamento dessa curva depende de quo ampla seja a amostra. Se, por exemplo, dispusermos de apenas trs observaes, a probabilidade de aceitao de crca 0.58, quando nos deslocamos de uma unidade o; se a extenso da amostra 10, a probabilidade de aceitao crca de 0.11. visvel agora a vantagem de uma crescente extenso da amostra: quanto maior a amostra, menor a possibilidade de aceitao de uma hiptese extremamente afastada do ver dadeiro estado de coisas. A figura 22 mostra como a curva " C O cae muito mais acentuadamente para amostras mais amplas. Para amostras muito pequenas, de 2 ou 3 elementos, a probabilidade de aceitar hipteses errneas bem alta, ainda quando nos afastamos o correspondente a duas uni dades 0.

.0

.8

Seja a o valor padro, fx a mdia, < r o desvio padro conhecido do universo normal de que so colhidos ii ele mentos. Essas curvas retratam a probabilidade de acei tar a hiptese Ho-A=a,quando se usa o mtodo descrito e. em verdade.|/x-a|=\aO rro tipo I de rejeitar Ho. se

.6

H - s a igual a 0.05. 0 teste bilateral.

.4

(aplicvel aos testes 1 e 12 do capitulo vi). (Reproduzido, por especial permisso dos autores e do editor, C. D . Farris, F. E . Grubbs e C. L. "Weaver, Operating Characteristics for the Common Statistical Tests of Significance, Annals of Mathematical Statistics. X V II. 1946, 178-92).

F ig . 22 Curvas caractersticas dc operao do teste bilateral normal (z)

224

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Voltando ao nosso exemplo relativo a resultados de testes de inteligncia: se o desvio padro verdadeiro da populao de resultados de teste 5, e ns fazemos apenas 5 observaes, a curva da figura 22 revela o seguinte: (1) Se a mdia verdadeira 105, aceitaremos a hiptese de que exatamente 100, crca de 39 por cento das vzes. Em trmos de freqn cia, isso quer dizer que se colocamos um dado nmero de examinadores a trabalhar, e xnstruimos cada um dles no sentido de que submeta ao teste 5 elementos da populao, aleatoriamente selecionados, 39 por cento dos examinadores, utilizando os procedimentos aci ma indicados, para a aceitao ou rejeio de hipteses, viriam a aceitar a hiptese de que a mdia 100, quando , verdadeiramente, 105. Se a mdia verdadeira 102.5, a probabili dade de aceitar a hiptese , aproximadamente. 0.80 (isto , meia unidade distante de a). Se a mdia verdadeira 110, a probabilidade de aceitao quase zero (isto , duas unida des o distante de a).

(2)

(3)

A curva C O muito til no planejamento de pesquisa. Por meio dela podemos comear a avaliar o grau de con fiana a ser depositado em hiptese por ns aceita; se a extenso da amostra pequena, diremos, normalmente, que o nosso grau de confiana baixo, e que a curva C O habilita-nos a expressar quantitativamente sse tipo de confiana. Naturalmente, desejaramos que o grau de confiana fsse o mais alto possvel. Mas, os planejadores da pesquisa devem balancear o custo crescente de uma colheita de amos tra mais ampla, contra a necessidade de contarem com grau maior de confiana, isto , contra a necessidade de uma curva C O que apresente acentuado declive, quando a situa o verdadeira se desvia amplamente da hiptese. Vejamos de que modo sse balanceamento pode ser levado a efeito.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

225

14. liso das curvas CO.


No dispomos ainda de curvas C O para todos os pro cedimentos estatsticos de verificao; mas, quando os temos, podemos, com respeito s quatro seguintes questes estats ticas, tomar decises de maneira consciente e eficaz: (1) Quais so os erros crticos de tipo II? Isto , a partir de que desvio da hiptese em relao ao valor verdadeiro, devemos ns estar certos de que ela deve ser rejeitada? Que procedimento estatstico de verificao deve ser empregado? Em que nvel deve ser colocado o rro de tipo I, isto , com que freqncia devemos expor-nos a rejeitar uma hiptese, quando verdadeira? Quantas observaes devem ser feitas?

(2) (3)

(4)

Essas perguntas relacionam-se umas s outras e no podem ser consideradas independentemente. Respond-las requer constante referncia formulao do problema, e, em particular, ponderao da gravidade dos possveis enganos. Dentro em breve examinaremos a maneira de reformular estatisticamente uma hiptese estabelecida em estgio anterior. Adiaremos, temporriamente, essa discusso, pois o mtodo de responder s quatro questes relacionadas muito geral, e se aplica a muitas formulaes estatsticas de hipteses. Consideraremos aqui, para efeito de ilustra o, hipteses da forma: uma propriedade de uma popula o (Q ) equivalente a alguma quantidade especificada (a). O mtodo discutido ser, contudo, aplicvel a todos os demais tipos de hipteses. Na formulao do problema, segundo modlo formal, pudemos dar-nos por satisfeitos com a enunciao de duas hipteses alternativas sob a forma: H 0: Q = a, H: Q = (= a. Sabemos agora, entretanto, que Q 4= a pode significar muitas coisas, desde que, se Q = } = a, Q pode assumir muitos valores. Conseqentemente, devemos ampliar nossa formulao origi nal das alternativas.

226

P LA N E JA M E N T O

DE

PESQUISA

SOCIAL

A primeira tarefa consiste em determinar o valor critico do rro de tipo II. O valor crtico do rro de tipo II aqule desvio do valor hipottico (a) para o qual deseja mos estar praticamente certos de que a hiptese Q = a no aceitvel. Por exemplo, se estamos testando a hip tese de que o Q I mdio da populao 100, devemos deci dir para que valor verdadeiro de fi, ns, prticamente, nunca desejaremos aceitar a hiptese = 100. Esta apenas uma das maneiras de definir o valor crtico; isto , em trmos de certeza prtica de rejeio. Em verdade, qualquer pro babilidade de rejeio poderia ser usada; por exemplo, aqu le desvio, em relao a a, para o qual desejamos aceitar (Q = a) no mais do que 50 por cento das vzes. Geral mente, entretanto, preocupamo-nos mais com o engano que, prticamente, nunca estamos dispostos a cometer e usaremos, portanto, aquela definio. O problema, agora, como decidir para que valor de Q no desejamos prticamente nenhuma possibilidade de aceitar a hiptese em questo. Para resolv-lo, devemos voltar a referir-nos aos enganos que podem ser cometidos, e ao que ocorre em relao gravidade de engano associado aceitao de H 0, quando o valor verdadeiro de Q desvia-se mais e mais de a. Consideremos, inicialmente, o caso em que a pesquisa tem apenas um objetivo, O; duas hipteses, H n e Hi\ e suas correspondentes vias de ao C 0 e C \ . Admitamos, alm disso, que H 0 se apresenta sob a forma Q = a; e que H 1 corresponde a Q 4= a- Examinemos a seguir as consequncias de escolher C 0 para O , quando o valor verdadeiro de Q desvia-se mais e mais de a. O que desejamos especificamente saber : qual o desvio mnimo de Q em relao a a que torna mxima a gravidade de usar Co para alcanar o objetivo O. Importa recordar que a gravidade de um engano relativo a um objetivo, O , funo da ineficcia da via de ao e da importncia do objetivo. A importncia do objetivo, entretanto, no se altera com a modificao do verdadeiro valor de Q; altera-se apenas a eficcia da via de ao. A seriedade do engano, portanto, mxima, quando mxima a ineficcia da via de ao (i. ., quando a eficcia de C0 igual a zero). Conseqentemen te, para determinar que desvio em relao a a torna de mxima gravidade o engano, devemos determinar o valor de Q para o qual a eficcia de Co prticamente zero.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

227

H, naturalmente, mais de um objetivo, em geral, de sorte que devemos determinar o valor de Q para o qual a eficcia da via de ao prticamente zero para todos os objetivos. Esse valor de Q pode ser tomado como valor crtico. A determinao da eficcia da via de ao para o objetivo, em relao aos vrios valores de Q , pode ser feita segundo o esquema atrs apresentado (ver seco 3.2.1 do segundo captulo). Suponhamos, por exemplo, estar interessados em deter minar se o Q I mdio (jx) de uma classe igual a certo valor especificado (a), com o objetivo de determinar se deve ser aplicado classe um programa de treinamento avanado (C 0). sse programa destina-se, digamos, a fornecer classe meios de alcanar o maior rendimento possvel no aprendizado, naturalmente nos limites de sua capacidade. Se aceitarmos H 0'. = a, aplicaremos classe o programa especial. Poderemos decidir que, se a mdia verdadeira fr inferior a 90, seria to prejudicial aos estudantes submetlos ao programa especial, que isso comprometeria comple tamente os nossos propsitos. Nesse caso, sse desvio de 10 pode ser tomado como o valor crtico. Uma vez escolhido o valor crtico, voltamo-nos para a curva ou tabela C O, a fim de determinar que teste usaremos na avaliao da hiptese. Para cada teste alternativo exis tente, devemos, quando possvel, determinar o nmero de observaes que se fazem necessrias (para qualquer nvel de significncia fixado), de maneira que o rro de tipo II se tome igual a prticamente zero no valor crtico. Para usar a curva C O com sse propsito, o valor crtico deve ser expresso em a unidades, onde a o des vio padro verdadeiro da varivel a ser investigada. Se o no conhecido, e no foi feita nenhuma observao prvia que permita avali-lo, podemos fazer o tipo seguinte de aproximao grosseira: podemos avaliar o desvio mais amplo que seja razovel esperar entre duas observaes de ele mentos da populao, e dividir sse desvio estimado por 6, sendo o resultado aproximao grosseira de a. No teste bilateral z, a conhecido, ou seu valor fixado, e, por isso mesmo, essa aproximao no precisa ser feita. Se, contudo, estivermos empenhados em determinar o Q I mdio de certa populao da qual o no conhecido, a aproximao pode

228

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

fazer-se necessria. Em tal caso, pode ser grosseiramente estimado, por exemplo, que os resultados mais baixo e mais alto, sero, aproximadamente, 85 e 115. Haver, assim, uma diferena de 30 que, dividida por 6, fornece um o estimado igual a 5. Mtodo mais satisfatrio para estimar o tomar uma pequena amostra probabilstica da populao, a partir da qual possa-se calcular s. Isto , amostragem dupla pode ser uti lizada quando a primeira amostra (ou, pr-teste) usada para fornecer estimativas com base nas quais possar ser escolhida uma eficaz segunda amostra e estabelecido um pro cedimento de avaliao. Pr-testes sero examinados com algum pormenor no captulo x. No obstante, quando obtido um valor para a, podemos divid-lo pelo valor crtico, de forma a obter o que poderia ser chamado desvio crtico. No exemplo, o valor crtico 10 e dizemos que a 5; ento, o desvio crtico igual a 10/5, ou 2. Podemos agora considerar a famlia de curvas C O para determinado teste e assinalar sse desvio crtico sbre o eixo das abscissas. Cada curva da famlia desig nada pelo nmero de observaes (n) que permitiu tra-la. Escolhemos o menor n cuja curva prticamente zero no desvio crtico. No exemplo do Q I, o desvio crtico igual a 2. Usando as curvas C O para o teste bilateral z (figura 22), verificaremos que o n que satisfaz essas condies 5. Isto significa: se, dentre a populao, selecionarmos amostra aleatria de 5, e testarmos a hiptese de que o Q I mdio igual a 100, estaremos prticamente certos de no aceitar essa hiptese, se a mdia verdadeira fr 90, ou inferior a 90 (ou 110, ou superior a 110). sse processo deve ser repetido para cada procedimento alternativo de avaliao, e respectiva famlia de curvas CO. Em princpio, devemos escolher o teste que requeira nmero menor de observaes. H uma exceo, entretanto; certos procedimentos de avaliao, embora requeiram menos obser vao, requerem mais clculo. Em casos tais, os custos to tais de observao e clculos devem ser comparados, enten dendo-se que o custo abrange o dispndio de tempo e esforo, bem como o de dinheiro. Em alguns casos, quando o custo de observao relativamente baixo, mas o de computao

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

229

relativamente alto, pode tornar-se desejvel empregar um este que exija mais observaes e menos clculo. sses testes que exigem menor nmero de observaes para garantir que o rro de tipo II se mantenha dentro de certos limites para qualquer valor de Q, so chamados testes "mais poderosos. H alguns testes relativamente aos quais pode ser demonstrado que nenhum outro requereria menor nmero de observaes para garantir que o rro de tipo II se mantenha dentro de certos limites, para qualquer valor de Q; sses testes so denominados uniformemente mais pode rosos. O teste z um teste uniformemente mais poderoso. No h outro teste para as mesmas hipteses (| x a, quando o conhecido ou tem valor fixado) que tenha uma curva C O que caia mais perto da linha de base do que a curva C O do teste z, para qualquer valor de Q. A expresso "unifor memente mais poderoso , entretanto, enganosa, pois sses testes podem no ser, em verdade, os mais econmicos rela tivamente aos objetivos da pesquisa. Nos ltimos anos temse trabalhado, considervelmente, para desenvolver os chama dos testes ineficazes, que so menos poderosos do que os uniformemente poderosos mas que, em certas circunstncias, revelam-se mais econmicos. sses "testes ineficazes podem ser mais econmicos, embora requeiram maior nmero de observaes, porque exigem menos tratamento dos dados; isto , menos confrontao, tabulao e clculo. Alguns dsses testes sero examinados nos dois prximos captulos. (Ver [5: xv], [12] e [22]). O seguinte um procedimento para escolher (1) o teste a ser utilizado; (2) o rro de tipo I aceitvel; e (3) o nmero de observaes a fazer. Uma vez estabelecido o valor crtico, devemos determinar a melhor maneira de agir com referncia a cada um dos proce dimentos alternativos de avaliao. J expusemos a maneira como fazer tal determinao com referncia a um rro de tipo I especfico. Mas, em qualquer procedimento de ava liao, na medida em que o rro de tipo I diminue, o nmero de observaes necessrias para que no ocorra prticamente nenhum rro de tipo II, no valor crtico, aumenta. O que desejamos, ento, um equilbrio timo entre o rro de tipo I e o nmero de observaes para cada teste. Mas o que um equilbrio timo?

230

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Podemos comear a responder essa questo iecorrendo a um exemplo. Suponhamos que, para um dado teste, so necessrias 96 observaes no nivel de significncia 0.05 (rro de tipo I), e que so necessrias 165 observaes no nvel de significncia 0.01 para que no se cometa prticamente nenhum rro de tipo II no valor crtico. Suponhamos dever conduzir o teste em ambos os nveis de significncia; qual seria, ento, o custo total esperado de cada procedi mento? Por custo total esperado entendemos o custo m dio, por teste, em que incorreramos se o teste devesse ser repetido um nmero de vzes indefinidamente grande. sse custo total esperado pode ser calculado da seguinte maneira: (1) Determinar o custo (co.os) da coleta de 96 observaes e o custo (co.oi ) da coleta de 165 observaes. Determinar o custo (C) da rejeio da hip tese quando verdadeira. Ento, o custo es perado associado a sse rro no nvel de sig nificncia 0.05 igual a 0.05 C (isto , a probabilidade de cometer o rro multiplicada pelo custo do rro). Isto quer dizer, por exemplo, que, se devssemos realizar sse teste 100 vzes, esperaramos cometer sse rro 5 vzes. O custo esperado, por tentativa, seria, ento, de 5/100 ou 0.05 vzes o custo do rro. De maneira semelhante, o custo esperado as sociado ao rro de tipo I, no nvel de signi ficncia 0.01, igual a 0.01 C. Determinar o custo (K) associado ao trata mento de dados obtidos em cada qual dos n veis de significncia. Desde que maior nmero de observaes se fazem necessrias ao nvel 0.01 do que ao nvel 0.05, Ko.oi ser, em ge ral, maior do que K 0.o s O custo total esperado (T C ) de cada proce dimento seria, ento,
T C o .0 5 T C q .o i = c 0.05 -f- 0.05 C f- K l- 0.01 C + K 0.05 o.oi

(2)

(3)

(4)

s== C o.oi

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

231

(5)

Escolher o nvel de significncia onde o custo total mnimo.

Podemos generalizar sse procedimento para o teste de duas hipteses, da maneira seguinte: (1)
I. 2. 3. 4. 5. 6. 7.

Preparar o seguinte quadro:

rro de tipo I (nvel de significncia) Custo de rejeitar H c, quando verdadeira Produto de entradas em 1 e 2 N de observaes exigido Custo das observaes Custo do tratamento de dados Custo total: soma das entradas em 3, 5 e 6

a C aC n c K TC

0.001

0.01

0.05

etc

----

(2)

Escolher o rro do tipo I para o qual a entrada na linha 7 seja mnima.

Ilustremos sse procedimento, examinando um exemplo simplificado. Suponhamos estar levando a efeito um levan tamento, e suponhamos que nossas observaes consistem de entrevistas. Suponhamos, ainda, que escolhemos o valor cr tico, e o teste a ser utilizado. Consultamos as curvas C O e verificamos ser o seguinte o nmero de observaes exigi das em trs diferentes nveis de significncia *: 0.05 96 0.01 165 0.001 270 Suponhamos, agora, que o custo de uma entrevista $0.50. e que independe do nmero de entrevistadores. Suponha-

* Em verdade, deveramos empregar todos os nveis de .sign cncia para os quais existam disponveis as curvas CO. Apenas trs delas so aqui empregadas a fim de simplificar a ilustrao.

232

p la n e ja m e n to

de

p e s q u is a

s o c ia l

mos que o custo de rejeio da hiptese H 0, quando verdadei ra, $ 1,000.00. Admitamos que o custo de tratamento de dados $ 10.00 para 96 observaes, $ 15.00 para 165 e $ 20.00 para 270. Podemos, ento, proceder tabulao seguinte :
I. 2. 3. 4. 5. 6. 7. rro de tipo I (nvel de significncia) Custo de rejeio de H, quando verdadeira Produto de entradas em 1 e -2 Nmero de observaes exigido Custo das observaes Custo do tratamento de dados Custo total: soma das entradas em 3, 5 e 6 $ $ $

0.001 $1.000,00 $ 1,00 270 135,00 20,00 156,00 $ $ $

0.01 $1.000,00 $ 10,00 165 82,50 15,00 107,50 $ $ $

0.05 $1.000,00 $ 50,00 96 48,00 10,00 108.00

Neste caso, e porque $107,50 a entrada mnima na linha 7, o rro de tipo I timo para sse teste 0.01, com 165 ob servaes. Neste caso, naturalmente, a diferena entre os nveis de significncia 0.01 e 0.05 insignificante. O procedimento descrito permite-nos avaliar, da melhor maneira possvel, o que pode ser conseguido com qualquer procedimento de estimao. Isto , relativamente a um es pecfico valor crtico, o procedimento d-nos meio de deter minar o nvel de significncia timo (menos dispendioso), e indica o nmero de observaes para qualquer procedi mento de avaliao, com referncia ao qual existam curvas C O traadas. Por generalizao simples, podemos nos valer dsse mtodo para escolher um procedimento de avaliao: escolher aquela combinao de (a) procedimento de avalia o, (b) nvel de significncia e (c) nmero de observaes, para o qual o custo total seja mnimo. Quando mais de duas hipteses esto implicadas na pes quisa, a rejeo de uma pode significar a aceitao de qual quer das outras. Portanto, o custo de rejeio de uma hipte

LOGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

233

se, quando ela verdadeira, varia na dependncia da hiptese falsa que fr aceita. Para considerar uma situao comum, em que diversas hipteses se apresentam, imagine-se que tenha mos trs hipteses, H x , H 2 e H x. Nesse caso, ao rejeitar H i, podemos aceitar Hn ou H a. E o custo resultante da acei tao de Ho, sendo H y verdadeira, pode ser diferente do custo resultante de aceitar-se H s, com H x verdadeira. Quando mais de duas hipteses se apresentam, o pro cesso ora delineado se torna inconveniente, e no nada raro o pesquisador ter que se haver com numerosas hipteses. J nos referimos a problemas em que surgem diversas hip teses, e aos quais chamamos problemas de estimativa. M todos que podem ser empregados para a obteno de estimati vas sero analisados no captulo viii. No obstante, a lgica a ser empregada no projeto estatstico de um procedimento de estimativa pode ser examinada antes de se estudar os mto dos especficos de computao das estimativas. Nos problemas de estimativa, h trs decises a tomar, concernentes ao projeto de pesquisa prtica. Elas abran gem (1) o mtodo de amostragem a ser utilizado; (2) o pro cedimento de estimativa a ser utilizado; e (3) a extenso da amostra a ser utilizada. O melhor mtodo existente para tomar decises como essas, incide no uso de complexas tcnicas matemticas; uma ilustrao pode ser encontrada no Apndice IV. Mas, os princpios lgicos necessrios j foram discutidos no captulo iv, seo 2.4. Efetivamente, analisar todos os procedimen tos possveis de amostragem e estimativa que poderiam ser empregados numa pesquisa, seria demorado e caro. E todo sse trabalho, afinal, no indispensvel. A experincia com amostragem e estimativa acaba trazendo conhecimentos a respeito da ineficcia de certos procedimentos, em alguns tipos de situao. Um perito em amostragem, por exemplo, capaz de escolher os candidatos mais provveis para seleo e, desta maneira, simplificar de modo aprecivel o projeto. Em casos especficos, o procedimento pode ainda ser complexo, j que as funes matemticas que entram em jgo nas equaes podem torn-las insolveis, ou de difcil solu o, com as tcnicas conhecidas atualmente. Acrescente-se que pode ser extremamente complicado representar os custos em trmos dos erros possveis, particularmente quando vrios

234

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

objetivos estiverem presentes, e a escala monetria no fr adequada para a determinao de custos relativamente a alguns dsses objetivos. Dificuldades prticas dessa ordem sero diminudas no futuro, com tcnicas metodolgicas e estatsticas mais aperfeioadas. Deve-se salientar, porm, que o tipo de abordagem lgica anteriormente descrito no afetado pelas dificuldades mencionadas. 15. Sumrio.

Neste captulo tentamos expor os princpios lgicos que governam o uso de mtodos estatsticos, quando se chega a concluir algo a respeito das caractersticas de uma populao, partindo das caractersticas das amostras. Vimos como os dados obtidos a partir da amostra podem ser organizados em tabelas de distribuio de freqncia, e em grficos. me dida que cresce a extenso da amostra, e decresce o intervalo de classificao, o histograma se aproxima de uma curva limite, que uma curva regular de freqncia. Essa curva representa uma funo de distribuio. As distribuies podem assumir variadas formas, sendo a mais importante delas a distribuio em forma de sino, simtrica, chamada distribuio normal. A rea sob a curva normal, limitada por duas ordenadas que passam pelos pontos A e B, repre senta a probabilidade de que seja obtida uma observao entre A e B. Valores como sse podem ser calculados a partir da equao da curva normal, e so dados na tabela normal (Apndice, Tabela I). A distribuio normal pode ser definida por meio de dois parmetros, a mdia (u) e o desvio padro (o), que so medidas de tendncia principal, e de disperso de dados, respectivamente. As melhores estimativas (x e s) dsses parmetros, que podemos obter utilizando amostra aleatria foram definidas dste modo:

LGICA

DOS

PROCED IM ENTOS

ESTATSTICOS

235

Depois disso, consideramos o mtodo de testar a hiptese a. Vimos que as estimativas ( x ) de esto tambm, elas prprias, normalmente distribudas, com mdia verdadeira igual a } x , e desvio padro (a ;) igual ao desvio padro das observaes (o), dividido pela raiz quadrada do nmero de observaes da amostra (\/n); ou seja, " < 7 V?!

Convertemos o desvio entre mdia estimada (x) e o valor hipottico da mdia (a) em unidades padro ( z ); ou seja,

az

Os valores de z aparecem normalmente distribudos e, por isso mesmo a probabilidade de obter um desvio de x em relao a a maior do que uma quantidade dada (z), pode ser determinada com auxlio de tabelas normais. Tal probabi lidade utilizada como base para a aceitao ou rejeio da hiptese. A aceitao ou rejeio de uma hiptese depende dos rros tolerveis. Dois tipos de rro esto em causa: (I) a probabilidade de rejeitar uma hiptese, quando verdadeira (que expressa como um nvel de significncia), e (II) a probabilidade de aceitar uma hiptese que falsa. O rro de tipo'II varia de teste para teste, e pode ser expresso como uma funo dos possveis valores verdadeiros das variveis em causa, isto , como uma curva caracterstica de operao. Utilizando nossos clculos anteriores, a propsito de gra vidade de erros, podemos determinar um "valor crtico que represente aqule rro de tipo II, que desejamos estar prticamente certos de no cometer. sse valor pode ser con vertido em desvio crtico, se o dividirmos por um cr conhe cido ou estimado da populao. Utilizando o desvio crtico e as curvas CO, possvel fazer uma seleo tima de: (1) teste a ser utilizado, (2) rro de tipo II (nvel de significn cia) a ser empregado, e (3) nmero de observaes a fazer.

236

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Os procedimentos descritos para levar a essas escolhas timas so trabalhosos, quando mais de duas hipteses esto em causa. Nesse caso, procedimentos de estimao podem ser usados. Mas, ainda aqui, uma seleo tima pode ser feita. Ao longo desta discusso, admitimos que s hipteses havia sido dada uma reformulao estatstica. No prximo captulo consideraremos os diversos tipos de formulaes es tatsticas que podem ser dados s hipteses. Essa inverso de ordem deliberada, pois se requer compreenso da natu reza dos testes estatsticos para entendimento do sentido das hipteses estatsticas e dos mtodos de test-las.
Mtodo para calcular x e s para dados agrupados, quando so iguais os intervalos de classe.
N ota 1

O mtodo ser ilustrado com base em amostra de 100 resultados de teste, agrupados em intervalos de classe.

(1)

(2)

(3)

(4)

(5)

(6)

Resultado ' do teste 0- 9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99
T o ta l

FreqP.ncia

4 6 17 26 20 11 6 5 3 100

fi 2

Ponto m dio da clase * 4 .5 14.5 24.5 3 4.5 4 4.5 54.5 64.5 74.5 84.5 94.5

Desvio unitrio
Ui

/..

iA
32 36 24 17 0 20 44 54 80 75 382

-4 -3
-2 -1

8-

-12

0 1 2 3 4 5

-12 -17 0 20 22 18 20 15 46

Os intervalos de classe, e os resultados do teste aparecem na coluna 1, e o nmero de resultados de teste situado em cada classe dado pela coluna 2.
PROCEDIM ENTO: (1) Determinar o ponto mdio de cada classe ( * i), e inscrever o resultado na coluna 3. Para encontrar o ponto mdio, subtrair o limite inferior da classe do limite superior da classe, dividir por 2, e adicionar o resultado ao limite infe rior da classe. Por exemplo, na primeira classe (9 0) /2 = 4.5.

LGICA

DOS

PROCEDIM ENTOS

ESTATSTICOS

23 7

(2)

(3)

(4)

(5) (6) (7)

Escolher um dos pontos mdios da classe, mais ou menos na metade da coluna 3, e inscrever um "0" ao seu lado, na coluna 4. Essa a mdia imaginada (*). O resultado final dsse procedimento independe do ponto mdio escolhido. No caso presente, foi escolhido o ponto mdio 44.5. Dado que tdas as classes cobrem intervalos iguais, podemos medir a diferena entre o ponto mdio de qualquer classe, e o ponto mdio que serve de mdia imaginada em trmos do nmero de intervalos de classe que le est acima ( + ) ou abaixo ( ) dessa mdia imaginada. Na coluna 4, a partir do "0" que foi inscrito, marcar, para cima, 1, 2, etc, e para baixo, +1, +2, +3, etc. Para cada classe, multiplicar a entrada na coluna 2 pela entrada na coluna 4; isto , fui. Inscrever os resultados na coluna 5. Multiplicar a entrada na coluna 2 pela entrada na coluna 4, ou seja ftu?. Inscrever os resultados na coluna 6. Total da coluna 2 (2/* = 100), da coluna 5 (2^iu< = 46) e da coluna 6 = 382). Calcular .v empregando a seguinte frmula:

onde k a diferena entre pontos mdios de classes (neste caso, 10), e Xo o ponto mdio da classe que foi selecionado para ser mdia provisria. Utilizando os dados acima, obtemos i= (8) ( 1 0 ) ^ + 4 4 . 5 = 4.6 + 44.5 = 49.1.

Calcular s utilizando a frmula seguinte

Utilizando os dados acima obtemos

Tpicos para discusso.


1. vantagens? Qual a funo dos procedimentos estatsticos?

Quais su

23 8

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

2. Que se entende por: (a) distribuio de freqncia; (b) histo grama; (c) funo de distribuio; (d) distribuio normal; (e) moda; (f) mediana; (g) mdia; (h) desvio padro; (i) varincia; (j) proba bilidade; (k) rro de tipo I; | 1 ) rro de tipo II; (m) valor crtico; (n) desvio critico; (o) curva CO; (p) z; (q) teste uniformemente mais poderoso; (r) teste ineficaz^ 3. Qual a diferena entre x e n, entre s e 0? 4. Qual o princpio lgico justificador dos procedimentos de avaliao estatstica? 5. Quais os custos que devem ser levados em conta para a .seleo de um procedimento de avaliao estatstica?

Exerccios.
1. Calcular x e s para os seguintes conjuntos de dados: a) renda anual de 10 elementos de uma populao, aleato riamente escolhidos $ 4,700 5,300 3,200 3,900 4,800 b) $ 6,400 7,100 5,100 3,900 4.200

idades de 14 estudantes, aleatoriamente escolhidos


21 21

19 20 21 28 18 18 c) resultados de teste 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99

20 25 23 21 20 19 freqncia 1 3 2 5 9 12 10 4

2. Suponha-se desejar testar a hiptese (t = 71. Sabe-se que o -desvio-padro da populao 4. Quantas observaes devem ser feitas, utilizando o teste bilateral z, se o valor crtico (a) 67; (b) 77; ic) 79; (d) 62; (e) 83? 3. Determinar os valores de z para os seguintes dados:

LGICA

DOS

PROCED IM ENTOS

ESTATSTICOS

239

a) fj. = 40,

5 = 34, a = 12, n = 16 b) n 11.2, x = 13.1, c r = 2.8, n = 10 c) M = $3,500,* = 53,100, a = S1.200, = 150

4. Com base na tabela I do_ Apndice, determinar a probab dade de conseguir um desvio de x em relao a fi, maior do que o obtido em cada parte do problema 3.

Leituras sugeridas.

A propsito da lgica dos mtodos estatsticos, ver Churchman (1: Introd.) e (2), Neyman e Pearson (13), Shewhart (14) e W ald (16), (17), (18), (19) e (20). Com exceo de (1), essas apresentaes sio em nvel avanado. Para um bom (se bem que no avanado) quadro geral dos m todos estatsticos, ver Dixon e Massey (5). Mood (11) faz apre sentao de nvel mais avanado. A respeito dos fundamentos matemticos da estatstica, ver Cramr (3), Feller (6), Hoel (8), e Kendall (9). Trata-se. tambm, de apresentaes de carter avanado. H diversas introdues, muito elementares, ?.os mtodos estatsticos. Entre elas, Mode (10), Walker (21) e Wilks (23). O pesquisador social deve se familiarizar com algumas revistas q se ocupam dos mtodos estatsticos. A mais til para o pesquisador social o Journal of the American Statistical Association. Outras so. Biomctrika, Biometrics Bulletin, e o Journal of the Royal Statistical Society e scu Supplement. Annals of Mathematical Statistics, revista mais tcnica do que qualquer das citadas, mais digna da ateno dos que possuem treinamento avanado em matemtica e estatstica.

Referncias e bibliografia.
1.
C hurchm an,

C. W., Statistical Manual: Methods of Making Experimental Inferences. Seg. ed. rev.. Philadelphia: PittmanDunn Laboratory, Frankford Arsenal, 1951. Theory of Experimental Inference. New York: millan Co., 1948.
H a r a ld ,

2
3.

Mac
P r in c e

C r a m f .r ,

4. 5.
6.

Princeton University Press, 1945. D e m in g , W . E., Some Theory of Sampling. New York: John Wiley and Sons, 1950. D i x o n , W . J., e M a s s e y , F . J., J r ., Introduction to Statistical A na lysis, New York' McGraw-Hill Book Co., 1951.
F e lle r , F
e r r is ,

ton:

Mathematical Methods of Statistics.

Applications. Annals of

W illia m ,

7.

C. D., G Characteristics

John Wiley and Sons, 1950. E., e W e a v e r , C. L., "Operating for the Common Tests of Significance". Mathematical Statistics, X V II (1946), 178-97.
rubbs,

New York:
F.

A n Introduction to Probability Theory and its

240

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

8. 9.

H o e l , P. G Introduction to Mathematical Statistics, New York:

John W iley and Sons, 1947. 2 vols.. London: Chas. Griffin and Co. Ltd., 1947. 10. M od e , E. D., The Elements of Statistics. New York: PrenticeHall, Inc., 1941. 11. Mood, A. M., Introduction to the Theory of Statistics. New York: McGraw-Hill Book Co., 1950. 12. M o s t e l l e r , F r e d e r ic k , "O n Some Useful Inefficient Statistics ', Annals of Mathematical Statistics, xVii (1946), 377-408. 13. N e y m a n , J e r z y e P e a r s o n , E. S., "On the Problem of the Most Efficient Tests of Statistical Hypotheses", Philosophical Tran sactions of the Royal Society, Ser. A, C C X X X I (1933), 289-337. 14. S h e w h a r t , W . A., Statistical Methods from the Viewpoint of Quality Control. Washington D. C.: United States Depart ment of Agriculture, 1939. 15. S n e d e c o r , G. W . , Statistical Methods. 4" ed. Ames: Iowa State College Press, 1946. 16. W a l d , A b r a h a m , "Contributions to the Theory of Statistical Estimation and Testing Hypotheses, Annals of Mathematical Statistics, X (1939), 299-326. 17. O n the Principles of Statistical Inference. "Notre Dame Mathematical Lectures, n. 1. Notre Dame, Ind.: Notre Dame University, 1942. 18. "Statistical Decision Functions W hich Minimize the M a ximum Risk", Annals of Mathematics, X L V I (1945), 265-80. 19. Foundations of a General Theory of Sequential Decision Functions, Econometrica, X V (1947), 279-313. 20. "Statistical Decision Functions", Annals of Mathematical Statistics, X X (1949), 165-205. 21. W a l k e r , H. M., Elementary Statistical Methods. New York: Henry Holt e Co., 1943. 22. W il c o x s o n , F r a n k , Some Rapid Approximate Statistical Proce dures. Ed. rev., Stamford, Conn.: Stamford Research Labo ratories, American Cyanamid Co., 1949. 23. W flks, S. S., Elementary Statistical Analysis. Princeton: Prin ceton University Press, 1948.
K e n d a l l , M . G., Advanced Theory of Statistics.

C a p tu lo

VI

TESTES D E H IPT ESE S (1)

1.

Introduo.

As hipteses elaboradas durante a formulao do pro blema enunciam as condies sob as quais aceitaremos cada qual das vias de ao alternativas. As hipteses correspon dem a asseres acrca da eficcia dessas vias de ao alter nativas. No modlo idealizado, formulamos, em seqncia, as condies sob as quais cada hiptese seria idealmente aceita como vlida. Impedidos, por motivos de ordem prtica, de fazer observaes acrca do total da populao, a avalia o das hipteses posta na dependncia da colheita de amostras, que se utilizam como base para inferncias esta tsticas. Isso requer que as hipteses sejam reformuladas, de maneira a se tornarem suscetveis de avaliao estatstica, isto , suscetveis de avaliao por meio de testes de car ter estatstico. O nmero de testes estatsticos aumentou considervelmente nos ltimos vinte anos, tornando-se to grande que nem mesmo o estatstico profissional pode estar familiarizado com todos. Tal como sses testes, tornaram-se mais nume rosas as espcies de hipteses que podem ser estimadas por processos estatsticos. No presente captulo, examinaremos vrios tipos de hi pteses estatsticas e de mtodos para test-las. Alguns testes teis sero descritos e ilustrados. A apresentao dsses testes no pretende tornar desnecessrio o conheci mento de um bom livro de estatstica. (Alguns bons textos so relacionados nas Leituras sugeridas, ao fim dste ca ptulo). Os testes descritos tm a pretenso de constituir um convite para um estudo mais completo dos mtodos es tatsticos, conduzindo a fontes que dles se ocupam porme norizadamente. Por outro lado, as descries e ilustraes

242

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

destinam-se a dar a quem se inicia em estatstica alguma vi so e compreenso dos mtodos estatsticos. Para os que j conheam tais mtodos, os testes e ilustraes podero ser instrumentos de recordao til. No ltimo captulo, examinamos um tipo de questo que pode ser respondida por alguns testes de hipteses: Se uma populao tem certa propriedade Q, qual a possibilidade de conseguirmos um dado conjunto de observaes, a partir de uma amostra aleatria simples colhida dessa populao? O conjunto de observaes , em si mesmo, passvel de des crio com base em uma ou mais propriedades mensurveis, que so chamadas estatsticas. As propriedades da distri buio de populao (e no da distribuio de amostra), que definem essa distribuio, denominam-se parmetros. Assim, na distribuio normal, jx e a so parmetros. Examina mos, tambm, vrias estatsticas, dentre as quais as mais im portantes foram a mdia da amostra o desvio-padro da amostra 5 e a varincia da amostra s2. Correspondem elas. respectivamente, estimativa dos parmetros (.i, o e o2 da populao. Examinamos, igualmente, outra importante es tatstica, z, que funo de jx x, a e n (extenso da amos tra) e que se reveste de grande importncia na avaliao estatstica. Muito nos convir reexaminar seu papel e con siderar diversas outras estatsticas funcionais, que so re levantes para o teste de hipteses: t, y? (chi quadrado qua drado leia-se qui ) e F. 2. z.

Na ilustrao apresentada no ltimo captulo, pergun tamos: "Se a mdia da populao [i igual quantidade a, qual a possibilidade de obtermos uma amostra aleatria de observaes, cuja mdia x apresente, em relao a a, desvio maior do que | 5 c a|? Para apontar essa possibilidade (ou probabilidade), fomos, antes, obrigados a determinar como se distribuem as mdias da amostra. Alm disso, convertemos x num desvio da mdia da populao, expresso em unidades de desvio padro de x, a (0 chamado rro padro da mdia estimada). Indicamos sse desvio com o smbolo z. Desde que-z se apresente normalmente distribudo, podemos determinar a probabilidade de obter um valor z igual ou maior

TESTES

DE

HIPTESES

( 1)

243

do que qualquer quantidade, recorrendo a tabelas normais. Assim, pelo uso da estatstica z, podemos determinar (quan do a conhecido) a probabilidade de obter uma amostra aleatria de observaes, cuja mdia x se desvie da mdia da populao, por quantidade superior a qualquer quanti dade dada. Por isso mesmo, o teste da hiptese a (quando a conhecido) chamado um teste z. A exata definio de z pode ser dada, simbolicamente, da maneira seguinte:

onde Xi qualquer observao feita relativamente a uma populao normal. Se consideramos a distribuio das m dias da amostra (x) e no observaes discretas, teremos
z. =

ll.-/*!. = I*~ mI

o-/ \ / n '

pois

< r ;= o'/v/.

3. t.
O smbolo t desempenha papel muito semelhante ao de z; le , tambm, medida do desvio da mdia da amostra em relao mdia da populao. Mas, em vez de medir sse desvio em unidade a4 mede-o em unidades s, unidades do desvio padro estimado, ou desvio padro da amostra. As sim, o valor de t para uma observao singular, dado por

O valor de t para * dado por

s/ V n

pois

Si = s / V u .

244

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Nos casos em que o desvio padro da populao no conhecido, ou no pode ser presumido, o desvio da mdia da amostra em relao mdia da populao pode ser expresso em unidades de desvio padro da amostra, isto , em termos de t. Diferentemente de z, t no distribudo normalmente. Embora a distribuio de t houvesse sido descoberta na ltima poro do sculo X IX , no foi seno a partir de seu redescobrimento, em 1908, que le se tornou de utilidade para a estatstica. Foi autor da redescoberta o estatstico ingls, W . S. Gosset, que desejou esconder a sua identidade e assinou seu trabalho com o pseudnimo "Student. Por isso mesmo, essa estatstica normalmente chamada t de Student. Estritamente falando, o desvio padro verdadeiro (o) de uma populao normal somente poderia ser conhecido atravs de observao acurada de todos os membros da populao. Mas a estimativa (s) do desvio padro tende a tornar-se cada vez mais exata na medida em que se alar ga a extenso da amostra a partir da qual ela calculada, (O rro padro de s igual a /V 2n, onde a a mdia dos sigmas calculados com base em n observaes e, por tanto, tende a decrescer quando n aumenta.). Em conse qncia, quando n grande, s pode ser usado em lugar de a sem perigo de rro grave e o teste z pode se aplicar. Antes que Student redescobrisse a distribuio t, no havia, contudo, meio de realizar testes com base em amostras pequenas. A idia em que se baseia a distribuio t muito sim ples, embora seja muito complexa a maneira de atingir o re sultado. Consideremos uma populao normal cujo desvio padro no seja conhecido. Suponhamos colhr um nme ro infinito de amostras de, digamos, 5 observaes, a partir dessa populao, e admitamos ter calculado x, s, e, conse qentemente, t, para cada amostra. Qual seria a distribui o dsses tl Student respondeu a essa pergunta atravs de anlise matemtica. A distribuio aparece na figura 23. A parte assinalada na figura de 1 por cento ou .01 da rea total sob a curva. a rea correspondente aos valores de t menores do que 4.604 e maiores do que 4.604. Os valores de t acima e abaixo dos quais as reas totalizam .05 da rea global sob a curva, 2.7764. stes valores

TESTES

DE

HIPTESES

( 1)

245

podem ser encontrados na tabela dos t (Tabela III do Apn dice). Procuramos na coluna GL (graus de liberdade) um valor igual ao do nmero de observaes menos um, n 1, ou, no caso, 4* para chegar, na horizontal, coluna encimada por .05. A tabela torna claro que distribuies semelhantes foram feitas para outras extenses de amostras e que os valores para diversos nveis de significncia foram tabulados.

Fig. 23 Distribuio de t para amostras de 5

Quando a extenso da amostra aumenta, a distribuio de t aproxima-se de uma distribuio normal. Nota-se que os valores dados a t na linha indicada por oo \ ao p da tabe la, so os mesmos que aparecem na tabela normal. Quando a extenso da amostra superior a 123, pode-se usar a distribuio normal; ou seja, s pode ser substitudo por nr. 4. i 2 e F.

Os smbolos x2 e F so estatsticas mais complexas do que as duas j consideradas. A compreenso integral delas requer mais conhecimento de matemtica do que ste livro supe. Ser til, de qualquer modo, caracteriz-las brevemente, para que o leitor tenha uma idia, embora vaga, da natureza delas.
* Para uma explicao do motivo por que se empregou n-1 invs de n, veT seo 5, adiante.

246

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Chi quadrado (x2) uma medida da compatibilidade en tre a freqncia observada de um evento ou propriedade e a freqncia terica esperada, com base na distribuio admi tida. Suponhamos, por exemplo, que uma teoria prediz que a varincia (o2) de uma distribuio deve ser igual quan tidade a. Retiramos uma amostra aleatria da populao pertinente e calculamos s2. A razo de s2 para o valor pre dito de o2, multiplicada por um fator adequado (neste caso. a extenso da amostra menos um) igual a x2- (Para pormenores, ver [2:xiii]). Suponhamos agora que retiramos duas amostras da mesma populao normal e calculamos a varincia da pri meira, sj, e da segunda, s;. Ento

Isto , F igual razo das varincias das duas amostras. As distribuies de amostragem de ambas x2 e F, assim como as de z e t foram tabuladas e aparecem nas tabelas V e V I do Apndice, respectivamente. (Para pormenores a respeito da distribuio F ver .[2: viii]).

5. Graus de liberdade.
Na descrio de procedimentos de avaliao estatstica, far-se- constante referncia aos graus de liberdade asso ciados a uma estatstica de amostra. V ia de regra, os graus, de liberdade de uma estatstica, objeto de clculo, indicam o nmero de fatores (a partir dos quais a estatstica calculada) que podem ser alterados independentemente, sem alterar o valor da estatstica. Suponhamos, por exemplo, calcular a soma de trs nmeros: * + y + z s. Se fixarmos o valor de S, podemos atribuir qualquer valor a (digamos) x e y, mas, uma vez determinados x e y, estar determinado z. Ou seja, se a soma fixada, e tdas, menos uma das variveis so determinadas, tambm esta ltima varivel estar determinada. Portanto, tdas as variveis

TESTES

DE

HIPTESES

( 1)

247

menos uma so "livres. Neste caso, portanto, h dois graus de liberdade. Em geral, se h n variveis, e uma equao que define a estatistica, h n 1 graus de liber dade. Se calcularmos x com base em 10 observaes, por exemplo, h 9 graus de liberdade associados a x. Se cal cularmos s2 a partir de vinte e uma observaes, h vinte graus de liberdade. Suponhamos agora ter duas equaes de duas variveis: (1) (2) x + y S x - y = T

Ento x e y ficam determinados, uma vez que se determinem 5 e T. Por exemplo, se S igual a 15 e T igual a 5, x = 10 e y 5. Se acrescentamos outra varivel, z: (1) (2) x \ -y \ -z S x + y z T

apenas uma das variveis tem alguma liberdade. Por exemplo, se 5 = 15, T 5, e admitimos que x tenha o valor 5, resultar (1) (2) ou, 5 + y + z = 5 + y - z = 15 5

(1)
(2)

+ ^
0

y, z =

6. Hipteses relativas ao valor de uma propriedade singular de uma populao singular.

e y e z ficam ento determinados e devem ser ambos iguais a 5. Se h n variveis e duas equaes que definem a estatstica, h n 2 graus de liberdade. Via de regra, se h n variveis e k equaes que definem a estatstica, o nmero de graus de liberdade ser n k. Graus de liberdade ser simbolizado por "G L .

Muitas questes que os pesquisadores propem podem ser apresentadas como perguntas acrca de uma das trs

248

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

seguintes propriedades de uma populao: (1) o valor mdio de uma propriedade especificada; (2) a disperso de uma propriedade especificada; (3) a percentagem ou proporo da populao que apresenta a propriedade especificada. Eis algumas perguntas tpicas que podem ser apresen tadas, respectivamente, sob cada uma daquelas formas: (1) O Q I mdio dos estudantes que terminam curso superior em Harward maior do que

120?

(2) (3)

A varincia de renda entre empregados da General Motors menor do que $ 10,000,000? certo que 60 por cento do eleitorado dos Estados Unidos da Amrica favorvel ao treinamento militar obrigatrio para todos?

Cada uma dessas trs perguntas pode ser transformada em uma hiptese do tipo seguinte: (1) H 0: Q a,

onde Q a propriedade da populao que se deseja inves tigar e a o valor "hipottico derivado da teoria, ou de observaes prvias. Nos casos comuns de pesquisa, quan do se apresentam duas hipteses, a alternativa H \ \Q = 4 = a. H o chamada "hiptese zero" e a hiptese que o proce dimento de avaliao deve destruir ou corroborar. Pares alternativos de hipteses so (2) Ho- Q a (Q menor ou igual a a; isto Q no maior do que a). H t : Q > a (Q maior do que a). (3) / / 0: Q a (Q maior ou igual a a; isto Q pelo menos to grande quanto a). Hi-, Q < a (Q menor do que a).

TESTES

DE

HIPTESES

(1 )

249

Os testes 1 11 diro respeito a sses trs tipos de pares de hipteses.


N ota: Para simplificar a apresentao dos testes, indicaremos de forma abreviada o que sabido ou presu mido:

Carater aleatrio significa terem sido as observaes feitas, sabida ou presumidamente, a partir de amostra alea tria. Qualquer tipo de amostra probabilstica pode ser usada nesses testes, mas, em alguns dles, a estatstica per tinente deve ser calculada de maneira diversa da que se usa para os casos de amostras aleatrias simples. Normalidade significa estar a coleo de tdas as pos sveis observaes relevantes (isto , o universo), sabida ou presumidamente, normalmente distribuda. c r ou o2 quer dizer que o valor de 0 ou de o2 (o des vio padro, ou a varincia do universo) conhecido ou presumido.

T EST E

1*
Ho: n = < z

Hi: y .= t=a
C
o n h e c id o s o u

r e s u m id o s :

Carter aleatrio, normalida

de e 0.
P r o c e d im e n t o :

(1) (2)

Calcular x, mdia da amostra. Calcular

(3) (4)

onde n o nmero de observaes. Escolher na tabela II do Apndice, um valor apropriado para z. Se z za, aceitar H n; caso contrrio, acei tar H 1.

* As curvas C O para sse teste (ao nvel de significncia .0 aparecem na figura 22. (Cf. seo 13 do capituio anterior).

250

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Exem plo: Predizemos que os resultados mdios obtidos por uma populao especificada, que se submete a um nvo tipo de teste, ser igual a 100. sse prognstico baseia-se na experincia colhida em testes semelhantes aplicados mesma populao. No vemos porque a disperso de resul tados dos dois testes dever diferir e, por isso, admitimos que 0 seja igual a 20, valor obtido em teste anterior. Colhe mos uma amostra aleatria de 25 pessoas da populao e submetemo-la ao nvo teste. A mdia dos 25 resultados obtidos 106. Desejamos determinar se devemos aceitar a hiptese (.i = 100, ao (digamos) nvel de significncia .05.

H o'. M= 100 H M* 100 Soluo:


(1) 5 = 106. 106 - 100 (3) z.6 = 1.96.

- 2q- V 25 = 1'50 . (2) z = (4) z < z.os (i e, 1.50 < 1.96): logo aceitar H 0.

T ESTE 2
Ho- m Hi'. C P r e s u m id o s :
a

M>

o n h e c id o s o u

Carter aleatrio, normalidade

e o.
P r o c e d im e n t o :

(1) (2)

Calcular x. Calcular (i a) rz = ---- -Vn. nota: no usar o valor absoluto de (x a).

TESTES

DE

HIPTESES

( 1)

251

(3) (4)

Multiplicar o nvel de significncia por 2, isto , 2a. * Escolher na tabela II do Apndice, o valor de 22 a correspondente quantidade obtida na fase (3). Se z Z2a, aceitar H 0; caso contrrio, acei tar H i.

(5)

E x e m p l o : Com base em observaes passadas, predizemos que o nmero mdio de anos de freqncia escola, com pletados por donas de casa, em certa cidade, no maior de que 10. Sabemos que o desvio padro de nmeros de anos de freqncia escola completados no total da comu nidade 4. Admitimos que sse desvio padro se aplique populao de donas de casa. Colhemos uma amostra alea tria de 6 donas de casa e determinamos quantos anos de escola cada uma delas completou. A mdia da amostra 10.5 anos. Tem fundamento a nossa predio, ao nvel de significncia .05?

//: m< 1 0
H f. ii > 10

Soluo:
(1) x = 10.5. ( 2 ) z = (1-5 1 0 i9 .j.y T = 1,25 .

4 (3) 2a = 2(.05) = .10. (4) a .io = 1 6 4 5 . (5) z < 2 .io (i e., 1.25 < 1.645); ogo aceitar H.

* Nesse teste s rejeitaramos H h se x fsse maior do que esperado, certa porcentagem de vzes, quando | x ^ a. Em conseqncia, * no pode ser, neste caso, demasiado pequeno e a rea do setor de rejeio situa-se inteiramente do lado positivo da distribuio de .v. Mas, se recorrermos tabela II do Apndice e verificaremos o valor de za, obteremos, de cada lado, a distncia (em ffj unidades) at s reas de extenso a/2. Por isso mesmo, neste caso, utilizamos 2a e apenas o valor positivo de z.

252

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

TESTE 3
IIo: / > d

Ih: u < a
C
o n h e c id o s o u

r e s u m id o s

Carter aleatrio, normalidade

e < T .
P
r o c e d im e n t o

(1) (2)

Calcular x. Calcular
_ (x - a)
------------V II .
a

(3) (4) (5)

Calcular 2. Selecionar, na tabela II do Apndice, o valor de Z o a Se z z? ento aceitar H 0; caso contr rio, aceitar H x .

E x e m p l o : Suponhamos que, em outra cidade (ver Exem plo no Teste 2), feita a predio de que o nmero mdio de anos de escola completados por donas de casa no menor do que 10. Suponhamos ter colhido uma amostra aleatria de 64 donas de casa. O nmero mdio de anos de escola completados pela amostra 8.0. Admite-se que < ? seja ainda igual a 4. vlida a predio, no nvel de significncia .10?

H o', n > 1 0 Hi: n < 1 0 Soluo: (1) * = 8.0.


( 2 ) z = (8- ~ 10)- V 6 4 = - 4 . 0 . (3) 2a = 2(.10) = .20. (4) z.2 o = 1*282. (5) s < 2 .2 0(i.e., -4.0 < -1.282); logo, rejeitar H 0 e aceitar H i.

TESTES

DE

HIPTESES

( 1)

253

T ESTE 4 *
Ho- M =
Hl'.
C
o n h e c id o s o u

M^

r e s u m id o s

Carter aleatrio e normali

dade.
P
r o c e d im e n t o

1: * *

(1 ) (2)

Calcular a: e s, mdia da amostra e desviopadro. Calcular

(3) (4)

(5)

Calcular os graus de liberdade, GL, para G L = n 1. Buscar na coluna G L da tabela III, do Apn dice, o valor mais prximo ao do computado para GL, na fase (3) e buscar, horizontalmen te, na coluna intitulada nvel de significncia, o valor ta. Se t t, aceitar H 0\caso contrrio, accitar Hi-

E x e m p l o : O s pesos dos empregados de uma fbrica, em geral, no sofrem alterao durante o ms de janeiro. Dezes seis empregados, selecionados aleatoriamente, so postos sob dieta especial, durante sse ms. O pso mdio ganho foi 1 .50 libras. O desvio padro da alterao do pso da

Neste e em todos os testes posteriores em que aparecer desvios\/(N n)/N cm

padro estimado da populao (s), deve-se usar

lugar de s, se fr colhida amostra aleatria, sem restries e sem substituio, a partir de uma populao finita. sse procedimento ilustrado pelo teste 5. Correspondentemente, usa-se s2 (N n) / N em lugar de s2. ** As curvas CO para sse procedimento (ao nivel de significncia .05) aparecem na figura I do Apndice.

254

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

amostra, foi 2.00 libras. H alguma razo para acreditar que, no nvel de significncia .01, a dieta produziu aumento de pso nos trabalhadores? //: n = 0 tfi: ti * 0 Soluo:
(1) x = 1.50 e i = 2.00.

( 2 ) / = |1'200|vT^

300logo, rejeitar H 0 e acei

(3) gl = 1 6 1 = 15. (4) /.oi = 2.9467. (5) t > /.oi (ie ., 3.00 > 2.9467);

tar H \ \ ou seja, no h razo para acreditar, que a dieta produziu um aumento de pso nos tra balhadores.
P r o c e d im e n t o 2: O teste seguinte em sentido estats tico menos eficaz do que o primeiro. Quando n menor do que 5, os dois, prticamente, se equivalem. ste segundo, porm, no requer clculo de 5 e, portanto, poupa tempo.

(1) (2) (3)

Calcular x. Calcular R, diferena entre a maior e a menor observaes da amostra. Calcular

(4)

(5)

Escolher, na metade esquerda da tabela IV do Apndice, o valor de f a na horizontal cor respondente extenso da amostra e na colu na encimada pelo apropriado nvel de signifi cncia. Se t' t'a, aceitar H 0; caso contrrio, aceitar Hu

TESTES

DE

HIPTESES

( 1)

255

Exem plo: Consideremos o mesmo exemplo proposto para o procedimento 1. O ganho maior em pso foi de 4.00 libras e o menor correspondeu a uma perda de 1.00 libra.

H n: n = 0 Ih: M+ 0 Soluo:
(1)
X

= 1.50.

(2) R = 1 4.00 - (-1.00)1 = 5.00.

(4)
(5) /' >

= .212. /'d (ie ., .30 >

.212);

logo, rejeitar H 0 e acei

tar H i. T EST E 5 Ho :n = a
Hi\ n
+

a .

C o n h e c id o s o u P r e s u m id o s : Carter aleatrio, normalida de e amostra colhida sem substituio de um universo finito e pequeno. P
r o c e d im e n t o :

(1) (2)

Calcular x e s. Calcular

Vn v

(3)

onde N a extenso da populao e n a ex tenso da amostra. Calcular

256

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(4)

Prosseguir repetindo as fases (3) e (5) do procedimento 1, do Teste 4.

E x e m p l o : Num escritrio, onde trabalham 110 empregados, o nmero mdio de dias de ausncia por doena foi 6, em 1950. Uma amostra aleatria de 9 empregados revelou a mdia de 8 dias de ausncia por doena, com desvio padro de 5 dias. H motivo para acreditar que, ao nvel de significncia .05, o nmero mdio de dias de ausncia por do ena, em relao ao conjunto de empregados, sofreu alte rao?

H : /i =

Hn M* 6

Soluo:
(1) x = 8 c s = 5.

(4) GL = 9 _ ! = 8
(5) /.os = 2.3060.

(6)

t < t.os (i e.,

1.25 < 2.3060);

lo g o , a c e ita r

H{ ); ou

seja,

n o h r a z o p a r a a c r e d ita r q u e a m d ia a n u a l d e a u s n c ia s p o r d o e n a te n h a a u m e n ta d o .

T ESTE 6 H o - M< a
Hl: n > a

o n h e c id o s

o u

r e s u m id o s

Carter aleatrio e normali

dade.

TESTES

DE

HIPTESES

( 1)

257

r o c e d im e n t o

(1) (2)

Calcular x e s. Calcular

no tomar a diferena entre x e a em valor absoluto. (4) (5) Calcular 2U . Escolher na tabela III do Apndice o valor de 2 ll correspondente ao G L apropriado, na colu na encimada por 2. se - t2a, aceitar H u, caso contrrio, aceitar H i

(6)
E :

Com base em exame de estatstica do censo, afir ma-se que o nmero mdio de habitantes por casa, no bairro A no maior do que 4.5. Colhe-se amostra de 100 ca sas, na rea A; encontra-se a mdia 5.3 e o desvio-padro 2.0. Procede a afirmao, ao nvel de significncia .05?
x e m p l o

ff0: n < 4.5 ff,: m > 4.5

Soluo:
(1) x 5.3 e s = 2.0. (2) l = 32 7045) \/I = 4.0 . (3) G L = 100 1 = 99. (4) 2a = 2(.05) = .10.

(5 ) l .io = 1 .6 6.

(6) I > t.w(i.e., 4.0 > 1.66) logo; rejeitar H e aceitar H\ .

258

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

TESTE 7
Ih:

Hf. M< tt
C
o n h e c id o s ou

r e s u m id o s

Carter aleatrio e norma

lidade.
P
r o c e d im e n t o

( 1 ) (5) Tal como no Teste 6. (6) Se t o < i, aceitar H 0; caso contrrio, acei tar H i.
xem plo : Afirma-se que o nmero mdio de ausncias de alunos de escola elementar , por ms, pelo menos igual a 2.2. Uma amostra aleatria de 25 alunos revelou a mdia de ausncias de 2.5 dias por ms, com desvio-padro de 1.2. Procede a afirmao, no nivel de significncia .25?

Ih: ii > 2.2 Ih: fi < 2.2

Soluo:
(1) = 2.5 c j = 1.2. (2) <= (2-51 7 22' 2) V 2 5 - 1 . 2 5 , (3)
gl

= 25 - 1 = 24.

(4) 2a = 2(.25) = .50. (5) /.s = .68485. (6)

l> tM (i.e.,

1.25

>

.68485),

logo, aceitar

H o-, ou seja, os alunos se ausentam pelo menos 2.2 dias por ms, em mdia. TESTE 8
Ih: < r'- = a Ih: <r-> Ih.: o- < a
C
o n h e c id o s ou

r e s u m id o s :

Crater aleatrio e normali

dade.

TESTES

DE

HIPTESES

( 1)

259

r o c e d im e n t o

(1) (2) (3) (4)

Calcular s2. Calcular GL = n 1. Calcular .5a e (1.00 ,5a). Calcular

2
(5)

GLs2 a

Usar a tabela V do Apndice. Verificar na coluna G L o valor correspondente ao calculado na fase (2). Horizontalmente, buscar a co luna encimada pelo valor .5a, e escolher o valor de % 2 5n - Se x2 maior do que x2 s > aceitar H j. Caso contrrio, buscar a coluna encimada pelo valor (1.00 .5a) e escolher X2(1.0 0 .5) Se X2 for maior do que x2 d.oo,5 o), aceitar caso contrrio, aceitar H u.

E x e m p l o : Verificou-se, com base em observaes feitas no ano passado, que os trabalhadores de uma fbrica dispendem, em mdia, 4.5 minutos para realizar certa operao, com uma varincia de .75 minutos. Selecionada amostra aleatria de 25 trabalhadores, verifica-se que a operao exige 4.2 minutos, com varincia de .60 minutos. H razo para acreditar que, ao nvel de significncia .10, a varincia sofre alterao?

E 0: o1 = .75 Ha cr* > .75 B


o1 < .75

Soluo:
(1) (2) GL = 25 - 1 = 24. (3) .5o = .5(.10) = .05, (4) (5) = = 36.415. Xa = 13.848.
x ! 05

= .60.

(1.00 - ,5a) = (1.00 - .05) = .95. 1 9 .2 0 .

x2 5 < xJ < xJ 05

(ie ,

13.848 < 19.20 < 36.415);

logo aceitar

H 0; isto , no h razo para acreditar que a varincia tenha sofrido alterao.

260

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

T ESTE 9*
H0: < 7 2< o Hi. a2 > a
C
o n h e c id o o u

r e s u m id o s

Carter aleatrio e normali

dade.
P
r o c e d im e n t o

(1) (2) (3) (4)

Calcular s2. Calcular GL n 1. Calcular X-=


G L

Selecionar, na tabela V do Apndice, o valor X2 ,, correspondente ao G L apropriado, na co luna encimada pelo adequado a. Se x2 menor ou igual a x2 a. aceitar H; caso contrrio, aceitar H\ .

(5)

E x e m p l o : Foi observado que a varincia na freqncia di ria num museu de arte era de 7,000. Com base em amostra aleatria correspondente a 15 dias, determinou-se uma va rincia da amostra de 7,500. Pode-se afirmar que a varincia no superior a 7,000, no nvel de significncia .05?

H0: ff5 < 7,000 H t: ^ > 7,000

Soluo:
(1) = 7,500. (2) GL = 15 _ i = 14.

(3) x^ ll i ) _ ( 7,5002 =
7,000 (4) x ! 05 = 23.685. I5-U-

(5)

< xJ0 5 (ie., 15.0 < 23.685); logo, aceitar H 0; isto , a varincia aumentou. de freqncia diria no

* As curvas CO . para sse teste (ao nivel de significncia .05 aparecem na figura II do Apndice.

TESTES

DE

HIPTESES

( 1)

261

T E S T E 10*
H 0: a - > a H i: < t 2< a
C
o n h e c id o s o u

r e s u m id o s

Carter aleatrio e normali

dade.
P
r o c e d im e n t o

(1) (3) Tal como no teste anterior. (4) Escolher, na tabela V do Apndice, o x2i correspondente ao G L apropriado e sob a colu na encimada pelo valor igual a (1 a). (5) Se x2 X2 i a aceitar H 0; caso contrrio, aceitar h x : '
E x e m p l o : A mdia mensal da fra de trabalho civil numa grande cidade, entre 1940 e 1950, flutuou em trno de certa mdia, com varincia de 25 milhes. Uma amostra aleatria, colhida a partir de 1950, fornece uma varincia das mdias mensais, igual a 20 milhes. H razo para acreditar que. ao nvel de significncia .01, essa varincia decresceu?

//o; < r 2> 25,000,000 Hi: <r < 25,000,000

Soluo:
( 1) = 20,000,000. (2) GL = 11 - 1 = 10.

, ( 10 ) (2 0 ,0 0 0 ,0 0 0 ) (3) ~ 25,000,000 (4) x2,, = 2.558. (5) x2 > x*99 (i-e., 8.0 > 2.558); lo g o , a c e ita r a v a r i n c ia n o decresceu.

H u;

isto ,

* As curvas CO para sse teste (ao nvel de significncia .0 aparecem na figura III do Apndice.

262

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

TESTE 11
H 0: p = a

Hi: p * a
o u P r e s u m id o s : O s acontecimentos observa dos so independentes (i. , no tm efeito um sbre o outro), e tm a mesma probabilidade de ocorrer. A amostra deve, em geral, ser de extenso tal que np > 5; em geral, p deve ser menor do que .90.

C o n h e c id o s

r o c e d im e n t o :

(1)

Calcular p, freqncia relativa observada das ocorrncias do acontecimento; isto , razo do nmero total de vzes em que o acontecimento ocorreu pelo nmero total de casos observados. Calcular

(2)

(3)

Calcular zJ P ~ a . < J

(4) (5)

escolher, na tabela II do Apndice, o valor apropriado de za. se z ^ H i. za, aceitar H 0\caso contrrio, aceitar

Exem plo: Com base em experincia passada, prediz-se que a proporo de profissionais que ultrapassam os 50 anos .400. Colhe-se amostra aleatria de 1,000 profissionais e determina-se que .417 viveram, pelo menos, 50 anos. Isso contraria a predio, ao nvel de significncia de .05?

Ho : p = IIi: p j z

.400 .400

TESTES

DE

HIPTESES

( 1)

263

Soluo:
(1) p = .417.
(2 ,

(5) z <

(4) z.0 5 = 1.96.

.o s (i e., 1.13

< 1.96);

logo, aceitar H 0; ou seja a

predio no contrariada.

7. Hipteses concernentes s diferenas da mesma propriedade em diversas populaes.


Inmeras perguntas que o pesquisador coloca podem tomar esta forma: em que condies uma populao seme lhante a outra, ou a vrias outras, com respeito a uma propriedade especifica? Por exemplo: (1) a mdia de inteligncia dos graduandos de Harvard igual mdia de inteligncia dos graduandos de Yale? Ou seja, (.iN = }iy? H igual variao de renda entre os empre gados da Chrysler e da Ford? Ou seja,
02c = 02k?

(2)

(3)

a mesma a proporo dos habitantes de Detroit e de New York, favorvel ao servio mi litar obrigatrio? Ou seja, so iguais f> D e
/>NY?

No h restries quanto ao nmero de populaes que podem ser comparadas, embora os mtodos usados para com parao de duas populaes sejam, algumas vzes, diversos dos utilizados para comparar nmero maior. Alm de per guntar acrca da igualdade de duas populaes, podemos indagar tambm, por exemplo, se a mdia apresentada por uma maior ou menor do que a mdia apresentada por outra.

264

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

E questes semelhantes podem ser levantadas em trno de varincia e propores. TESTE 12*
Ho' Mi = M Hi'. Mi -t- M >
C o n h e c id o s o u P r e s u m id o s : Ambas as amostras so alea trias e colhidas de universos normais; e a2. P r o c e d im e n t o :

(1) (2)

Calcular a mdia de cada amostra, xx e x2. Calcular


-

I* i

tt!

onde Oj e o; so as varincias conhecidas de duas populaes e /?i e n2 correspondem s extenses das amostras das duas populaes. (3) Escolher na tabela II do Apndice, o valor apropriado de za. (4) se z ^ z aceitar H 0', caso contrrio, aceitar H i.
E xem plo: Queremos determinar se os alunos de duas es colas diferentes apresentam o mesmo Q I mdio. Com base em testes anteriores, admite-se que a varincia, numa escola, 100 e na outra, 144. Amostra aleatria de 10 alunos colhida na primeira escola, e submetida ao teste. O resul tado mdio 104. Amostra aleatria de 24 alunos colhida na segunda escola e submetida ao teste. O resultado mdio e 98. Devemos afirmar que as duas escolas tm o mesmo Q I mdio, ao nvel de significncia .05?
Ho: Mi =

Hl'. Ml * W
*

As curvas CO para sse teste (ao nvel de significncia .0


m

aparecem na figura 22, onde:

w m >* *!+ < i-

TESTES

DE

HIPTESES

( 1)

265

Soluo:
(1) i = 104 e .V , = 98.
J 104 - 98 | J 100~,~144 ~ 1' 50 V 10 + 24 (3) 2 .0 5 = 1.96. 2 (4) s <
2 .0 3

(i.e., l.SO < 1.96), lo g o , a c e ita r

H 0; QI

isto , as m d io .

d u a s escolas a p re s e n ta m o m e sm o

T ESTE 13
H o'- Mi H \ \Ml
< > M! Mj

C o n h e c i d o s o u P r e s u m i d o s : Carter aleatrio, normalida de e a2 relativo a cada amostra (i. , <rj e o|).

r o c e d im e n t o

(1) (2)

Calcular rj x2. Calcular


(ii
X l)

no (4) (5)

to m a r a d ife r e n a e n tre x i e jc2 em v a lo r

a b s o lu to .

Localizar, na tabela II do Apndice, o valor de Z2n Se z ^ Zaa, aceitar H 0, caso contrrio aceitar Hy.

x em plo : Amostra aleatria de 100 graduados da classe de 1940 colhida em duas universidades diferentes. A ren da anual mdia da primeira amostra $7,000: a da segunda, $7,775. Admite-se que as varincias de ambas as populaes sejam iguais a 1 milho. H razo para acreditar que a m-

266

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

dia da classe pertencente primeira universidade no maior do que a da pertencente segunda, ao nvel de significncia
. 20 ?

H o'
:

Ml <

M2

m i > h

Soluo:
(1) * = 7,000 e *, = 7,775. (2)
V

7, 000- 7,7-75

Jl,000,000
100 +

1,000,000'
100

(3) 2a = 2(.20) = .40. (4) z 4 = .842. (5) z < sM (i.e., 5.48 < .842);]ogo, aceitar H u; ou seja,

a mdia da primeira universidade no maior que a da segunda.

TESTE 14 # < > :M l> M s


f f i : Mi < Ms

C o n h e c id o s o u P r e s u m id o s : Carter aleatrio, normali dade e a2 relativo a cada amostra. P r o c e d im e n t o :

(1) (4) Tal como no teste anterior. (5) Se z Z 2, aceitar H 0; caso contrrio, acei tar Hi.
xem plo: Situao idntica apresentada no teste ante rior. H razo para acreditar que a mdia da classe per tencente primeira universidade menor que a da pertencente segunda, ao nvel de significncia .05?

TESTES

DE

HIPTESES

( 1)

267

Soluo:
(1) i = 7,000 e ia = 7,775. r

, , \ __________ 7 ,0 0 0 7,775 1,0 00,0 00 l.O O ^

z~J V

tn

100

100

(3) 2a = 2(.05) = .10. (4) 3.10 = 1.645.

(5) z < - 2 .1 0 (i.e., -5.48 <-1.645);

logo, aceitar

rejeitar H 0; ou seja, a mdia da primeira univer sidade menor que a da segunda. TESTE 15
Ho'- Ml = Mi = = M fc

H \ \ M i^ M ; (** (i, , pelo menos duas das mdias no so iguais).


C o n h e c id o s o u P r e s u m id o s : Amostras aleatrias de igual extenso, colhidas de universos normais, cujas varincias so conhecidas ou presumidas e iguais.

r o c e d im e n t o :

(1) (2)

Calcular 3 c para cada amostra. Calcular ( S - ) 2 ,= S 2- - ^ ,

onde A : nmero de amostras. (3) Calcular (x-x)X: = 0T . ^ 2 .

onde n nmero de elementos em cada amostra. (4) Calcular GL k 1.

268

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(5)

Localizar, na tabela V do Apndice, o valor de X2, correspondente ao GL apropriado, na colu na encimada pelo adequado a. Se X" ^ xf- aceitar H u, caso contrrio, aceitar Hx .

(6)

x e m p l o : Procura-se testar a coerncia de cinco observa dores num laboratrio, no que diz respeito a determinar a porcentagem de certa substncia qumica em dado composto. Sabe-se que a varincia de leitura independente dos obser vadores, e igual a .0001. Cada observador faz duas leitu ras, cujas mdias calculadas so .460, .465, .469, .461 e .463. H coerncia entre os observadores, ao nvel de significncia .05?

H : Ml = mj = m = H i : m. = Mi

= M

Soluo: (1) Xy = .460, x2 = .465, x3 = .469, p c 4 .461 e x5 = .463. Para facilidade de clculo, reduz-se cada x de .460. Isso no afetar os sultados. Portanto, seja xi = .000, x2 = .005, x3 = .009, x, = .001 e xo = -003. J f c (2) (.000)2+ (.005)' + (.00 9)2+ (.001)*+ (.003)* (.000 + .005 + .009 + .001 +.003) > _ 00005 j 2 (.000051)
.0001
'

(4) G L = 5 - 1 = 4. (5) x! = 9.488. (6) x2< x2 o (i e., 1.02 < 9.488); logo, aceitar H,y, ou seja, h coerncia entre os observadores. T ESTE 16
H o'- mi
= M 2
l h : Mi + M s

TESTES

DE

HIPTESES

( 1)

269

C o n h e c id o s

lidade.

o u P r e s u m id o s : Carter aleatrio e norma As varincias so desconhecidas, mas iguais (i. ,

P r o c e d im e n t o 1*

(1) (2)

Calcular xlt x2, Sj e si;. Calcular


(i-D (n2- 1) sj

m + n72

(3)

onde Hi e n2 so as extenses das duas amos tras. Calcular

(4) (5)

(6)

Calcular GL = n )- n2 2. Localizar, na tabela III do Apndice, o valor de correspondente ao GL apropriado e na coluna encimada pelo adequado a. Se f ^ aceitar H; caso contrrio, aceitar

E xem plo: Durao mdia de 15 suspenses de trabalho aleatoriamente escolhidas foi, em 1951, na cidade A, de 25.7 dias, com varincia de amostra de 20. A durao mdia de 10 suspenses de trabalho, aleatoriamente selecio nadas, foi, na cidade B, em 1951, de 19.5 dias, com uma varincia de amostra de 25. H razo para acreditar que a mdia de suspenses de trabalho, nas duas cidades, seja igual, ao nvel de significncia de .05?

Ho'

Ma Md

Hi .M / 41K b
* As curvas CO para sse teste (ao nvel de significncia .05)
m

aparecem na figura I do Apndice, onde

mi

mi,

'

*1 +

A-

270

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Soluo:
(1) i, = 25.7, & = 19.5, s \= 20, c s* = 25.

(4) g l = 15 + 10 - 2 = 23. (5) tM = 2.0687. (6) i > tos (ie., 3.24 > 2.0687);

logo

rejeitar

H0 e

aceitar H x ; ou seja, as duraes mdias das suspenses de trabalho nas duas cidades no so iguais.
P r o c e d im e n t o 2: Quando nt n2, pode ser usado o teste seguinte, simplificado, embora menos eficiente. As observa es feitas relativamente ao teste 4, procedimento 2, cabem aqui.

(1) (2) (3)

Calcular e x2. Calcular R x e R 2, oscilaes de cada amostra. Calcular


l' 75 {R i+ R i)'

(4) (5)
E

Localizar, na metade direita da tabela IV do Apndice, o valor de t'a igual a n = = n < , na coluna encimada pelo a adequado. Se t' t'a, aceitar H 0; caso contrrio, aceitar

xem plo: Estudo semelhante ao feito no exemplo dado para o primeiro procedimento, levado a cabo em duas outras cidades, C e D. Amostra aleatria de 10 suspenses de trabalho colhida em cada cidade. A mdia da amostra na cidade C 26.1 e na cidade D, 21.3. A menor e a maior suspenses na primeira amostra foram 10 e 40 dias, respectivamente. Na segunda, foram, respectivamente, 3 e 37. H razo para acreditar que a mdia das suspenses de trabalho igual, ao nvel de significncia .05?

H o: Mc = M o
H i: p c + M d

TESTES

DE

HIPTESES

( 1)

271

Soluo:
(1) xi = 26.1 e X 2 = 21.3. (2) R y = 40 - 10 = 30. R2 = 37 - 3 = 34. (3) f - I26 . l - 2 1 . 3 j _ * .5 (30 + 34) (4) l'M = .304.

(5) t'

<

/'os

(i.e., .13 < .3041; logo, aceitar H 0, ou seja;

as mdias de suspenso de trabalho so iguais. T ESTE 17


Ho -M i ^ H l'.

M J

> Mi

C o n h e c id o s o u P r e s u m id o s : Carter aleatrio e nor malidade. As varincias so desconhecidas, mas iguais (i. , = o j). P
r o c e d im e n t o :

(l) -( 2) Tal como no teste (3) Calcular (xi_- X 2 J W iT r H l 1 1 2 no tomar a diferena entre ~ x i e em valor absoluto. Calcular G L nx f- n > 2. Calcular 2a. Localizar na tabela III do Apndice, o valor de 2 a correspondente ao G L apropriado, na coluna encimada por 2a. Se t > a, aceitar H 0; caso contrrio, aceitar
H i.
Exem
plo: Deseja-se determinar qual, dentre dois tipgra fos, escreve o maior nmero de palavras por minuto. Cro nometra-se o servio de cada um em 10 perodos aleatrios, durante o dia. O nmero mdio de palavras escritas pelo

(4) (5) (6)

(7)

272

P L A N E JA M E N T O

DF.

PESQUISA

SOCIAL

tipgrafo A de 42 por minuto, com uma varincia de 20. O tipgrafo B apresenta mdia de 37 palavras por minuto, com varincia de 40. Pode-se afirmar que o tipgrafo A mais rpido do que o tipgrafo B, ao nvel de significncia

(42 - 3 7 )

(4) g l = 10 + 10 - 2 = 18. (5) 2a = 2(.025) = .05. (6) /.o s = 2.1009. (7) / < /.o s (i e., 2.04 < 2.1009); logo, aceitar H 0; ou

seja, o tipgrafo A no mais rpido do que o tipgrafo B. T ESTE 18


H 0: Mi > M s H i . M i < M i

o n h e c id o s ou P r e s u m id o s : Carter aleatrio e nor malidade. As varincias so desconhecidas, mas iguais (i. , aj = o-).

P r o c e d im e n t o :

(l)-(6) Tal como no teste 17. (7) Se f Ua, aceitar H 0; caso contrrio, acei tar Hi.
Exem plo: Deseja-se determinar se a cidade B apresenta maior nmero de contravenes dirias do que a cidade A.

TESTES

DE

HIPTESES

( 1)

273

Amostra aleatria de 50 dias examinada com relao cidade A, sendo a mdia da amostra e a varincia, respec tivamente, 140 e 1,000. Amostra aleatria de 25 dias examinada com relao cidade B, sendo a mdia da amos tra e a varincia, respectivamente, 125 e 2,500. O nmero de contravenes, em mdia, cometidos por dia, na cidade B maior do que o nmero correspondente na cidade A, ao nvel de significncia .05?

H o '- P a

>

P-a

Hi: Soluo:
(1)

< pu

xA =

H0,

x3 =

125, s-A

= 1,000, e s%= 2,500.

/ _ _ J ( 4 9 ) ( l , 0 0 0 ) + (2 4 )(2 ,5 0 0 ) 50 + 25 - 2------- = 3 8 '6 '

S- V

(3) = - l l i 0 . ^ L = 1 .59.

(4) g l = 50 + 25 - 2 = 73. (5) 2a = 2(.05) = .10. ( 6 ) .10 = 1.67 ( A p r o x i m a d a m e n t e ) (7)

t > /.io (i.e.,

1.59 > - 1 .6 7 ) ;

logo, aceitar H 0; ou

seja, o nmero mdio de contravenes re gistrado na cidade B no maior do que o registrado na cidade A.

T ESTE

19
IIa: pi = m = ~

Ih - .m ^n (pelo menos duas das m dias no so iguais). Carter aleatrio e nor malidade. A varincia de cada universo desconhecida, mas o2 c2 = . . . = o2.
C o n h e c id o s
ou

P r e s u m id o s :

274

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

r o c e d im e n t o :

(1) (2)

Calcular x e s2 para cada amostra. Calcular


* (S)*

onde k = nmero de amostras. (3) Calcular

(4)

Calcular p_ 2 {x x) 2 (k-1) i 2

(5) (6)

(7)

Calcular GLj k 1 e GL2 = k(ri 1). Localizar, na tabela V I Apndice, na parte que encimada pelo a propriado, o valor de F a correspondente ao G L2 e ao G L t apro priados. Se F Fa, aceitar H 0; caso contrrio, acei tar H i.

xem plo: Amostras aleatrias de 6 estudantes cada, so colhidas em 4 diferentes escolas e seus elementos subme tidos a certo teste de aptido. As mdias computadas e as varincias so as seguintes:

x \= 105
2 = 100

sl

2=
=

8.3
11.2

3 = 107

sl = 12.0
s, = 8.5

Xi = 102

H razo para acreditar que as mdias das escolas no so as mesmas, ao nvel de significncia .01?
Et,'. M l= M 2= El'- Mi + M ;
=

TESTES

DE

HIPTESES

(1 )

275

Soluo: (1) Para facilidade de clculo, diminuir de 100 as mdias das amostras:
i i = 5, .2 = 0,

x3 =

7, e

= 2.

(2) ( - 5 ) * = (5') + (02) + (7 2 ) + (22 )-

(5 + 0 + 7 + 2 ) i = 2 9 .

(3) , . -
4 m (4) p

10.0.

(6)(29)_ (3) (1 0 ) ~
g l

'
= 4(6 - 1) = 20.

(5) g l , = 4 - 1 = 3. (6) (7) = 4.9382.

F > f.oi (i.e., 5.80 > 4.9382); logo, rejeitar H 0 e aceitar H t;

ou seja, as mdias no so iguais. T EST E 20


Ho: o \= 4 Hi: o \
C
o n h e c id o s ou

o \

r e s u m id o s :

Carter aleatrio e norma

lidade.
P r o c e d im e n t o :

(1) (2)

Calcular s2 e s|. Calcular

se s2 > s|; caso contrrio, inverter as posi es e os ndices, isto , fazer com que o ndice 1 corresponda amostra com s2 maior. (3) (4) (5) Calcular G I^ 1 e G L2 = n2 1. Calcular ,5a. Localizar, na tabela V I do Apndice, na parte que encimada pelo valor igual a . 5a, o vaior

276

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(6)

de F .S a correspondente ao G L2 e sob o apro priado GLj. Se F F.r > a , aceitar H 0; caso contrrio, acei tar H i.

plo: Dois atletas percorreram, repetidamente, o mes mo percurso. Amostra aleatria de 8 corridas do atleta A tm varincia de 26 (segundos ao quadrado). Amostra aleatria de 8 corridas do atleta B tem varincia de 15. H motivos para crer que, no nvel de significncia .10, a velocidade de A varie diferentemente que a de BI

Exem

Ho'. O a = oi

IIi\a \4: a \ Soluo:


(1) (2) (3)
j

= 26 = 2 6 /1 5 =
, =

ia = 1.73. 7

15.

g l

8 -

1 =

g l

5 =

8 -

1 =

7.

(4) .Sa = .5 (.1 0 ) = .05. (5) (6)

F .os =

3.7870.

F < Fm (i.e.,

1.73 < 3 .787 0); logo, aceitar H 0; ou seja, no h razo para acreditar que as velocidades de A e B variem diferentemente.

T ESTE

21 *
H0: < rl < o \

Hi. c r *> < r f


C o n h e c id o s
ou

P r e s u m id o s :

Carter aleatrio e norma

lidade.
P
r o c e d im e n t o :

(1) (2)

Calcular Calcular

e sjj.

* As curvas CO para sse teste (ao nvel de significncia .05) aparecem nas figuras IV-VI do Apndice'.

TESTES

DE

HIPTESES

( 1)

277

no necessrio que a frao tenha numerador maior que o denominador. (3) (4) Calcular G LX = nx 1 e G L2 n2 1. Localizar, na tabela V I do Apndice, na parte encimada pelo valor apropriado de a o valor de Fa correspondente ao GLo adequado, sob o G LX apropriado. Se F F a, aceitar H u; caso contrrio, aceitar H i.

(5)

E x e m p l o : Duas amostras aleatrias so colhidas de duas divises do exrcito; a primeira, com 21 elementos, colhida na diviso A, e a segunda, com 51 elementos, colhida na diviso B. A varincia de idades da amostra colhida em A 24.6 e a da colhida em B 30.0. Pode-se inferir que a disperso de idades em A no maior do que em B, ao nvel de significncia .01?

H o: <d < < r % Ht: ti > ti Soluo: (1) (2) (3) (4) (5) s\ s= 24.6 e s B = 30.0. F = 24.6/30.0 = .82. GLj = 21 - 1 - 20 e G L, = 51 1 = 50. Fo i = 2.26 (aproximadamente). F < F .oi (i.e ., .82 < 2.26); logo, aceitar Ho ; ou seja, as idades, na diviso A, no esto mais dispersas do que na diviso B.

T EST E 22 Ho -oJ = ff? = = Th: a?4 =4 (pelo menos duas das va rincias no so iguais).
C
o n h e c id o s o u

r e s u m id o s

Carter aleatrio e norma

lidade.

278

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

r o c e d im e n t o

(1)

Calcular, separadamente, para cada amostra, ,

( i> )

(2)

Adicionar os resultados de (1); isto , cal cular [ <<-*>]

(3) (4)

Calcular G L = n ; 1, para cada amostra. Calcular > '< -

(5)

Calcular =, , f c ! d GL*

isto , (4) ln [ (2 )/(4 ) ], onde (2) represen ta os resultados obtidos na fase (2), etc., e ln o logaritmo natural. (6) Calcular, separadamente, para cada amostra, J Si = (*_*>*
GL'-

isto , (1 ) / ( 3 ) . (7) (8) (9) Calcular ln (s2) para cada amostra, separa damente. Calcular G LS ln (s?) para cada amostra; isto , (3) (7). Adicionar os resultados de (8); isto , ,calcular 2 GL'. ln (*)

TESTES

DE

HIPTESES

( 1)

279

(10) (11)

Calcular M = (5) (9). Consultar a tabela V II do Apndice: a) se M menor do que a menor inscrio correspondente ao k apropriado, aceitar H 0. se M maior do que a maior inscrio correspondente ao k apropriado, aceitar Hise M estiver compreendido entre a menor e a maior inscrio, calcular. * 1
G L 'i

b)

c)

e consultar a coluna Ci apropriada. Se M fr menor ou igual ao valor que apa rece nessa coluna, aceitar H 0; caso con trrio, aceitar H i. Nota Se alguns G L ; so pequenos (menores ou iguais a 2) e outros so grandes (iguais ou maiores do que 12), e se requer grande exatido, consultar (10). Para exame e ilustraes de outros mtodos de testar essas hip teses, ver (6:80-81)
Exem plo: Deseja-se determinar se a variao de tempo exigida para realizao de certa operao diferente em 5 diferentes fbricas. Coligem-se dados a partir de amos tras aleatrias colhidas em cada fbrica, obtendo-se os seguin tes resultados:

(1)

(2) l; 14 22 20 10 14 80

13)
GL'i 13 21 19 9 13 75

(4)

(5) ti

()

(7) GL-, ta (i!) 54.21 8 9.46 76.19 3 3.66 54.86 308.38

(8) IG L , .077 .048 .053 .111 .077 .366

Amostra
1 2 3 4 .......... 5 ..........

ta (> )
4 .17 4 .26 4.01 3 .7 4 4.22

..... ..... .....

845 1,491 1,045 378 884 4,643

65 71 55 42 68

Total

280

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Ao nvel de significncia .05, testar as seguintes hipteses:

IIo*, af = <72 = III'. Ct\ + Cf]


Soluo: (1)
(2) S

3 ~

Coluna 4.
[ 2 ( * . - * ) * ] = 4,6 4 3 .

(3)
(4) 2

Coluna 3.
GL. = 7 5 -

s
(5)

23 2

(*'*)

G L , l n ----- --------- = (75) ln

4 543

= 75 (4.1 2 5 7 ) = 30 9.43 .

23 GL (6) (7) (8)


(9) ^

Coluna 5. Coluna 6. Coluna 7.


G L, l n ( 2) = 3 0 3 . 3 8 .

(10) (11)

M = 309.43 - 308.38 = 1.05. O menor valor correspondente a k 5 na tabela V II do Apndice 9.49. Uma vez que 1.05 < 9.49, aceitar H 0; ou seja as varincias so iguais.

T ESTE 23 H0 : > i= Hi: pi + h


o n h e c id o s o u P r e s u m id o s : Amostras aleatrias iguais de ambas as populaes. A probabilidade de ocorrncia do acontecimento examinado, em cada amostra, permanece constante ao longo de tda a amostragem. Assim, se a

TESTES

DE

HIPTESES

( 1)

281

populao fr pequena, ser necessria amostragem com repetio.


P
r o c e d im e n t o

(1)

Preparar a tabela seguinte (chamada dupla dicotomia ):


Nmero de ocorrncias

Nmero de no ocorrncias b

Total

Amostra da 1" populao Amostra da 2" populao Total

a + b

c a + c

d b + d

c+ d
a + b+c + d = 2n

(2)

onde a representa o nmero de ocorrncias na primeira amostra, b o nmero de no ocorrn cias, etc. . Calcular
2n(ad b c + ri) 2

4 {a+ c){b + d){a+b){c + d)


(3) (4) Escolher, na tabela II do Apndice, o valor apropriado de za. Se z za, aceitar H 0; caso contrrio, aceitar H t.

x em plo : Deseja-se determinar (ao nvel de significncia .01) se uma repartio pblica emprega maior percentagem de veteranos da segunda guerra mundial do que outra. Na repartio A, de amostra aleatria de 100, 30 so veteranos; na repartio B, de amostra similar, 40 so veteranos.

H o '- p A pB H l-. p A + pB

282

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Soluo: (D
Nmero de ocorrncias Amostra de A Amostra de B 30 40 Nmero de no ocorrncias 70 60 Total

100 100

Total

70

r."'

130

200

-_

a /200(3

{> *

0 X 6 0 - 7 0 X 4 0 + 1 0 0 )! _ <70) (130) (100) (10.0)

(3) (4)

z.oi

= 2.58.

z < z.oi (i. , 1.33 < 2.58); logo, aceitar H t; ou seja, as porcentagens so iguais.

T EST E 24
Ho'. pi < pi H\: p \ > pi
C P
o n h e c id o s ou

P r e s u m id o s :

Tal como no teste 23,

r o c e d im e n t o :

(l)- (2 ) Como no teste 23. (3) Calcular 2a. (4) Selecionar, na tabela II do Apndice, o valor apropriado de z2a(5) Se z Z2a, aceitar / 0; caso contrrio, aceitar H i.
E xem plo: Deseja-se saber se os pacientes de um hospital, portadores de lceras (A ), so, mais do que os no ulcerosos (B ) , provenientes de famlias em que exista pelo menos

TESTES

DE

HIP TESES

( 1)

283

um alcolatra. Amostra aleatria de 50 pacientes portadores de lceras, exibe 40 pacientes com um alcolatra na familia, ao passo que amostra de 50, entre os demais ,exibe 20 pacien tes com alcolatras na famlia. Ao nvel de significncia de .05, existe porcentagem significativamente maior de alcolatras em famlias portadoras de lceras do que em fam lias de outros tipos de pacientes?
Ho4 -Pa < Pb H l4 . Pa > Pb

Soluo:
( 1)
Nmero de ocorrncias Amostra de A Amostra de B 40 20 Nmero de no ocorrncias 10 30 Total

50 50

Total

60

40

100

/-n _ A/100 ( 4 0 X 3 0 - 1 0 X 2 0 + 50) (2) ^ -----(6)(4f(50)(50)-----= 429 (3) 2a = 2(.C5) = .10. (4) 2, = 1.645. (5) z > z.io (ie., 4.29 > 1.645);

logo, rejeitar H 0 e acei

tar H l, isto , apresentam-se lias onde haja que em outras

pacientes portadores de lcera mais freqentemente em fam pelo menos um alcolatra do famlias.

As hipteses ( H 0: px p2) e {Hx: < p2) podem ser examinadas de modo anlogo ao que acabamos de descrever, com uma diferena na fase (5) : (5) Se z Z2 o, aceitar H 0; caso contrrio, aceiHy.

284

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

8.

Hipteses concernentes s propriedades relacionais. Inmeros problemas tratam de questes do seguinte

tipo: (1) De que modo se podem exprimir alteraes em uma varivel Y em funo de alteraes em outra varivel X I Variaes em uma varivel tendem a fazer-se acompanhar de variaes em outra varivel?

(2)

A fim de responder a tais questes, mtodos de regresso e de correlao analtica (anlise de correlao), foram desenvolvidos. 8.1 Anlise de regresso.

Imaginemos que se est interessado em levar a efeito um estudo da distribuio dos resultados obtidos pelos empre gados de certa firma em um teste de aptido, relacionando-os com o nmero de anos que os empregados freqentaram a escola. Imaginemos, ainda, que nenhum empregado tenha passado menos de seis anos na escola, e que nenhum tenha estudado mais de dezoito anos. Poderamos comear agru pando os empregados segundo o nmero de anos que tives sem estado na escola, submetendo cada grupo ao teste. Poderamos, a seguir, determinar, a distribuio dos resul tados obtidos em cada grupo e calcular a mdia e a varincia da distribuio para cada um dles. Poderamos afixar cada uma das treze mdias obtidas em um grfico em que o eixo horizontal (X ) representasse o nmero de anos de estudos, e em que o eixo vertical (Y ) representasse os resultados. Os pontos imagem das mdias de cada grupo poderiam ser unidos por meio de uma curva. Esta seria a curva de regres so de Y em X , ou seja, dos resultados em nmero de anos de estudos. Nesse caso, a varivel dependente percorre os resultados, e a varivel independente, os anos de escolari dade. Em alguns casos a curva de regresso pode ser um segmento retilneo ou quase retilneo. Tem-se, ento, a regresso linear.

TESTES

DE

HIPTESES

( 1)

285

Consideremos o seguinte exemplo de regresso linear. Imaginemos iguais as varincias da distribuio das notas em cada grupo (formado segundo os anos de escolaridade). Sejam (o2 y t) essas varincias. E imaginemos que as mdias das notas ( y ) , para cada grupo (x) tenham sido as seguin tes (\ ivx) :
Nmero de anos de escolaridade (x) Mdia das notas do teste ( n , - x )

9 10 11 12

13

14

15

16

17

18

70 75 80 85 90 95 100 105 110 115 120 125 130

muito conveniente exprimir o nmero de anos de freqn cia escola (x) como desvios da mdia dsse conjunto de valores (|O i ou seja, como (x (x^). No presente caso, | .i. igual a 12 anos. Os dados podem, pois, ser reescritos dste modo:
1 u > 1 K J I 1 f U i x nv) M rx 70 2 3 4 5 O
(.(.,.),

75

l 80

85

90

95 100 105 110 115 120 125

Note-se que a mdia dos valores (!*, ou seja, (m,), igual a 100 e que esta mdia ocorre associada mdia dos valores de X (12 anos). Pode-se mostrar que isto sempre acontece nas regresses limeares. Os valores esto marcados na figura 24. Qualquer reta de regresso pode ser dada por uma equao da seguinte forma:
IV ' = ! l i/ +
B ( x

onde B a declividade da reta; ou seja, o nmero de uni dades de que varia quando x varia de uma unidade. B o chamado coeficiente de regresso. No caso em exame, B igual a 5. No caso de B = 0, a reta de regresso hori zontal. Quando isso acontecer, as alteraes nos valores de V no tendem a estar associados s alteraes de valores de X ; em outras palavras, a variavel Y independente de X . Se

286

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

h declividade, existe associao dos valores de Y, corres pondendo s alteraes de valores de X . , porm, prema turo asseverar que Y dependente de X , quando h decli vidade. A afirmativa equivaleria a dizer que as modifica es em X causariam as modificaes em Y, o que nem sem pre o caso. O que, em verdade, se pode, apropriadamente, assegurar (caso haja declividade, isto , caso \ B y x= j= 0]), que alteraes em Y esto associadas a alteraes em X .

F ig. 24 Regresso linear de notas de teste sbre o nmero de anos de frequncia escola

A fim de ver de que modo opera a equao da regres so, suponhamos que se queira determinar o valor de \ i s isto , a mdia obtida pelos indivduos que se submeteram ao teste de aptido, e que foram agrupados por terem todos 8 anos de freqncia s escolas. Ento, uma vez que |.i = 100, B = 5 e = 12, obtemos \ iv x= 100 + 5(8 12) = 100 20 = 80.

Uma utilidade dessa equao se torna aparente. Se desejamos fazer um prognstico a respeito da iiota de um indivduo, selecionado ao acaso em um dos grupos X , a melhor estimativa ser, sem dvida, a mdia obtida pelo

TESTES

DE

HIPTESES

(1 )

287

grupo Isso decorre do fato de que os valores de y para um x especificado se aglomeram em torno de sua mdia. Suponhamos, agora, que no conhecemos a equao de regresso do nosso exemplo, e que estamos interessados em fazer uma estimativa, luz do que informa certa amostra da populao. Para ter uma idia da reta de regresso, precisamos, em primeiro lugar, de estimativas de j.iv e de Bvx. Para \ ix podemos usar a mdia (x) dos x's que sele cionamos para compor a amostra. Estimativas sem desvio de \ n y e de Bv que tenham varincia mnima, so y e byx, ZXiVi 2*,%!,--- ' * 4 1

b y x

O uso dessa estimativa ser examinado na seco 8.2. A equao de regresso estimada % = y + by x (xi - x), onde yx a estimativa de \ lvx . sse valor conhecido como estimativa de Y e, algumas vzes, representado por i/e A reta a que essa equao d lugar tem a propriedade de que a soma dos quadrados dos desvios verticais [2(j/a yx) ] menor do que a soma correspondente em qualquer outra reta que possa ser traada pelos pontos. Por isso mesmo, essa reta chamada o ajuste dos mnimos quadrados. Deve-se ter em mente que possvel que no se saiba da existncia de uma regresso linear quando se recorre a tal equao. Se a regresso existe, dela obtemos a melhor estimativa atravs da equao. Pode surgir a questo de saber se Y independente de X . Em caso positivo, By x ser igual a zero. Para responder a tal questo, podemos testar a hiptese H n: B y x = 0. O procedimento cabvel descrito no teste 25. Suponhamos desejar estudar a distribuio de resultados de testes relativos no apenas ao nmero de anos de escola freqentados, mas relativos tambm aos grupos de renda. Desejaramos, ento, determinar a regresso de resultados com referncia a duas variveis independentes. Isso implica

288

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

em regresso mltipla. Tcnicas para avaliao de regresses dessa ordem no sero aqui examinadas, mas constituem objeto de discusso em (5 :x iv ). A regresso de Y em X , pode ser ou no linear; pode ser uma curva. H tcnicas adaptveis a sses casos. possvel testar a hiptese de que uma regresso linear. Teste com esse fim examinado em (2: 160-62). No exemplo acima, a populao foi agrupada segundo o nmero de anos de escola freqentados ( X ) , e a distri buio de resultados de teste [Y) foi determinada para cada grupo. possvel agrupar a populao segundo seus resultados, e determinar a distribuio de anos para cada grupo de resultados. Obteramos, dessa forma, uma regres so de X em Y. tambm possvel estudar a correlao entre a regresso de Y em X , e a regresso de X em Y . sse estudo tem o nome de anlise ds correlao. O signi ficado e as tcnicas necessrias para tal estudo esto expos tos na seco 8.3 dste captulo. Ocupemo-nos, agora, de uma ilustrao especfica do uso de regresso linear, e consideremos o procedimento para avaliar a equao de regresso e testar as hipteses concernen tes ao significado da declividade. Suponhamos colher amos tra de 10 membros da populao de empregados, cujos resul tados no teste e nmero de anos de escokridade so os seguintes:

Elementos

Anos de escolaridade (X ) 13 10 18 12 8 7 11 10 6 12

Resultados (Y )

1 2 3 4 5 6 7 8 9 10

104 96 124 120 95 122 110 90 85 104

TESTES

DE

HIPTESES

( 1)

289

Anos de escola completados

F ig. 25 Diagrama de distribuio e reta de regresso estimada de y em x

sses valores podem ser representados grficamente. Aparecem na figura 25. Tal representao chamada dia grama de disperso. Segue-se o procedimento para avaliar a reta de regresso correspondente a sses dados.

8.2 Procedimento para determinar a equao de regresso linear. e


So dados: um conjunto de pares de observaes, yit tais que um s yt esteja associado a cada x.

290

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(1)

Prepara-se o seguinte quadro: -

Xi

yi

Xi

i! 1

y. 1

1 .... 2

..... Total

Para obter x'if faz-se uma estimativa da mdia (x<j) dos valores inscritos na coluna xt. Subtrai-se x0 de cada x{ , inscrevendo-se o resul tado na coluna x'i (ou seja: x'i x'i x0), registrando-se o sinal da diferena. Para obter y'ir faz-se estimativa da mdia (y0) , repetindo o procedimento. Caso as colunas x* e yn tenham mdias prximas de zero, os dados originais podem ser empregados, sem que seja necessrio transform-los nos x'i e ifi.

(2)

Calcula-se

. = * + . 1 1 y = y+^ '-

(3) (4) (5)

Calcula-se Calcula-se Calcula-se

2 (*, i ) 3= 2a!
2 (y. y)2= 2y?~

(2x-,)!

(2y,)!

(6)

Calcula-se

s U, x) (> , y) = 2.t-,y,

TESTES

DE

HIPTESES

(1 )

291

(7)

A equao de regresso de Y em X ser ento descrita pela equao:

> '= y +

2 (Xj x) (y, y) 2 (* ,- x) -

(.v, - x) ,

onde yx o valor previsto de Y para um dado valor de X . O coeficiente de regresso esti mado (byx) obtido de

, _ 2 (.v, - x ) ( y , - y )

da,

2 (*,--*)* y. = y + bv x (xi - )-

O coeficiente de regresso verdadeiro, ou da populao, representado por B. O rro padro estimado do valor previsto ( yx) obtido de

n 2

O rro padro estimado de b1 lx obtido de

V 2(x ,- )2-

E xem plo: Equao da regresso de resultados de teste acrca de anos de escolaridade, baseada em 10 observaes

292

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(D
Observa es Anos de e s c o la . Resultados do teste

X %

y %
104 96 124 120 95 122 110 90 85 104 -

X i
1 2 6 0 4 5 1 2 6 0

y
4 - 4 24 20 - 5 22 10 -10 -15 4 50

X i*
1 4 36 0 16 25 1 4 36 0 123

y* I
16 16 576 400 25 484 100 100 225 16 1 ,9 5 8

* y |
4 8 144 0 20 -110 - 10 20 90 0 166

1 2 ............... 3 ............... 4 ............... 5 ...............

.......

6...........
7 ............... 8 ............... 9 ...............

13 10 18 12 8 7 11 10

10.......

6
12

T o t a l.

................... 1 - 1 3

j,

= 12

e y0 .= 10.

(2) (3) (4) (5) (6) (7)

* = 12 + (13)/1 0 = 10.7. y = 100 + 50/10 = 105. Z(z; - x)\= 123 - 169/10 = 1C6.1. 2(y,. - yY = 1,958 - 2,500/10 = 1,708. 2(*i - x) (y, - y) 166 - (- 13)50/10 = 231. yx = 105 + 231/106 l(* f - 10.7) = 105 + 2.18(*. - 10.7). bV I =2.18. = J I7708- (231)7106.1 _ 12 3

TESTE 25
Ho: B vx 0 / / i : B vz 4= 0 C o n h e c id o s o u P r e s u m id o s : A regresso de Y em X linear; Y est normalmente distribudo com igual varincia para qualquer valor de X , sendo os valores observados de Y selecionados aleatoriamente para cada valor fixado para X.

TESTES

DE

HIPTESES

( 1)

293

(1) (2) (3) (4)

Calcular byx. Se by x negativo, ignorar o si nal nos clculos subseqentes. Calcular svx. Calcular sb y x Calcular

(5) (6) (7)

Calcular G L n 2. Selecionar, na tabela III do Apndice, o valor apropriado de ta. Se f> aceitar H u, caso contrrio, aceitar H i.
8 .2 . O

Exem plo: Usar os dados da seco o nvel de significncia. .05.

teste

para

0: byx = o Hi: bvx rjr o


Soluo:
(1) l v x = 2.18. (2)-(3) sb = 1.42. (4) t = 2.18/1.42 = 1.54. ( 5) ; g l = 10 - 2 = 8. (6) /.o s = 2.306. (7) / < /.o s(i.e., 1.54 < 2.306); logo, aceitar H

isto , o coeficiente de regresso no significativo. 8.3 Anlise de correlao.

Na anlise de correlao, a regresso de Y em X e a regresso de X em Y so (de fato) ambas determinadas, e a relao entre elas medida por uma quantidade chamada coeficiente de correlao. O coeficiente de correlao ver dadeiro, ou da populao, simbolizado pela letra grega r (q) e as estimativas dsse valor so representadas por r.

294

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Apresentemos, inicialmente, uma abordagem no matem tica do significado de correlao. Suponhamos obter para cada individuo de uma populao um resultado de teste de capacidade de leitura (x ), e um resultado no teste de voca bulrio (i/f). de se esperar que uma pessoa que obteve bom resultado em um dsses testes tenda a apresentar bom resul tado no outro. E de esperar tambm que maus resultados num dos testes conduzam a maus resultados no outro. Ou seja, de esperar que bons e maus resultados num teste sejam acompanhados, respectivamente, por bons e maus resul tados no outro. Se fizssemos um grfico, definindo a posi o de cada individuo pelos resultados obtidos nos dois testes, poderamos esperar que a distribuio dos pontos fsse a que aparece na figura 26, mais ou menos. Estas duas variveis se diriam correlacionadas positivamente.

Alta

Baixa Baixa Alta

F ig. 26 Variveis correlacionadas positivamente

Nem tdas as variveis esto correlacionadas positiva mente. O alto valor de uma varivel, p. ex., pode tender a acompanhar-se de baixo valor de outra. Se nos propuss semos a determinar a renda de um grupo de indivduos e a energia fsica por les dispendida no trabalho, esperara mos concluir que a renda aumenta na medida em que o esforo fsico tende a diminuir. Grficamente esperaramos uma coleo de pontos distribudos mais ou menos como na figura 27. sse conjunto de observaes associadas aos pares se diria negativamente correlacionado.

TESTES

DE

HIPTESES

( 1)

295

Alta

Baixa Baixa Alta

F ig . 27 Variveis correlacionadas negativamente

Por fim, as duas variveis podem sofrer alteraes independentemente; ou seja, o alto valor de uma tanto pode ser acompanhado por um alto como por um baixo valor da outra. de se esperar, por exemplo, que o nmero de crian as nascidas anualmente na cidade de New York seja inde pendente do indice pluviomtrico do Peru. Isto , no espe ramos que os valores dessas variveis mostrem tendncia de variar seja no mesmo sentido, seja em sentido opostos. Grficamente, surgiria um conjunto de pontos tal como o que aparece na figura 28. E diramos que essas variveis so no correlacionadas.

Alta

Baixa

--------------------------------------Baixa A lta

F ig. 28 Variveis

no

correlacionadas

296

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

J deixamos referido que o coeficiente de correlao exprime a relao entre a regresso de X em Y (Bxy ) e a regresso de Y em X (ByX ). Especificamente,
p

y/Bx yB yx

Pode-se demonstrar que sse valor , no mximo, 1 (cor relao positiva perfeita) e, no mnimo, 1 (correlao negativa perfeita). Zero representa independncia per feita. As propriedades matemticas de Q podem ser compreendi das sem maior dificuldade. Suponha-se que consideramos to das as possveis X observaes (x{) e determinamos de quan tas unidades O j, elas se afastam da mdia [ (x{ \ ix) /o*]; e procedemos da mesma forma para tdas as Y observaes associadas [(y{ H*)/o]. Se ambos sses desvios tm mesmo sentido (i. , so ambos positivos ou negativos), o produto positivo. Se os desvios tm sentidos diferentes (i. , um positivo, outro negativo), o produto negativo. Suponhamos agora ter determinado sses produtos para cada possvel par de observaes, havendo obtido o total:

O ,

a.

Se esta soma fr positiva, teremos indicao de que as vari veis tendem a alterar-se no mesmo sentido. Se fr negativa, indicar a tendncia de se alterarem em sentidos opostos. Quanto mais acentuada essa tendncia, maior ser a soma. conveniente considerar o produto mdio dsses des vios, e no a soma, pois a mdia possibilita sejam feitas com paraes entre conjuntos de extenso diferente, formados por pares de observaes. Em consequncia, o coeficiente de correlao pode ser definido da seguinte maneira: (*i - M i) (y. - m )
a x <Jy

A estimativa de define-se como:


1 (*. x)
Sx

(y< y)
Sy

TESTES

DE

HIPTESES

( 1)

297

Essa frmula pode sofrer transformao para tornar mais simples os clculos necessrios. A forma aparentemente mais complexa, porm de uso mais simples, apresentada na seo 8.5, fase (2). 8.4 Ms aplicaes da anlise de correlao.

Nas cincias sociais, o uso da correlao tornou-se pro cedimento padro, embora em muitos casos no se considerem devidamente as vantagens de usar um ou outro tipo de esti mativa de correlao. Como se trata de assunto muito complexo, desejvel que freqentemente se consulte um especialista em estatstica matemtica. H duas ms aplicaes da anlise de correlao que so comuns, e em relao s quais o cientista social deve estar prevenido. Consiste a primeira em admitir que o coeficiente de correlao estimado r, tenha algum sentido por si mesmo. Um coeficiente de correlao de amostra no tem sentido por si mesmo. Devemos determinar qual a possibilidade de que tal estimativa se concretize, caso o coeficiente verdadeiro tenha um valor especificado; ou seja, cabe-nos determinar se a estimativa ou no significativa. Por exemplo, pode mos indagar: se o verdadeiro valor de coeficiente de correla o igual a zero, qual a possibilidade de obtermos uma estimativa especificada? Na prtica, muitos pesquisadores admitem automticamente r como significativo, desde que le seja igual ou maior do que certa quantidade especificada (p. ex., 85). Essas concluses nem sempre so acertadas; em alguns casos, mesmo sendo r inferior a .85, le signifi cativo, e pode no ser significativo quando maior do que .85. Em outras palavras, mesmo que o valor verdadeiro do coefi ciente de correlao seja igual a zero, casos haver em que o valor de r seja maior do que .85. Consideraremos, abaixo, testes de significncia que aparecem freqentemente. Ao segundo rro comum, j nos referimos (no cap. iii). Consiste em asseverar que, por estarem X e Y correlaciona dos, um causa ou efeito do outro, produtor ou produto do outro. Tal inferncia no pode se basear exclusivamente em anlise de correlao. As condies e operaes requeridas para estabelecer tal relao foram anteriormente discutidas. Deve-se fazer notar que no estamos limitados con siderao de apenas duas variveis na anlise de correlao.

298

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

Mtodos existem para o tratamento simultneo de grande nmero de variveis. Devemos acentuar, por fim, que h algumas medidas de associao entre variveis, muito teis, embora relativa mente desconhecidas. Trs dessas medidas particularmente teis em cincia social so: (1) o coeficiente de compatibi lidade que mede o acrdo entre classificao e um padro pr-estabelecido; (2) o coeficiente de coerncia, indicador da coerncia de um juiz ou observador, quanto a suas prefern cias, ao comparar pares de observaes; e (3) o coeficiente de concordncia, que mede a concordncia entre vrios juizes ao compararem pares de observaes. Essas medidas e os testes que determinam sua significncia so examinados em (8: I, xvi). Para discusso mais ampla de correlao, ver (5), (7), (9) e (10).

8.5 Procedimento para clculo do coeficiente de correlao linear.


(1) Preparar tabela anloga da primeira fase do clculo do coeficiente de regresso linear (ver sec. 8.2). Calcular
= \l I n Z x ly t- (Z *!) Syl) P

(2)

v
E
xem plo

(2*:)s][2yJ- (2y)2 ]'

Usar os dados fornecidos na seco 8,2. Ver (1) do l 9 Exemplo da seco 8.2.
J (10) (166) ( 13) (50 ) ] 2 V [ (10 ) (123) - ( - 13) 2] [ (10 ) (1 ,9 5 8 ) - (50)*]

(1)
m

K> '
T ESTE 26

'

'

H0: P

H p * 0

TESTES

DE

HIPTESES

( 1)

299

o n h e c id o s o u

r e s u m id o s :

pare s de o b se rv a e s so

c o lh id o s a o a c aso e e sto n o r m a lm e n te d is tr ib u d o s . P
r o c e d im e n t o :

(1) (2) (3)

Calcular r. Calcular GL = n 2. Localizar, na tabela V III do Apndice, o va lor de ra correspondente ao G L adequado, e na coluna do a apropriado. Se r menor ou igual a r, aceitar H 0\caso contrrio, aceitar H i. Testar ao nivel

(4)

E xem plo: Usar os dados da seco 8.2. de significncia .05.

H o '- p = 0

Hi: p + 0 Soluo: (1) (2) (3) (4) r = .54 GL = ro 5=


(v e r sec.

8.4.)

10 - 2 = 8. -6319.

r < r.oo (i. , .54 < .6319); logo, aceitar H 0; isto , o coeficiente de correlao no significativo.

T EST E 27
H o -p

=o

P* 0 C o n h e c i d o s o u P r e s u m i d o s : A s o b se rv a e s c o n siste m d e d o is c o n ju n to s de d isp o si e s d o m e sm o c o n ju n t o de e le m e n tos.

300

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

r o c e d im e n t o

(1)

Preparar a tabela seguinte:


K
X,

Elemento

Aa
Xj Y3

A
X

Disposio

1 ..

Disposio 2 . .

Yx

(2)

(3)

onde A i, A 2 . . . , A u correspondem aos ele mentos; X i a posio atribuda ao primeiro elemento na disposio 1, a posio atri buda ao primeiro elemento na disposio 2, etc.. Determinar a posio X do elemento colocado em primeiro lugar na disposio Y . Suponhase que a posio X fsse 4. Conta-se, ento, o nmero de elementos (A ) direita de A 4 (i. , n 4) e da subtrai-se o nmero de ele mentos esquerda de A (i, , 3). Chamar di a sse valor. Suprimir A 4. Repetir sse procedimento para o elemento colocado, na disposio Y, em segundo, terceiro, etc., luga res, at o penltimo. O u seja, calcular do, d.......... dn_i. Calcular
n 1

i =l

(4)

Calcular
25
r n [ n 1)

onde n = nmero de elementos na disposio. a) Se n 10, escolher, na Tabela IX , do Apndice, a probabilidade correspondente ao

TESTES

DE

HIPTESES

(1 )

301

valor de 5 obtido em (3) e sob a apropriada coluna n. Se essa probabilidade maior ou igual a .5a, aceitar H 0 , caso contrrio, aceitar Hx . b ) Se n > 10: i) Calcular

ii) iii)

iv)

Calcular G L = n 2. Localizar na tabela III do Apndice o valor de ta correspondente ao va lor do G L apropriado e sob o ade quado a. se , aceitar H 0; caso contrrio aceitar H x .

xem plo: Dois dirigentes de emprsa, independentemente, classificam 10 de seus subordinados com respeito capaci dade de direo. Os resultados so os seguintes:

Ai Classificao do dirigente A Classificao do dirigente B

A2

Ac

A,

Ad

At

Ao

Aio

1 5

3 1

4 4

6 6

2 7

7 8

8 9

y 3

l 2

5 10

Qual a correlao entre as classificaes? cativa, ao nvel de significncia .05?


//o: p = 0
I h : p z
0

ela signifi

Soluo: (1) (2) Ver tabulao acima. d = + 5 d3 = - 7 d2 8 = f- 2

302

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(3) (4) (5)

d5 = + 5 ds = 0 dg 0 dt 1 d i f- 3 S = 1. r = 2( 1)/(10) (9) = .0222. Resulta, da Tabela IX do Apndice, que a probabilidade igual a .500. Uma vez que .500 > .5(.05), aceitar H 0; ou seja, as classificaes no esto significativa mente correlacionadas.

T ESTE 28
Ho'- P
=

Hi.
C o n h e c id o s o u P r e s u m id o s : O s pares de observaes so aleatoriamente colhidos e distribudos normalmente. P
r o c e d im e n t o

(1) (2)

(3)

(4)

Calcular r. Localizar, na tabela X do Apndice, o valor de z correspondente a r . Se r fr negativo, mudar o sinal do valor indicado. Localizar, na Tabela X do Apndice, o valor de z' correspondente a p. Se a for negativo, mudar o sinal do valor indicado. Seja z a representao dsse valor nvo. Calcular ' V--3

(5)

Calcular

(6)

Localizar, na tabela II do Apndice, o valor adequado de za.

TESTES

DE

HIPTESES

( 1)

303

(7)

Se z z, aceitar H 0; caso contrrio, aceitar H x.

E x e m p lo : Amostra de 10 observaes resulta em r = .59. Testar as seguintes hipteses, para a = .01:

//:
H r .

P P

= .800 .800

Soluo:
(1) r = .59. (2) a' = .678. (3) z' = 1.099.

<41
(6) z.oi = 2.576. (7) z < z,oi

(i.e., 1.11

< 2.576),

logo, aceitar H t

T ESTE 29
flo: pi = Pi
i/ i: pi + ps C o n h e c id o s o u P r e s u m id o s : Em cada amostra, os pares de observaes so aleatoriamente colhidos e distribudos normalmente. P :

r o c e d im e n t o

(1) (2)

Calcular r1 e r2. Localizar, na tabela X do Apndice, o valor de z' correspondente a ^ (zi), e o valor de z cor respondente a r2 (z'2). Se ambos sses r fo-

304

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(3)

rem negativos, deve ser dado valor negativo ao correspondente z . Calcular


-I z - z 1

V (4) (5)

* tl\ 3

Ui

Selecionar, na tabela II do Apndice, o valor apropriado de za. Se z za, aceitar Ho; caso contrrio, aceitar H

E x e m p lo : Colhe-se uma amostra aleatria de mdicos de duas cidades, A e B, obtendo-se coeficiente de correlao para cada uma, em relao renda e ao tempo de clnica de cada mdico. Os resultados so: rA = .65 e rB = .56. Extenses das amostras, nA = 53 e nB = 28. Testar, ao nvel de significncia .05, as hipteses:

Ho'. Hi'-

PA

Pb

Pa

P b

Soluo:
(1) rA = 6 5 c rB = -56. (2) z = .775 c zi = .633. 1.775 .633 | _ . , (3) 2 - 1 /5 0 + 1 /2 5 (4) z. 6 = 1-96. (5) z < z.o s (i.e., .46 < 1.96);

logo, aceitar H:

os coeficientes de correlao so iguais.

TESTE 30
Ho'- Pl = P2 H i', pi 4 1 Pi

TESTES

DE

HIPTESES

( 1)

305

C o n h e c id o s o u P r e s u m id o s : Amostras aleatrias d a m e s m a populao, pares normalmente distribudos, trs observa

es para cada indivduo. Seja p, = a correlao entre observaes em X t e Z i e seja p2 = a correlao entre obser vaes Yi e Z i ; isto , Z um padro para as comparaes.
P r o c e d im e n t o :

(1) (2)

Calcular rxz, ry z e rxy. Calcular


F_

2 (1 r2 r2 r2 + 2 r r r ) '
' xj XI VI XV xt V

(**. O

; ( ~ 3) (1 + r)

(3) (4)

(5)

Seja GLi = 1. Calcular GL> = n 3. Selecionar, na tabela V I do Apndice, o valor de F a na linha do apropriado G L2 e sob o adequado G Lt == 1. Se F F a, aceitar H o ; caso contrrio, aceitar Hl

E xem plo: Um grupo de 53 alunos, aleatoriamente escolhi dos, submeteu-se a trs testes: de leitura ( X ) , de vocabul rio (V ) e de inteligncia ( Z ) . Os coeficientes de correla o entre os resultados obtidos nesses testes foram os se guintes:

^xy * .72, rx z .80, e

- .64.

Ao nvel de significncia .05, determinar qual das seguintes hipteses deve ser aceita:
Ho'.
Pxt

Pyi

Soluo:
(1) rIV = .12; rx z = .80,

H l'.

Pxt 4*

Pyt

e r = .64.

(.80 4 )2 .6 .64) 2(50) (51, (1 + . .72)_____________ __ 6 ( 2 ) F ~ 2 [1 - (.7 2) - (.80) 2 ( .6 4 ) '+ 2 (.72) (.80) (.64) ]

(3) GL| = t e

g l 2= 53 3 = 50.

(4) F.0 6 = 4.03. (5) F > F.ot (i.e., 6.5 > 4.03);

logo, rejeitar H 0 e aceitar H s

306

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Tpicos para discusso.


1. Qual a diferena entre as distribuies z e ? Qual a dife rena no seu emprego? 2. Imagine-se que a mdia verdadeira de uma populao seja conhecida. A amostra colhida, e sua mdia calculada. De que modo se pode testar a afirmativa de que a amostra foi colhida de modo alea trio? 3. Em que diferem as anlises de correlao e de regresso? Quando convm usar uma e outra? 4. Que significa estatisticamente significativo?

Exerccios.
1. Fazemos a previso de que a mdia de compartimentos das casas de certa rea seja igual a 6. Amostra aleatria de 25 casas c tomada, e, para elas, a mdia de compartimentos de 4.75. Tomando por base certos estudos anteriores, admitimos que o =r 1.50. A pre viso fundada, ao nvel de significncia .01? 2. Der estudantes, selecionados de modo aleatrio, numa classe de primeiranistas, apresentam mdia de 1.32. Os primeiranistas do ano anterior apresentavam mdia de 1.56. A varincia, dada como inalterada desde o ano anterior, 0.72. Pode-se admitir, ao nvel de significncia .05, que a classe dste ano inferior do ano anterior? 3. Em mdia. 45 crianas esto matriculadas nos jardins de infncia, considerada uma amostra aleatria de 16 estabelecimentos do gnero, colhida em certo municpio. A varincia da amostra de 220. O Estado tem, em mdia, 32 crianas matriculadas em cada estabe lecimento. O municpio significativamente diferente do Estado? Seja a = .05. Imagine-se que a menor turma da amostra contava com 20 crianas, e que a maior contava com 53. Responder pergunta sem fazer uso da varincia da amostra. 4. Imagine-se que em amostra de 21 indivduos se tenha x = 21.2 e s2 = 14. H motivo para crer que a populao de que a amostra foi retirada tenha mdia pelo menos igual a 20.0? Seja a = .005. 5. Amostra aleatria e 8 retirada de uma classe de 40. A mdia e a varincia da amostra so, respectivamente, 95 e 38. Pode-se inferir, ao nvel de significncia .10, que a mdia da classe seja 100? 6. Caso as observaes em amostra aleatria de 25 pessoas tenha varincia igual a 1264, pode-se concluir que a populao tem varincia igual a, menor do que, a maior do que 1300? Seja a = .10. 7. Suponhamos que observaes a propsito de amostra alea tria de 17 pessoas apresentam varincia de 17.5. Deve-se concluir que a varincia da populao , pelo menos, 20? Seja a = .01. 8. Se a amostra aleatria de residncias e m uma cidade revela que 52 por cento das 1200 crianas (da amostra) entre 5 e 6 anos freqentam escola, pode-se inferir que a cidade tpica, uma vez que a percentagem 43? Seja a = .20.

TESTES

DE

HIPTESES

( 1)

307

9. Suponha-se que duas amostras aleatrias de 33 (m) e 40 (na) indivduos apresentam as seguintes mdias de amostra e varincias verdadeiras: xi = 9.2, o2 = 3.4, x < = 11.1 e o f = 4.3. Deve-se inferir que, ao nvel de significncia . 10, as populaes de que as amostras foram colhidas apresentam as mesmas mdias? 10. De amostras colhidas a partir de duas populaes, obtiveramse os dados seguintes: A 32 40 25 51 B 24 48 36 52

22

Pode-se inferir, ao nvel de significncia .05, que a mdia da popu lao A to grande quanto a da populao B? 11. Amostras de 35 so colhidas em quatro diferentes universi dades. Sabe-se que as observaes feitas em cada universidade tm a mesma varincia: 6,200. As mdias de amostra so 92, 87, 71, 104. Pode-se concluir que as mdias da populao so iguais? Seja a a = . 01. 12. Uma amostra aleatria de 50 alunos e 25 estudantes graduados submetida a teste de proficincia em matemtica. Os primeiros obtm resultado mdio de 45.6, com varincia de amostra de 6.1. Os ltimos, resultado mdio e 52.5, com varincia de amostra de 8.7. So os alunos e os estudantes graduados igualmente proficientes? Seja a = .005. 13. Suponha-se a situao figurada no problema 12. Aqui, m 15, Xi = 47.3 com Ri = 15.0 e na = 15, xa = 54.2, com Ra = 22.0. Testar H n: y.i = H a, ao nvel de significncia .05. 14. Suponha-se que amostras aleatrias de 11 so colhidas de quatro populaes com os resultados seguintes: Xi = 12. 1, Sj 6. 2, x2 10.8 s2 = 8.1, Xa = 11.3. s2 = 5.3, x, = 13.5 e S4 = 7.1. H razo para acreditar que essas amostras correspondem a populaes com iguais mdias? Seja a = .01. (Presume-se que as varincias verdadeiras so iguais). 15. Dois vendedores esto oferecendo o mesmo produto em locais diferentes. Cada qual, em semanas escolhidas aleatriamente, efetuou o seguinte nmero de vendas: A 45 51 44 48 B 61 72 73 54

Pode-se inferir que as vendas apresentam varincia igual de semana para semana? Seja a = .05.

308

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

16. A varincia de amostra na renda de 41 arquitetos aleato riamente escolhidos 16 milhes. A varincia da amostra na renda de 61 engenheiros de 22 milhes. Ao nvel de significncia .25. pode-se concluir que a renda dos engenheiros est mais amplamente dispersa do que a dos arquitetos? 17. Amostra aleatria de 100 pessoas do bairro A inclue 75 por cento favorveis ao controle de aluguis. No bairro B, onde se colhe amostra de 50, 70 por cento so favorveis ao mesmo controle. Ao nvel de significncia .05, pode-se inferir que A e B apresentam a mesma percentagem em favor do contrle_ de aluguis? 18. Certa caracterstica possuda por 58 por cento de uma populao. Colhe-se amostra de 100, na qual apenas 41 por cento apresenta a caracterstica. Ao nvel de significncia .01, podemos considerar a amostra como aleatoriamente selecionada da populao? 19. Calcular o coeficiente de regresso de renda cm idade para os seguintes dados e determinar se le significativo ao nvel .05. Idade 27 34 56 32 47 65 39 58 Renda (semanal) 98 37 28 38 104 120 56 75

20. Calcular o coeficiente de correlao dos seguintes dados determinar se significativo ao nvel .01. X 17 26 19 18 21 22 15 17 14 2 Y 54 85 41 40 67 71 50 55 32 5

21 . Suponha-se colhida uma amostra de 40, na qual a idade e a renda apresentam coeficiente de correlao igual a .57 e a idade e o tamanho da famlia apresentam coeficiente de correlao igual a .69. Ao nivel de significncia .05, h razo para acreditar que as corre laes da populao, com respeito quelas propriedades, so iguais? 22. A correlao entre resultados de testes de atitude aplicado a uma amostra aleatria de 20 pessoas .31. Acredita-se que a corre-

TESTES

DE

HIPTESES

( 1)

309

lao da populao .40. Ao nvel de significncia .01, tem base essa crena? 23. Cinco finalistas num concurso artistico so classificados p dois juizes diferentes da maneira seguinte:

Finalistas

1 2

5 4 4

Classificao A . . Classificao B . .

5 5

3 1

1 2

Esto essas classificaes nivel . 10?

significativamente

correlacionadas,

ao

Leituras sugeridas
Bons livros de referncia para os cientistas sociais, a propsito de testes estatsticos, so Churchman ( 1 ) , Dixon e Massey ( 2 ) , Edwards (3) e Johnson (5). Os ltimos trs examinam aspectos da correlao por ns no discutidos. Tratamento da regresso e correlao, em nvel muito elementar, pode ser encontrado em Mode (8). Para tratamento avan ado e pormenorizado, ver Ezekiel (4) e Kendall (6).

Referncias e bibliografia
1.
C
hurchm an

2. 3. -4. 5.

6.
7.

Dunn Laboratory, Frankford Arsenal, 1951. W . J., e M a s s e y , F. J. Jr., Introduction to Stistical A na lysis. New York: McGraw-Hill Book Co., 1951. E d w a r d s . A. L., Experimental Designs in Psychological Research. New York: Rinehard 6 Co., 1950. E z e k i e l , N. J. B M ethods of Correlation Analysis. 2" ed. New York: John W iley & Sons, 1949. Jo h n s o n . P. O., Statistical Methods in Research. New York: Prentice-Hall Inc., 1949. K e n d a l l , M. G., Rank Correlation Methods. London: Chas. Griffin 6 Co. Ltd., 1948. Advanced Theory of Statistics. London: Chas. Griffin 6 Co., Ltd., 1947.
D ix s o n ,

, C . W ., Statistical Manual: Methods of Making Experimental Inference. 2'4 ed. rev. Philadelphia: Pittman-

310

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

E. B., The Elements of Statistics. 2 ed. New York: Prentice-Hall Inc., 1951. 9. S p u r r , W . A., A Short-Cut Method of Correlation, Journal of the American Statistical Association, X L V I (1951), 89-94. 10. T h o m p s o n , C. A., e M e r r i n g t o n , M . , "Tables f o r Testing the Homogeneity of a Set Variances", Biometrika, X X X III (194346), 296-304.
M
ode,

8.

C a p tu lo

V II

TESTES DE HIPTESES (2); A ANLISE DE VARINCIA E COVARINCIA 1. Introduo.


Recentemente, o pesquisador social passou a dispor de numerosos instrumentos estatsticos extremamente teis. Den tre les, o mais importante talvez tenha sido a anlise de varincia e covarincia. sses mtodos so mais complexos do que a maioria dos que examinamos no captulo anterior. Discutiremos apenas suas utilizaes relativamente simples e comuns. Um estudo mais aprofundado de tais mtodos, pelo cientista social, revelar-se- muito compensador.

2. A anlise de varincia.
Grande nmero de projetos de pesquisa preocupa-se com determinar se uma varivel (V i) "afeta significativamente outra varivel (V 2)i isto , se alteraes em V \ produzem alteraes em V 2. Cabe lembrar (cap. iii) que o modlo tradicional para efetivar essas determinaes consiste em con servar com valores fixos tdas as variveis que no V x e Vo, fazendo variar V , e observando se o valor V2 sofre alte raes. H diversas desvantagens nesse procedimento tra dicional, ainda que presumamos que tdas as variveis rele vantes, com exceo de V x e V2, possam ser mantidas cons tantes. O uso dsse modlo pode conduzir a resultados no realsticos. Ou seja, pode indicar que alteraes em pro vocam alteraes em V2 naquelas situaes em que tdas as outras variveis relevantes permaneam com valor fixo.- En tretanto, tais situaes jamais podem ocorrer fora do labora trio; ou seja, ou os valores das outras variveis se alteram ou, quando no, assumem valores fixos diferentes daqueles que assumiram no laboratrio. Imagine-se, por exemplo, que

312

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

se deseja saber se um texto acarreta melhores resultados do que outro. Poderamos criar duas "classes semelhantes em uma universidade, entreg-las a um mesmo professor, etc.. Os resultados nos capacitariam a julgar o livro texto apenas para sse professor, essa universidade, sse grupo de idade, e assim por diante. Sugesto a dar, depois da ilustrao, a de que se repi ta o experimento com diferentes professores, diferentes uni versidades, etc.. O procedimento se torna muito longo e exige grande esforo, tempo, dinheiro. E pode, ainda assim, conduzir a resultados sem intersse. Imaginemos, por exem plo, desejar determinar se uma varivel, V 3, funo das variveis V x e V2. Dois experimentos tradicionais poderiam ser feitos: um para examinar as flutuaes de Va quando variamos V > , mantendo fixo e outro para examinar as flutuaes de V3 quando variamos V lt mantendo fixo V 2 Dos dados assim recolhidos no seria possvel saber de que modo varia Va quando V x e V se alteram conjuntamente, salvo se j se soubesse que os possveis efeitos de e de V 2 sbre V3 so independentes. Em outras palavras, V r e V2 podem interagir; por exemplo, podem tender a anular os efeitos recprocos. Para determinar se sse , ou no, o caso, teramos de precisar como se altera V3 em relao a variaes de V x com referncia a diferentes valores de V2. Conseqentemente, cresce muito a complexidade do experi mento. Torna-se bvio, ento, que haveria grande vantagem em recorrer a um mtodo que permitisse determinar simultneamente (a) se cada conjunto de variveis (V lf V2, . . V n) produz efeito significativo sbre outra varivel (V x) e (b) se cada qual das variveis, independentemente, afeta Vx ou interage com outras variveis do conjunto. Ou seja, para fraseando R. R. Fisher, prefervel fazer natureza muitas perguntas numa s entrevista do que propor-lhe uma questo em cada qual de uma srie de entrevistas. Essa inclinao to velha quanto a cincia, mas so mente nas ltimas dcadas surgiu mtodo que tornou poss vel satisfaz-la. sse mtodo chama-se anlise de varincia, ou A N O V A , e deve-se em grande parte a Fisher (7) e (8). A anlise de varincia reveste-se de importncia parti cular para as cincias sociais, pois, em tais cincias, raramente

TESTES

DE

H IP .

(2):

A N L.

DE

VAR.

COV.

313

possvel, mesmo aproximadamente, manter valor constante de tdas as variveis, exceto uma. Ou seja, ainda que se deseje faz-lo, o cientista social raramente est em condies de manipular os sujeitos e suas circunstncias de modo a atender a essas exigencias. Por exemplo, se le deseja uti lizar a mesma sala para duas classes diferentes, as aulas no podem ser dadas simultneamente, tendo-se, portanto, valo res diversos para a varivel tempo. A mudana pode acarre tar uma alterao dos resultados observados. Se o pesquisa dor puder determinar a extenso do efeito sbre os resultados, poder fazer ajustamentos, o que o liberta de preocupaes com a varivel tempo, que no precisar ser mantida cons tante. Imaginemos que duas sejam as variveis relevantes in dependentes e que para cada uma, Vj e Vn, dois valores nos interessem. Surgem, ento, quatro situaes a merecer aten o do pesquisador, tal como se exibe na matriz abaixo. O pesquisador pode encontrar as situaes na realidade, sem precisar, portanto, manipular as variveis. Se no as encon trar, pode ser relativamente mais simples cri-las do que criar, digamos, uma ou duas situaes de outra espcie. Para exemplificar, seria impossvel fazer com que duas classes ti vessem aulas no mesmo local e no mesmo instante mas seria simples fazer com que tivessem aulas no mesmo local em diferentes salas. Podemos controlar a situao de pesquisa, ainda que no possamos manipular as variveis, se, em situa es congneres, fr possvel determinar as alteraes dos resultados observados que se devem s flutuaes das vari veis independentes.

V, A a V, b Ab Bb Aa B Ba

A lgica utilizada na anlise de varincia no muito complicada, embora a matemtica em que se expressa seja, s vzes, de tratamento difcil. Consideremos a matriz de

314

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

quatro clulas, dada acima. Imaginemos que uma observa o seja feita em cada clula, ento, h trs varincias que podem ser estimadas: o2j: a varincia entre as mdias das linhas, que so duas. o2 : a varincia entre as mdias das colunas, que so duas. c r2 : a varincia da populao de observaes, que V O so quatro. Por conseqncia, o2t representa a varincia nos valo res de V 3 que associada a variaes na varivel V x e <r.2 representa a varincia correspondente, relativa a V 2. Se a soma dessas duas varincias no iguala a varincia total, c2^ a diferena deve ser atribuda a variveis no controladas (ou casuais). A parte da varincia total no levada em conta em V x e V.2 chamada varincia residual, a 2. Ento, ff? = ffv, (ov, + <^.)l

Suponhamos que o2j = o2. Isso significaria que as va riaes controladas em V x acompanham-se de variaes no maior do que a atribuvel ao acaso, devido a variveis no controladas. Concluiramos, portanto, que variaes em V x no se acompanham de variaes significativas em V3. Se, por outro lado, <j2j = j= c r 2, as alteraes de V 3 que acom panham as alteraes de V x no podem ser atribudas ao acaso. Ora, o que a anlise de varincia possibilita o seguinte: ( 1 ) permite estimativas independentes da varincia nos re sultados observados, em ligao com alteraes em cada uma das variveis controladas e estimativa da varincia ligada a variaes de tdas as variveis no controladas. ( 2 ) per mite determinar se as variaes controladas e casuais so, ou no, significativamente diferentes. (3) permite determi-

TESTES

DE

H IP .

(2 ):

AN L.

DE

VAR.

COV.

315

nar se a varincia relacionada a combinaes das variveis controladas diversa da que se poderia esperar, se tais vari veis fssem independentes. sse terceiro aspecto do mtodo tem o objetivo de in dicar se algumas das variveis controladas interagem ou no. Duas variveis controladas interagem se o efeito que uma exerce sobre a varivel dependente , por sua vez, dependente do valor de outra varivel controlada. Para recorrer a um exemplo trivial de interao, diremos que a quantidade de conforto ou desconforto experimentado por uma pessoa de pende da temperatura e da umidade. Mas o efeito de tem peratura e umidade sbre o conforto no so independentes. Pequena elevao de temperatura, quando a umidade gran de, pode causar mais desconforto do que uma elevao maior da temperatura quando a umidade menor. Reciprocamen te, o efeito de variaes de umidade sbre o conforto depende da temperatura. Se a anlise de varincia indica que a varincia relacio nada com alteraes de uma varivel controlada (V j) sig nificativamente diferente da varincia associada a variveis no quer isso dizer, necessriamente, que produz altera es na varivel dependente (V x) . V x pode no ser o pro dutor de alteraes em V*; de fato, pode ocorrer que V x produz alteraes em V j ou que V e V x esto apenas corre lacionadas. Por exemplo, se observamos que alteraes em notas escolares so acompanhadas por alteraes na quanti dade de tempo devotado ao estudo, no podemos determinar, apenas a partir dai, que varivel o produtor e que varivel o produto. Voltemos a um exemplo anterior: seja V t a quantidade de precipitao de fuligem em certa rea e V x a percentagem de habitantes dessa rea afetados de tuber culose. A anlise de varincia mostraria que a varincia relacionada a ^ significativamente maior do que a variao casual. No obstante, a precipitao de fuligem no produz tuberculose. Lembremos, com base na explanao anterior, que a tuberculose produzida, entre outras coisas, pela defi cincia de alimentao. Deficincia de alimentao produ zida por baixos salrios. Pessoas que recebem salrios bai xos habitam reas de aluguel baixo e o aluguel baixo produzido pela precipitao de fuligem. A relao pode ser expressa por um diagrama:

316

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Precipitao de fuligem

M o ra d ia cm

reas de aluguel baixo

Para concluir que a precipitao de fuligem produz tu berculose, seria necessrio mostrar no apenas que variaes na precipitao de fuligem acompanham-se de variaes na incidncia da tuberculose, mas tambm que alteraes na precipitao da fuligem precedem alteraes na incidncia d tuberculose. Nada h na anlise de varincia que nos diga isso; a precedncia h de ser demonstrada atravs de outros meios. H ainda um mau uso da anlise de varincia contra o qual o leitor deve ser prevenido. Importa usar valores dife rentes das variveis testadas. pequena a inconvenincia de no usar valores diferentes da varivel, quando esta , claramente, quantitativa; mas se qualitativa, e a escala de apreciao no explicitada, rro pode ser cometido. Supo nha-se que desejamos determinar o efeito de professores sbre o desempenho de estudantes. Seria necessrio testar diferen tes professores; para ter garantia de que os professores esco lhidos so diferentes, deve ser tornada explcita a escala de acrdo com a qual a diferena estabelecida. Constitue prtica habitual colher simplesmente amostra de professores e presumir que so diferentes. Uma amostragem no pode assegurar essa diferena; por isso, os professores escolhidos podem assemelhar-se no que diz respeito varivel crtica. Se a anlise de varincia mostrasse, ento, que no h efeito professor" no se poderia, vlidamente, aplicar essa conclu so populao de professores de que foi colhidas a amostra. Deve-se notar, ainda, que as concluses baseadas na anlise de varincia aplicam-se apenas gama de valores das variveis controladas que se usaram. Se, por exemplo, o Q I usado como varivel controlada e recorremos a valores entre 80 e 110, as concluses retiradas de uma anlise so mente se aplicam a essa faixa de valores.

TESTES

DE

H IP .

(2 ):

A N L.

DE

VAR.

COV.

317

H muitas formas diferentes de conduzir uma anlise de varincia; isto , so possveis diferentes planejamentos para o utilizao do mtodo. Convm ao cientista social familiarizar-se com o maior nmero possvel de tais planeja mentos. Aqui, consideraremos dois dos mais comumente empregados: o fatorial e o quadrado latino. 2.1 Planejamento fatorial.

O planejamento fatorial um plano de pesquisa em q os valores de duas ou mais variveis controladas se agrupam em duas ou mais categorias. Constri-se matriz (como fize mos acima) de modo a ter uma clula para cada possvel combinao das diferentes categorias. Fazem-se observaes para cada clula. Podemos considerar qualquer nmero de variveis e qualquer nmero de categorias, mas, com o au mento dsses nmeros cresce a complexidade da anlise. Consideraremos apenas o planejamento fatorial de duas variveis. facil a generalizao para um maior nmero de variveis. Examinaremos, em primeiro lugar, o caso cm que uma observao feita para cada clula e, depois, o caso em que vrias observaes so feitas para cada clula. 2.1.1 Hipteses e pressupostos no planejamento fatorial.

Se temos um conjunto de variveis controladas, V u .. ., V n, e uma varivel dependente Vx, ento, a anlise de varincia permite testar as seguintes hipteses: H o: quando Vj se altera (numa faixa especificada R i ) Vx no se altera. H i: quando V i se altera (em R\), V x tambm se altera. H'o : quando V 2 se altera (em R 2) , V x no se al tera. H\: quando V2 se altera (em R 2) , V K tambm se altera. Etc. Quando se sabe, ou se admite, que alteraes numa va rivel Vi precedem alteraes em V x, ento, as hipteses aci ma podem ser reformuladas:

318

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

H 0: alteraes em V f alteraes em V x.

(em Ri)

no

produzem

H x: alteraes em V i (em Ri) es em V

produzem altera

Se observaes repetidas so feitas para cada clula, podemos submeter a teste os seguintes conjuntos de hip teses, alm dos que foram relacionados acima: H 0: V i e V 2 no interagem. H i : Vj e V2 interagem. H 0: V 2 e V 3 no interagem. H\: Vs e V a interagem.

H 0: Vi e V2 e V 3 no interagem. Hi'. Vi e V2 e V 3 interagem. Etc. As presunes em que se apia a anlise de varincia so muito complexas. Aqui, ns as consideraremos apenas brevemente. Para pormenores, ver (3), (4) e (7). As presunes para o planejamento fatorial de duas variveis so as seguintes: (1) quaisquer observaes podem ser considera das a soma de quatro componentes: (a) um valor constante que no afetado por Vi ou V2; ( b ) um valor devido a possvel influ ncia de Vx; (c) um valor devido a possvel influncia de V 2; e (d) um valor devido a va riveis casuais (ou residuais).

(2a) As observaes so tdas colhidas aleatoria mente a partir de populaes normais. (2b), tdas tm as mesmas varincias. (Se a pre-

TESTES

DE

H IP .

(2 ):

AN L.

DE

VAR.

COV.

319

(3)

suno [26] no justificada, srios erros po dem resultar. Por isso mesmo, se h razo para pr em dvida sua validade, o Teste 20 pode ser usado para verificao). Os efeitos residuais (erros devidos a vari veis no controladas) esto normalmente dis tribudos, so independentes e apresentam a mesma varincia para tdas as observaes. Presume-se, alm disso, que a mdia dos efei tos residuais zero; isto , a longo alcance os efeitos residuais positivos e negativos tendem a anular-se.

Nota a propsito de simbolismo: Na apresentao pos terior de procedimentos em testes relativos anlise de va rincia e covarincia, ser conveniente usar X e Y para re presentar observaes individuais, X e Y para representar mdias de amostra, x para representar ( X X ) e y para representar (Y Y ). Os seguintes ndices sero tambm utilizados: I i /' in re st w = = = =r Categorias de Vi; isto , colunas. Categorias de V 2; isto , linhas. Categorias de V 3; interao, residual. subtotal, intra-grupo.

Ausncia de um ndice representa valor pertinente a tdas observaes feitas a propsito da varivel.

2.1.2 Planejamento fatorial, duas variveis, observaes singulares.


T ESTE 31 H oquando Vi se altera (em R i ) , V3 no se altera. H i'. quando se altera (em R i ) , V& tambm se altera.

320

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

H'o : quando V 2 se altera (em R 2) , V s no se altera. H\: quando V2 se altera (em R 2) , V 3 tambrn se altera.
C o n h e c id o s P ou : P r e s u m id o s :

Ver 2.1.1.

r o c e d im e n t o

(1)

Preparar a seguinte matriz:


Ki

/I

a b

x,

B X ..
A

A'

T o ta l r a n

A /fo * J C 6

k
T o ta l

AA t r.,
r*

r*

peral r = I Total T

(2)

Calcular a soma dos quadrados dos desvios de mdias de colunas {X\) em relao m dia de tdas as observaes ( X ) :
(-Y, - X ) 2= \{T\+ r-B+ . . . + rK) -

S * =

7; Kk '

(3)

Calcular a soma dos quadrados dos desviosde mdias de linhas (X i) em relao mdia gera 1. J - ( * . - * > - Oi + **+ + Tl)

(4)

Calcular a soma (geral) dos quadrados das observaes individuais (X n), em relao mdia geral: i (A V - X ) *= < * ! . + + + x *>+ Y-

+ ... +* w - x s -

T -

TESTES

DE

H IP .

(2 ):

AN L.

DE

VAR.

COV.

321

(5)

Calcular a soma residual dos quadrados dos desvios:


2*5. = 2.t2 - 2*5 - 2S? = (4) - (3) - (2)

(6)

Preparar a seguinte tabela:

Soma dos quadrados de desvios Mdias do colunas.. Mdias do linhas . . . Kosidual................. Total.................. (2) (3) (5) (4)

G L

Desvio quadrado mdio

GLj = K - 1
G L i= * - l G Lr, = GL - GL , _ g l
gl

rf? = (2) / g l , Fi = (fl/tir. ?? = (3)/GL, d?t = (5)/GL

= Kk\

(7)

Localizar, na parte apropriada da Tabela V I do Apndice, o valor de F a correspondente a GLrc, sob o adequado GLi. Se i 7! F a, aceitar H 0; caso contrrio, acei tar H i. Localizar, na parte apropriada da Tabela V I do Apndice, o valor de F a correspondente a GLre, sob o adequado G L(. Se Fi F a, aceitar H '0; caso contrrio, acei tar H\.

(8) (9)

(10)

E m trs dias sucessivos, o mesmo problema dado a quatro indivduos {A, B, C e D ), cujos Q I so, respectivamente, 80, 90, 100 e 110. So as variaes do Q I e o nmero de tentativas prvias acompanhados por mo dificaes no tempo necessrio para resolver o problema? Os dados so fornecidos abaixo, na fase (1). Seja a = .05. E x e m p lo :

H q:

Alteraes no Q I (entre 80 e 110) no se acompanham de alteraes no tempo necess rio para resolver o problema.

322

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

H i: H '0:

H\ :

Alteraes no Q I (entre 80 e 110) so acom panhadas de alteraes no tempo necessrio para resolver o problema. Alteraes no nmero de tentativas prvias (entre 0 e 2) no se acompanham de altera es no tempo necessrio para resolver o problema. Alteraes no nmero de tentativas prvias (entre 0 e 2), acompanham-se de alteraes no tempo necessrio para resolver o problema.

Soluo: (D
Nmero de tentativas prvias

QIT otal

110

100

90

80

0 ............. 1............. 2................ Total,,.

2.6 2.1 1.8 6.5

2,8 2.2 2.2 7.2

2.3 2.5 1.9 6.7

3.1 2.0 2.2 7.3 27.7*

10.8 8.8 8.1 27.7

(2) Z ^ = H 6 . 5 2+ 7 . 2 + 6 .7 * + 7 . 3 )

(3) 2 z = H 1 0 . 8 2+ 8 . 8 + 8 . P ) - - ^ ^ = 0 . 9 8 .

27.7a

(4) 2*2 = (2.62+ 2.12+ 1.82+ . * . + 2 , 2 2) (5) (6)


Soma dos quadrados de desvios Medias de colunas. Mdios do linhas .. Total.. 1 1 1 1 1 1 ..
2x*t =

2 7.7* = 1.59. (4) (3)

1.59 - 0.15 - 0.98 = 0.46.

GL 4-1 = 3 3-1 = 2 11-3-2 = 6 12-1 = 1 1

Desvio quadrado mdio

0.15 0.98 0.46 1.59

.15/3=.05 ,98/2= .49 .46/6= .08

F,= .05/.08= .63 i\= .49/.08 = 6.13

TESTES

DE

H IP .

(2 ):

AN L.

DE

VAR.

COV.

323

(7) (8) (9) (10)

F.05 = 4.7571 (G Lj = 3, GLa = 6). i7 ! < F .o s (i. , .63 < 4.7571); logo, aceitar H 0. F .os = 5.1433 (G L , = 2, GLa 6). Fi > F .o s (i. , 6.13 > 5.1433); logo, rejei tar H o e aceitar H\.

2.1.3 Projeto fatorial, duas variveis, igual nmero de observaes repetidas em cada clula.
Uma vez que h observaes repetidas em cada clula, possvel fazer uma estimativa da varincia em cada clula; ou seja, da varincia intra-grupo, a^v . Alm disso, consi derando que efeitos possveis das variveis controladas se cancelam na estimativa, isto deve nascer das variveis no controladas. Suponhamos que se admita no haver varin cia intra-grupo; ento as observaes em cada clula podem ser tratadas como se fssem uma observao nica, (i., a sua unio pode ser tratada como observao nica). Es timativa da varincia de tais somas (a varincia subtotal, rrM pode ser feita nos mesmos moldes adotados para fazer a estimativa da varincia total, como no ltimo teste. A va rincia em coluna (Oj ) e a varincia em linha (o?) tam bm podem ser avaliadas como no ltimo teste. Mas a di ferena cj Oj o '?l no pode ser considerada como va rincia devida s variveis no controladas, j que esta se cancela ao tratar-se apenas das somas nas clulas. Deve-se, pois, ento, interao entre variveis controladas. A varin cia de interao, o , pode ser, portanto assim definida:

Retornando s observaes originais, a varincia para tdas as observaes (i., a varincia total a~) pode ser ava liada. A diferena entre as varincias total e subtotal deve ser devida s variveis no controladas; isto , trata-se da varincia intra-grupo o2 v- Logo,
a i = o 1 a ;, .

Obtidas as estimativas para essas varincias, sua significncia poder ser determinada mediante o emprego da estatstica F, do ltimo teste.

324

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

TESTE 32 H H i: H 0: H\: H " 0: H'\:


C o n h e c id o s ou

Quando V i se altera (e m ft), Va no se altera. Quando V x se altera (em R i ) , 1 se altera. tambm

Quando V 2 se altera (em R * ) , V s no se al~ tera. Quando V 2 se altera (em R ), \ rs tambm se altera. No h interao entre V x e V. H interao entre V x e V*.
P r e s u m id o s :

Ver

2.1.1.

P r o c e d im e n t o :

(1)

Preparar a seguinte matriz:

A X ao 1

B X 5ul X Ra2

K X Ka 1 X Kai

^Aan

x Ban X Bbl X B & 2

X Kan X Kbl x Kb,

x bl b
X a X ^bn

X Bbn

X Kbn -

xA k 2
X ki k X a Ic t i

x Bkl
X Blc2 X d kn

X Kkl X K ki

XKkn

TESTES

DE

H IP .

(2 ):

A N L.

DE

VAR.

COV.

325

(2)

Somar os dados em cada clula e preparar matriz:


A a b B T ,. Tub K

Total
T

r.
Ti

ro

Tlk T

T ,t Th

r**
Tk

7*
T

Total

(3)

Calcular a soma dos quadrados dos desvios de mdias de colunas de X : ^ = jn (T\ +r-B+ ...+ T 2 K) J"L Kkn'

(4)

Calcular a soma dos quadrados dos desvios de mdias de linhas de X : 2 i== J _ (^ +r * + . . . + r p - ^ .

(5)

Calcular a soma dos quadrados dos desvios de tdas as observaes de X :


Z x 2= (X 2 Aal + A Jlai + . . . + -YJcjJ

(6)

Calcular a soma dos quadrados dos desvios de sub-totais de X : + nk ) T Kkn'

(7)

Calcular a interao das somas de quadra dos:


X x l = Zx *, - Z x 2 , - 2*5 = (6) - (3) - (4).

(8)

Calcular a soma de quadrados intra-grupos:


Z x 2 = Z x 2 - Z x 2, = (5) - (6).

326

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(9)

Preparar a seguinte matriz:


Soma de quadra dos

GL GLr= K 1 GL< = -1 GLi = (GL,)teL ) GL,, = K1 GL= GL GI. G L = J n - l

Mdia quadrada d) = (3 )/gl, 2; =(4)/ g l 3? = (7)/gl,.

F F, =55/dl* F< = a /2 i* F in

M dias de colunas... M dias de linhas .... Interao ............... Subtotal................ Intra-grupos........... Total................

(3) (4) (V ) (6) (8) (5)

d \ ,= (8)/ GL

* Na prtica, os valores de Fi e de Fj so freqentemente cal culados tomando d^/ drn bem como d?/ d2 in no lugar do que se indica na tabela. As vantagens disso constam em (10: sees 14.0, 14.9, e 14.10).

(10)

(11) (12)

(13) (14)

(15)

Selecionar, na parte apropriada da Tabela V I do Apndice, o valor de F a oposto ao G LW e sob GLi. Caso F \ F a, aceitar H 0; de outra forma, aceitar H\ . Selecionar, na parte apropriada da Tabela V I do Apndice, o valor de F a oposto ao GL,C e sob GL{. Caso F t F a, aceitar H '0; de outra forma, aceitar H\. Localizar, na parte apropriada da Tabela V I do Apndice, o valor de F a correspon dente G L k , e sob GL,. Se F in F a, aceitar H " 0; caso contrrio, aceitar H'\.

Se a interao significativa, pode dever-se isso a qualquer ou a mais de um dos seguintes fatores. (a) (b) As duas variveis controladas produzem, em conjunto, um efeito que nenhuma delas produ ziria separadamente. H uma importante varivel no controlada que deve ser tomada em considerao, varivel

TESTES

DE

H IP .

(2 ):

A N L.

DE

VAR.

COV.

327

(c) (d )

que se est alterando de maneira sistemtica de clula para clula. As amostras nas clulas no so colhidas aleatoriamente. No h interao e a significncia aparente resulta de um rro de tipo I.

As possibilidades ( b ) e (c) devem ser examinadas aprofundadamente, atravs de reconsiderao do modlo de pes quisa e do procedimento de amostragem. Duplicao da pesquisa com resultado idntico, reduziria a possibilidade de (d) ocorrer.
Exem plo: * Suponhamos dispor do conjunto de dados que aparece na fase (1) abaixo. Testar as hipteses acima re feridas ao nvel de significncia .05.

Soluo:
A a
2 5 3 7 6 6

B
0 1 0 6 5 3

C
3 4 2 8 6 S

A a b
Total 10 19 29

B
1 14 15

C
9 19 28

Total 20 52 72

< 3)

<4)
*

mS)'I20 + S2,) - (3TTR3T" 56-89O exemplo tomado de Dixon e Massey (4:134-37).

328

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(5 ) 2ac*= 2 2+ 5 2+ . .. . + 5

7 22 (3 )(2 )(3 )

= 96 .0 0 .

(6)-2*; i = J ( 1 0 ' + 1 9 '+ . . . + 1 9 ' )

7 8 .6 7 .

(7) (8)
(9)

in

= 78.67 - 20.33 = 96.00 78.67 =

56.89 = 17.33.

1.45.

2x2

Soma de quadra dos Mdias de colunas... Mdias de linhas . . . . Interao................... Subtolal..................... Intra-grupos.............. Total...............

GL 2 1 2 5 12 17

Mdia quadrada

20.33 56.89 1.45 78.67 17.33 96.00

10.17 56.89 .72

10.17/1.44= 7.06 F,= 56.89/1.44 = 39.51 F in= .72/1.44= .50


F ,=

1.44

(10) (11)

(12) (13)

(14) (15)

F. os = 3.8853 (G Li = 2, G L = 12). F i > F.os i., 7.06 > 3.8853); logo, aceitar H i e rejeitar Ho; ou seja, variaes em so acompanhadas de variaes em V s. F. 0 5 = 4.7472 (G L X = 1, G L = 12). Fi > F. os (i., 39.51 > 4.7472); logo, re jeitar H '0 e aceitar H\; ou seja, alteraes de V2 so acompanhadas de alteraes de Vs. F. a = 3.8853 (G L X = 2, G L, = 12). F in < F .0 5 (i., .50 < 3.8833); logo, acei tar H " t; ou seja, no h interao significa tiva entre V x e Vs.

Nota se h apenas uma varivel de classificao, o procedimento relativo ao teste semelhante ao descrito, exceto no que se refere a umas poucas alteraes de menor importncia. Apenas as mdias de coluna, intra-grupos e

TESTES

DE

H IP .

(2 ):

A N L.

DE

VAR.

COV.

329

a soma total de quadrados de desvio so calculadas. coluna de somas mdias ao quadrado igual a

onde rii corresponde ao nmero de observaes na /-sima coluna. A soma total de quadrados calculada do modo acima indicado. A soma intra-grupos de quadrados igual diferena entre as mdias de coluna e a soma total de quadrados. GLco igual a G L GLi, onde GLi igual a K 1 e GL = 2.2 Planejamento do quadrado latino e do quadrado greco-latino.

s>

Suponhamos ter trs variveis ( Vi, V 2 e V 3) e trs valores de cada uma delas que desejamos incorporar a uni planejamento fatorial. Para faz-lo, deveremos construir uma matriz tridimensional com 3 X 3 X 3, ou 27 clulas. Se tivssemos trs variveis e quatro valores para cada uma. seriam necessrias 4 X 4 X 4 , ou 64 clulas. Freqente mente, no prtico usar tantas clulas, em razo do grande nmero de observaes que se fazem necessrias e das ml tiplas situaes diferentes que devem ser encontradas ou construdas. Para vencer essa dificuldade, introduziu-se utna modificao no planejamento fatorial modificao que torna possvel o uso de menor nmero de clulas mas que produz um rro maior do que o planejamento fatorial comum. sse mtodo chamado planejamento quadrado latino. Sejam A. B e C trs categorias de V ^ a, b e c trs ca tegorias de V n \ e 1, 2 e 3 trs categorias de V s. Podemos construir matriz de 9 clulas, dste modo:
.4 B

C
3 1 2

b c

2 j 3

2 3 1

330

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

O significado dessa matriz se esclarece por meio de um exemplo. Suponhamos desejar medir a atuao de gru pos de trs diferentes extenses, A, B e C, efetuando-se as medidas em trs conjuntos de condies, a, b e c. A ordem adotada pelos grupos para a tarefa pode afetar a sua atua o. A ordem pode ser, pois, a terceira varivel controla da. O grupo A agir primeiramente nas condies a e, a seguir, nas condies b e, enfim, c. O grupo B agir ini cialmente nas condies c, depois nas condies a e, enfim, b. O grupo C, por sua vez, agir, de incio, nas condies b, depois c e finalmente a. Uma anlise das atuaes pode ser levada a efeito para determinar o efeito da ordem em que so executadas as tarefas e que permitir que as dife renas entre os grupos e as condies venham a ser preci sadas, independentemente da ordem. O procedimento que se segue anlogo quele que foi empregado no teste do fatorial, e vem ilustrado abaixo. Note-se que na matriz que construmos, cada nmero aparece uma s vez em cada linha e em cada coluna. disposio dos elementos, que foi escolhida, no a nica a satisfazer essa propriedade; h outras maneiras de colocar os elementos respeitando a mesma propriedade, como sucede neste caso, digamos:

A
(I

/i
1

C 1
1

b c

2 1

3 2

Note-se, ainda, que o nmero de espcies de cada varivel ainda o mesmo. Imagine-se, continuando o exemplo anterior, que se pre tenda que cada grupo execute a tarefa que lhe foi confiada, utilizando um de trs diferentes instrumentos (a, P e y) em cada tentativa. Uma quarta varivel foi introduzida. Essa quarta varivel pode ser incorporada ao planejamento acima por meio de simples generalizao. O mtodo generaliza-

TESTES

DE

H IP .

(2 ):

AN L.

DE

VAR.

COV.

331

do chamado quadrado greco-latino. sentar-se-ia da seguinte forma:

A matriz revista apre

c
3y

a
b c

la 2y 30

2 ( 3 3a
h

1 / 3 2a

Note-se que nenhuma das letras gregas aparece mais de uma vez em cada linha ou coluna, ou mais de uma vez em combinao com o mesmo nmero. H muitos outros ar ranjos suscetveis de utilizao que satisfariam tambm essas condies. O procedimento de anlise em ambos os mtodos muito semelhante, razo porque no ser exposto o proce dimento para o quadrado greco-latino. Para pormenores, ver (4:x).

T ESTE 33 (quadrado latino) H 0: H i : H 0 : H\ : HV H " i: Quando se altera, (dentro de R i). V 4 no se altera. Quando V x se altera tambm se altera. (dentro de R i).

Quando V2 se altera (dentro de R s). no se altera. Quando V2 se altera (dentro de R*). tambm se altera. Quando V8 se altera (dentro de Rs). V 4 no se altera. Quando V 3 se altera tambm se altera. (dentro de Rs),

C o n h e c id o s

o u P r e s u m id o s : O mesmo que em 2 . 1 , ex ceto quanto generalizao para trs variveis.

332

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

P r o c e d im e n t o :

(1)

Preparar a seguinte matriz:

Vi B X Ban . K X ,:^ X KH

A
a b V,

Total
Ta Tb

x ,

X i,

X Akm Ta

XU kl T

X Kk(nt l) Tjc

Tk T

Total

m = nmero de categorias da Vs.

Notar que K =

k = m.

(2)

Calcular Tl = Xxal + -X sn + + XxnTl = Xm2 + A 'jiaj + . + Xk'1 -

T m - X a I* (3) (4) (5) Calcular Calcular Calcular

XKcm'

2ij = i ( r , + r B+ ...+ 7 ^ ) - - g .
2 * = -^(TI + T I+ . . . +TI)

Kk'

Ti

2*j = -(r + rj+ 1 m 1

j.2
" a

onde / corresponde a qualquer categoria de V 3. (6) (7) Calcular Calcular


2* = + X ^ + ...+ X ^ - 7 Kk.

2**, = S*2 - 2*? - Sac - Sxf.

TESTES

DE

H IP .

(2 ):

AN L.

DE

VAR.

COV.

333

(8)

Preparar a seguinte tabela:


Soma de quadra dos

GL

Quadrado mdio

Mdias de coluna... Mdias de linha . . . .

(3) (4) (5) (7)


(6)

G L ;= - 1 GL j = m l GL re= GL - G L ,_ G L;- GL; GL = A7:-1

5 (3)/GL j d? = (4)/GLi 3?=(5)/G L; d?. = (7)/GLr,

F icRfifi. F i= $ r& .

(9)

Localizar, na parte apropriada da Tabela V I do Apndice, o valor de F a correspondente a GLf0 , sob GLj* Se Fi F a, aceitar H 0; caso contrrio, aceitar H\ . Se F { Fai aceitar H' 0: caso contrrio, aceitar H\. Se Fy - F a, aceitar H " 0: caso contrrio, aceitar H'\.

(10) (11) (12)

Suponha-se ter feito escolha de trs grupos de cinco, dez e quinze escoteiros de certa cidade. A les dada a mesma tarefa, para que a executem em trs ocasies diferentes manh, tarde e noite. Neste caso, alteraes nas trs variveis (extenso do grupo, nmero de tentativas prvias e hora de execuo da tarefa) precedem a realizao do trabalho. Oferecidos o planejamento e os dados que aparecem abaixo, testar as seguintes hipteses ao nvel de significncia .05:
E xem plo:

H o:

Alteraes no tamanho do grupo (entre 5 e 15) no produzem alteraes no tempo de execuo. Alteraes no tamanho do grupo (entre 5 e 15) produzem alteraes no tempo de execu o. Alteraes no perodo em que se efetua o trabalho no produzem alteraes na atuao.

H i :

H 'o :

334

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

H\ : H "o :

Alteraes no perodo em que se efetua o trabalho produzem alteraes na atuao. Alteraes do nmero de tentativas prvias (entre 0 e 2) no produzem alteraes no tempo gasto para a tarefa. Alteraes do nmero de tentativas prvias (entre 0 e 2) produzem alteraes no tempo gasto para a tarefa.

H "i :

Soluo: (D
Hora do teste 9 da manh 3 da tarde 9 da noite Total Extenso do grupo 15 2(0)* 1(1) 7(2) 10 10 6(1) 7(2) 1(0) 14 5 1(2) 6(0) 9(1) 16 Total 9 14 17 40

* Os nmeros entre parnteses correspondem ao nmero de tenta tivas prvias.

(2) r = 2 + 1 + 6 = 9. r , = 1 + 6 + 9 = 16.

r2= 7 + 7 + 1 = 15. 40= (3) 2*5 = \ ( 102+ 1 42+ 1 62) - ^ - = 6 . 2 2 .


(4) 2*? = J (9 2+ 1 4 ! + 1 7 *) j r = 1 0 .8 9 .

402

(5) 2 * 5 = J (9=4-16*+ 15) _

= 9 . S5.

402 (6) 2 * 5 = 22+ I s + . . . + 9 ! - - ^ - = 80.2 2 . (7) 2*5, = 80.22 - 6.22 - 10.89 - 9.55 = 53.56.

TESTES

DE

H IP .

(2):

AN L.

DE

VAR.

COV.

335

(8 ) Soma de quadra dos Mdias de coluna... Mdias de linha Mdias de V3......... Resduo................... Total................

GL

Quadrado mdio 3.11 5.45 4.78 26.78

6.22
10.89 9.55 53.56 80.22

F, = 3 . 11/26.78= .1161 Fi = 5.45/26.78 =.2035 Fj = 4.78/26.78 =.1785*

* Em verdade, se um valor computado de F menor do que no h necessidade de realizar o teste, a menos que se pretenda deter minar se o resduo significativo em comparao com as outras mdias; i. , h muita conformidade entre colunas, linhas ou categorias de V 8 ? Se houver, pode manifestar-se uma influncia restritiva sbre' as vari veis controladas.

(9) (10) (11) (12)

: 19. F. 0 5

2,

Fi < F'Q5 (i., .1161 < 19.00); logo, aceitar Ho 5 (i., .2035 < 19.00); logo, aceiF< < F. 0 tar H \ O 5 (i., .1785 < 19.00); logo, aceiFj < F. 0 tar H "0.

3. A anlise da covarincia.
A anlise de covarincia extenso extremamente til da anlise de varincia. Deve-se tambm largamente a R. A. Fisher. sse mtodo aplicvel a situaes em que a varivel afeta os resultados observados, mas onde no se pode atribuir aos sujeitos testados valores iguais daquela varivel, antes de realizar as observaes. Por exemplo, imaginemos estarem em tela as condies de "habilidade inicial na atuao de um grupo de sujeitos, sem que, porm, os indivduos possam ser selecionados antecipadamente em trmos de uma igual "habilidade inicial. Se, durante as pesquisas, fr possvel determinar as atuaes iniciais de cada

o o

< N

II

II O l

336

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

sujeito, ento os resultados observados podero ser ajusta dos de modo a levar em conta essa fonte de variaes. Ou ento imaginemos que uma fonte de variao venha a surgir durante as investigaes, no prevista mas reconhecida, no momento em que comparea. Durante a pesquisa, por exem plo, pode tornar-se aparente que as atuaes dos indivduos dependam de sua educao. Se fr possvel determinar o grau de educao recebido, os resultados podero ser ajus tados face nova fonte de variaes, por meio de anlise de covarincia. Imaginemos que se pretenda saber se os valores de uma dada varivel (Y ) se alteram com as alteraes sofridas por uma varivel sob controle, ( Vj ) . Imagine-se, ainda, que exista uma outra varivel (X ) que se suspeita deva exercer influncia em Y , sem que se possa, entretanto, atribuir valo res a X antes do incio das investigaes. Os valores de X , no entanto, podem ser determinados para cada observa o y . O problema, ento, o de cancelar o efeito de X sbre Y, de modo que as relaes entre V x e Y possam ser estudadas sem levar em considerao o efeito que X possa exercer em Y . Desdobremos V x em trs categorias, A, B e C. Admi tindo que se tenha quatro pares de observaes para cada valor de V lf os dados podero ser dispostos desta maneira:

7,
A X 2 B C

r
8 7 7 10
32

r
10

Y 6

1 0 1 Totais Mdias 4 1

4 3 1 4 12 3

6 13 40 10

0 2 4 2 8 2

S
8 5
Tx T, 96

24 6

24 2

TESTES

DE

H IP .

(2 ):

ANAL.

DE

VAR.

COV.

337

sses dados podem ser distribudos em um grfico, ao eixo das abscissas correspondendo valores de X , ao das ordenadas correspondendo valores de Y , e de modo que a origem do sistema de referncia represente X e Y (Fig. 29).
15 _

1 2

14

F ig . 29

Desenhos semelhantes podem ser feitos separadamente para cada uma das classes A, B e C (Fig. 30). Os pontos fixados na figura 30 podem ser superpostos de modo a obter a figura 31. Quando se efetua a superposio, as mdias das colunas X , bem como as mdias das colunas V, foram igualadas. A linha de regresso de Y sbre X pode ser calculada, quer na figura 29, quer na 31. O coeficiente de regresso daquela ( bt) pode ser aplicado s observaes tomadas glo balmente. O coeficiente de regresso desta (6u>) a regres so intra-grupos, j que o diagrama da figura 31 cancelou a varincia entre os grupos. Se a disperso em trno da linha de regresso, na figura 31, significativamente inferior disperso corres pondente na figura 29, o fato de se igualarem as mdias dos sub-grupos exerce efeito significativo sbre os dados. Pode-se inferir da que as mdias das categorias de V i (| i.A >| Ib e (ic) so significativamente diferentes nos dados originais. Donde, se pode concluir que alteraes no valor de V x sero acompanhadas de alteraes em Y.

338

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

0 I

FiG. 30

F ig. 31

O procedimento de clculo da anlise de covrincia tem por objetivo (a) a estimativa de varincia em trno da linha de regresso com coeficiente bt e (b) a estimativa da varincia em trno da linha de regresso com coeficiente 6. A diferena bt i atribuvel disperso das mdias, cujo efeito se anula com o clculo de b< . Da se determina a seguinte razo F:
b , bw bw '

Se esta fr significativa, pode-se inferir que as mdias das colunas contribuem de modo significativo para a varincia, relativamente varincia ao acaso (intra-grupos).

TESTES

DE

H IP .

(2 ):

AN L.

DE

VAR.

COV.

339

A anlise de covarincia pode ser empregada sempre que existam diversas variveis controladas, embora a ilus trao a ser dada se limite ao caso em que haja uma s variavel de classificao. A anlise tambm pode ser empre gada nos casos em que haja mais de uma observao por clula. Pode ser empregada, enfim, nos casos em que com paream diversas variveis do tipo da varivel X do exem plo anterior. Para os pormenores relativos ao mtodo, ver (4:xiii), (5:333 e ss.), bem como (9:216 e ss.). T ESTE 34 H o: No h diferena de valor mdio para valo res Y que foram ajustados (em relao ao valor Y previsto a partir da equao de re gresso y j- b<[x y ] ). H diferena de valor mdio para valores Y que foram ajustados.

Hi\

C o n h e c id o s o u p r e s u m id o s : Em cada grupo de observa es, os valores Y esto normalmente distribuidos em trno da mesma linha de regresso, com iguais varincias para diferentes valores de X . P
r o c e d im e n t o

(1)

Preparar a seguinte matriz:


V \

A Xm Xu
*

B Y x Bl x}
i

i <

K Xm Xm %
\

Yn Y01

. .

^KI

Y ai

Y Kl

Xpn Txb Ytn Tre


%

Xtn

Y n Tr*

Xkn

YKn TrK n Tr

th

340

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(2)

y 4 corresponde s observaes da varivel de intersse fundamental. Calcular a soma total de produtos, I S

)
( Y Kn) (T x j . ^ r ) ,

S*y =

{ X a i)

( Y a i ) 4- ( X a * ) ( Y a )

( X Kn)

onde x = (3)

(X - X ) e y =

( 7 - Y ).

Calcular a soma das intra-mdias de produ tos. nSCXi-XXY-F):


(Tyx) + (Tya) + . . . + ( r Xjc) crv*) j - (Tx)k ^ y)-

2 *, *= ! [

(4)

Calcular a soma intra-grupos,


IX -X Y i):

cr \ * * * * * *

X
(5)

( Yii

Xxy - Xx<yi

Calcular a soma total de quadrados (como na anlise de varincia) :


rr

() 2*s= (X^i)!+ (X as) s+ . . 4 j


() 2y2= ( F ai ) 24- (F ;,)* + . . . 4 -

(6)

Calcular a soma de quadrados de mdias (de colunas), como na anlise de varincia:


(a) 2* ? = ^ + ^ + . . . + ^ ) J*.

(b) Zfi = h (rV* +r 'a + +r2i'/c) (7)

Calcular a soma de quadrados intra-grupos:


(a )

2*

2*2 - 2?

(5a) -

(6 a).

(A) 2y* = 2y2 - 2y? = (56) - (6A).

(8)

Calcular a soma total de quadrados em trno da linha de regresso,

S S -

TESTES

DE

H IP .

(2 ):

AN L.

DE

VAR.

COV.

341

(9)

Calcular a soma de quadrados em trno da linha de regresso para intra-grupos: _


=

[2 (zjOu,] 2_
-----

2^

----- ( 7 o )

(10)

Calcular a soma de quadrados de mdias em trno da linha de regresso: Z# = * s/a _ m (8) _ (9),

(11)

Preparar a tabela seguinte:


Quadrado mdio

GL
Entre mdias... Intra-grupos.... Total..........

li*

Xxy

Zy>

GL'

2/t

K-l (6a) (3) (6b) GL^ = : ( n - l) - l C(n-l) (7o) (4) (74) g l = :( : - i ) - i K n-l

(10) 2 ! = ( i o ) / g l ; (9) 31 = (9)/GLi


(8)

(5a) (2) (5b)

aL. = K n 2

(12)

Calcular

(13)

Localizar, na parte apropriada da Tabela V I do Apndice, o valor de F a correspondente a GL' e sob GL\. Se Fi ^ F a, aceitar H 0; caso contrrio, acei tar H i.

(14)

xem plo: Utilizando os dados fornecidos na fase (1) abaixo, testar as seguintes hipteses, ao nivel de significncia .025:

H 0. No h diferena significativa no valor mdio dos valores de Y que foram ajustados. Hi'. H diferena significativa no valor mdio dos valores de Y que foram ajustados.

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Soluo: d)
Vi A X 2 1 0 1
Total

B Y 8 7 7 10 32 X 4 3 1 4 12 K 10 11 6 13 40 X 0 2 4 2 8

C r 6 5 8 5 24

Tx 24

r, 96

(2) 2 xym (2 )(8 ) + (1)(7) + . . . + (2 )(5 ) -

(24) (96) = 24. (3 )(4 ) (24) (96) (3 )(4 )

(3) "Zxii [ (4) (32) + (12) (40) + (8) (2 4) ] (4) 2 (*y) 24 - 8 = 16. (5) (a) 2 .V 2= 22+ l 2(- . , . + 22242 = 24. (3) (4) 962 = 70. (3) (4)

(6) (6) (a)

2;y2= 82+ 7S4-. . . + 52 2 .2 = \ (42+ 1 224- 85 )

242 (3) (4) 962 = 32 . (3) (4)

2 v 2= | (3 224- 4 024- 242 ) -

(7) (a) 2 4 24 - 8 - 16.

(4) 2yl = 70 - 32 38.

(8) 2 / ^ 7 0 - 2 ^ 4 6 . 0 0 ,
W 38 - 1 2= 30.89.

(10) 2>^2 = 46.00 - 30.89 = 15.11.

TESTES

DE

H IP .

(2 ):

AN L.

DE

VAR.

COV.

343

d l)
Z*1 8 16 24 2xy 8 16 24 GL' 2 8 10 s /1 15.11 30.89 46.00
Quadrado mdio

GL
Entre mdias..., Intra-grupos,,..

Zy

2 9 11

32 38 70

7.56 3.86

(12) (13) (14)

Fi 7.56/3.86 = 1.96. F .0 2 5 = 6.0595 (onde GLj. = 2, GLo - 8). F t < F .0 2 5 (i- , 1.96 < 6.0595); logo, acei tar H 0.

sse teste pode tambm ser aplicado para valores de Y no ajustados. Em tal caso, d2 = 32/2 = 1 ' 16 e d2 = 38/9 4.22. W

ento Fi 16/4.22 3.79. sse resultado seria tambm no significativo, uma vez que F 0 2 5 = 5.7147, onde G Li = 2 e GLa = 9. Tpicos para discusso. 1. Em que tipos de pesquisa social pode mostrar-se particular mente til a anlise de varincia? E anlise de covarncia? Dar exemplos. 2. Uma vez que a anlise de varincia tenha mostrado que o efeito de uma varivel sbre as observaes significativo, como se pode determinar a extenso em que varia aqule efeito para diferentes valores da varivel? 3. Como se pode "anular" o efeito de uma varivel pelo uso da anlise de varincia? E pelo uso da anlise de covarincia? 4. Planejar um experimento utilizando a anlise de varincia para determinar qual o melhor de trs livros-texto acrca da mesma disciplina. 5. Por que h nmero igual de categorias de cada varivel no planejamento quadrado latino? Quantos possveis arranjos haver se cada varivel fr aberta em trs categorias? 6. Definir interao, varincia intra-grupos. 7. Explicar com palavras prprias os princpios lgicos sbre os quais se apoiam (a) a anlise de varincia e (b) a anlise de covarincia.

344

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Exerccios.

1. Trs grupos experimentais eqiiivalentes (A, B e C ), treinad durante perodos de tempo diferentes, retebem a mesma tarefa para executar sob dois conjuntos de condies (a e b), mensurvelmente diferentes. O nmero de' minutos exigido para execuo da tarefa foi determinado para cada caso:
' A a b 45 29

B 37 36

C 51 42

Os perodos de treinamento, bem como suas condies, afetam o tempo de execuo? Seja a = .05. 2. Com base no seguinte conjunto de dados, determinar (a se alteraes em qualquer das duas variveis so acompanhadas de alteraes na varivel observada e (b) se as duas variveis interagem. Seja a = .01
A 7 3 b c d 10 16 8 21 24 20 B31 40 37 33 48 52 60 59 C 20 27 29 31 50 45 31 27

3. Suponha-se que quatro indivduos (A, B, C e D ), com dif rentes nveis de educao, submetem-se a quatro diferentes exame (a, b, c e d). Os resultados e a ordem dos exames so indicados abaixo. H significativa diferena entre os indivduos? Alterao nos testes, acompanha-se de alterao dos resultados? Faz diferena a ordem em que os exames se realizam? Seja a = .10.
A a b c d 25(1) 20(2) 18(3) 13(4) B 7(2) 3(3) 0(4) 9(1) C 22(3) 15(4) 32(1) 26(2) 10(4) 19(1) 23(2) 23(3)

TESTES

DE

H IP .

(2):

A N L.

DE

VAR.

COV.

345

4. Trs grupos so formados. Cada qual composto de cin indivduos aleatoriamente selecionados a partir de certa populao. Os elementos de cada grupo so submetidos a um teste. O nmero de erros feitos por indivduo registrado na coluna X abaixo. Os grupos so, depois, colocados em ambientes A, B e C, que diferem entre si, com respeito ao nvel de rudo. So submetidos, novamente, ao mesmo teste. O nmero de erros registrado na coluna Y abaixo. Produz o nvel de rudo efeito significativo sbre o nmero de erros cometidos? Seja a = .05.

A X 13 10 8 9 5 r 8 8 5 3 4 X 6 8 2 4 4

B Y 9 7 6 3 6 X 10 14 1 1 8 15

C Y 10 1 3 1 2 7 1 3

Leituras sugeridas.
Para tratamento introdutrio da anlise de varincia e de covarincia ver Dixon e Massey (4), Johnson (9) e, em particular, Edwards (5), que inclue extensa discusso. Tratamentos mais avanados encontram-se em Cochran e Cox (3), Mann (10), e Mood (11).

Referncias e bibliografia.
1.

2.

3. 4. 5. 6.

W ., Statistical Manual : Methods of making experimental inferences. Philadelphia: Pittman-Dunn Lab., Frankford Arsenal, 1951. C o c h r a n , W . G., "Some Consequences When the Assumptions for the Analysis of Variance Are Not Satisfied", Biometrics, III (1947), 22-38. C o c h r a n , W . G. e Cox, G. M., Experimental Designs. New York: John Wiley & Sons, 1950. D ix o n , W . J. e M assey , F. J Jr., Introduction to Statistical Ana lysis. New York: McGraw-Hill Book Co., 1951. E d w a rds , A. L Experimental Designs in Psychological Research. New York: Rinehart & Co., 1950. E is e n h a r t , C h u r c h il l , "The Assumptions Underlying the Analy sis of Variance, Biometrics, III (1947), 1-21.
C h u r c h m a n , C.

346

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

7. 8. 9. 10. 11.

F is h e r , R. A., Statistical Methods for Research Workers. London:

Oliver 6 Boyd Ltd., 1948. The Design of Experiment, London: Oliver & Boyd, 1949. Jo h n s o n , P. O., Statistical Methods in Research. New York: Prentice-Hall, Inc., 1949. M a n n , H. B Analysis and Design of Experiment. New York: Dover Publications, Inc., 1949. M oo d , A. M ., Introduction to the Theory of Statistics. New York: McGraw-Hill Co., 1950.

C a p tu lo

V III

TESTES D E H IP T ESE S (3) E P R O C E D IM E N T O S E S T IM A T IV OS

1. Introduo.
Neste captulo, estudaremos vrios tipos de testes pouco relacionados entre si. So, de incio, examinados alguns mtodos de testar hipteses referentes a dados qualitativos. A seguir, so discutidos testes de hipteses relativos a dis tribuies e mtodos de testar que nada pressupem acrca das distribuies em que se apoiam. Apresenta-se, afinal, procedimento para estimativa de valores de caractersticas diversas da populao. O captulo conclue com uma discusso dos testes de hiptese e procedimentos estimativos.

2. Anlise qualitativa.
Na maioria dos testes at agora discutidos, os dados considerados consistiam em medidas segundo alguma escala. Nos testes que envolvem propores ou porcentagens (i. , os que envolvem p ) as observaes no so medidas, mas consistem em enumerao de elementos que possuem uma propriedade especificada. Por sse motivo, os testes que envolvem p dizem-se relacionados com estatstica de enume rao. A freqncia observada de um acontecimento (fr) tambm uma estatstica de enumerao. Pode, naturalmente, ser convertida numa estimativa de p, dividindo-a pelo nmero total de observaes (2/i). Ou seja,

ou

/ - ia / .

348

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

As estatsticas de enumerao usam-se, comumente, quando as variveis relevantes so tratadas qualitativamen te, como atributos. Prvias eleitorais, por exemplo, contam o nmero de pessoas pr ou contra um candidato ou questo. As distribuies binomiais e de Poisson revelam-se particularmente teis no tratamento de dados qualitativos. Cada qual delas ser examinada ao mesmo tempo que alguns testes adicionais que envolvem estatstica de enume rao. 2.1 Distribuio binomial.

Considere-se o caso de procuramos testar uma hiptese relativa a expresso de preferncia verbal. Cada um dos elementos de um conjunto ser inquirido sbre se gosta ou no de certo objeto. A resposta "sim ou "no e, con seqentemente, cada observao qualitativa. Suponha-se que escolhida amostra aleatria de vinte pessoas e feita estimativa da probabilidade de preferncia com base em tal amostra. Naturalmente, a estimativa poder mostrar-se im precisa, pois que baseada em amostra. Para ter idia de quo imprecisa pode ser essa estimativa, cabe construir um histograma semelhante aos que examinamos no cap tulo V. O histograma resultar da repetio do processo de escolher 20 pessoas aleatoriamente e assinalar o nmero de vzes em que certa porcentagem de respostas sim aparece (ver fig. 32). A curva de freqncia (ou funo de distribuio) de que ste histograma se aproxima, na medida em que aumenta o nmero de amostras, chamada distribuio binomial. No se trata de curva regular, desde que est envolvida uma escala descontnua; isto , pode haver uma ou duas res postas sim, mas no 1 1/2, ou 2 1/2, etc. . A equao que define a distribuio binomial - - ti*nn ~ k Pu * k \{ n - k ) \P q '

onde P k = probabilidade de obter exatamente k respostas de certo tipo.

TESTES

DE

H IP .

(3)

PROCED.

ESTIMATIVOS

349

" O O } c. 0 o

o o

Smero U e respo6tas sim,"

F ig. 32 Histograma de dados de preferncia (100 amostras de 20)

n nmero de observaes na amostra. n! (leia-se fatorial d e n ) = n(n - l ) ( n 2) . . . 1. P. ex 6! = ( 6 )( 5 ) (4 )( 3 ) (2) (1) = 720.


( N o t a : 0! = 1 ).

k = nmero de sucessos. kl
P

k(k -

l ) ( k 2) . . . 1.

probabilidade de obter um sucesso em uma observao singular. (1 p ) , probabilidade sucesso. de no obter um

Se um conjunto de acontecimentos puder ser classificado em duas categorias de modo que uma observao deva ser includa em uma e apenas uma dessas categorias, a colo cao da observao numa delas pode ser definida como um sucesso, e na outra, como um insucesso. No exemplo da prvia eleitoral, uma resposta sim" poderia ser definida como um sucesso e uma resposta no como um insucesso. As definies podem tambm ser invertidas, mas, uma vez

350

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

que os acontecimentos se definam como sucessos ou insuces sos, as definies devem ser mantidas ao longo do problema. Pode-se ilustrar a distribuio binomial da maneira seguinte. Suponha-se ser sabido que 60 por cento de uma populao pertence ao sexo masculino e 40 por cento ao femi nino. Qual a probabilidade de escolher 10 elementos do sexo masculino e 5 do sexo feminino em amostra aleatria de 15 elementos da populao? Nesse caso, n 15, k 10, p = .60 e q .40. Fazendo as substituies na equao indicada acima, a probabilidade de obter 10 elementos do sexo masculino 15! ------------ (. 6010) (. 40(1 5 10)) = 10! (15 - 5)! = (3003) (.0060) (.0102) = .1838.

O u seja, a probabilidade de selecionar 10 elementos do sexo masculino e 5 do sexo feminino, em amostra aleatria de 15 elementos, igual a .1838. A mdia (fi) da distribuio binomial simplesmente np e a varincia (a2) igual a npq. Aplicando sses dados ao exemplo acima, teramos que o nmero mdio de elemen tos do sexo masculino que seria selecionado em amostras repetidas de 15 elementos, corresponderia a 15(.60) ou 9. A varincia das estimativas da amostra (15) (.60) (.40) ou 3.60. Propriedade extremamente importante da distribuio a de que, tendendo n para infinito, a distribuio bino mial tem por limite a distribuio normal. Essa tendncia mais acentuada na medida em que p esteja mais prximo de .50. Conseqentemente, a distribuio normal pode ser usada para aproximar a binomial em muito casos. Dessa aproximao normal fazem uso todos os testes de hiptese, apresentados no captulo vi e que envolvem propores. O uso da aproximao normal conveniente porque a distri buio normal de manejo muito mais fcil do que a bino mial. Discusso pormenorizada da distribuio normal, em nvel elementar, pode ser encontrada em (8) e, em nvel mais avanado, em (4:vi).

TESTES

DE

H IP .

(3)

PROCED.

ESTIMATIVOS

35 1

Nos ltimos anos, desenvolveu-se tcnica muito til baseada na distribuio binomial: flha de probabilidade binomial. Essa flha torna possvel obter, com rapidez, resultados aproximados em numerosos problemas que envol vem estatstica de enumerao. Tem, ainda, a vantagem da apresentao visual, acentuando fatos ou indcios que, de outra maneira, poderiam passar despercebidos (9:174). Alguns dos empregos dessa flha so: (a) comparar pro poro observada com proporo terica; (b) fazer estima tivas e planos de amostragem para populaes binomiais; e (c) aproximar os resultados obtidos pelo teste t e pelo teste F, incluindo a anlise de varincia. A flha pode ainda ser utilizada para teste de preciso de ajuste e testes no paramtricos, assuntos que sero examinados adiante. Exame completo da flha pode ser encontrado em (9). 2.2 A distribuio de Poisson.

Se o valor de N (extenso da populao) grande e np ou nq muito pequeno, (em geral menor do que 5), na distribuio binomial, boas e convenientes aproximaes a Pt podem ser feitas atravs da distribuio de Poisson. Define-se tal distribuio pela equao seguinte:
mk P, -- e~m .

~ ~

k \

onde P k = probabilidade de Ic sucessos. m = np, mdia terica, e 2.78. ..

Tabelas que fornecem o valor de Pt para vrios valores de m aparecem em (1), (3), (5). Aplicao particularmente til da distribuio de Pois son a de permitir determinar se um pequeno grupo mino ritrio est distribudo aleatoriamente numa populao. Suponha-se, por exemplo, desejar determinar se 120 catlicos esto distribudos aleatoriamente em 60 quarteires da cidade.

352

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

A probabilidade de encontrar k catlicos em qualquer dos blocos, caso estejam les distribudos aleatoriamente, for necida pela equao acima. Nesse caso, m 120/60 = 2, nmero esperado de catlicos por quarteiro. Utilizando as tabelas de Poisson, podemos determinar a probabilidade de encontrar qualquer nmero k de catlicos em um quarteiro. No caso presente, obtm-se os seguintes valores: k
0 1 2 3 4 Pk .135 .271 .271 .180 .090

k
5 6 7 8

Pt .036 .012 .003 .001

Ento, se 7 catlicos forem encontrados em um quarteiro, deveremos rejeitar (ao nvel de significncia .01) a hiptese de que estejam distribudos aleatoriamente. 2.3 Independncia de atributos.

Muitos so os casos em que de convenincia deter minar se duas variveis se alteram independentemente. Podemos, por exemplo, imaginar que altura e pso no so independentes; ou seja, que so correlacionados. Poderemos medir as alturas e os pesos dos elementos de amostra aleatria e proceder a uma anlise de correlao. Casos h, porm, em que as variveis so tratadas qualitativamente, como atributos. Poderemos, por exemplo, desejar determinar se so independentes as profisses do pai e do filho. O teste seguinte aplica-se exatamente a casos dsse gnero.

T ESTE 35 H a: Vx e Vn so independentes. H x: V i e V -2 no so independentes.


C
o n h e c id o s ou

P r e s u m id o s :

Carter aleatrio.

TESTES

DE

H IP .

(3)

PROCED.

ESTIMATIVOS

353

P r o c e d im e n t o a tr ib u to ) :

(q u a n d o

duas

c a te g o ria s

para

cada

(1)

Preparar a seguinte matriz de "contingncia :

V, I 1 V, Total 2 0 c a+c II b d b+d Total a+i> c \ ~ d a+b+c+d=n

onde a o nmero de observaes situadas na clula 1-1, b, o nmero na clula II-l, etc. (2) Calcular
( |ad b c | h/2) -n * " (a+)(a+c)( + rf)(c + d)

(3)

Localizar na tabela V do Apndice o valor de x2 ( i correspondente a GL = 1 e sob o apro priado a. Se x2 x2 a. aceitar H 0, caso contrrio, aceitar H

(4)

E x e m p i .o : Amostra aleatria de 76 empregados de uma emprsa escolhida. Deseja-se determinar (ao nvel de significncia .10) se diploma universitrio e estabilidade conjugal so independentes. Os dados so fornecidos na fase (1) abaixo.

H 0: Hi :

Diploma universitrio e estabilidade conjugal so independentes. Diploma universitrio e estabilidade conjugal no so independentes.

354

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Soluo:
( )
Divorciados No divorciados 27 32 59

Total

Com diploma universitrio Sem diploma universitrio Total

6 11 17

33 43 76

(2)

(1 6 .3 2 - (27) (11) I - 76/2) ^ (76) (17) (59) (33) (43) lo g o , a c e ita r

'

(3) x2 io = 2.706. (4) r < x 2 io (i-e., .2397 < 2.706); se ja, as v a r i v e is

H 0;

ou

so in d e p e n d e n te s .

P r o c e d i m e n t o 2 ( o n d e u m a tr ib u to tem d u a s c a te g o ria s e o u tr o m a is d e d u a s ) :

(1)

Preparar a seguinte matriz:

Vx

A
i

B
fB a f Bb

Total
T Tb fh/T,a fh /T b

b
V2

j A ti f Ab

n Total

J An Ta

J Bn T
b

Tn T

JL /T n V

(2)

Calcular
p = T a /T .

TESTES

DE

H IP .

(3)

PROCED.

ESTIMATIVOS

355

(3)

Calcular
X2 =

(T' - pTA)/p{ 1 - p).

(4) (5)

Calcular GL n 1. Localizar, na tabela V do Apndice, o valor de x2 correspondente ao GL apropriado e sob o adequado a. Se i 2 x3 . aceitar H u; caso contrrio, aceitar Hl

(6)

Exem

plo: Deseja-se determinar se os graus obtidos em um teste independem do sexo dos alunos a le submetidos. Colhem-se 160 observaes a partir de registros antigos, escolhidos aleatoriamente. Os resultados aparecem na fase (1) abaixo. H razo para acreditar que sses atributos so independentes, ao nvel de significncia .10?

H u: Hy-.

As notas do teste e o sexo so independentes. As notas do teste e o sexo no so indepen dentes.

Soluo:
( )
M a ch o 18 12 15 26 31 24

G r a u s de Teste A ................. B ................... C ................... 1 ) ................... K ................. Y .................... T o ta l

F m ea 4 9 7 v 6 5 34

Total 22 21 22 29 29 160 4 7 2 2 = 0 .7 2 7 9 7 2 1 = 3 .8 5 7 22 = 2 .2 2 7 3 7 2 9 = 0 .3 1 0 6 7 3 7 = 0 .9 7 3 5 7 2 9 = 0 .8 6 2 8 956

\ lb

(2) (3) (4)

p = 34/160 = x2 = [8-956 - 10.227. GL =

.213. (.2 1 3 )(3 4 )]/(.2 1 3 )(.7 8 7 ) 5.

6 1 =

356

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(5) (6)

x210 = 9.236. t > X2 .io (i. . 10.227 > 9.236); logo, rejeitar H u e aceitar H a as notas do teste e sexo no so independentes.

3.

Hipteses relativas a distribuies.

Houve poca na histria dos mtodos estatsticos em que se colocou grande nfase na determinao das distribui es fixadas pelas observaes. Tal se devia, em parte, idia de que no era possvel aplicar corretamente as tcni cas estatsticas, a menos que se estivesse seguro de que a distribuio era normal, binomial, de Poisson, ou outra qualquer. Por sse motivo, muitos textos mais antigos devo tam espao considervel ao exame de mtodos para testar a normalidade de uma distribuio e sugerem mtodos para transformar as observaes de modo que os dados resultantes dessa transformao apaream como normais. Mais recen temente verificou-se que em muitos casos, apesar da distri buio no ser normal, o uso de testes que pressupem essa normalidade no conduz a rro srio (2). Alm disso, foram elaborados testes em nmero crescente e que no requerem pressuposies relativas ao tipo da distribuio. sse assunto ser examinado na seco seguinte. H ainda, contudo, muitos problemas cuja soluo re quer seja a distribuio conhecida e, especificamente, normal. Por exemplo, sse o caso quando se avalia a proporo de uma, populao que se mantm acima ou abaixo de algum valor, na assim chamada estimativa de extremos. Alm disso, no caso de uma distribuio ser normal, os testes que se baseiam nesse fato, so mais eficientes do que os outros. Faz-se, por isso mesmo, desejvel, transformar, algumas vzes, em normal, uma distribuio que no o seja. Para realizar essa transformao, h numerosas tcnicas dispon veis. Mtodo comum , por exemplo, o de usar os loga ritmos das observaes. Para exame dsse e de outros mto dos de normalizar os dados, ver (6: vii). Em situaes onde se mostre desejvel determinar se um conjunto de observaes se apoia em distribuio normal, ou em algum outro tipo especfico de distribuio, o teste mais comumente usado o de x2 (que ser explanado na seco 3 .2 ). Caso a distribuio no seja normal, sse teste

TESTES

DE

H IP .

(3 )

PROCED.

EST1MATIVOS

357

apresenta certas desvantagens: no sensvel a desvios que se manifestem nos extremos da distribuio. Em conseqencia, no se deve usar o teste quando os extremos so impor tantes. Outros testes existem (6:viii), mas quase todos apre sentam a mesma desvantagem, ou exigem amostras muito amplas. Um dos melhores testes existentes apresentado em (7). Para muitos fins, um mtodo aproximado de testar a normalidade surge como aceitvel. Em tais casos a flha de probabilidade normal muito til. Tem a vantagem de ser extremamente simples e a desvantagem, porm, de no fornecer medidas de rro. Consideraremos em primeiro lugar essa flha e, a seguir, o teste x23.1 Flha de probabilidade normal e o teste de normalidade.

Para falar dste mtodo, abandonaremos o procedimento usual que temos adotado na apresentao dos testes. O mtodo ser descrito por meio de uma ilustrao. O emprego da flha de probabilidade normal para teste de normalidade requer que os dados sejam recolhidos em grupos. No h regras definidas a respeito do nmero de classes ou de observaes necessrias; via de regra, dese jvel dispor de pelo menos dez classes e cincoenta obser vaes. Imaginemos que os dados sejam recolhidos de amostra composta com 200 empregados de certa forma, e que a idade de cada empregado seja determinada. sses dados devem, a seguir, ser dispostos como se mostra na tabela abaixo.

'I d a d e d o g r u p o

L im ite s u p e r io r

F r e q li n cia

F r e q n F r e q n c ia C u m u la t iv a cia c u m u la t iv a R e la tiv a (p o r c e n to )

20-25................ 25-30................ 30-35................ 35-40................ 40-45................ 45-50................ 50-55................ 55-60............... 60-65................ 65-70................

25 30 35 40 45 50 55 60 65 70

2 6 12 20 40 50 36 18 12 4

2 8 20 40 80 130 166 184 196 200

1 4 10 20 40 65 83 92 98 100

358

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

A freqncia cumulativa simplesmente a soma de tdas as freqncias de classes, at e inclusive a classe em relao qual ela computada. Por exemplo, a freqncia cumu lativa da quarta classe (35-40) igual a 2 -f 6 f- 12 } - 20, ou 40. A freqncia cumulativa relativa percentual para uma classe igual freqncia cumulativa dividida pela fre qncia total e multiplicada por 100. Por exemplo, a fre qncia cumulativa relativa percentual para a quinta classe (40-45) igual a (80) (100)/(200), ou seja, 40. Os limites superiores so assinalados ao longo da abscissa da flha de probabilidade normal (ver figura 33). A freqncia relativa cumulativa percentual ento assinalada, usando-se os nmeros da ltima coluna direita como valo res das ordenadas. Traa-se uma linha reta que passe to prxima dos pontos quanto possvel. Se os pontos se situam prximos dessa linha reta, a distribuio aproxima-se da normal. Os pontos extremos desviam-se, geralmente, mais do que os outros, e podem ser desprezados, a no ser que haja um intersse acentuado nos extremos da distribuio. No exemplo, nenhum dos pontos afasta-se mais do que dois por cento da linha traada, e a maioria est dentro de uma faixa de um por cento. Para a maioria dos casos, isso considerado satisfatrio e a presuno de normalidade parece justificada. No h maneira de medir a confiana que se deve depositar em julgamento dessa ordem, pois no se trata de um teste estatstico rgido. Mas, como se deixou indi cado, o teste satisfatrio para muitos propsitos em que os extremos no so crticos. 3.2 Teste x2 de grau de adequao.

O teste x2 pode ser usado para avaliar o grau de ade quao de um conjunto de dados a qualquer distribuio conhecida. Exemplificaremos com um teste de normalidade. Deve ser lembrado, entretanto, que sse teste no sensivel a desvios da normalidade que se manifestem nos extremos da distribuio. Deve-se dedicar uma palavra ao mtodo pelo qual so determinadas as freqncias tericas. Suponha-se, por exem plo, que se sabe ou se admite que uma populao normal apresenta mdia (|x) igual a 10, e um desvio padro (o)

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMATIVOS

359

F ig . 33 Flha de probabilidade normal

360

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

igual a 2. Suponhamos agora desejar determinar a fre qncia terica relativa de observaes em um intervalo de 6 a 8. Inicialmente, 6 e 8 so convertidos em desvios da mdia expressos em unidades a; ou seja, em trmos de z: I z - mI _ |6 10| 2 **---- ; u-

Com auxlio da Tabela I do Apndice ns determinamos a rea delimitada por sses dois valores de z: .0228 e . 1587, respectivamente. A diferena entre sses valores a pro poro da rea sob a curva normal, limitada pelas ordenadas traadas em pontos que se afastam da mdia por 1 e 2 unidades a. Logo, a freqncia relativa terica de obser vaes situadas entre 1 e 2 unidades o (isto , entre 6 e 8, nas unidades das observaes originais) .1587 .0228, ou seja, . 1359. T ESTE 36 Um conjunto de freqncias tericas admite um conjunto de valores especificados (Fi). H : Um conjunto de freqncias tericas no admi te um conjunto de valores especificados (Fi).
C P
o n h e c id o s ou

r e s u m id o s :

Carter aleatrio.

r o c e d im e n t o

(1)

Preparar a seguinte tabela:


F r e q n c ia D e s c ri o

O b se r vado

T e r ic o j

j\-Pi

fi
1........

Fi

fi 1
fn

Fi
F, K
2 >

fi-F , fi-F ,

(fi-Fp/F, <.h^F,)'/Fi (f-Fj'/F 2 (fi-Fi)*/Fi=x*

Total...

f<

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMATIVOS

361

Nota: (2) (3)

/,. deveria ser igual a.

^ F, .

Calcular GL = n 1. Localizar, na Tabela V , do Apndice, o valor de x2 a correspondente ao G L apropriado, na coluna a adequada. Se i 2 % 2 U , aceitar H 0; caso contrrio, aceitar H.

(4)

Desejamos determinar se um conjunto de freqn cias tericas igual aos valores que aparecem na coluna F t abaixo. Os valores F t foram obtidos a partir de uma dis tribuio presumidamente normal (|.i = 47, a = 9 . 5 ) . Ao nvel de significncia .05, testar as seguintes hipteses:
E x e m p lo :

H u:

As freqncias tericas para as classes indi cadas so iguais aos valores que aparecem na coluna Fc, ou seja, a distribuio normal com |i = 47 e a = 9 .5. As freqncias tericas para as classes indi cadas no so iguais aos valores que apare cem na coluna F{.

Hi'.

Soluo:
( )
Id a d e do G ru p o b a ix o de 25

fi 2 6 12 20 40 50 36 18 12 4 200

Fi 2 5 13 26 38 40 36 12 6 200 0 1 - 1 - 6 10 0 - 4 0 - 2 ...............

(fi-F )/F 0/2 = 0.00 1/5 = 0.20 1/13 = 0.08 36/26 = 1.38 4/38 = 0.11 100/40 = 2.50 0/36=0.00 16/22 = 0.73 0/12 = 0.00 4/6 = 0 67 5.67 = xJ

25-30........... 30-35........... 35-10.......... 40-15........... 45-50.......... 50-55.......... 55-60........... 60-65........... 65 o u m ais- Tutal_ _

362

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(2) (3) (4)

GL = 10 1 = 9. = 16.92. X2 < X2.c5 (i. , 5.67 < 16.92); logo, acei tar H 0.
x20 5

4.

Testes no paramtricos.

J se fz referncia a testes que no exigem pressu posies quanto natureza da distribuio dos dados. sses testes so chamados no paramtricos porque muitos dles no envolvem o uso de parmetros de distribuio. Os testes no paramtricos podem ser empregados para determinar se h ou no alguma diferena entre duas dis tribuies, independentemente de hipteses restritivas a pro psito da natureza dessas mesmas distribuies. sses tes tes so particularmente teis quando os dados no podem ser expressos quantitativamente, mas apenas como respostas ordenadas. Tal o caso quando os dados consistem em escalonamentos e quando no se conhece a distribuio cor respondente. O teste de significncia de correlao de escalonamento apresentado sob o nmero 27 no para mtrico. O teste x2 de grau de adequao (teste 36) igualmente no paramtrico. Uma das vantagens de usar testes no paramtricos reside no fato de que, usualmente, les requerem nmero reduzido de clculos. Essa vantagem ser posta em evi dncia nos dois tipos de testes no paramtricos a serem examinados nesta seco: testes de sinal e testes de fluxo. 4.1 O teste de sinal.

Em muitos projetos de pesquisa social torna-se desej vel comparar dois grupos ou dois indivduos em diferentes e variadas circunstncias. Isto , o pesquisador deseja determinar se h ou no diferena entre grupos ou indiv duos, ao longo de uma gama de situaes. Em cada situa o ser feita observao a respeito de cada grupo; se dois grupos esto envolvidos, obtm-se observaes em pares. Pode no haver fundamento para estabelecer quaisquer presunes relativas distribuio das observaes em cada uma ou em tdas as situaes. Faz-se, ento, necessrio

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMATIVOS

363

recorrer a um teste no paramtrico. O teste de sinal pode ser, particularmente, empregado nessa situao. O teste de sinal utilizvel para uma grande variedade de objetivos, embora nos limitemos a discutir apenas alguns (para exame pormenorizado, ver [3:xvii]). As aplicaes que iremos examinar destinam-se a responder questes tais como as seguintes (sejam A e B dois grupos ou indivduos) : (1) So A e B diferentes com respeito a alguma propriedade especificada ao longo de situa es 1 a n? A melhor do que B por, pelo menos, uma porcentagem pc? A melhor do que B pelo menos q unidades?

(2) (3)

Essas perguntas so transformadas em hipteses rela tivas mediana m. Lembremos que a mediana corresponde ao valor, no eixo de abcissas, de uma funo de distribuio, cuja ordenada divide em partes iguais a rea sob a curva. A mediana da amostra, no caso de um nmero mpar de observaes, aquela observao que tem antes e depois de si, igual nmero de observaes. No caso de nmero par de observaes, o valor mdio entre as duas observa es mdias. Por exemplo, a mediana de 3, 9 e 27 c 9; a mediana de 3, 9, 11 e 27 10. A estatstica crtica nesses testes o nmero de vzes em que aparece o sinal menos freqente (-f- ou ) na diferena entre as observaes feitas aos pares. Essa esta tstica habitualmente representada por r, smbolo que se usa tambm para representar o coeficiente de correlao da amostra. Para evitar confuso, o smbolo r., ser usado para representar a estatstica no teste do sinal. A distribuio de rs foi elaborada, e aparece na tabela X I do Apndice. Convm notar que no so apontados valores quando n muito pequeno. De fato, valores atri budos a n menor ou igual a 10 no so, em geral, dignos de confiana, e s devem ser usados para aproximaes gros seiras. Para tratamento mais refinado de amostras peque nas, ver (3:252-54).

364

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

T ESTE 37 II o : m, = my Hi: m, + w
o n h e c id o s o u P r e s u m id o s : A s diferenas entre os pares de observaes so independentes.*

P r o c e d im e n t o :

(1)

Preparar a tabela seguinte:


Xi Xi y< yi ya sinal de Xi - Vi

X J

Xn

yn

(2) (3)

(4)

Calcular rs, nmero de vzes em que aparece o sinal menos freqente. Localizar, na Tabela X I, do Apndice, o valor de rs correspondente ao n apropriado e na coluna a adequada. Se r., maior do que rsa, aceitar H,; caso con trrio, aceitar H i.

E xem plo: Duas escolas (A e B) competiram entre si, por vrios anos, em diversos tipos de esporte. Foi selecionada uma amostra aleatria de 14 jogos nos quais no era pos svel o empate. Os resultados vm relacionados abaixo. Ao nivel de significncia .05, so as escolas diferentes em capacidade atltica?

Ih: w a =

Ih : nu +
* Falando estritamente, tambm se supe que no haja empates, seja, que as observaes no so iguais em nenhum par. Na prtica, entretanto, ainda que empates no ocorressem se as medidas fssem precisas, os empates fazem-se presentes pois as medidas so costumeiramente aproximadas, igualadas nas unidades ou dcimos de unidade, por exemplo. sses empates devem ser excluidos" (3: 248).

TESTES

DE

H IP .

(3)

PROCED.

ESTIMATIVOS

365

Soluo:
( 1)
A
7 2 3 49 21 32 12

B
4 3 4 54 18 18

S in a l de D ife r e n a + li i; i 1 28 18 64

B
14 24 2 14 20 12 11

! S in a l de D ife r e n a +

I
1 ! |

+ + +

I-

+ +

31

2 6

(2)

rs =

5 (i. , h 5 sinais menos, ).

(3)
(4)

r.r.o .s = 2.
rs > rs.o5 (i. , 5 > 2); logo, aceitar H 0; ou seja, no h diferena entre as escolas.

T ESTE 38
IIO . )! > C,nV II l Ki < cwy

c uma constante especificada. C onhecidos ou P resu m id o s : A s diferenas entre os pares de observaes so independentes e as medidas entre os pares so comparveis (isto , podem ser feitas na mesma escala). P ro ced im ent o : (1) Preparar a tabela seguinte:
S in a l de D if e r e n a

Xi

y ;

c y : cy i cy 2 cy n

x :-c y i

T l
X-2 Xn

'Vi
>'2

366

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(2) (3)

Computar rs. Localizar, na tabela X I do Apndice, o valor de rs correspondente ao n apropriado, na coluna a adequada. Se r, > rsa, aceitar H 0; caso contrrio, acei tar H i.

(4)

Exem plo: Afirma-se que um vendedor (A ) duas vzes melhor do que outro ( B ) . Ambos vendem o mesmo artigo. Colhe-se amostra aleatria de 12 registros de vendas dirias. Os dados aparecem abaixo. a afirmao aceitvel, ao nvel de significncia .10?

H o- u

^ 2jb II f. rrtA < 2i/)

Soluo:
( )

Ai
47 51 63 40 65 75 43 55 74 50 57 71

Bi 22
25 27 30 31 37 20 27 35 21 25 34

2Bi 44 50 54 60 62 74 40 54 70 42 50 68

S in a l de

Ai-2Bi
+ + + + + + + + + + +

(2)
(3)

rs =

1.
2.

r Jio =

(4)

r < rr io (i. , 1 < 2); logo, rejeitar H 0 e aceitar H 1 ou seja, A duas vzes melhor do que B.

TESTES

DE

H IP .

(3)

PROCED.

ESTIMATIVOS

367

T ESTE

39
Ho'.

= fft +

Hi'. i + > + ? q um nmero especificado de unidades. sse teste semelhante ao anterior, exceto que se usa o sinal da diferena xt (/i + <?) 4.2 O teste de fluxo.

Referncias j foram feitas, diversas vzes, dificuldade de obter observaes repetidas quando esto envolvidos sujeitos humanos. Tendem les a alterar-se sob estmulo repetido e do mesmo tipo e, conseqentemente, as observa es deixam de ser independentes ou aleatrias. A despeito dessa possvel dificuldade, em muitos projetos desejvel fazer um conjunto de observaes independentes a propsito do mesmo sujeito ou sujeitos, com repetio do mesmo est mulo. Em tais casos conveniente testar as observaes para determinar se possvel admit-las como selecionadas aleatoriamente do universo das observaes possveis. H numerosos testes para determinar o carter aleat rio ou o de independncia. A maior parte dles s pode ser utilizada sob condies especiais. Contudo, o teste de fluxo pode ser usado para sse objetivo em grande varie dade de circunstncias e, como o teste de sinal, le tem a virtude da extrema simplicidade. A mediana da amostra determinada, e, a seguir, as diferenas entre as observaes (tomadas na ordem em que foram colhidas) e a mediana so indicadas por + ou por , dependendo de estarem acima ou abaixo da mediana. Ento, cada conjunto con secutivo de mesmo sinal chamado um fluxo. O nmero de fluxos () determinado. A probabilidade de obter vrios nmeros de fluxos para diferentes extenses de amos tra foi computada. A tabela X II do Apndice apresenta os valores crticos necessrios para realizar testes de fluxo ao nvel de significncia .05. Dois testes de fluxo sero apresentados abaixo: um para determinar se a mediana da populao igual a um valor especificado e o outro para determinar se um conjunto

368

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

de observaes pode ser considerado amostra aleatria de uma populao singular. Para maiores esclarecimentos e aplicaes, ver (3:xvii, sec. 3). TESTE 40
H 0: m = a Hi. m ^ a
C o n h e c id o s o u P r e s u m id o s : Carter aleatrio e a ordem em que as observaes so feitas. P r o c e d im e n t o :

(1)

Preparar a tabela seguinte:


Xi

X I

Xt

Xn

S in a l de

Xi a

(2) (3)

(4)

(5)

Se algum xt for igual a a, afast-lo da lista. Calcular u, nmero de fluxos de sinais conse cutivos + e . Calcular m, nmero de vzes em que aparece o sinal menos freqente, e n2. nmero de vzes em que aparece o sinal mais freqente. Localizar, na tabela X II do Apndice os valo res de u .0 2 5 e u .9 75 na coluna nx apropriada e correspondente ao n2 adequado. Se u .0 2 5 < u 1 1 .9 7 5 , aceitar H 0; caso contr rio, aceitar H x .

plo: Uma amostra aleatria dos resultados de 15 testes selecionada. Os resultados so fornecidos abaixo. H razo para acreditar que, ao nvel de significncia .05, a medida dos resultados obtidos pela populao igual a 75?

Exem

H0: m = 75 Hi\ nt 4= 75

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMAT1VOS

369

Soluo: (D

li

90

71

64

83

87

76

70

51

62

85

87

95

73

69

81

ln a l de .t i- 7 5

(2) (3) (4)

u = 7. nx 7 e n 2
8

u .0 2 5 = 4 e u .9 75 = 12.

(5) u.0 2 5 < u < u -9 75 (i., 4 < 7 < 1 2 ) : , logo, aceitar H 0-

T ESTE 41 HoUm conjunto especificado de observaes colhido aleatoriamente de uma populao sin gular. Um conjunto especificado de observaes no colhido aleatoriamente de uma populao singular.
ou

H i:

C o n h e c id o s

P r e s u m id o s :

A ordem em que as obser

vaes so feitas
P r o c e d im e n t o :

(1) (2)

Calcular a mediana da amostra, m . Preparar a tabela seguinte:

x*
S in a l de x,

XI

xn

m'

370

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(3) (4) (5)

(6)

onde Xi a primeira observao feita, x2 a segunda, etc. (Esta no a mesma ordem usada para calcular a mediana). Calcular u, nmero de fluxos de sinais conse cutivos + e . Calcular nx e rio, onde nx = n- = n / 2, se n par; e nx rio (n l)/2 , se n mpar. Localizar, na tabela X II do Apndice, os va lores de u.0 2 5 e u.9 7 5 sob o nx adequado e cor respondentes ao rio apropriado. Se u.0 o 5 < u ^ U.9 7B , aceitar H 0, caso contrtrrio, aceitar H x .

xem plo; Imagine-se que repetidamente proposto a al gum um problema de tipo labirinto para resolver em inter valos regulares de tempo. Fazem-se observaes a propsito da durao necessria para resolver o problema. Os resul tados das vinte primeiras tentativas aparecem abaixo. Podem essas observaes ser consideradas como colhidas aleatoria mente de uma populao singular? Seja a .05.

H t: H x:

O conjunto de mente de uma O conjunto de toriamente de

observaes colhido aleatoria populao singular. observaes no colhido alea uma populao singular.

Soluo: (1) As observaes, por ordem de grandeza, so: 54, 53, 51, 47, 46, 45, 42, 41, 36, 34, 33, 32, 31, 30, 29, 29, 29, 28, 26, 25. a mediana da amostra, rri 33 + (1/2) (34 - 33) = 33.5.

(2 )
X, 54 53 51 47 46 42 45 30 36 41 34 33 29 29 32 31 29 2

2 ( i

25

Sinal de

.r,m!

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMATIVOS

371

(3) (4) (5) (6)

10. U .0 2 5 = 6 e U .9 7 3 = 15. u < U.0 2 5 (i. , 4 < 6); logo, rejeitar H 0 e aceitar H a ou seja, as observaes no so colhidas aleatoriamente de uma populao sin gular.

u = 4. m = n2 =

20/2 =

5. Procedimentos estimativos.

O problema da estimativa, em estatstica, muito se lhante ao problema geral de descrio nas cincias. Em trmos de senso comum, descreve-se, algumas vzes, um aspecto da natureza pintando em palavras certas caracters ticas da circunstncia. Dizemos que a descrio "precisa se ela traduz fielmente o que est realmente acontecendo. Da mesma forma, em estatstica pode-se desejar descrever uma ou mais propriedades de uma populao, e essa descrio chamada estimativa da propriedade, quando se baseia em amostra. Seria desejvel dispor de critrios que nos ha bilitassem a determinar se uma estimativa boa ou adequada. J consideramos (no cap. iv) as qualidades que devem possuir os procedimentos de estimativa que so precisos e s permitem varincia mnima. Critrios adicionais, contudo, so necessrios. Mas no h nenhum conjunto de critrios estatsticos que assegure a melhor estimativa em trmos pr ticos, pois "a melhor depende da natureza do problema sob investigao. Os mtodos de estimativa a serem examinados nesta seco no devem ser tidos como necessariamente os melho res" em todos os casos. A maioria dos mtodos baseia-se no princpio de que o custo da superestimao ou o custo da subestimao proporcional (aproximadamente) ao qua drado da quantia de super ou subestimao. N o exemplo dado no Apendice IV , usa-se princpio diferente: o custo proporcional quantia de super ou subestimao, e no a seu quadrado. A razo de se considerar o quadrado a de que, em muitos casos, faz-se aceitvel presumir que o custo se eleva mais acentuadamente para erros maiores do que para erros sem importncia. O u seja, quatro vzes to srio errar por duas unidades como errar por uma, nove

372

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

vzes to srio errar por ts unidades como por uma, etc.. Alm disso, o princpio de reduzir ao mnimo o quadrado do rro (princpio dos mnimos quadrados ) tem a van tagem de ser mais simples de manipular matemticamente do que a maioria de outros mtodos de estimativa e, em conseqncia, , freqentes vzes, mais simples dizer exata mente quais so os riscos existentes numa estimativa por mnimos quadrados do que dizer quais so os riscos em uma estimativa de outro gnero. Mais ainda, reduzir ao mnimo os quadrados pode tambm reduzir ao mnimo outras funes do rro. No obstante, o leitor deve manter-se alerta com respeito ao princpio dos mnimos quadrados e suas aplicaes, pois, em alguns casos, os riscos podem no ser proporcionais ao quadrado do rro. Ocasies haver em que se faa desejvel obter um valor singular, ou uma estimativa localizada de uma varivel Com efeito, pode se tornar desejvel determinar o melhor valor em que apostar. Nunca se pode estar certo de que uma estimativa inteiramente precisa, mas possvel usar mtodos de estimativa que, a longo alcance, propor cionam uma distribuio de estimativas cuja mdia igual ao valor verdadeiro da quantidade estimada; ou seja, mto dos precisos. Os mtodos de estimativa esto, claro, intimamente relacionados aos mtodos de amostragem. Por exemplo, o procedimento para obter uma estimativa precisa da mdia a partir de amostra aleatria simples proporcio naria estimativas imprecisas se aplicado, digamos, a amostras estratificadas desproporcionadas. J examinamos bom nmero de estimativas localizadas: jc uma estimativa localizada da mdia; s2 uma estimativa da varincia; s, do desvio padro; p, de uma proporo; b, de um coeficiente de regresso; r, de um coeficiente de cor relao; etc.. Tdas essas estatsticas de amostra, e outras que j foram examinadas, so estimativas localizadas de pro priedades de populao e, para muitos propsitos, so as melhores de que dispomos. V ia de regra, quando o pesquisador enfrenta um pro blema de estimativa, no lhe importa um valor singular, mas um intervalo de valores; isto , uma variedade de valores que se admite pode conter o valor verdadeiro. Uma das van tagens de uma estimativa por intervalos a de que pos-

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMATIVOS

373

sibilita ao investigador exprimir quantitativamente a confian a que merece a estimativa. As estimativas por intervalos do, pois, um intervalo de confiana, no seguinte sentido: um intervalo de confiana de 95 por cento, por exemplo, tem uma probabilidade de .95 de incluir o valor verdadeiro. Um intervalo de confiana de 90 por cento afirma que a proba bilidade de que nle se inclua o valor verdadeiro de .90, e assim por diante. Em outras palavras, ao fazerem-se vrias tentativas de identificao do verdadeiro valor, usando o mesmo procedimento de estimativa sbre muitas amostras aleatrias de mesma grandeza, 95 por cento das estimativas (ou a porcentagem que tiver sido especificada) acabariam, a longo alcance, por determinar o verdadeiro valor, situando-o no intervalo calculado. Note-se que os intervalos de con fiana no asseguram que o verdadeiro valor esteja no inter valo delimitado. Nem se pode prognosticar que estimativas futuras venham a ficar no mesmo intervalo. Com base na estimativa o que se pode asseverar apenas que qualquer interessado que empregar o mtodo poder, com uma pro babilidade determinada, identificar o verdadeiro valor. Tal como sucede no caso das estimativas localizadas, os riscos que se corre ao delimitar intervalos de confiana aparecem, por hiptese, como proporcionais ao quadrado do rro. * Algumas das estimativas de intervalo, mais comuns, so descritas abaixo. Para as mincias, ver (3:viii e ix) e (6:vi).

E S T IM A T IV A 1.
C o n h e c id o s
ou

Intervalo de confiana da mdia. Carter aleatrio, normali

P r e s u m id o s :

dade e ff.

* R. A. Fisher sugeriu tambm que as estimativa proporciona "mxima informao", e que tornam mxima a possibilidade dos acon tecimento observados ("princpio de mxima possibilidade", ou de "mxima verossimilhana"). N a maioria dos casos que ocorrem na prtica, h pequena diferena entre as estimativas de mnimos qua drados e as estimativas de mxima verossimilhana e, ainda, as esti mativas de um terceiro tipo, denominadas estimativas minimax" (esti mativas que tornam mnimo o mximo risco possvel de ocorrer).

374

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

P r o c e d im e n t o :

(1) (2) (3) (4)

Calcular x. Calcular a = 1 (p c/ 100), onde pc igual confiana do intervalo desejado, percentual. Selecionar, na Tabela II do Apndice, o valor apropriado de za. Calcular o intervalo de confiana:

Exem plo: Deseja-se determinar o intervalo de confiana de 95 por cento de para amostra aleatria de 25 resultados de teste. Admite-se que a seja igual a 1.5 e que x, cal culado, tenha sido 104.00.

Soluo:
(1) = 104.00. (2) a = 1 - (95/100) = .05. (3) 2 .0 5 = 1.96.

(4, [ , 4 .o o _ ^ ip - ] a , 5 [ io 4 .o o +i ^ m ] .
98.12<M l0 9 .8 8 .

E S T IM A T IV A 2.
C
o n h e c id o s ou

Intervalo de confiana da mdia. Carter aleatrio e norma

P r e s u m id o s :

lidade.
P
r o c e d im e n t o :

(1) (2) (3) (4)

(5)

Calcular x e s. Calcular a = 1 (pc/100). Calcular G L n 1. Selecionar, na Tabela III do Apndice, o valor de ta sob o adequado a, em frente do apro priado GL. Calcular o intervalo de confiana:

TESTES

DE

H IP .

(3)

PROCED.

ESTIMATIVOS

375

E xem plo: Determinar o intervalo de 99 por cento para a idade mdia de estudantes universitrios, sabendo que amostra aleatria de 16 estudantes revelou mdia de 21 anos, com desvio padro de 4 anos.

Soluo:
(1) X = 21 = 4. (2) a = 1 - (99/100) = .01 (3) g l = 16 1 = 15. (4) = 2.95.

18.05<M <23.95 .

E S T IM A T IV A 3.
C
o n h e c id o s ou

Intervalo de confiana da varincia. Carter aleatrio e norma

P r e s u m id o s :

lidade.
P
r o c e d im e n t o :

(1) (2) (3) (4)

Calcular s2. Calcular G L = n 1. Calcular ,5a = 1 - ,5a. (1/2) (1 p c / 100) e

Selecionar, na Tabela V do Apndice, o valor de x25 a correspondente ao G L apropriado e na coluna encimada por ,5a; selecionar correspondente ao mesmo G L mas sob a colu na 1 . 5a. Calcular

(5)

376

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

E xem plo: A varincia da amostra de renda de 30 traba lhadores aleatoriamente selecionados 2 milhes. Determi nar o intervalo de confiana de 90 por cento para a varincia da populao.

Soluo:

(1) r = 2,000,000.
(2) ;g l = 30 - 1 = 29. (3) ,5a = 1/2(1 - 90/100) = .CS, (4) x2 o s = 42.557, e 1 ,C5 = .95.

e X29 s = 17.708.
r (29) ( 2, 000 ,00 0) 1 IT 77 8----- J

r (29 ) ( 2 ,0 0 0 ,0 0 0 ) ~\ 42.557

1 , 3 6 2 , 8 7 8 < i r 2< 3 , 2 7 5 , 3 5 6 .

E S T IM A T IV A 4. entre duas mdias.

Intervalo de confiana da diferena

C o n h e c id o s o u P r e s u m id o s : Carter aleatrio e normali dade. As mdias so independentes, as varincias desconhe cidas, mas iguais. P r o c e d im e n t o :

(1) (2) (3) (4)

Calcular x1, x2, Calcular GL nt

e s^. n% 2.

Calcular a = 1 (pc/100). Localizar, na Tabela III do Apndice, o valor de ta correspondente ao G L apropriado e sob o adequado a. Calcular o intervalo de confiana: [ ^ 1 ] S+{n'-^slU / 1+ 2 r(.- 1) if+ (n2- 1) ifj L 1. J > h+ a 2 1

(5) (*,- *,) - 1

TESTES

DE

H IP .

(3)

PROCED.

ESTIMATIVOS

377

xem plo: Colhe-se amostra aleatria de 10 reunies das tropas de escoteiros A e B. A mdia de comparecimento s reunies de A 30, e s de B 20. As varincias da amostra so, respectivamente 20 e 10. Determinar o inter valo de confiana de 90 por cento para a diferena entre as mdias de comparecimento verdadeiras.

Soluo:
(1) (2) (4)

xA = 30, xB = 20, s2 a = 20, e


gl

= 10.

= 10 + 10 - 2 = 18.

(3) a = 1 - 95/100 = .05.

lM = 2.10.

( 5 ) nn _ 9 n ) _ ? 1nJlQj, 0 rd O - D 2 +( 1 0 -l) oj v 18 L (10)(10) J


(M /i Pb)

(10 + 10 1 r ( o 1) 2 0 + ( o - i ) o i 18 1 (10) (10) J


6.37 ^ (n fig) < 1 3 .6 3 .

Significa isso que pelo menos seis pessoas mais comparecem s reunies de A, em mdia toma da a longo alcance, e no mximo treze pessoas mais comparecem s reunies de A. Se o limite inferior fsse negativo (ao nvel escolhi do), rejeitaramos uma diferena verdadeira entre ^ e ( i j, ^

E S T IM A T IV A 5. regresso.

Intervalo de confiana do coeficiente de

C o n h e c id o s o u P r e s u m id o s : A s observaes ( x4 ) no esto sujeitas a rro e os erros das observaes (j/t) so independentes e normalmente distribudos, com mdia zero. P r o c e d im e n t o :

(1) (2)

Calcular b e sb (Ver cap. vi, seco 8.2). Calcular a 1 (pc/100).

378

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(3) (4)

(5)

Calcular G L = N 2. Localizar na Tabela III do Apndice o valor de ta correspondente ao G L apropriado e sob o adequado a. Calcular o intervalo de confiana:
(4 - U i) <

B < ( + Ust).

E xem plos: Um coeficiente de regresso do nmero de psicopatas em relao extenso de comunidades determi nado, correspondendo a 10.4, com rro padro dessa esti mativa igual a 3.9. Utilizou-se amostra de 1,000 casos. Determinar o intervalo de confiana de 95 por cento do coeficiente de regresso verdadeiro.

Soluo: (1) (2) (3) b 10.4 e s;, = 3.9. a = 1 - 95/100 = .05. GL r= 1,000 - 2 = 998.

(4) f.os = 1 96.


(5)

10.4 - (1.96) (3.9) ^ B ^ 10.4 + (1 .96) (3.9), 2.76 B s 18.04.

E S T IM A T IV A 6. correlao.

Intervalo de confiana do coeficiente de

C o n h e c id o s o u P r e s u m id o s : Os pares de observaes so aleatoriamente escolhidos e esto distribudos normalmente. P


r o c e d im e n t o :

(1) (2) (3) (4)

Calcular r. Localizar, na Tabela X do Apndice, o valor de z' correspondente a r. Calcular oy = 1 /V n - 3. Calcular a = 1 (pc/100).

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMATIVOS

379

(5) (6)

Localizar, na Tabela II do Apndice, o valor apropriado de za. Calcular


Zi e
Z

ZaG
2a<7,'.

}
Zz
= 2 +

(7)

Localizar, na Tabela X do Apndice, o valoi de rt correspondente a e o valor de r2 cor respondente a z2. Segue-se ri S. p < r2 .

(8)

Exem plo: O coeficiente de correlao calculado a partir de amostra aleatria de 10 pares de observaes igual a . 59. Determinar o intervalo de confiana de 99 por cento de q.

Soluo:
(1) r - .59. (2) z' = .678. (3) oy = l/V lO - 3. (4) a = 1 - 99/100 = .01. (5) z.oi = 2.576. (6) z, = .678 - (2.576)(.377) = -.293. zj = .678 + (2.576)(.377) = 1.649. (7) T ! = -.285 e , j = .929. (8) -.285 < p < .929.

E S T IM A T IV A 7. Intervalo de confiana de uma propor o ou percentagem.


C
o n h e c id o s o u

r e s u m id o s :

n > 3 0 e ( . 1 0 < p <

.9 0 ).

Os fatos so independentes e tm igual probabilidade de ocorrncia.

380

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

P r o c e d im e n t o :

(1) (2) (3) (4)

Calcular p, freqncia relativa observada. Calcular a = 1 (pc/100). Localizar, na Tabela II do Apndice, o valor apropriado de za. Calcular o intervalo de confiana:

Nota: Se fr usada uma porcentagem, no uma proporo, substitue-se a porcentagem pela proporo, no procedimento acima e substitue-se 1 por 100 na fase (4).
Exem plo: Numa prvia eleitoral 60 entre 100 indivduos selecionados aleatoriamente so favorveis ao candidato A. Determinar o intervalo de confiana de 99 por cento para a proporo da populao em favor de A.

Soluo:
(1) p = 60/100 = .60. (2) a = 1 - 99/100 = .01. (3) z.qi = 2.58. (4) [.60 2 . 5 8 > P ^ ^ ] #s[.6 0 + 2 .47<*>S.73 . . 5 8 ,

/ Levantamentos sociais referem-se to freqentemente a estimativas de porcentagens que convm dar maior ateno a tais estimativas. O rro padro (o) da estimativa de uma porcentagem (PC ) cujo valor verdadeiro a dado por

TESTES

DE

H IP .

(3 )

PROCED.

ESTIM ATIVOS

381

onde n a extenso da amostra. No Teste 11 foi visto que o valor de z de uma estimativa de um valor hipottico (a) de uma porcentagem dado por

2= _

PC d

PC

( 2)

o\

Substituindo o valor de afc dado nas equaes (1) e (2), obtemos


PC-a

(100 a)
n

(3)

Elevando ao quadrado ambos os membros de (3), resulta:

r l ^ n(.PC a ) 2
a (100 a) ' '

Explicitando n, tem-se:
_ tfa (100 - a)

( PC- a) ' -

( '

/c \

Ora, (P C a) igual diferena entre o valor estimado e o valor hipottico da percentagem. Suponhamos conhecer o valor da percentagem verdadeira (a); usando a equao (5) pode-se determinar o nmero de observaes necess rias para obter uma estimativa dentro de qualquer percenta gem especificada e com dada probabilidade. Suponhamos, por exemplo, que a percentagem verda deira 50, e que desejamos que nossa estimativa tenha uma aproximao de 5 por cento (isto , entre 45 e 55 por cento), 95 por cento das vzes. Ento
a = 1 - 95/100 = .05. 2 .0 5 = 1-96. PC a = 5.

Substituindo em (5), obtemos


(1.96)2(50)(100 50) _ , git " = --------(5) or384

Em consequncia, se a percentagem verdadeira igual a 50, sero necessrias 384 observaes aleatoriamente seleciona das para obter estimativas com aproximao de 5 por cento

382

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

dsse valor, 95 por cento das vzes. Dessa maneira, se temos alguma idia do valor verdadeiro, podemos determinar o nmero de observaes necessrias para obter um grau de confiana especificado, utilizando a equao (5). Se nossa idia inicial acrca do valor de a mostrar-se pouco plausvel como base da estimativa, pode-se fazer ajus tamento, utilizando a verso corrigida de a. Ou seja, pode mos concluir que nossas observaes foram em nmero demasiado ou insuficiente para atingir o nvel de confiana desejado. No primeiro caso, teremos conseguido grau de confiana maior do que o necessrio; e, no segundo, menor. Se obtivemos menor grau de confiana do que o desejado, podemos fazer novo clculo de n, com base na estimativa corrigida de a, e fazemos o nmero adequado de observaes adicionais. Nas tabelas 20 e 21 indicado o nmero de observaes necessrias para os vrios valores verdadeiros possveis de uma percentagem, para nveis de confiana de 95 por cento e 99 por cento. Nas tabelas os valores verdadeiros possveis das percentagens so indicados em pares (p. ex., 1-99, 2-98, etc.). Isto se justifica a partir do trmo a (100 a), que aparece na equao (5). Se a = 1, ento (100 a) = 99 e, inversamente, se a = 99, ento (100 a) 1. 6. Composio de erros: uma observao tcnica.

Antes de encerrarmos a discusso dos aspectos esta tsticos do planejamento de pesquisa prtica, h um parti cular tcnico a realar; a saber, a composio de erros. Deixamos indicado anteriormente que a grande vanta gem dos mtodos estatsticos deflui do fato de que les for necem medidas do rro a que podem dar lugar a inferncias feitas de amostra para populao. Casos h, entretanto, em que parte dessa vantagem se perde no uso dos mtodos estatsticos casos que se relacionam com testes ou pro cedimentos de estimativa duplos. O ponto pode ser escla recido por meio de exemplo. Suponhamos desejar testar a hiptese ( H 0: | *i = | .ia) ntilizando o teste 16. Nesse teste, presume-se que as varinas das duas populaes, embora desconhecidas, so iguais (i. , = a'l ). Ora, o pesquisador pode levantar questes quanto procedncia dessa presuno e, conseqen-

o o

O O ' 00 O ' ^ Tf l o so Ov vo vo cn CN o io ? 00 O Q Tf fO 00 i o >0 CN


cn

C ' N co N OO Tf -rt CO lO > H OO O V3 rt< -h

2 rH O ' O ' 'C O CO to 'O '*} co CN

t o VO ^ O 'O t' CN rH

T t

t'- 00 * * *o CNh h h V .

o <o o

f - H O lT j C N O O ' ' o O' O' lO fO H rt" co Q\ r^~ O r"O C i tO CO rH co co 00 PO 00 T f< O ' ' i 1 to oo CO CO rH 1 2 ,4 4 0 3 ,1 1 0 1 ,3 8 2

CN t o O ' C^ T ** CN T* VC TT CO CN

'O '- h Q O ' to ^

t o 00 CO o C N nnrH

'O
to o

O o O 't H n tO co 00 " Q O T* >0 CN CN fo r o o CO CO * O ' 1''- r"> CN IO ** CN O CN CN t** CN O O ^ H O ' O ' CN O ' Tf CN

O 00 so Q r- O cO 'O CO CN

O r ^ O O 00 t o 'O CO

CN CN rH t H

r r-^ -rf co IO OO 00 rH t o CO CN CN

CN O CN to *'' co 'O CO

CN CO CN rH

o *) L O

X 'O 't 't O' to O ' CO CN rH

778

't 'f lO r . IO CN IO co

o.

co r o co to vO t"> oo oo

* r

t o t o I'* o CN O ' r- o ^ CN CN IH

616

654

O ' CN 00 CN 00 O IO CO CO CO 00 O f<5 IT; co co *> CO O O T CO IO 00 O IO co o O CN

O CN 1 O ' to Q O' lO ^ ^ M *f T- O t o 00 CN -h co co CO O ' vC CN CO r o 'C CN O ' CN rH rH . IO to 00


CN rH t H

664

H ^ tN l^ CO O ^ CN

*?

O *1 * t oo ^ C CO IO O -t* T i- C O O C O to rH
CO -h co l O

20

o>

TABELA

O
oo O'

vO o OO < ~ 'j cocoCO CO 00


- m 3

1 -

OO CN r f O O0 CN t o CO ^ o
rH

it j C

C O Cv co C

00 O ' 00
rH

O'

O'

o
rH

O I 'r-C N O

-H O 0 O 0 N r , o 'f M

co C O0
CN 0 0

'O

O I- o CO 0 0 CO r*. O t o 00 o o o *+ o IO 1 IO * p CO CN Q O * \ 5o O CN IO IO rH tO *-< o O O 'N rH o 3 2 ^

f N 'O O t rf* CO 1 <"0 O Tt* CN CO

to O

'r f

m
O'

(N O C C f> t o 00 t o O '
rH N CO - 1

o <N

to o
O'

CO CO 1^ CO o CO 00 to lO O C N H CN
rH CO to CO CO rH C " f (N

CN CO CN

O ' CN co O0 t- t<
O co

2 0 ,8 0 7

5 ,2 0 2

2 ,3 1 2

1 ,3 0 0

2-98

O' O'

io CN H

P CU O 5 |_ 0 ) c, f aX a.1

657

O l - 'C C M vO lO O n

Reproduzido

d e M. Parten, "Surveys, pools and samples

O'

3 8 S O' o

VO

325

(N ew

0 ' t ' c o

, t s

York:

OC t o co O ' CO co co CO CN rH -H

^ to o o 00 CO

Harper

1 80 :

& Bros.,

20

1950), pp. 314-15.

fO O O l^ 0 \ ts i rs co O COrfO 0"0c0^ * >r o CN O r >0 1 0 0 0 ' lo o o n C N fO O lO tONrtf


cn

to <r-^ 0 ^ 0

0 0L O C O o ^ f" O 'O < 35 O m

O' lo

r - -< O IO

' O fO O O t^T f

O f* )O O N

l oT f

r o

' O h O i O o O GO LO

co T f io \0 cn cn o cs (N H <

T f ,-h LO

T f* iO

CN CO GO

fO ^ Q O O O O 'O CN CO 00 Tf

O O Q t>fO COOTfH
CN CS '

) ) CN

Tf ro OO 00 )O ' > ilOOfO

> o t^ n

<t

'O 1 L O> o 'tN N O '


CN *-< * 1

O' O r o lo t ' *

r O OT f * <sq
O ' (N * f O Tf <
0 0 CN iO r o

OOQr
O fO O r

00 O' 00 O v T -H (N *

T* Tf o CO'O'H't O O O -H -fO O \ M O fO0 0* LO Tf 00 ro CN <

21

0 0 iO r f^ O O C rO iO t

'Ot^ON ONtC Tf 00 IO O' CNOO'O'


* t". ro * >

TABELA

fOroO ^^GOO 8 O o IO
O

OT f

lO C N H

i<

o > OC N t '~ -rs 1 lo ----O T f T f ro 5 01


5O G
r H lO C N iH

) > T f rlO'OfO'f ' O Tf s O


lo

CN CN

CO t * CN H

fO

<

s
fO LO CN

-J

_________
t i

oo DT f O'

oo O ' Tf < CS f-H


< r-~ c n

CN O ' Tf -< ro O O ro

co O 'p .2 t

1 l oS g1
CL 1

ib id

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMATIVOS

385

temente, deliberar test-la. Pode, ento, usando o teste 20, testar a hiptese ( H 0: = o2 2 ). Realizando sse teste, sbre a validade da igualdade das varincias, h sempre alguma possibilidade de que a hiptese venha a ser aceita, embora falsa (rro de tipo II); ou seja, quando, em verdade, i ^ a2- Suponhamos que efetivamente a igualdade ve nha a ser aceita, quando falsa. O pesquisador no sabe que assim sucede e, por isso mesmo, prosseguir e aplicar o teste 16 a H: |.ii = \ i2, ao nvel de significncia de (di gamos) .05. Ento, nesse caso, pode ser evidenciado que a hiptese afirmativa da igualdade das mdias ser rejeita da, quando verdadeira, com uma probabilidade maior do que .05 (para exemplo numrico, ver [6:7375]). O importante, pois, no abandonar o teste duplo, de vez que freqentemente le se revela vantajoso, mas com preender que, ao aplic-lo, obtm-se resultado que no necessriamente significativo ao nvel (rro de tipo I) em que o segundo teste seja realizado. 7, Sumrio.

sse captulo leva-nos a minucioso exame das fases estatsticas do projeto de pesquisa prtica. A necessidade de planejamento estatstico foi assinalada quando do exame do modlo ideal: a impraticabilidade ou impossibilidade de se fazer observaes a propsito de todos os elementos de uma populao em foco. A partir da, surge a necessidade de selecionar amostra da populao com base na qual se pos sam fazer inferncias aplicveis populao total. Os v rios mtodos para consegui-lo foram objeto de discusso no captulo iv. Os princpios lgicos gerais, justificadores dos mtodos estatsticos de fazer inferncias com base em amostra, foram objeto de exame no captulo v. Nos cap tulos vi, vii e no presente, consideraram-se procedimentos especficos aplicveis a tipos vrios de hipteses e de pro blemas de estimativa. Foram apresentadas numerosas e di ferentes formas de hipteses estatsticas, formas para as quais as hipteses inicialmente erigidas (cap. ii) podem ser transpostas. As fases do planejamento estatstico dos procedimentos de pesquisa prtica podem ser resumidas da forma seguinte:

386

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(1)

(2) (3) (4) (5) (6)

reformulao estatstica das hipteses levanta das na fase de planejamento da pesquisa, cor respondente formulao do problema; seleo do mtodo de amostragem; determinao da extenso da amostra; determinao do rro de tipo I aceitvel; determinao dos rros de tipo II aceitveis; escolha de um teste estatstico ou procedi mento estimativo.

Estas decises se interrelacionam, e, conseqentemente, no podem ser tomadas uma com independncia das outras. E tdas, por sua vez, dependem da determinao dos custos seguintes: (a) (b) (c) (d) custo de preparao da amostra; custo de obteno de observaes em unidade de amostra; custo de tratamento dos dados obtidos a par tir da amostra; custo esperado, combinado com o rro de tipo I, no teste de hiptese, ou o rro de subestimao em procedimentos estimativos; custo esperado, combinado com os erros de tipo II, no teste de hipteses, ou o rro de superestimao, em procedimentos estimativos.

(e)

Em outras palavras, o propsito do planejamento esta tstico o de reduzir ao mnimo o total dsses custos. Deve ter-se tornado claro que uma garantia de tal reduo smente pode ser conseguida com recurso aos procedimentos apon tados. Tpicos para discusso.
1. Por que a distribuio binomial importante nas cincias sociais? 2.' Em que tipos de situaes revela-se til a distribuio de Poisson? Indicar exemplos. 3. Quais so as vantagens dos testes no paramtricos? 4. Definir (a) fluxo: (b) mediana; (c) grau de adequao; (d) intervalo de confiana. 5. Podem as observaes feitas com base em amostra ter sempre distribuio normal perfeita? Explicar.

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMATIVOS

387

6. Que propriedade da flha de probabilidade normal a torna d grande utilidade? Como pode a flha ser utilizada no clculo da mdia e do desvio padro de um conjunto de dados?

Exercidos.
1. Colhe-se amostra aleatria de 50 advogados em certa cidade. Dles, 8 trabalham por conta prpria e votam nos candidatos republi canos; 12 trabalham por conta prpria e votam nos democrticos. Dentre os que so empregados, 17 votam nos republicanos e 13 nos democrticos. So essas variveis independentes, ao nvel de significncia . 10? 2. Suponha-se que amostra aleatria dos associados de um clube pode ser dividida nos grupos seguintes:

Nmero de filhos

Alugam a moradia

So proprie trios da moradia 1 3 3 9 8 2 3 1

0 1 2 3 4 5 6 7

9 8 5 2 2 6 2 0

Essas variveis so independentes, ao nvel de significncia .20? 3. Usando a flha de probabilidade normal, determinar se o dados seguintes podem ser admitidos como correspondentes a uma populao normal. Grupo de idade menos de 20 20-25 25-30 30-35 35-40 40-45 45-50 Grupo de idade 50-55 55-60 60-65 65-70 70-75 75 ou mais

Freqncia

Freqncia

.005 .079 .135 .145 .134 .117 .113

.123 .086 .042 .017 .003 .001

4. Cinco moedas sero atiradas 100 vzes, anotando nmero de caras" que aparecem em cada lance. Prepara-se tabela de

388

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

distribuio de freqncia e determina-se o grau de adequao em rela o seguinte tabela de distribuio de freqncia terica, ao nvel de significncia de .05: Nmero de "caras" Freqncia terica 3.12 15.63 31.25 31.25 15.63 3.12

2
3 4 5

5. Duas filiais de certa firma vendem os mesmos artigo Amostra das vendas dirias, com dez dos artigos, vendidos em ambas, fornece os dados seguintes: Nmero de artigos vendidos Itens Loja A 1 2 3 4 5 6 7 8 9 10 63 58 12 76 63 98 56 26 5 89 Loja B 66 42 20 0 88 80 71 62 87 80

H alguma diferena entre as lojas? (A distribuio no conhecida). Suponha-se a = .05 6. Os estudantes A e ' B so significativamente diferentes se notas que obtiverem em cursos comuns forem as que se indicam na tabela? Seja a = .10. Cursos a b c d e f A 72 87 73 83 98 95 B 71 94 74 61 70 90 Cursos 9 h i i k A 80 95 90 92 91 B 65 70 74 77 67

TESTES

DE

H IP .

(3 )

PROCED.

ESTIMATIVOS

389

7. Imagine-se que 11 pares de associados sejam selecionados, u de cada clube, A e B. Determina-se a renda anual dsses elementos. H razes para acreditar que, ao nvel de significncia .01, os scios de A tenham renda que seja, em mdia, crca de mil dlares superior renda dos scios de B?

A $8,857 9,516 8,058 6,047 9,504 4,554

B $5,406 9,852 3,730 9,200 4,955 4,967

A $6,411 8,699 3,584 8,530 7,160

B $4,143 4,179 9,067 7,152 6,130

8. Amostra aleatria de 20 pacientes de1 uma diviso hospitalar colhida, em ordem, anotando-se as idades dos elementos. Deve a idade mdia ser tomada como 40 anos (a = .05)? As idades anotadas foram, na ordem em que apareceram, estas: 39, 53, 63, 48, 36, 26, 18, 53, 45, 37, 28, 58, 37, 22, 57, 49, 42, 34, 25, 18. 9. O nmero de aparelhos telefnicos em doze pases europeus determinado na ordem indicada abaixo. H razes suficientes para asseverar que a amostra no foi colhida aleatoriamente de uma popu lao singular? Ponha-se a = .05.

Pas

Nmero de telefones 281,790 415,522 29,576 220,510 442,998 43,086

Pais

Nmero de telefones 25,055 185,456 1,589,595 4,146,489 49,872 165,362

............. ustria Blgica ............... Bulgria ........... Checoslovquia Dinamarca ....... Eire ...................

Estnia ............. Finlndia ........... Frana ............... Alemanha ......... Grcia ............... Hungria ...........

10. Determinar o intervalo de confiana de 90 por cento para a mdia, sendo x = 117, a = 23, n = 36. 11. Determinar o intervalo de confiana de 95 por cento para a mdia, sendo x = 27.5, s = 4.2 e n = 25.

390

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

12. Determinar o intervalo de confiana de 98 por cento para a varincia, sendo s2 = 1,042 e n = 28. 13. Determinar o intervalo de confiana de 95 por cento para uma proporo sendo p = .69 e n = 34. 14. Determinar o intervalo de confiana de 90 por cento da diferena entre duas mdias, sendo X x = 23.5, x2 = 29.7, sf = 4 . 9 , S 2 = 5.3, nt = 71 e ns = 51. 15. Determinar o intervalo de confiana de 97.5 por cento para o coeficiente de regresso, sendo b = 5.71, Sb = 3.20 e n = 17. 16. Determinar o intervalo de confiana de 99 por cento do coeficiente de correlao, sendo r = .76 e n = 19.

Leituras sugeridas.
Indicaes bibliogrficas foram feitas, para cada tpico, ao longo do captulo. Salienta-se, entretanto, uma vez mais, que obras gerais de referncia para os assuntos da estatstica, os que foram aqui tratados e outros, so Dixon e Massey (3) e Johnson (16).

Referncias e bibliografia
H erbert , e C o l t o n , R. R., Tables /or Statisticians. "College Outline Series. New York: Barnes & Noble, Inc., 1950. 2. B enf.p e , O. J., "The Sensititvity of t and F to Departures from Normality". University of Washington. Tese de "Mestre". Seattle, 1949. 3. D ix o n , W . J. e M assey , F. J. Jr., Introduction to Statistical Ana lysis. New York: McGraw-Hill Book Co., 1951. 4. F e l l e r , W . A., An Introduction to Probability Theory and its Applications, vol. I. New York: John W iley & Sons, 1950. 5. F is h e r , R. A. e Y ates , F r a n k , Statistical Tables [or Biological. Agricultural and Mcdical Research. London: Oliver Boyd, 1943. 6. J o h n s o n , P. O., Statistical Methods in Research. New Y o rk: Prenticc-Hall, Inc., 1949. 7. M assey , F. J. Jr., "The Kolmogorov-Smirnov Test for Goodness of Fit", in Journal of the American Statistical Association, X L V I (1951), 68-78. 8. M o d e , E. B., The Elements of Statistics, 2 ed., New York: Prentice-Hall Inc., 1951. 9. M o st e ll er , F rederick e T u k e y , J. W "The Uses and Useful ness of Binomial Probability Paper", in Journal of the Ameri can Statistical Association, X L IV (1949), 174-212. 10. S w e d , F. S. e E is e n h a r t , C h u r c h il l , "Tables for Testing Ran domness of Grouping in a Sequence of Alternatives", in Annals of Mathematical Statistics, X IV (1943), 66-87. A r k in ,

1.

a p t u l o

IX

A FASE OBSERVACIONAL DO PLANEJA MENTO DA PESQUISA PRTICA 1. Introduo.


Quando nos referimos anteriormente ao planejamento da pesquisa prtica, fizemos aluso aos ajustamentos relati vos ao nmero de sujeitos (i., colheita de amostra em vez de contagem completa) e s inferncias que extrapolam para uma populao os resultados proporcionados pelas amostras. Ajustamentos prticos adicionais podem revelar-se necess rios, tendo em vista o modlo ideal. sses ajustamentos impem-se quando comeamos a planejar as condies e ope raes atravs das quais as observaes devem realizar-se; ou seja, quando iniciamos a fase observacional do planeja mento da pesquisa prtica. Para comear, assinalemos que, embora lidando apenas com amostras, pode resultar impossvel preencher os requisi tos do modlo de pesquisa idealizada, com respeito a essas mesmas amostras. Alguns dos elementos colhidos em amos tras podem revelar-se no acessveis observao e, dos que o sejam, alguns podem recusar-se ou mostrar-se incapazes de cooperar com o observador. No planejamento das opera es efetivas de pesquisa, o seu desenvolvimento prtico deve ter em conta sse ponto. A notar, ainda, que pode ser impossvel ou no compensador observar os sujeitos indicados nos ambientes idealmente especificados e sob est mulos tambm idealmente concebidos. Em conseqncia, tcnicas substitutivas e/ou ambientes e estmulos devero, eventualmente, ser tambm planejados. Cada qual dsses possveis ajustamentos prticos, ser examinado no presente captulo. A sse respeito, o princi'

392

p l a n e ja m e n t o

de

p e s q u is a

s o c ia l

pal problema de planejamento consiste em preparar mtodos e meios para efetiva aproximao ideal e para ajustamento dos desvios que se manifestem. Inicialmente, daremos aten o a ajustamentos exigidos em funo do sujeito. Em se guida, sero discutidos problemas de planejamento observa cional relativos a ambientes e estmulos.

2. Decises referentes ao planejamento prtico e relativas aos sujeitos.


Possveis problemas prticos relativos aos sujeitos a observar e suscetveis de surgir no curso da pesquisa podem ser especificados da seguinte maneira: (1) Pode dar-se o caso de no ser possvel obser var o sujeito por estar le ausente; le no pode apresentar-se ou ser encontrado em um ambiente definido. A sse problema chama remos de ausncia. Um sujeito presente pode recusar-se a coope rar com o pesquisador; isto , pode no se dispor a responder ao estmulo feito. Por exemplo, pode recusar-se a responder ou mes mo a permitir que lhe sejam dirigidas pergun tas, a submeter-se a testes ou a ser observado em quaisquer circunstncias. A sse problema chamaremos de recusa. Um sujeito presente e disposto a responder, pode, deliberada ou acidentalmente, dar res postas distorcidas, fornecendo, assim, dados enganosos ao pesquisador. A sse problema chamaremos de rro de resposta.

(2)

(3)

2.1 Problema da ausncia.


Tratando com sujeitos humanos, o pesquisador deve, ou conseguir coloc-los num ambiente desejado, ou observ-los naquele em que j estejam. O observador pode criar con dies para observar o sujeito sem que ste o saiba. Isso

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ.

PRTICA

393

pode ser conseguido escondendo-se o observador ou disfar ando-se o seu papel. Esconder-se difcil (se no impos svel) na maioria das situaes normais. Em alguns casos, pode revelar-se recurso de estrema eficcia, especialmente quando grupos pequenos estejam em causa. Crianas em escola podem ser observadas atravs de espelhos especiais, meio tambm aplicvel a uma classe restrita de outros am bientes. Instrumentos de registro (gravadores, filmadores) podem ser plantados junto aos sujeitos. De modo geral, sses instrumentos so mais fceis de ocultar do que os ob servadores, embora requeiram preparao maior. O disfarce do observador pode mostrar-se til em algumas pesquisas; nelas, no se permitr que os sujeitos saibam estar sendo observados por uma pessoa presente. Tal procedimento chamado observao participante. sse mtodo apresenta desvantagens srias nascidas do fato de que o observador dever fazer a interpretao dos dados e das condies em que foram obtidos. Significa isso que o planejador da pes quisa que encarrega outros da observao participante exerce reduzido controle sbre as observaes e no tem meios de avaliar sistemticamente o rro que nelas se cometa. Para pormenores acrca desse mtodo, ver (16); para exemplos, ver (20), (22) e (23). A situao comum de pesquisa aquela em que o su jeito conhece o observador. Quer isso dizer que o pesqui sador deve, ou colocar o sujeito num ambiente preparado, ou colocar o observador no ambiente em que se encontra o sujeito. Trazer o sujeito a um ambiente ao qual le, nor malmente, no viria, requer (numa sociedade livre) sua co operao. O sujeito pode recusar-se a comparecer, ou estar incapacitado (p. ex. por doena) a faz-lo. Tais recursos criam problemas de amostragem que sero examinados abai xo. Se o observador deve transferir-se para o ambiente em que se espera esteja o sujeito (p. ex. sua casa ou seu escritrio), dificuldades anlogas podem manifestar-se. O sujeito pode no se encontrar onde era esperado; pode ter-se afastado temporriamente (p. ex. em frias) ou permanente mente (p. ex. mudana), ou encontrar-se incapacitado a aten der (p. ex. devido a doena). Essas possibilidades existem

394

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

mesmo no caso em que o estmulo, mas no o observador, introduzido num ambiente em que se espera seja encontrado o sujeito. Por exemplo, em levantamentos levados a efeito por carta ou telefone, sses mesmos perigos (alm de outros) esto presentes. A seguinte declarao de J. S. Stock traz evidncia marcante da extenso e seriedade do problema levantado por sujeitos ausentes:
Uma das caractersticas da amostragem por rea a de que se predetermina a pessoa que vai ser entrevistada. Sabe-se, antes de comear, a quem se deve procurar, e, a experincia mostra, especial mente em nossas modernas cidades, que a pessoa no encontrada. Ora, a amostragem por rea parte do princpio de que todos tem um lar, de modo que ao colhr amostra nas casas, consegue-se amostra de todos. Ao selecionarmos um conjunto de pessoas para serem entrevistadas, escolhendo-as por amostragem de rea, propondo-nos encontrlas tdas, verificamos, ao fim, que a grande maioria no pde ser encontrar, e que as caractersticas sociais das que o foram diferiam, sob vrios aspectos, das que no o foram. Realizamos numerosos experimentos a sse respeito, tomando fam lias como unidade, e verificamos, por exemplo, atravs de insistncia reiterada, que as pessoas no encontradas pertenciam a famlias de menores rendas. E assim, tais pessoas eram operrios, e m cujas fam lias se manifestava tendncia para conseguir rendas mais altas. Assinalamos diferena marcante no que se refere s caractersticas de migrao. Por exemplo, em Washington D. C., h anos atrs, decidimos entrevistar algumas unidades habitacionais para indagar se a famlia ali residia no Natal anterior (ou para indagar coisa seme lhante). Na primeira tentativa, constatamos que dois por cento afir mou que no residia ali no Natal anterior. Dispnhamo-nos a chamlos de migradores, mas havia grande proporo, trinta por cento, em verdade, que no fra possivel encontrar. No havia na casa adulto algum que pudesse dar a resposta. Voltamos por uma segunda vez. Dos que encontramos nessa ocasio, quatro por cento no tinha vivido naquele endero no ltimo Natal. Numa terceira vez, verificamos que naquele endero no tinham vivido sete por cento. E, finalmente, na quarta tentativa, notamos que dezesseis por cento eram migradores, segundo aqule conceito. Ora, insistir muito dispendioso. Com efeito, costumamos cal cular que nos custa um dlar por entrevista colocar o entrevistador em contato com o sujeito. No estando a pessoa em casa, a quantia se duplica. Antes que tivssemos dado por isso, as tentativas j envol viam grande custo, pois, segundo pudemos concluir, numa cidade grande, como Filadlfia, em trinta por cento das casas e as casas tinham sido tomadas como unidade ningum era encontrado.

A FASE OBSERV. IX) P L A N E JA M E N T O

DA PESQ.

PRTICA

395

Quando os indivduos so aquela unidade, as coisas tomam feio ainda pior. Sessenta por cento dos indivduos a serem entrevistados no se encontravam em casa. [31: 22-23].

2.1.1 Reduo da ausncia.


A possibilidade de ausncia dos sujeitos deve ser leva da em conta no planejamento prtico da pesquisa, particular mente quando se recorre amostragem probabilstica. Gran de nmero de ausncias pode impedir uma amostra probabihstica planejada de s-lo verdadeiramente. Tal se deve ao fato, a que Stock se referiu acima, de que a classe de ausentes tende a diferir da dos presentes com respeito a propriedades que so crticas em pesquisa. Em outras palavras, a omisso de ausentes introduz um desvio uma tendncia a afastar-se da representatividade. Essa dificul dade no pode ser contornada atravs de puro e simples aumento da extenso da amostra, pois amostra aumentada ainda apresenta possibilidade de no ser representativa, re lativamente a importante segmento da populao, quando no inclue os ausentes. Suponhamos, por exemplo, que o pes quisador leva a efeito um levantamento para determinar qual a porcentagem de mulheres adultas, em certo bairro, que trabalha fora. Se le pretender realizar as entrevistas noite, de forma a encontrar em casa a maioria das mulheres, estar fadado a desencontrar-se das que trabalham nesse perodo e de considervel proporo de mulheres adultas no casadas ou casadas e sem filhos, porque estas, muito mais freqentemente (do que as casadas e mes) saem noite. Excluir essas mulheres introduziria distoro ou desvio na amostra. Para exemplos vrios de tais resultados, ver (25:409-12) e (14). Geralmente, convm mais tentar impedir a ocorrncia de ausncias do que tentar corrigir os erros delas decorren tes. Um bom planejamento prtico pode reduzir de muito a magnitude do problema. H muitas medidas preventivas bvias a serem tomadas, embora nem tdas adaptveis a qualquer situao. (1) Marcar hora para entrevistar o sujeito. Isso pode ser feito por chamadas pessoais, carta e telefone.

396

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(2)

Obter informao preliminar a propsito de quando podero ser encontrados os sujeitos. Isso pode ser feito atravs de rpido levantatamento prvio. Dar noticia da hora aproximada em que o en trevistador tentar o contato e recorrer pu blicidade para conseguir a cooperao dos sujeitos. Escolher as horas em que o observador ten tar o contato, o que reduzir o nmero dos no encontrados. Selecionar entrevistadores e supervisores de modo a consegu-los suficientemente habilido sos e suficientemente conhecidos da populao de modo a poderem planejar eficientemente seus "contatos.

(3)

(4)

(5)

A despeito de tais precaues, podem ainda ocorrer au sncias quando a extenso da amostra ampla e o encontro com cada qual dos sujeitos, difcil. Medidas corretivas podem, ento, impor-se e, conseqentemente, devem ser pla nejadas de antemo. No h mtodo corretivo "seguro para tratar as au sncias. Todavia, vrios dles existem, cujo valor relativo depende da especfica situao e das condies da pesquisa.

1. Em alguns casos, tda ou parte da informao ser procurada em contato direto com o sujeito, pode ser obtida de segunda mo. Um parente, amigo, ou vizinho, pode estar em condies de oferecer a informao necess ria. No uso de informante de segunda mo h grande perigo, pois le pode estar mal informado acrca do sujeito sem o saber. Em outros casos, contudo, o substituto pode revelar-se melhor do que o prprio sujeito. Por exemplo, um pai estar em condies de fornecer informaes melho res acrca de seu filho ou filha do que a prpria criana. Tais casos, porm, restringem-se, geralmente, a situaes que s dizem respeito a tipos elementares de informao, tais como, idade, pso, etc..

A FASE OBSERV. DO P L A N E JA M E N T O

DA

PESQ.

PRTICA

397

2. Tentativa reiterada de contato com os ausentes o mtodo bvio e o melhor, quando os gastos no so im portantes. Isso , pode ser feita tentativa para averiguar quando o indivduo estar em condies de atender, buscan do-o nessa ocasio. Se a pessoa em questo no mais se encontra no local indicado, talvez seja possvel determinar aqule em que no momento se encontre. No caso de levan tamentos por carta, a reiterao das tentativas de contato pode ser feita por via postal ou chamados telefnicos. Os custos dessa reiterao so, evidentemente, proporcionais ao nmero de ausentes e ao grau de disperso apresentado. Se a reiterao se impe, faz-se necessrio determinar at que ponto e sob que condies a ela se recorrer. til instruir os observadores a fim de que a reiterao consista em en trevista com hora marcada, se possvel combinada por tele fone. Envelope selado, dirigido ao observador ou a seu supervisor, pode ser deixado na casa ou no escritrio do ausente, acompanhando pedido de que ste indique a hora em que poder ser encontrado. Tentativas de contato po dem ser dispendiosas e por isso mesmo deve-se colocar algum limite no esforo a empregar. Planejamento dessas tenta tivas, feito pelo entrevistador ou pelo seu supervisor, pode reduzir considervelmente aqule custo. A reiterao pode tambm efetuar-se em base de amos tragem; ou seja, podem fazer-se tentativas para entrar em contato com uma poro, apenas, dos ausentes. Em tal procedimento, o custo da observao se reduz, mas, uma vez que haver ainda ausentes na amostra, o desvio no redu zido tanto quanto ocorreria com uma reiterao abrangedora de todos os casos. O problema bsico o de balancear dois custos: o da reiterao e o do desvio. O pesquisador deve escolher extenso de amostra que reduza ao mnimo a soma dsses dois custos. Mtodo para consegu-lo, relati vamente a levantamentos por via postal, sugerido por Hansen e Hurwitz (11). Salientam les que, via de regra, amostra de um entre trs ausentes desejvel, e que de um entre dois melhor, se o custo da reiterao de entrevista no alto. Birnbaum e Sirkin (4) fizeram anlise seme lhante para levantamentos dependentes de entrevista pessoal.

398

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

2.1,2. Ajustamentos aplicveis s ausncias.


Seria desejvel, naturalmente, evitar a necessidade de reiterao com respeito a qualquer ausente. Isto somente seria possvel se soubssemos ou pudssemos fazer estimati vas razoveis acrca das propriedades dos ausentes. Su gesto muito simples e engenhosa para fazer tais estimativas foi apresentada por H. O. Hartley em (13). Mtodo para o mesmo tipo de estimativas foi desenvolvido independente mente por Politz e Simmons. til examin-lo. Antes, contudo, de estudar o procedimento que aplica, conveniente examinar os princpios lgicos em que se assenta:
Todo conjunto de e-ntrevistas levadas a efeito num momento A deve incluir pessoas no encontradas" em outro conjunto de entre vistas realizadas em momento anterior B. Deve incluir tambm pessoas que estavam ausentes em outro momento anterior C e deve incluir, ainda, pessoas que se encontravam ausentes tanto no momento B como no C. Estatisticamente poder-se- reconstruir, a partir de uma amostra de pessoas presentemente "encontradas", amostras anteriores de pes soas "encontradas e "no encontradas", desde que: (a) as pessoas forneam informes acrca de momento anterior em que seriam "encon tradas" e (b) as pessoas que integram a atual amostra de "encon tradas sejam procuradas em momentos escolhidos aleatriamente. Considere-se, por exemplo, os trs grupos seguintes entre os quais se distribuem todos os elementos da populao: 1) os que so encon trados, em mdia, durante 20 por cento do tempo, 2) 50 por cento do tempo e 3) 80 por cento do tempo. Se o momento das visitas fixado aleatriamente, pode-se esperar, na primeira visita, que seja encontrado crca de 20 por cento do grupo (1), 50 por cento do grupo (2) e 80 por cento do grupo (3). Ora, se cada pessoa da amostra fr includa apenas no grupo a que pertence, torna-se claramente necessria correo da subrepresentatividade de cada grupo. Desde que apenas crca de um quinto das pessoas do primeiro grupo entrevis tado, a sse grupo atribui-se o pso 5. Por motivo idntico, o segundo grupo recebe o pso 2, pois apenas crca de metade das pessoas dsse grupo encontrada em casa, enquanto ao terceiro grupo se d o pso 1.25. claro que tal ponderao no elimina completamente o desvio, pois considera somente trs grupos arbitrriamente definidos. Por outro lado, o desvio deve se reduzir, pois, a ponderao compensa ao menos parcialmente a subrepresentao de pessoas habitualmente afastadas de casa. O nmero de tais grupos, entretanto, no precisa ser restringido a trs. Com certas adaptaes bvias, o exemplo dado se aplica a qual quer nmero dsses grupos em que a populao venha a ser repartida, salientando-se que cada grupo contm pessoas que so encontrada? em qualquer perodo em que se processe a entrevista [27: 11-12],

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

399

O mtodo de Politz-Simmons abrange as seguintes fases: (1) (2) Procurar cada pessoa que figura na amostra apenas uma vez. Determinar, para aqules que so encontra dos, durante que perodos de entrevista da semana anterior, poderiam ser encontrados em casa. Por exemplo, se as entrevistas tm lugar durante a noite, e uma entrevista deternada se realiza num sbado noite, perguntar: (a) (b ) (c) (d) (e) (3) Pode o senhor me dizer se estve em casa ontem noite, nesta mesma hora? E ante-ontem noite, a esta hora? E quarta-feira noite? E tera-feira noite? E segunda-feira noite?

Agrupar as respostas de todos os entrevista dos, de acrdo com terem les estado em casa 6/6, 5/6, 4/6, 3/6, 2/6 ou 1/6 dessas noites. Calcular as estimativas para cada varivel sob investigao, e para cada qual dos seis grupos, separadamente. Ponderar cada estimativa, correspondente a cada grupo, multiplicando pelo recproco da proporo de noites em que aqule grupo es teve em casa, na hora da entrevista. Calcular a estimativa total com base nas esti mativas ponderadas dos seis grupos.

(4)

(5)

(6)

Suponha-se, por exemplo, que se est realizando uma investigao para determinar a porcentagem de votantes que se abstiveram em eleio recente. Esboa-se um plano de amostragem, planeja-se um procedimento relativo a entrevis tas e estas so determinadas para se realizarem no perodo noturno. Faz-se contato com cada qual das casas indicadas na amostra, colhendo-se, digamos, os seguintes resultados:

400

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

wn a G cr 8 cr
d

"2 to co Cw o u. td c / j c o o i- 'n s! c o s >^ O' O


T 3H *1! lu (g

II II Ti T II tn II in 1 cn m 0 s m X X X X X X in 0 0
O 00 0 0 0 CN VO CO CN *-< *-

O VO O in ON

00 m cs CM c n

1-81 8 8 S*e
> S ?
T3 > T3

8 C N8 C O
in

(N O m

-H

toT 3 On )u

V O n (S ^ ^ ^

X X X X X o o o m cm o

II O o ^

o 9 o in M o c n (s i ^ 1 1 ^1 11 1 1 1m 1 1 vo 1 1 ^ \ \ vo \ vo vo \ VO
3 CTa c o C/J k l O (T J o 0> 1 o 1

00

t CO

c/ 5

! > co S S 8 8

(fl

P "o * c a g
CO

G ^ a ; o h

r a 'S c /j TJ o Oc o

A FASE OBSERV. 3 0

P L A N E JA M E N T O

DA PESQ. PRTICA

40 1

A proporo estimada, ajustada, de votantes que deixaram de votar , ento, igual a 989/1,980 = .50 (A proporo no ajustada seria 708/1,475 = .48). claro que a estimativa feita no leva em conta aqueles que no se encontravam em casa em nenhuma das seis noites. Contudo, Politz e Simmons sugeriram mtodo para tambm lev-los em conta. Em primeiro lugar, utilizando os dados recolhidos, podemos calcular os coeficientes de regresso das entradas da coluna 5, em relao s entradas da coluna 1, e o das entradas da coluna 6, relativamente s da coluna 1. A significncia dsses coeficientes testada. Se no fo rem significativos, no ser preciso considerar os que estive ram ausentes em tdas as noites da semana, j que sua omis so no conduz a desvio. Caso a regresso seja significativa, fazemos noites em casa, entre as seis da semana igual a zero e determinamos, com auxlio das duas equaes de re gresso, os valores que devem ser colocados nas colunas 5 e 6, na linha dste zero, incluido no tpo da coluna 1. Ima ginemos que os valores fssem 100 e 70, respectivamente; calcularamos, ento, 70 f- 989, ou seja 1,059 e ainda 1,980 f- 100, ou seja, 2,080. A nova proporo estimada, ajustada, seria, portanto, 1,059/2,080 = .51.* Uma pergunta que surge com naturalidade, quando se estuda o mtodo de Politz e Simmons esta: quo dignas de crdito so as respostas a respeito da presena em casa? O mtodo, entretanto, pode fornecer uma espcie de teste

* O mtodo admite que o momento em que o observador determ se o sujeito est ou no em casa, selecionado de modo aleatrio da populao de momentos possveis em que tais determinaes possam ser levadas a efeito. Caso as perguntas acima sejam utilizadas, uma seleo de seis momentos feita. sses seis momentos "no so sele cionados aleatoriamente de modo independente, mas selecionados de modo sistemtico dentro de um agregado de seis noites consecutivas, escolhido aleatoriamente. Fixao exata da probabilidade envolveria a correlao intra-classe da probabilidade de se achar um indivduo em casa nas noites sucessivas. A experincia tem mostrado, no obstan te, que essa correlao tende a ser pequena ou mesmo negativa, dado que uma pessoa costuma permanecer em casa na noite que se segue noite em que se ausentou. A hiptese de correlao nula , portanto, realista". (27: 21). Deve-se notar, ainda, que os erros esto sendo computados se se faz uma estimativa da caracterstica do grupo zero, usando-a para calcular a estimativa da populao.

402

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

relativo ao crdito a dar a tais respostas. Instrues sero dadas aos entrevistadores para que anotem as porcentagens dos que so e dos que no so encontrados em casa. Sabese, alm disso, que a porcentagem esperada de pessoas que esto em casa, em amostra feita em perodo aleatoriamente escolhido, igual porcentagem mdia do tempo em que tdas as pessoas seriam encontradas em casa. Essa por centagem
pode ser estimada diretamente, a partir das informaes obtidas das pessoas que respondem, levando em conta o nmero de noites que cada pessoa estve em casa, nas seis noites precedentes. A compa rao entre as duas estimativas independentes, da porcentagem mdia de pessoas encontradas em casa, destina-se, de hbito, a corroborar a acuidade genrica das respostas, dos registros dos entrevistadores e de outras fontes quaisquer de rro. Os resultados dsse tipo de anlise comprobatria, para o levantamento feito em Chicago, so stes: AREA M E T RO P O LIT A N A DE C H IC A G O

Porcentagem dos em "casa"

Porcentagem dos "no em casa"

Baseada em registros feitos pelos entrevistadores, anotados os nmeros de procurados e de encontrados ............................ Baseada nas respostas fornecidas pelos entrevistados, levando em conta o nmero de noites em que estavam em casa ...........

61.1

38.9

61.5

38.5

. . . A contagem direta fornece uma comprovao estatstica interna muito elegante a respeito do grau de crdito a dar s respostas pergunta: no-estar-em-casa; e, indiretamente, fornece uma compro vao do cuidado que o entrevistador adota ao tratar com seus entre vistados [27: 16].

O mtodo de Politz e Simmons para ajuste dos no en contrados no , em qualquer situao, necessriamente o melhor. Ocasies h em que a reiterao pode ser mais efi ciente. Avaliaes comparativas entre os dois mtodos so

FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

403

necessrias para cada situao diferente; avaliaes que to mem em considerao (1) desvio, (2) a varincia das esti mativas e (3) os cursos de operao. O mtodo PolitzSimmons pode se mostrar vantajoso nos casos em que se dispe de poucos recursos para reiteraes, em que o levan tamento deve ser levado a efeito rpidamente e em que a populao, largamente dispersa, torna a reiterao relativa mente dispendiosa. Casos haver em que se apresente van tajoso combinar os dois mtodos. Ambos os mtodos, por exemplo, podem conduzir a desvio srio, se a propriedade investigada estiver correlacionada com a freqncia dos su jeitos no encontrados. Nesses casos, o desvio pode ser de algum modo reduzido, complementando-se o mtodo PolitzSimmons com uma ou duas reiteraes. Em relao a alguns estudos, pode no existir informao suficiente para garantir deciso eficaz quanto maneira de manipular as ausncias. Quando assim ocorra, freqentemente possvel utilizar um teste prvio para obter a informao necessria.

2.2 Recusas.
Ainda quando o sujeito seja encontrado no ambiente em que se deve fazer a observao, ou para sse ambiente seja trazido, pode acontecer que le recuse a responder ao estmu lo. Essa recusa pode fornecer informao relativa ao sujeito, mas, em geral, no a informao desejada. O problema surgido com as recusas , por vrios aspectos, semelhante ao criado pelas ausncias, embora, via de regra, no haja tantas recusas quanto ausncias. No trato com o problema da recusa, mais uma vez se mostra de maior convenincia a preveno do que a cura. O planejamento de medidas para enfrentar a recusa muitas vzes se confunde com o das ado tadas para reduzir ao mnimo o problema da ausncia. A l gumas bvias medidas preventivas so: (1) Boa publicidade para despertar atitude de co operao nos sujeitos. Essa publicidade deve acentuar a importncia dos resultados da pes quisa. Utilizao de observadores que possuam tato e habilidade e que tenham compreenso e ex perincia do problema.

(2)

404

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(3)

(4)

(5)

Observaes iniciais feitas pelo observador com o objetivo de realar a importncia dos resultados e o importante papel do sujeito. Alm disso, deve-se assegurar ao individuo que a informao obtida dle, ou a seu respeito, no o prejudicar em nenhuma circunstncia. Compensao para os sujeitos, especialmente quando dles fr exigido tempo longo; compen sao ou presente. Mais importante, talvez (e no to bvio), adotar procedimento de obteno de dados que no desperte antipatia do sujeito. No h princpios gerais quanto a sse ponto. Toda via, uma forma de procedimento satisfatria pode ser desenvolvida com base na utilizao de estudo pilto, teste prvio e ao por tenta tiva. sses mtodos sero examinados porme norizadamente no prximo captulo, mas, con vm assinalar, a esta altura, que tais estudos freqentemente resultam em considervel pou pana posterior. Deming assegura (7:36), por exemplo, que estudos-pilotos nos quais se jam aperfeioados os instrumentos de pesquisa e estudados a varincia e o custo, podem me recer emprgo de 5 a 25 por cento da verba global destinada pesquisa.

Possveis, medidas corretivas so (1) realizar maior nmero de tentativas para induzir os que se recusaram ante riormente a, agora, cooperarem, oferecendo-lhes compensao maior e/ou (2) entregar a tarefa a um observador mais experimentado. Em alguns casos, se a recusa persistir, poder-se- recorrer a informaes indiretas. No h mtodo melhor para enfrentar o problema das recusas, desde que as razes que a elas conduzem variam considervelmente e tem havido pouco estudo sistemtico a respeito dsse assunto. 2.3 rro de resposta.

Mesmo que o sujeito seja encontrado e coopere com o observador, respondendo ao estmulo, no se segue que a resposta seja, obrigatoriamente, acurada. Em virtude de falhas de informao, o sujeito pode, sem o saber e sem in-

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

405

teno, dar respostas imprecisas, ainda quando sinceramente empenhado em informar corretamente o observador. De outra parte, a impreciso pode ser deliberada. sse proble ma aparece tanto nas respostas verbais como nas de tipo no verbal. Falsificaes dsse gnero podem ser contornadas, em certa medida, empregando-se procedimentos que tendam a tornar aparentes as falhas, quer ao sujeito, quer ao obser vador. No obstante, sejam quais forem as precaues to madas, natural que persista algum rro de resposta. Em conseqncia, torna-se muito desejvel poder-se medi-lo. O procedimento de pesquisa prtica pode ser planejado de tal forma que algum tipo de medida dsse rro se torne vivel. Consideremos, primeiramente, o caso em que a proprie dade sob exame tenha um nico valor para cada unidade de amostragem, como, por exemplo, a idade no ltimo aniver srio. Vrios tipos de evidncia podem ser utilizados para a determinao da idade. Alguns tipos de evidncia apa recem como um pouco melhores do que outros. Ilustrando, natural supor que uma certido de nascimento seja melhor do que a resposta da pessoa pergunta: Qual era a sua idade no ltimo aniversrio? Entretanto, mais fcil obter a resposta do que examinar certificados. Consideraes de economia podem redundar em preferncia pela indagao direta. Acresce que, provavelmente, ns teriamos que re correr ao sujeito, de qualquer modo, a fim de localizar o ponto em que o certificado poderia ser obtido: resulta que mais simples indagar ao sujeito, na ocasio em que se o entrevistar. Lembrando, porm, que os certificados cons tituem evidncia mais apropriada, as respostas referentes a idades podem ser confirmadas mediante exame dos certifi cados. O procedimento conduz a uma estimativa da acuida de das respostas em tela. Caso o nmero de pessoas envol vidas seja muito grande, a confirmao pode tornar-se muito dispendiosa. Resulta que a verificao da acuidade dever ser conduzida custa de amostras. Exemplificando, imagine-se que em um estudo destinado a estimar a idade mdia de certa populao, se recorra a amostra de uma centena de pessoas, s quais se dirigir a pergunta pertinente. Imaginese que, a seguir, dez indivduos dos cem sejam aleatoriamente selecionados e que os certificados de nascimento dsses dez sejam procurados. A diferena entre idades poder ser de terminada, caso exista, em cada um dos dez casos. Um

406

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

teste poder, ento, ser preparado, a fim de determinar se a mdia das diferenas entre os pares de observaes igual a zero. Caso seja, podemos afianar que as respostas ver bais so acuradas; caso no, um fator de correo ter que ser aplicado s respostas verbais. Pode ser possivel usar amostras em seqncia para simplificar o procedimento de confirmao. Em muitos casos, os dados obtidos pelos observadores a partir de respostas dos sujeitos podem ser confirmados mediante o emprgo de outros tipos de registros como flhas de pagamento, registros e boletins escolares, formu lrios de imigrao, etc.. Em outros casos possvel re correr a pessoas que conheam o trao do sujeito que esteja em tela, empregando as suas informaes para verificar as que so dadas pelo prprio sujeito. sse mtodo precisa ser empregado com muito cuidado porque, normalmente, testemunhas no so dignas de todo crdito. Em outros casos, ainda, certas medidas podem ser tomadas com o fito de corroborar o testemunho. Por exemplo, a altura e o pso que o sujeito diz ter, podem ser diretamente medidos. A manifestao de certas preferncias pode ser corroborada mediante efetivas escolhas observadas em condies experi mentais. H muitas propriedades para as quais a corroborao extremamente complicada, como sucede no caso de eGtudos de opinio ou de atitudes, conduzidos por meio de testes ver bais. Em tais casos pode no existir outra evidncia alm das declaraes verbais do sujeito. possvel, aqui, intro duzir certas propriedades nos estmulos que tornem vivel a determinao da coerncia ou do grau de crdito que as respostas meream. Em sua forma simples e direta, sse procedimento se resume em submeter o sujeito mesma esti mulao em vrios momentos diferentes, anotando a resposta para ver se constantemente a mesma. Ainda que as res postas se mantenham constantemente anlogas, no se pode concluir que se tenha uma resposta acurada; mas o pesqui sador poder consider-la como digna de maior crdito. Em outras palavras, pode-se argumentar dizendo que a compa tibilidade das respostas condio necessria para a acuida de, sem ser, entretanto, condio suficiente. Uma pessoa pode, por exemplo, mentir ou dizer a verdade consistente-

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

407

mente. Segue-se que a consistncia uma comprovao de carter negativo, neste sentido de que uma incongruncia pode levantar as suspeitas do pesquisador sem que, de outra parte, a coerncia lhe possa dar certezas, dando-lhe, se tanto, alguma confiana nas respostas do sujeito. Discutiremos certas medidas destinadas a avaliar o grau de confiana em outra seco deste capitulo, examinando o tema um pouco mais atentamente. 3. Decises de planejamento prtico relativas a ambiente e estmulos de interesse para a pesquisa.

Pode ser nosso propsito determinar uma propriedade psicolgica de um grande nmero de indivduos, um trao digamos, como ascendncia-submisso. No planejamento ideal da pesquisa, o responsvel deve especificar um teste de comportamento idealizado a propsito dsse trao. sse teste pode ser dispendioso e demorado, criando dificuldades com respeito disponibilidade dos sujeitos. As situaes em que os sujeitos sejam suscetveis de observao podem estar ou no estar prximas da situao idealizada. Considere mos, inicialmente, caso em que possvel observar e esti mular os sujeitos uma situao que se aproxima da ideal. Admitamos uma analogia com as cincias fsicas. Supo nhamos que um fsico deseja determinar o comprimento de uma barra de metal temperatura, digamos, de 50 F. Pode revelar-se no prtica a construo do ambiente reque rido. Mas o fsico pode determinar o comprimento da barra de metal em ambiente onde a temperatura seja de, admita mos, 70 F. Acontece que, para certos metais, conhecida a extenso em que a temperatura os afeta; ou seja, conhe cido o coeficiente de dilatao. Aplicando sse conheci mento s medidas que efetivamente realiza, o fsico pode inferir aquilo que seria observado se a medida fsse feita sob as condies idealmente propostas. Suponha-se, porm, que le no conhea o coeficiente de dilatao do metal. Poder verificar qual , fazendo medidas a vrias tempera turas e determinando o acrscimo ou decrscimo de com primento, por unidade de alterao da temperatura. Essa determinao pode ser feita sob temperaturas fceis de atingir.

408

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Recursos anlogos so legtimos tambm no mbito das cincias sociais. H casos em que o pesquisador social conhece a maneira como esto relacionadas a varivel depen dente e a varivel independente, e em que o ajuste necess rio pode ser feito diretamente. Em outros casos, le no dispe dsse conhecimento, precisando, de incio, estabelecer aquela relao. Em conseqncia, poder converter o pla nejamento idealizado de pesquisa (que exige um s valor da varivel dependente em correspondncia com um fixado valor da varivel independente), reduzindo o problema ao de determinar a relao funcional entre duas (ou mais) vari veis. O instrumental estatstico para determinao dessa relao funcional a anlise de regresso. Suponhamos, para ilustrar, que se deseja determinar em quanto tempo uma pessoa executaria certo trabalho (imagi nando-se que o tivesse podido executar uma centena de vzes) na centsima primeira vez. Pode ser desagradvel intimar a pessoa a completar o trabalho 101 vzes, a fim de colher a resposta. luz do que se sabe a respeito das caracte rsticas das curvas de aprendizado (que so, usualmente, curvas com a forma de um S ), possvel constatar a velo cidade com que a pessoa completa a sua tarefa, exami nando um nmero reduzido de casos (menor do que 101), para, a seguir, escolher a curva que melhor se adapte aos resultados observados. Isso permitiria ao pesquisador uma extrapolao que daria meios de prever a velocidade com que a tarefa seria executada na centsima primeira vez. Pode suceder, por exemplo, que depois de dez vzes o tra balhador atinja a velocidade mxima, tdas as posteriores tentativas se completando mesma velocidade admitindose que a fadiga e a impacincia no interfiram. Nos casos em que ambientes e estmulos aproximados sejam utilizados, o pesquisador dever explicitar antecipa damente os tipos de ambientes e de estmulos que sero construdos ou especificar os tipos de medidas que sero feitas em ambientes naturais disponveis; isso permitir uma descrio pormenorizada dos fatores em tela, destinada a tornar vivel a extrapolao e a interpolao. O pesquisa dor dever, ainda, deixar explcitos os mtodos de extra polao e interpolao que vai empregar, justificando sses mtodos custa de conhecimentos tericos e fatuais, ou custa de hipteses relativas s variveis em foco. A inter-

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

409

polao e a extrapolao pressupem a existncia de certa estrutura que justifica a hiptese da existncia de relaes entre as variveis. Quando essa estrutura no se torna explcita, no h meios para analisar a propriedade das concluses obtidas.

3.1 Substitutos verbais.


Imagine-se que se pretenda determinar as preferncias de uma populao quanto a um conjunto de instrumentos, todos les destinados a um mesmo tipo de trabalho. Um levantamento de mercado pode, perfeitamente, apresentar-se com sse objetivo. Exemplificando, podemos desejar saber que tipo de marca de sabo de lavar as donas de casa pre ferem. Em condies ideais, gostaramos de colocar as donas de casa em uma situao em que elas desejassem sabo de lavar, oferecendo a cada uma delas uma s das marcas sob escrutnio. Observaramos a escolha feita. Se a amos tra de donas de casa muito ampla, o mtodo idealizado se torna pouco prtico e muito dispendioso. Em conseqncia, o seguinte ajustamento ser necessrio: exibir s donas de casa as diferentes marcas e perguntar a cada uma delas a marca preferida, caso houvesse margem de escolha. Talvez se precise recorrer a mais uma simplificao, se no fr pos svel exibir s donas de casa tdas as marcas de sabo de lavar; as diferentes marcas seriam apenas mencionadas, per guntando-se, ento, dona de casa, que marca ela prefere. Em cada uma dessas duas modificaes do plano ideal temos o que se chama substituto verbal, a figurar no lugar do que seria a resposta ostensiva. Com efeito, o pesquisador pode obter um substituto verbal, que figure no lugar do ambiente e do estmulo idealmente especificados, aceitando-o como substituto da resposta ostensiva idealmente especificada. A capacidade de empregar instrumentos verbais de pes quisa , ao mesmo tempo, vantagem e desvantagem para o cientista social. Vantagem, porque permite ao pesquisador investigaes em situaes onde probltmas de ordem prtica tornariam impossvel uma similaridade com a situao ideal. Entre os problemas de ordem prtica, dois, principalmente, despontam: (1) a dificuldade em manter indivduos e grupos em ambientes especialmente preparados, por longos perodos de tempo e (2), ainda quando superada a dificuldade ante

410

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

rior, o alto custo (freqentemente inevitvel) das pesquisas conduzidas em condies ideais. A desvantagem das tcnicas verbais reside no fato de que seu emprego introduz inmeras novas variveis no pro cedimento de pesquisa e, conseqentemente, novas fontes de rro. tentador ignorar essas variveis "aborrecidas, fon tes de erros, j que, via de regra, muito difcil avaliar os seus efeitos sbre as pesquisa. Uma avaliao satisfatria das tcnicas verbais exigiria que a sociedade se dispusesse a dar recursos e oportunidades ao cientista social, permitindolhe a execuo de grande quantidade de testes a respeito do comportamento no verbal. Enquanto melhor idia das tc nicas verbais no se torna vivel, o que importa aumentar a eficcia dos testes verbais e dos questionrios. Isso importa em mostrar, no planejamento de testes verbais e de ques tionrios, que ajustamentos ser preciso efetuar sbre as respostas verbais aos estmulos verbais a fim de conseguir boas inferncias em outros tipos de comportamento. H uma diferena entre o teste verbal e o questionrio que til explicitar e manter. O teste empregado a fim de determinar certa caracterstica de um indivduo ou grupo, sabendo-se ou presumindo-se que o sujeito (ou os sujeitos) no sabe (1) se tem ou no tem a caracterstica e (2) em que extenso tem a caracterstica.* O questionrio empre gado quando j conhecido ou admitido que o sujeito (ou os sujeitos) sabe ou pode estimar, dentro de certa margem de rro, se tem certa propriedade ou a extenso em que a tem. Exemplificando, se desejarmos medir a capacidade de aprendizado, a estrutura de personalidade, a inteligncia, de uma pessoa, usaremos os testes, j que no acreditamos que um indivduo possa dar-nos informaes dsse gnero diretamente. De outro lado, a fim de saber a idade, a renda ou (em certo casos) as opinies e atitudes, de uma pessoa, usaremos o questionrio, colocando as perguntas diretamente ao interessado. Consideraremos os testes e questionrios separadamente, ainda que sejam muito seme lhantes as tcnicas utilizadas na sua elaborao.

* Em algumas ocasies se reserva o trmo teste para fa referncia a um instrumento destinado a medir capacidades. O uso do trmo, aqui, no assim restringido.

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

411

3.1.1. Planejamento do teste.


Psiclogos, psiclogos sociais e socilogos empregaram mais tempo desenvolvendo mtodos para elaborao de tes tes e de questionrios do que para elaborao de qualquer outro tipo de instrumento de pesquisa. Isso se deve ao fato de que os testes e questionrios so largamente utilizados nas cincias que merecem a ateno de tais estudiosos. Seria preciso um livro muito maior do que ste somente para descrever os vrios mtodos existentes, de modo que reme temos o leitor para (10), por exemplo; um bom sumrio a respeito da espcie de medida que est na base do plane jamento de testes, encontra-se no artigo (6). Aqui ns nos limitaremos a falar de um tipo de planejamento de testes mais elaborado e difcil de aplicar do que a maioria dos comumente encontrados. Mas, que tem, no obstante, diver sas e importantes vantagens sbre outros tipos alternativos, como: (1) completamente geral (i. , pode ser aplicado para testes destinados a medir qualquer propriedade psico lgica ou social); (2) conduz a um mximo de informao; e (3) permite elaborar testes cujos resultados possuem signi ficado preciso. Procedimentos adotados para planejar testes, como os afamados procedimentos desenvolvidos por Thurstone (35), Guttman (32) e Lazarfeld (32) so mais fceis de usar do que aqule que vamos descrever; permitem elaborar os testes em tempo menor do que o que vamos apresentar. Sero, pois, preferveis, se o fator tempo for crtico. Mas, padecem do defeito (comum a vrios outros mtodos) de no nos darem meios de saber se o teste elaborado mede, efetivamente, a caracterstica ou a propriedade que, supostamente, devem medir. Do apenas uma certeza intuitiva de que os resul tados obtidos so relevantes para o problema em discusso.

3.1.1.1 Uso de definies na construo de testes.


Nenhum dos mtodos usuais de construo de testes emprega, de modo sistemtico, a definio da propriedade a ser determinada na elaborao do teste. Usam a definio simplesmente como um guia intuitivo para a seleo dos itens que comporo o teste. No de espantar que assim seja, pois, na maioria das vzes as definies so de tal modo

412

P L A N E JA M E N T O

DE

PESQ UISA

SOCIAL

formuladas que no possvel empreg-las de modo siste mtico no planejamento. Considere-se, por exemplo, o seguinte par de definies, empregadas por Allport e Thurstone, respectivamente, na preparao de seus conhecidos tes tes de trao e de atitude. Allport, como se recordar, definiu trao como um sistema neuropsquico generalizado e con centrado (peculiar ao indivduo), com a capacidade de tornar funcionalmente equivalentes vrios estmulos e de iniciar e orientar formas (equivalentes) de comportamento adaptativo e expressivo (2:295). Thurstone define atitude como a totalidade-soma das inclinaes e sentimentos, preconceitos ou distores, noes preconcebidas, idias, temores, convic es que uma pessoa manifeste em relao a qualquer tpico especfico (35:6-7). Nenhuma dessas definies orienta o pesquisador no sentido de encontrar mtodo para responder perguntas pertinentes relativas aos traos ou atitudes. Com efeito, tomemos a definio de Thurstone ao p da letra e vejamos o que acontece. Em primeiro lugar seria necessrio caracterizar as popu laes de (a) inclinaes, (b) sentimentos, (c) preconceitos ou distores, (d) noes preconcebidas, (e) idias, (f) temores, (g) intimidaes e ( h ) convices. A seguir, seria necessrio fazer uma contagem completa de cada uma das populaes ou, na pior das hipteses, obter amostra probabilstica. Uma estimativa da soma teria que ser feita, admitindo que o pesquisador pudesse chegar a medidas com parveis, capazes de serem adicionadas. O que sucede, com efeito, que nada disso se faz nem se tenta fazer por motivos bvios. Os itens do teste so escolhidos, em verdade, porque parecem pertinentes, e no porque se possa demonstrar que assim acontea, a partir da definio. Os itens, alm disso, no fornecem processo de medida aparen te. No teste em que se mede a atitude para com a igre ja (36), por exemplo, figuram itens como stes: Considero a igreja como um monumento ignorncia humana. Penso que a igreja o mais notvel fator de reerguimento humano. Pede-se, ento, ao sujeito, que assinale os itens com os quais esteja inteiramente de acrdo. Itens assi nalados e no assinalados parecem informar a respeito de uma atitude, como definida acima, sem que, porm, se disponha

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

413

de demonstrao de que assim realmente suceda. A defini o no facilita o trabalho de busca de uma eventual demons trao. O requisito fundamental no processo de elaborao de testes aqui discutido, a formulao de uma definio c/enffica da propriedade ou das propriedades em foco. As con dies para que uma definio seja satisfatria, foram apre sentadas no captulo iii. Em resumo, dissemos que uma definio cientfica deixa explcitas as condies e as opera es a levar em conta, a fim de que perguntas a respeito do conceito definido possam ser cientificamente respondidas. Uma vez que ns vamos ilustrar o procedimento empre gando o trao ascendncia-submisso, comecemos formulando uma definio cientfica dsse trao. Na situao de ascendncia e submisso, o sujeito en frenta o seguinte conjunto de condies: um ato agressivo se consumou, diminuindo a eficcia do comportamento do sujei to, em relao a um de seus objetivos. Em outras palavras, o estmulo um ato agressivo. A resposta que nos interessa a tentativa do sujeito de reagir ao agressor, isto , de controlar o agressor, ao invs de se ver por le controlado. Estamos, portanto, interessados em saber se o sujeito reage agresso e como reage. Podemos definir o comportamento de ascendncia e sub misso em trmos dos seguintes aspectos do comportamento do sujeito: (1) Uma resposta do sujeito A a certo ato de outro indivduo (B ) , quando o ato de B tem a funo de diminuir a eficcia do comporta mento de A, relativamente a um dos objetivos de A; em suma, quando B agride A. Um potencial produtor de reduo de eficcia do comportamento de B, relativamente aos objetivos de B.

(2)

Em trmos dsses aspectos do comportamento, o seguinte padro comportamental pode ser definido: (a) (b) Exibir (1) e (2) um ato de ascendncia. Exibir (1) e (no-2) ato de submisso.

414

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

(c) (d)

No exibir (1) mas exibir (2) um ato agres sivo (mas no de ascendncia). Deixar de exibir (1) e (2) no constitue agresso nem submisso.

O "grau de ascendncia de um indivduo pode ser definido como a probabilidade de que escolha o padro comportamental (a) e o grau de submisso pode ser definido como a probabilidade de que escolha o padro comportamental (b ) . A soma dessa probabilidades poder ser cha mada grau de conhecimento ou de conscincia da agresso. Com essa definio de grau de ascendncia, podemos perceber imediatamente o que se perde, quando se usam tes tes verbais no lugar de ambientes adequadamente preparados. No teste verbal ns perguntamos ao sujeito quantas vzes le teria a tendncia de responder de certa maneira, em pre sena da agresso. Essa pergunta, na melhor das hipteses, nos dar indicaes a respeito da resposta agresso quando o sujeito est consciente da agresso e da sua resposta. Muitas pessoas, contudo, reagem agresso sem estar intei ramente conscientes quer da agresso, quer da sua resposta. Logo, o mtodo do questionrio verbal servir, quando muito, para recolher evidncia relativa sensibilidade do sujeito s agresses quando le est perfeitamente consciente do ato agressivo (no sentido de que pode recordar a agresso e a sua resposta). Medida mais geral da ascendncia depen deria de outra evidncia, alm do testemunho oral do sujeito, ou dependeria de mtodo de inferncia, que levasse das res postas inconscientes s conscientes. A definio de ascendncia e submisso, que oferecemos a ttulo de ilustrao, vem dada em trmos de comportamento aberto, ou ostensivo. Para construir um teste verbal dsse trao, uma traduo do modlo ostensivo para o modlo ver bal ter que ser preparada. A definio deixa claro que os itens de um teste desti nado a examinar a ascendncia e a submisso devem permi tir estimativa da freqncia com que um sujeito exibe certo tipo de comportamento em circunstncias especficas. Deter minao dsse tipo no pode ser feita sem rro e sem custo conseqente. Procedimento verbal, portanto, s se justifica se o custo dsse rro, adicionado ao custo da aplicao do

FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

415

teste, fr inferior ao custo de outro mtodo ou de combi nao de outros mtodos. V ia de regra, o pesquisador ignora se assim acontece ou no; le o admite. Essa hiptese no significa que o investigador espere respostas absolutamente perfeitas; significa, porm, que le espera obter o mximo de informao pelo mnimo custo. Deve-se notar que o mtodo de planejamento, que esta mos descrevendo, nos d uma estimativa da preciso (grau de confiana) das respostas do sujeito. O teste completo conter o que pode equivaler s repeties das mesmas situa es, repeties que sero a base para estimar a preciso. Ainda que a hiptese da acuidade das respostas verbais esteja em jgo neste processo de planejamento de testes, importante registrar motivos de falha da hiptese a fim de que se tenha uma orientao para ulteriores investigaes destinadas a verificar a procedncia das suposies feitas. Porque, de fato, a particular situao pode parecer "irreal ao sujeito, de modo que se torna difcil, para le, imaginar o que faria naquelas circunstncias. Para ilustrar, imagine mos que a uma pessoa aborrea as viagens por via frrea; se lhe perguntamos o que faria no caso de algum interferir em sua vida, no momento da compra de uma passagem, seu desgosto por tda a situao viria alterar a sua noo a respeito da atitude que tomaria. Se perguntarmos a um indi vduo inteiramente desprovido de recursos o que faria se encontrasse algum na cabine do trem dormitrio, que hou vesse reservado, sua falta de familiaridade com situaes do gnero poderia distorcer a sua resposta. sse ltimo ponto traz implcita a idia de que as situaes propostas por um teste devem ser escolhidos, considerando-se, pelo menos, o status social e econmico dos entrevistados.

3.1.1.2 Uso de atributos relevantes a de variveis na elaborao de testes.


Ao definirmos a propriedade a ser medida por meio do teste, o que, em verdade, estamos fazendo caracterizar o ambiente, o estmulo e a resposta a observar. Devemos deci dir se aqules elementos ho de ser mantidos constantes ou variar e, no caso de variao, quais as alteraes a serem introduzidas. Presumivelmente essas decises tero sido to madas durante o planejamento do modlo ideal. Vejamos,

416

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

contudo, como podem ser introduzidas modificaes de car^ ter prtico no planejamento do teste de escendncia-submisso. O ambiente especificado na definio como aqule em que o sujeito observado (A ) est buscando atingir algum objetivo (O ). Em conseqncia, sse ambiente pode alterarse de maneira significativa, com respeito intensidade com que o sujeito deseja (i. , pretende alcanar) o objetivo que vem perseguindo. Essa , obviamente, uma varivel relevan te, pois, claro est que se uma pessoa interfere com outra, o que esta outra far depende de quo importante considere o objetivo que est visando. O grau de intensidade com que o sujeito se empenha em alcanar o objetivo (intersse) , portanto, varivel relevante. O estmulo decrscimo da eficcia da atividade do sujeito, resultante do comportamento do agressor tam bm relevante. Parece claro que a reao ao agressor de pende da intensidade da agresso. Podemos medir a inten sidade da agresso e, em conseqncia, a intensidade do est mulo, em trmos do decrscimo da eficcia, de responsabi lidade do agressor. Enfim, temos a eficcia da resposta do sujeito para atingir o ;eu objetivo. Isto , desejamos no apenas saber com que freqncia um indivduo escolhe comportamento ascendente ou submisso, mas ainda, a alterao dessa fre qncia diante da eficcia dos meios disponveis para atingir o fim colimado. Podemos caracterizar cada uma das situaes ascendncia-submisso em trmos de (a) o grau do intersse do sujeito em seu objetivo; ( b ) a intensidade do estmulo agres sor; e (c) a eficcia dos meios disponveis para atingir o objetivo. Essas so as variveis relevantes da situao ascendncia-submisso que desejamos variar. O problema agora o de saber como faz-las variar. 3.1.1.3 Variao dos atributos e das variveis do teste.

Deixamos explcitas as variveis relevantes que devem sofrer alterao. Devemos decidir agora como alter-las. De nvo cabe dizer que essas decises foram, presumivelmen te, adotadas em anteriores estados do planejamento.

A FASE OBSERV. DO P L A N E JA M E N T O DA PESQ.

PRTICA

417

Suponha-se, por exemplo, que decidimos expressar a propriedade a ser observada como uma funo das proprie dades relevantes. Desejamos, portanto, expressar as proprie dades relevantes como variveis que podem assumir qualquer valor ao longo de uma escala continua e determinada. Por exemplo, podemos desejar expressar o grau de ascendnciasubmisso em funo das trs variveis acima relacionadas. Sendo sse o nosso intersse, poderamos planejar o teste de maneira a realizar anlise de regresso mltipla. Podeiramos determinar quantos e quais os valores das trs vari veis se faria necessrio adotar para atingir a acuidade e preciso requeridas pelos objetivos da pesquisa. Por outro lado, podemos desejar, simplesmente, determi nar qual seja o grau de ascendncia ou submisso e deter minar se as variveis relevantes afetam-no separadamente ou em combinao com outras variveis relevantes. Poderamos, em tal caso, recorrer a um planejamento de teste baseado numa anlise de varincia. Como ilustrao, consideraremos caso dsse tipo. A deciso de testar apenas o efeito das variveis, e no o grau real dsse efeito, deve, na prtica, depender dos objetivos da pesquisa. No tipo de planejamento de teste baseado na anlise de varincia, as escalas ao longo das quais variem as trs variveis devem ser divididas em intervalos. O nmero de intervalos escolhido depender de consideraes de vria ordem, mas tdas dependentes dos propsitos da pesquisa. Um aspecto importante o nmero de itens a incluir no teste. Por exemplo, se empregamos o tipo de anlise de varincia apresentado no teste n. 32 (ver seco 2.1.3, cap. vii) e se deliberamos utilizar cinco valores de cada uma das variveis pertinentes, ser necessrio dispor de, no mnimo, 5 x 5 X 5 = 125 itens *. Se quisermos quatro valores de cada, precisaremos de 4 X 4 X 4 = 64 itens. Quando o teste de ascendncia e submisso foi delineado pela primeira vez, usaram-se trs valores de cada varivel e cada combinao era repetida uma vez, perfazendo um total de 2(3 X 3 X 3) = 54 itens. Acreditou-se que o teste fsse muito longo para os sujeitos, deliberando-se reduzi-lo mediante separao

* O projeto do Quadrado Latino e o do Bloco Incompleto, e gindo menor nmero de clulas, conduzem a erros mais apreciveis. O custo resultante dsse aumento de rro deve ser pesado contra o custo causado pelo aumento do nmero de itens, ao selecionar o teste.

418

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

de propriedades, o que redundou em 2(3 X 2 X 2) = 2 4 itens, que parecia nmero adequado. A seleo dos inter valos de atributos foi feita dste modo: A primeira propriedade (a), ou seja, o interesse do sujeito pelo seu objetivo, pode ser expresso ao longo de uma escala contnua percorrendo o intervalo de 0 at 1, onde 0 representaria a total ausncia de intersse e 1 representaria o mximo intersse (Veja-se [5] para os pormenores de tal escala). Mas, a escala pode ser repartida em intervalos adequados, Aqui, a escala de intensidade separada em trs intervalos: alto (intenso), moderado e baixo intersse (desintersse). Isso significa que os intersses altos, de .67 para cima, so essencialmente idnticos do ponto de vista dos objetivos da pesquisa. bvio que se admite estar o sujeito capacitado a compreender que trmos do tipo extremamente importante e crtico se referem a sse intervalo. Da mes ma forma, intensidades que oscilam entre aproximadamente .33 e aproximadamente .67 so igualmente idnticas (mode radas), admitindo-se que o sujeito entenda que expresses como interessado moderadamente se aplicam neste inter valo. Observaes anlogas podem ser feitas para o inter valo de .00 at .33 (baixo). Os valores de atributos podem ser representados sim bolicamente dste modo: a! = intersse baixo a2 = intersse moderado a3 = intersse elevado A intensidade do estmulo (b) pode ser medida em fun o do decrscimo da eficcia do sujeito na perseguio de seu objetivo. Uma vez que a escala de eficcia tambm varia de 0 a 1, a nova medida variar, da mesma forma, entre 0 (estmulo mnimo) e 1 (estmulo mximo). (Vejase [5] para os pormenores a respeito dessa escala). Aqui, a escala ser repartida em duas faixas: de 0 a.5 (baixa in tensidade do estmulo) e de .5 at 1.0 (alta intensidade do estmulo). As hipteses feitas, quando falvamos da inten sidade do intersse, transportam-se para c. Os dois atri butos agora considerados podem ser representados desta maneira:

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ.

PRTICA

419

bi = baixa intensidade do estmulo b j. = alta intensidade do estmulo Por fim, h a varivel (c) : a eficcia das respostas acessveis ao sujeito, n busca do objetivo original. Isto , as vias de ao abertas ao sujeito podem ser mais ou menos eficazes na consecuo do objetivo que o sujeito visa no momento da agresso. Essas flutuaes podem afetar a res posta do sujeito agresso; por exemplo, se h pequena margem para alcanar o objetivo, o sujeito pode reduzir a objeo interrupo causada pela agresso. A eficcia tambm pode ser medida em uma escala probabilstica de 0 a 1. Essa escala ser dividida em duas partes: de 0 a .5 (baixa eficincia) e de .5 a 1.0 (alta eficincia). Usaremos as seguintes representaes simblicas: C! baixa eficincia cL > = alta eficincia Qualquer situao ascendncia-submisso pode ser, ago ra, descrita em trmos das trs propriedades e dos atributos em que foram divididas. A tabela 22 indica tdas as pos sveis situaes, considerada a separao das propriedades que foi feita acima. Pode-se ver, examinando a tabela, que h doze situaes diferentes de ascendncia e submisso, caso as variveis se alterem da maneira indicada.
T
abela

22

POSSVEIS Intensidade

SITUAES do estimulo

DE

A SCE N D N CIA bi

SUBMISAO ba

Intensidade

da

resposta ai

Ci

C a

C l

C a

Grau de intensidade (interesse)

aa
a3

420

p la n e ja m e n to

de

p e s q u is a

s o c ia l

necessrio, a seguir, deliberar a respeito das caracte rsticas da resposta do sujeito que devem ser examinadas. J indicamos (ao definir trao) que nosso intersse est orientado para a probabilidade de selecionar um ato de ascen dncia ou de submisso. Num teste verbal o sujeito pode ser solicitado a indicar a freqncia de suas escolhas de um modo qualitativo, assinalando expresses como: nunca, prticamente nunca, ocasionalmente, metade das vzes, freqentemente, muito freqentemente e sempre. Se o sujeito se defronta com um conjunto de respostas que se presume sejam exaustivas, desejvel que a soma das fre qncias indicadas nas suas respostas seja igual de sem pre", j que le deve escolher uma resposta em cada situao. Isso muito difcil de conseguir quando se empregam esti mativas qualitativas da freqncia. Segue-se que mais interessante, nesse caso, pedir ao sujeito que faa uma esti mativa da porcentagem das vzes que le selecionaria cada uma das alternativas, instruindo-o para que mantenha a soma das porcentagens atribudas a cada alternativa igual a 100. Na verdade, a resposta, em qualquer situao, nem puramente de ascendncia, nem puramente de submisso, podendo ser caracterizada por um valor da escala a in tensidade. A medida em que a resposta afeta o agressor constitue medida da intensidade da resposta. A ascendncia pura e a submisso pura no passam de extremos, superior e inferior, da escala de intensidade. O valor de uma resposta pode ser caracterizado em funo da distncia a qualquer dsses extremos. O afastamento do limite de ascendncia medida de submisso; o afastamento do limite de submisso medida de ascendncia. A resposta do sujeito estudada em relao com o efeito que exerce no comportamento do agressor, tornando-se, pois, desejvel determinar a relao entre a probabilidade de certa resposta e a intensidade do revide que a resposta pode pro vocar. Essa intensidade pode ser medida pela diminuio da eficcia do objetivo do agressor. Essa escala, que tam bm varia de 0 a 1, ser dividida em trs intervalos: di = baixa intensidade (0-.33) d2 = intensidade moderada (.33-.67) d3 = alta intensidade (.67-1.00)

A FASE OBSERV. DO P L A N E JA M E N T O DA PESQ. PRTICA

421

Isso completa a especificao de atributos que sero sub metidos a variaes e a especificao dos valores que pode ro ser atribudos aos atributos. necessrio, ainda, plane jar a anlise estatstica das respostas dadas pelos sujeitos, individualmente considerados. A fim de determinar proprie dades da populao, usando amostras, devemos estar capa citados, em primeiro lugar, a caracterizar cada um dos sujeitos da amostra. Isso psto, precisaremos mostrar de que modo se caracteriza a populao, partindo das caracte rizaes dos sujeitos que compem a amostra. J se indicou que nesse teste se empregar a anlise de varincia. O particular projeto a ser utilizado requer que haja uma situao teste em correspondncia com cada uma das doze situaes exibidas na tabela 22, e requer que em cada situao se possa determinar a probabilidade do sujeito escolher respostas de intensidades diferentes. desejvel ter, para o teste inicial, estimativas de con fiana (preciso). Nesse sentido, a confiana a disperso das respostas de um indivduo mesma pergunta ou per gunta ou perguntas equivalentes. Duas situaes podem ser consideradas equivalentes se tm o mesmo valor para o atributo; isto , se caem na mesma clula da tabela 22. Caso existam dois itens para cada clula, a medida de confiana vivel. H outros meios disponveis para obter estimativas da confiana (ver [15]). A duplicao dos itens um dos mtodos mais simples e informativos, embora exija mais itens do que outros mtodos. O importante, porm, que se pla neje o teste de modo a existir uma possibilidade de estimar a confiana. Medidas de confiana sero debatidas abaixo (ver seco 3.1.1 .7) . Agora, tratemos dos itens do teste. 3.1.1.4 Planejamento dos itens do teste.

As consideraes e decises que acabamos de fazer e tomar ditam os requisitos que norteiam a escolha dos itens individuais que comporo o teste. Desejamos preparar vinte e quatro itens, dois para cada clula da tabela 22. Cada item deve conter uma descrio de circunstncia de ascendncia-submisso. Implica isso em especificar a natureza da agresso estimuladora e a importncia do objetivo para o sujeito, no momento dessa agresso. Em seguida, deve ser

422

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

colocado um conjunto de respostas alternativas, igualmente eficientes com relao quele objetivo, mas que variam quanto intensidade do efeito que produzem sbre o agressor. Fi nalmente, deve ser deixado espao para que o sujeito indique a freqncia com que escolheria cada alternativa. Examinamos um dsses itens e sua elaborao.
No domingo, de modo atrs do Voc (1) (2) (3) tendo nada melhor para fazer, voc decide descansar no passeando cm seu automvel. Voc para num cruzamento, a permitir que um pedestre atravesse a rua. Um carro para seu e o motorista comea a buzinar de maneira irritante.

Diz a le que deixe de tocar a buzina, ou, deliberadamente, retarda a partida para ret-lo mais do que o necessrio? ..........% Lana-lhe um olhar carrancudo, sem dizer nada? ..........% Ignora-o e procede como de hbito? ..........%

Os pressupostos dsse item so os seguintes: (1) (2) O objetivo do sujeito descansar. O grau de intensidade do intersse por atin gir o objetivo baixo (a i); falou-se em no ter nada melhor para fazer. A intensidade do estmulo alta ( b2); ou seja, falou-se em "irritante. A eficcia das alternativas alta (c2) , pois o passeio ser retomado normalmente, em qual quer caso.

(3) (4)

Portanto, esta uma situao ax -b2-c2. Os pressupostos de resposta a respeito dsse item so os seguintes: (1) As trs respostas so igualmente eficazes para a consecuo do objetivo, pois seja qual fr a escolhida, ser possvel retomar calmamente o passeio. A resposta (1) tem o propsito incisivo de reduzir a eficcia do outro motorista (d s); a resposta (2) reduz-lhe a eficcia brandamente (d2); e a resposta (3) pouco lhe afeta a efi ccia (dx) .

(2)

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ.

PRTICA

423

A ordem das respostas alternativas deve ser aleatria, pois de outra maneira o sujeito pode tender a assinal-las automticamente, fazendo com que sofram desvio conside rvel. Examinemos outro item.
Voc est lendo ura bom livro na biblioteca e quer muito terminar a leitura. Um conhecido impertinente e persistente entra e comea a conversar. Com base em experincia anterior, voc sabe que prati camente impossvel desencoraj-lo. Voc (1) (2) (3) Daria respostas breves e mostraria sua irritao? Fingiria ter um encontro e se desculparia? Entraria na conversao sem notar a interrupo? ..........% ..........% ..........%

Os pressupostos dsse item so os seguintes: (1) (2) (3) O objetivo do sujeito 1er um bom livro". A intensidade elevada (a3) o sujeito dese ja muito continuar a leitura. A intensidade de estmulo alta (b2) a interrupo reduz a probabilidade de leitura virtualmente a zero. A eficcia das alternativas alta ( c ), desde que a situao tal que o leitor, faa o que fizer, no ter possibilidade de continuar a lei tura. Ou seja, admitimos que o sujeito est cerceado por costumes sociais de maneira que lhe impossvel levantar-se, sair e continuar a leitura em outro local.

(4)

Os pressupostos da resposta a respeito dsse item so os seguintes: ( 1) As trs respostas so de eficcia igual em re lao ao objetivo, pois, pela natureza da situa o, nenhuma delas eficaz. A resposta (1) de intensidade moderada (c/2); a resposta (2) de intensidade elevada (d3); e a resposta (3) de baixa intensidade (dt).

(2)

424

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Comparando duas situaes quaisquer da espcie a que acabamos de aludir, faz-se claro que diferem com respeito a variveis que, embora no consideradas, podem afetar a res posta do sujeito. No caso da interrupo da leitura, por exemplo, seria considerado falta de polidez, ou grosseria, escolher a resposta de maior intensidade, mas isso no se daria necessriamente no caso do motorista. Ou seja, numa das duas situaes, aparece um estranho; na outra, um co nhecido. Idealmente, desejamos determinar qual a resposta do sujeito quando no surgem essas variveis pertubadoras, mas praticamente no podemos elimin-las. Tornando alea trias tdas essas influncias, podemos, entretanto, anularlhes o efeito. Se, por exemplo, a anlise de varincia aplicada s respostas, podemos valer-nos dela para determi nar se as variveis controladas afetam as respostas, contanto qe as variveis no controladas se alterem de maneira alea tria. Se o pesquisador suspeita que uma varivel no con trolada est exercendo influncia sbre os resultados, de maneira no aleatria, tratar de avaliar cada item com respeito quela varivel, e elimin-la atravs do uso da anlise de covarincia. Uma forma de verificar a presena de efeitos sistemti cos de uma varivel no controlada indagar dos entrevista dos (depois de haverem terminado o teste) porque responde ram cada item da maneira como o fizeram. Se dessas explanaes resulta uma explicao coerente, < um motivo que no se relacione com uma varivel controlada razo vel concluir estar presente uma varivel perturbadora. Desde que esta influncia seja identificada, pode-se planejar a sua eliminao usando uma seleo aleatria da varivel dos itens do teste. Suponha-se, por exemplo, suspeitar que um atri buto do agressor, sua condio de amigo ou estranho, esteja influenciando os entrevistados. Pode-se ento usar um nmero igual de itens envolvendo amigos e estranhos, colocando os atributos, aleatoriamente, em itens diversos.

3.1.1.5 Pressupostos gerais do planejamento de testes.


No processo de elaborao de testes, h que ter em conta pressupostos gerais, que dizem respeito ao projeto em totali dade, e pressupostos especficos (alguns j anteriormente mencionados), que dizem respeito a itens especiais do mesmo

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ.

PRTICA

425

teste. Alguns dos pressupostos podem parecer de impor tncia reduzida, mas cabe lembrar que se manifestam em todos os projetos de pesquisa, sejam les de carter psicol gico, social ou outros. D-se, porm, que, no planejamento da maioria dos testes psicolgicos e sociais, o pesquisador deixa de formular explicitamente suas presunes e, por isso mesmo, no as expe apreciao crtica. Pressuposto geral I: Para cada uma das doze combi naes de atributos, h, para um dado sujeito, trs probabi lidades (Pi, P 2, Pz) com as quais se designam, respectiva mente, cada uma das trs respostas alternativas. Cada Pi. a medida verdadeira da probabilidade do sujeito escolher aquela particular resposta (i), quando tdas as respostas alternativas apresentam igual eficcia como caminhos para atingir o fim desejado. A soma dessas probabilidades igual a um. Importa recordar que "trao foi definido como com portamento tpico, independente de eficcia. Em conseqn cia, se se quer isolar o trao de comportamento, necessrio que, para os objetivos do entrevistado, cada uma das res postas alternativas prsas ao esquema ascendncia-submisso tenha a mesma eficcia. Presume-se, portanto, que, para cada situao caracterizada de maneira nica pelos atribu tos pertinentes, h verdadeira probabilidade de escolha de cada resposta qualificada pelo atributo de intensidade (d). Presume-se, alm disso, que as alternativas cobrem tdas as possibilidades; em todos os casos, uma dessas alternativas h de ser escolhida. Pressuposto geral II: O valor esperado das estimativas do sujeito, relativamente freqncia com que selecionar cada resposta, igual verdadeira probabilidade de selecio nar a resposta P t tal como assentado no pressuposto I, acima. Em outras palavras, presume-se que o mtodo de avaliao usado pelo sujeito no apresente desvios. sses dois pressupostos so os de carter mais geral. Sua validade necessria para garantir a pertinncia de todo o procedimento. Por serem to gerais, entretanto, faz-se freqentemente muito difcil examinar-lhes a validade. aconselhvel, portanto, ocasionalmente, relacionar pressupos tos que se apresentem como aspectos especiais dos dois cita

426

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

dos. E stes ltimos foram referidos aps os dois itens acima indicados. Deve-se deixar entendido que alguns dsses pressupos tos podem no ser vlidos com referncia a certo sujeito. Presume-se, por exemplo, que certos fins tm alto (ou baixo) intersse para quase todos os membros de certa classe, com vistas qual o teste planejado. Pode ocorrer, contudo, que, relativamente a certo indivduo, essa propriedade geral da populao no se manifeste. E assim, relacionando as presunes feitas para justificar a incluso de um item, o pesquisador estar apto a decidir, com relao a sujeitos es pecficos, se a resposta dada ao item deve ou no ser con siderada. Em itens tais como os que, para propsitos ilustrativos foram apresentados no teste de ascendncia-submisso, admi te-se que as trs respostas alternativas apresentam eficcia igual para consecuo dos objetivos do entrevistado. Alm disso, a cada uma das respostas atribui-se um valor de inten sidade. A presuno de eficcia igual e o valor de intensi dade atribudo podem ser submetidos apreciao de rbi tros; e proceder assim altamente desejvel. De tal forma, essa presuno pode tambm ser verificada. Descreveremos na prxima seco procedimento que se pode adotar para sse fim. Nos itens relativos a ascendncia-submisso, aparecem assinalados os objetivos relevantes em cada circunstncia. bvio, porm, que h numerosos conjuntos de objetivos que poderiam acompanhar o assinalado, em qualquer ambi ente. Presume-se que o sujeito, quando estimadas as fre qncias de suas respostas, ter em conta, de maneira alea tria, ambientes outros em que os padres apresentariam alguma eficcia para diferentes objetivos. Em outras pala vras, a questo que ser levantada naturalmente por qualquer sujeito a de que sua resposta depende de outras possibili dades apresentadas pela situao, e isso , indubitvelmente, verdade. Mas admite-se que a resposta do sujeito corres ponda freqncia relativa de certa espcie de comporta mento em qualquer situao possvel. As instrues que o teste inclua devem esclarecer sse ponto para o sujeito. Determinado teste pode adequar-se a uma populao apenas. Pode no ter cabimento, por exemplo, aplic-lo a

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ.

PRTICA

427

fazendeiros ou habitaes de reas rurais. Em conseqncia, o teste h de ser planejado tomando em conta a populao a estudar. Se necessrio, caber dividir a populao em strata e elaborar testes para cada qual dles. Definio explcita e precisa da populao e dos strata imprescin dvel para adequado planejamento dos itens. A correspondncia entre situaes postas pelo teste e situaes reais pode ser verificada atravs de rbitros, aos quais se pea para avaliarem o teste antes que le seja apli cado. Pode-se perguntar-lhes, por exemplo, com que fre qncia enfrentaram as situaes apresentadas. Situaes incomuns devem ser eliminadas. No se pode confiar em que o sujeito responda apenas s perguntas relativas a situa es em que j se encontrou. le responder outras e essas respostas podem, por isso mesmo, carecer de acuidade. Uma vez escolhidos os itens, importante que a ordem final em que se disponham no teste no venha a introduzir desvios nas respostas do sujeito. Os itens no devem, por exemplo, ser ordenados no sentido de menor para maior intensidade de estmulo. Para evitar que isso acontea, pode-se atribuir um nmero a cada item, e orden-los no teste de acrdo com uma tabela de nmeros aleatrios. A mesma disposio aleatria deve ser dada s respostas alter nativas. A resposta que assinale caracterstica de ascendn cia no deve, por exemplo, ser colocada em primeiro lugar entre as alternativas. Sua posio deve variar aleatoriamente. Essa disposio aleatria tende a levar o sujeito a considerar separadamente cada item e reduz ao mnimo a inclinao por advinhar, ou por antecipar o item prximo e a resposta a le. Qualquer teste, verbal ou no verbal, deve acompanharse de um conjunto de instrues. Estas devem ser dadas com o objetivo de reforar as presunes englobadas no teste, esclarecendo, de antemo, dvidas que o sujeito possa ter. De modo geral, convm incluir um exemplo, para mostrar como devem ser dadas as respostas. Instrues para um teste de ascendncia-submisso poderiam, por exemplo, ser apresentadas da forma seguinte:
IN STRUES Neste estudo, ser-lhe-o apresentadas situaes mais ou menos comuns, face s quais voc deve escolher entre trs formas de compor tamento.

428

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

No espao correspondente a cada qual das escolhas, indique quantas vzes (percentualmente) voc acha que se comportaria daquela maneira. Assegure-se de que essas percentagens somam 100, em cada caso. Tanto quanto possvel, apoie as respostas em seu comportamento usual nas situaes figuradas.
E xem plo:

Quando voc comea a atravessar a rua, um carro pra exatamente em sua frente. Enquanto o contorna, voc (% de vzes) a) b) c) 0 grita com o motorista ........................ lana-lhe um olhar "feio ................. ......... 75 nada faz ........................................................ 25

Neste caso, as respostas indicam que voc praticamente nunca dirigiu gritos ao motorista; voc o olharia feio crca de 75 por cento das vzes; e nada faria nos outros 25 por cento de casos. Em qualquer situao, qualquer escolha teria a mesma eficcia; ou seja, as trs escolhas teriam aproximadamente o mesmo efeito.

3 .1 .1 .6

Avaliao dos itens do teste.

O mesmo pesquisador que planeja os itens pode avalilos com relao a atributos relevantes. Em geral, entretanto, le deve buscar assegurar-se de que os entrevistados inter pretaro os itens da maneira como le os interpreta. Para ter essa garantia, poder usar o mtodo seguinte: (1) Selecionar amostra probabilstica da popula o em causa. Essa amostra no dever confundir-se com aquela a que o teste venha a ser, afinal, aplicado. A essa amostra se cha mar juizes. Esclarecer os juizes acrca do objetivo e na tureza do teste, pondo nfase no significado de atributos e nos valores dos atributos usados. Fornecer a cada qual das pessoas matriz se melhante a que aparece na Tabela 22. Fornecer a cada juiz lista de itens numerados, e numerados diversa e aleatoriamente para cada juiz. De maneira geral, o nmero de itens apresentados aos juizes deve exceder algum mltiplo do nmero de blocos da tabe^

(2)

(3) (4)

A FASE OBSERV. DO P L A N E JA M E N T O DA PESQ. PRTICA

429

(5)

(6)

la. Se o teste utilizar, por exemplo, 24 itens (dois para cada situao), 36 ou 48 itens ao todo (isto , 3 ou 4, mas no o mesmo nmero para cada bloco) devem ser oferecidos aos juizes. Fazer com que os juizes, uns independente mente dos outros, avaliem cada item, regis trando o nmero dsse item no bloco da ta bela que lhe parea apropriado. Deve ser dito aos juizes que no necessrio que les coloquem o mesmo nmero de itens em cada bloco; podem, inclusive, deixar vazios alguns blocos (modificao dsse procedimento con siste em reservar um bloco no sei para os itens que levantem dvidas; ste procedimento requerer diferente anlise de resultados). Depois de cada qual dos juizes ter avaliado todos os itens; (a) Preparar, para cada item, uma tabela como segue:

Ju iz

(1) A valiao do pesquisador 0 b n a

(2) A valiao do Ju iz

(3) Diferena 1(2) (1)1

(4) Quadrado (ja Diferena

1 2

r e

Suponha-se, por exemplo, que utilizamos as qua tro variveis que aparecem no teste de ascendncia-submisso: a, b, c, d. Suponha-se que a avaliao do pesquisador a respeito do item ai, bo, C o, dv Suponha-se que a avaliao

430

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

do juiz a2, b 2, C \ , c?i. elas so

As diferenas entre

+ 1 0 1 0 a b c d e os quadrados so 1 , 0, 1 e 0, respectiva mente. ( b ) Adicionem-se os quadrados das colunas encimadas por (4) e divida-se a soma pelo nmero de juizes. (c) Se os valores obtidos na fase ( b ) exce derem de .50 para qualquer atributo, significar isso que o item foi conside rado como equivalente a um bloco de afastamento em relao avaliao do pesquisador. * O item poder, ento, ser eliminado, ou receber avaliao nova, que reduzir sse desvio quadrado mdio a menos do que .50 com relao ao atributo em causa.

* Desta medida de adequao do item importa realar vri aspectos. Em primeiro lugar, a medida parte do princpio de que a gravidade de um rro igual a n2, onde n o nmero de categorias pelas quais a avaliao do juiz difere da feita pelo pesquisador. Outras hipteses podem ser levantadas; por exemplo, igualar o rro a n ou n3. Quanto mais importante seja o grau de confiana, maior deve ser a potncia de n. Em segundo lugar, a gravidade de um desvio de n categorias independente do nmero total de categorias em que se subdi vide o atributo. Entretanto, a "distncia entre as categorias ao longo da escala da propriedade dcresce quando aumenta o nmero de cate gorias em que essa propriedade subdividida. Presume-se aqui que o nmero de categorias utilizadas pelo pesquisador reflete a impor tncia da distncia ao longo da escala. A diferena entre duas cate gorias (independentemente do campo de variao por elas coberto) , portanto, considerada praticamente (embora no mtricamente) a mesma, independentemente do nmero total de categorias em tela. Su ponha-se, por exemplo, que a escala vai de zero a um. Se duas cate gorias so usadas, ai pode ser classificado de 0 a .5 e a. classifica-se de .5 a 1.0. Se quatro categorias so usadas, pode ser classificado de 0 a .25, e a- de .25 a .50. Portanto, diferenas que no so importantes no primeiro caso, so importantes no segundo. Em outras palavras, uma diferena de .50 tomada como diferena crtica no primeiro caso, e .25 no segundo caso. Ento, se estas unidades dife rem mtricamente, elas so praticamente idnticas porque representam, r.as suas situaes respectivas, unidades prticas equivalentes de dife renas.

A FASE OBSERV. DO P L A N E JA M E N T O DA PESQ. PRTICA

431

Suponha-se, por exemplo, que o planejador atribui ao item o valor alt e que todos os 10 juizes do-lhe o valor a2 . As diferenas, assim como os quadrados, sero iguais a 1. O desvio quadrado mdio seria igual a 10/10 ou 1. Se me tade dos juizes desse ao item o valor at e metade o valor a2, o desvio quadrado mdio seria 5/10 ou .50. No primeiro caso, o item poderia ser transformado em a2, e o desvio qua drado mdio seria igual a 0. Suponha-se que metade dos juizes desse ao item o valor at e metade o valor a3. O desvio quadrado mdio ainda seria igual a 1.0, mas a trans formao do valor do item em ax ou a3 continuaria a indicar um desvio quadrado mdio de 1.0. O item deve, portanto, ser eliminado. Nada obriga a usar .5 como o valor crtico do desvio quadrado mdio. Se se desejar mais do que concordncia por maioria, o valor poder ser reduzido. (d) Repetir a fase (c) para cada atributo e, em seguida, para cada item.

Com base neste procedimento, concluiremos que as ques tes aprovadas no julgamento sero interpretadas coerente mente pelos que vieram a ser submetidos ao teste; isto , cada item ter o mesmo significado para a maioria dos su jeitos que constituem a amostra. Isso nos d garantia de que se poder depositar confiana na maneira como a popu lao reagir face a cada um dos itens. Alm disso, fornece medida do grau de confiana merecido por itens correlacio nados; diz se poderemos justificadamente afirmar que dois itens aparecem como o mesmo para a populao. Finalmente, capacita-nos a determinar se itens no correlacionados apa recem como diversos para a populao; isto , se a populao distingue ou no entre os itens. O procedimento que se descreveu semelhante, sob al guns aspectos, ao empregado por Thurstone (35); dle difere, porm, quanto a uma feio importante: aos juizes se fornece definio explcita dos valores do atributo, relati vamente aos quais lhes compete fazer avaliaes. Um item aprovado na medida em que receba dos juizes avaliaes coerentes. Em conseqncia, a varincia das estimativas dos juizes pode ser tomada como medida do grau de confiana que merea o item com respeito propriedade em [oco.

432

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

3.1.1.7 Avaliao das respostas e do teste.


Teste planejado segundo o mtodo descrito proporciona boa quantidade de informaes. Essas informaes podem ser sintetizadas atravs de meios vrios de indicao de resul tados. Desejamos o mtodo de registrar resultados que melhor atenda aos objetivos da pesquisa. E, desde que os objetivos variam, o mtodo melhor no nico. Mtodo muito simples de registro de resultados o seguinte. Considere-se como positivas as percentagens de resposta que correspondam a um caracterstico de ascendn cia, e como negativas as que correspondam a um caracterstico de submisso. Somem-se tais percentagens (omitindo as que correspondam a respostas neutras ). Divida-se o total pelo nmero de itens. O valor mximo que dessa maneira se pode obter 100 por cento, que representa o grau mximo de ascendncia (e grau mnimo de submisso). O valor mnimo que dessa maneira se pode obter 100 por cento, que representa o grau mximo de submisso (e grau mnimo de ascendncia). Ou seja, valores positivos indicam ascen dncia, e valores negativos indicam submisso. Zero cor responde a inexistncia de inclinao em qualquer sentido. Tal mtodo de aferir resultado ignora boa poro das informaes. Poderamos dispor de alguma informao mais, anotando separadamente as percentagens correspondentes ascendncia, submisso e s respostas neutras, utilizando, a seguir, todos sses trs valores. Mas, ainda assim, muita informao deixaria de ser tomada em conta. E informao em quantidade considervelmente maior pode ser conseguida recorrendo-se anlise de varincia. Se aplicarmos a anlise de varincia s respostas, pode remos determinar quais as variveis que, isolada ou combinadamente, afetam essas respostas. Tal informao poder mostrar-se necessria em alguns projetos de pesquisa. Por exemplo, ao avaliar a qualificao para um emprgo, pode no ser suficiente determinar se um potencial supervisor tem qualidade de ascendncia. Pode fazer-se necessrio saber se le tende a exercitar ascendncia maior na medida em que aumente a opresso sbre le. Conhecimento dsse fato pode ser obtido por uma anlise de varincia. Aplicao da anlise de varincia a cada teste pro cedimento demorado e eventualmente dispendioso. E, assim,

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

433

a maneira de decidir sbre como analisar os resultados do teste deve difluir de uma comparao dos custos de cada procedimento de aferio face ao valor da informao que proporcionam. Contudo, uma vantagem adicional da anlise de varincia deve ser lembrada; permite-nos avaliar no apenas os testes, mas tambm as respostas. Tenhamos em considerao, inicialmente, uma avaliao do teste, e a amostra completa relativa a cada item. Supo nha-se, por exemplo, que aparecem K pares de itens num teste, ou seja, cada item aparece duplicado. Representa a um item do par e b o outro. Ento, se houver K sujeitos, poder ser preparada tabela semelhante seguinte:

Itens sujeito
a

1
b a

1 2

Colocar-se- em cada clula a percentagem atribuda alternativa de ascendncia, menos a percentagem que se atri bui alternativa de submisso. Para os itens (colunas), sujeitos (fileiras), interao, e intra-grupos podem ser calculadas as estimativas de varin cia (desvio quadrado mdio), a partir dsses dados. Se diferena nos itens no se acompanha de diferena nas respostas, concluiremos que os sujeitos no estabelecem diferena entre os itens; ou seja, que os itens no apresentam diferena real para os sujeitos. Se no houver significativa diferena nas respostas, acompanhando diferena dos sujeitos, saberemos que o teste no discrimina entre sujeitos. possvel, naturalmente, que

434

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

os sujeitos no se distingam com respeito caracterstica em exame. Contudo, se se supe que os sujeitos diferem entre si, tal resultado poder significar que o teste no est em condi es de apontar diferenas to pequenas como as que existem entre os sujeitos. Se se acredita serem grandes as diferenas existentes entre os sujeitos, o teste deve ser tido como ina dequado. Se a interao entre sujeitos e itens no significativa, poderemos inferir que os itens discriminam de maneira idn tica relativamente a todos os sujeitos; ou seja, que les no esto sendo interpretados diferentemente por diferentes su jeitos. Se a interao siginificativa, poder-se- inferir que os itens correspondem, a coisas diferentes, quando vistos por indivduos diversos. (Para outras interpretaes possveis, ver cap. vii, 2 . 1 .3 . ) Pode-se tambm efetuar anlise para determinar quo dignas de confiana so as respostas dos sujeitos. H itens duplos para cada clula; a duplicao tem como base as ava liaes dos juizes. As colunas a e as colunas b podem ser agrupadas e, a seguir, realizado um teste para determinar se h diferena significativa entre as colunas a e b. Se no existir diferena significativa, poderemos concluir que os su jeitos so, em geral, coerentes (isto , merecedores de con fiana). Se h diferena significativa entre as colunas agru padas a e b, concluiremos, ou que os sujeitos no so coeren tes, ou que os juizes erraram, e no possvel confiar nos itens. Essas possibilidades poderiam ser estudadas mais a fundo. O mesmo tipo de anlise pode ser feito com relao a cada item; isto , submeter a teste a diferena entre a coluna a e a coluna b. Dessa forma, pode-se apreciar, por via de teste, o grau de confiana de que so merecedores os sujeitos (coletivamente considerados) em relao a cada item isolado. A anlise examinada acima permite avaliao do teste com referncia amostra completa, e avaliao da amostra com referncia ao teste. Procedimento semelhante pode ser adotado relativamente a cada indivduo. Utilizando a ma triz que aparece atrs, pode-se analisar separadamente as respostas de cada sujeito, de forma a determinar se distingue entre os itens e se coerente no que respeita s duplicaes. Anlise mais profunda acrca das respostas de cada sujeito

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

435

pode ser conseguida registrando-se tais respostas (diferena entre as percentagens que dizem respeito ascendncia e submisso), tal como se fz recorrendo matriz apresentada na seco 3. 1. 1. 3. dste capitulo. Essa matriz possibilita planejamento fatorial a trs variveis, 3 x 2 x 2 , com repe tio. Usando a anlise de varincia possvel determinar, para cada sujeito (1) se o seu grau de ascendncia ou sub misso afetado pelas trs variveis (inteno, intensidade do estmulo, e eficincia) tomadas separadamente, e (2) se essa medida afetada pelas trs combinaes possveis de duas variveis e pelas trs variveis tomadas em conjunto. Uma anlise dsse tipo nos d mais do que o resultado descritivo usual; d tambm indicaes explicativas. Nada, no teste verbal, nos d medida de acuidade de respostas, salvo no caso de a propriedade estudada ser a capacidade de obter certo resultado no prprio teste (p. ex., capacidade de leitura ou domnio de vocabulrio). Na maioria dos casos, respostas a testes verbais substituem o estudo de outros tipos de comportamento, para os quais seria dificil ou oneroso, de outra forma, colher evidncia. A de finio da propriedade examinada deve indicar, entretanto, como poderia ser colhida esta ltima evidncia. Na falta de definio (o que ocorre freqentemente), no possvel nem mesmo imaginar forma de verificao das respostas dadas ao teste verbal. As cincias sociais apoiam-se to fortemente nos testes verbais, que se torna aconselhvel grande esforo para verificar os resultados dsses testes mediante recurso a uma situao modlo. A verificao pode vir a ser muito esclarecedora, ainda quando se empregue pequena amostra de populao. Nada h de errneo em confiar nos substitutos verbais, contanto que essa confiana possa ser justificada. Sem verificao com base no teste modlo, no temos motivo sequer para dizer que "os testes verbais so os melhores instrumentos prticos disponveis. Mais do que isso, no temos como ajustar as respostas dos testes, isto , como corrigir a impreciso causada pelo instru mento, a menos que os testes verbais sejam dessa forma avaliados. Em alguns casos, confirmao de acuidade possvel. Imagine-se, por exemplo, que o teste se destina a analisar as atitudes frente ao servio militar obrigatrio. A acuidade

436

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

do teste pode ser aproximadamente avaliada ao ser le apli cado a amostras de duas populaes, uma delas favorvel, outra contrria ao servio militar compulsrio. Por exemplo, os que se alistam voluntriamente podem formar o grupo pr, e os que se opem conscientemente constituiro o grupo anti. O teste deve dar, para ambos os grupos, resultados altos, favorveis e contrrios. O emprego dessa forma de verificao de acuidade apoia-se em vrios pressupostos. Na ilustrao dada, admitese, por exemplo, que uma pessoa favorvel mais fcilmente se alistar no servio militar do que algum que a le se oponha. Isto pode no ocorrer. Outro possvel tipo de rro surge quando o teste, na verdade, mede uma atitude diferente daquela que se pretendia que le medisse, podendo acontecer que a atitude medida seja caracterstica de um dos grupos examinados, mas no do outro. A menos que a atitude examinada seja claramente definida, e a menos que os elementos tpicos dos grupos favorvel e desfavorvel sejam conhecidos, sse modo de verificar a acuidade pode conduzir a resultados decepcionantes, e mesmo falsos. Mas, se o pesquisador dispe de boas definies, e de conhecimento dos elementos tpicos dos grupos, o mtodo poder revelar-se muito proveitoso. Deve-se lembrar que um teste que, por exemplo, nos permita prever quem se alistar no servio militar, e quem deixar de faz-lo, no ser necessriamente medida da ati tude face ao servio militar obrigatrio. Pode medir, sim plesmente, "uma inclinao para o alistamento. Para che gar dessa inclinao atitude, preciso muita informao conceituai, fatual e terica. Um salto intuitivo, guiado pelo senso comum, pode alcanar bom resultado, mas no pro cedimento cientfico fundamentado. Em suma, um resultado de teste nada significa por si mesmo; no passa de um nmero. Pode ganhar sentido com base na conceituao que entra sistematicamente no planeja mento do teste, e em trmos da acuidade e preciso que revele para a medida da propriedade em estudo. O teste deve ser planejado de modo a fornecer estimativas de preciso das respostas, e de modo a permitir verificao da sua acui dade. Quando no assim planejado, os resultados nada valem, ou um projeto de pesquisa, novo, diverso, e freqen

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRTICA

437

temente infrutfero, deve ser elaborado para determinar apli caes possveis dos resultados anteriormente obtidos. A previsibilidade no basta. Saber que certas pessoas pelas quais certo resultado fr obtido tendero a comportar-se de tal ou qual modo nada acrescenta compreenso dessas pes soas e de seu comportamento. Prognsticos dsse tipo sero magia numerolgica, mas no cincia. A previso cient fica apenas quando assentada em conceituao, teoria (leis admitidas) e dados, de tal modo que seu xito ou insucesso acrescenta algo nossa compreenso dos fenmenos naturais (inclusive humanos e sociais), capacitando-nos a controllos. De fato, precisamos saber por que uma previso bem ou mal sucedida e, de modo mais genrico, por que o resultado de um teste pode ser utilizado para soluo de um problema de pesquisa. O planejamento do teste, e a concomitante aferio de resultados, so orientados no sentido de fornecer dados que possam ser entendidos e, portanto, sistematicamen te aperfeioados, como exige a cincia. 3.1.2 Questionrios.

Embora se tenha escrito muito acrca do planejamento de questionrios, pouco mais se disse do que o bvio. At o momento, poucos princpios metodolgicos existem aos quais se possa recorrer. Em conseqncia, a presente discusso carecer do rigor presente na ltima seco. Ao planejar um questionrio, admitimos que o sujeito pode dar-nos, de modo direto, o valor da propriedade (ou propriedades) sob investigao. Devemos decidir, tal como no planejamento dos testes, o que queremos saber (e, por tanto, por que o queremos), mas, a maneira de alcanar tal deciso diferente. Por exemplo, se admitimos que um indivduo sabe qual a sua atitude em relao a um grupo religioso, pedimos que exprima essa atitude, ou que selecione, de um conjunto de respostas alternativas, aquela que melhor espelhe a sua atitude. Mas, se admitimos que le no est consciente de sua verdadeira atitude, ento faz-se necessrio elabora um teste de atitudes, que ser, pelo menos, to com plexo como o teste de trao, que examinamos na seco ante rior. A economia de tempo e de esforo, para o planejador, e para a pessoa que se submete ao teste, considervel quan

438

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

do fr possvel admitir, justificadamente, que o consultado est consciente de sua atitude. Se um questionrio fr elaborado com base em conheci mento presumido, mas inexistente, no necessrio dizer que os resultados no tero utilidade. Devemos cuidar, por tanto, sempre que usamos um questionrio, de examinar, da melhor maneira possvel, a legitimidade daquilo que se admite. sse exame, pode ser feito com auxlio de estudos anteriores, ou de testes prvios deliberadamente preparados para sse objetivo. Uma vez que se tenha decidido ser possvel admitir que o sujeito tem conhecimento do ponto em foco, o problema ser, primordialmente, de comunicao. Quer isso dizer que pretendemos nos assegurar de que o sujeito compreende as perguntas adequadamente, que tenta responder fidedigna mente, e que sua resposta ser fielmente registrada. At o momento, no h cincia lingustica da comunica o, estruturada de maneira a valer-nos em tais situaes, embora no escasseiem as tentativas de constru-la. No existe, ainda, critrio geral que nos auxilie na preparao de questionrios. Logo, se queremos avaliar a adequao de um questionrio, o melhor a fazer alm do teste prvio controlado usar a experincia passada, e recorrer ao bom senso. A experincia acumulada com relao a ques tionrios no desprezvel. H numerosos artigos em peri dicos que bem orientam a formulao de tipos especficos de perguntas. Um dos melhores o de Mauldin e Marks (24). Vrias das observaes e ilustraes seguintes foram tomadas dsse artigo. Erros de resposta s perguntas de um questionrio po dem ser, via de regra, atribudos a dois fatores: (1) comu nicao deficiente e (2) lembrana deficiente. "Comunicao deficiente pode dever-se a (a) ser de significado dbio a pergunta apresentada pelo questionrio ou feita pelo entre vistador, e (b) no ser a resposta dada claramente, ou no ser claramente compreendida por quem a registra. A incapa cidade do entrevistador tornar clara a pergunta, pode dever-se sua incapacidade de compreend-la. Isso, por sua vez, pode resultar de preparo deficiente, ou de falta de habilidade. Os dois problemas sero considerados no prximo captulo, quan do tratarmos de seleo e treinamento de pessoal.

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESQ.

PRTICA

439

Ser incidir em lugar comum dizer que as perguntas devem usar linguagem familiar aos sujeitos, no ser muito longas, nem muito numerosas. O problema, est claro, se se resume aos significados de "familiar, "muito longas e "muito numerosas. Vrias tentativas j se fizeram para esclarecer sistemticamente os significados dessas expres ses (34), empregando escalas lingusticas. Entretanto, at hoje, o planejador deve confiar, antes de tudo, numa a-sistemtica familiaridade com a populao a ser consultada, no bom senso, e no teste prvio. (A respeito dos testes prvios, falaremos no captulo x). Em caso de dvida, uma pergunta longa deve ser sub dividida em duas ou mais pores.
At h pouco, o Bureau of the Ccnsus perguntava...: "Qual o maior grau de escolaridade que voc completou?" Literalmente inter pretada, a pergunta no deveria provocar dificuldades para a vasta maioria dos entrevistados. No obstante, muitas pessoas ouviam o trecho "maior grau de escolaridade" e imediatamente reagiam em trmos do "ltimo ano de escola freqentado". Algumas pessoas nem sequer ouviam o final da questo, isto , o trecho "que voc com pletou . . . Por isso. agora perguntamos: "Qual o maior grau de esco laridade que voc freqentou?" A seguir o entrevistado depara com a pergunta: Voc completou sse grau? Isso elimina parte do desvio da resposta, nesse caso particular (24: 650).

Os consultados tendem a responder aquilo que imaginam ser a questo do entrevistador. Podem imaginar incorreta mente, cabendo antecipar a falha do questionrio. O autor, por exemplo, perguntou certa vez a uma dona de casa. A sra. cria galinhas? A resposta foi No", acompanhada, porm, de rudos provocados pelas aves no quintal. Poste riores indagaes permitiram concluir que a dona de casa pensou que a pergunta fsse A sra. cria galinhas para venda? Ela criava os animais para seu prprio consumo. A pergunta precisou ser reformulada para H galinhas vivas neste local? Mauldin e Marks salientam que na avaliao de uma pergunta, mais importante saber como o interro gado interpretar a questo? do que saber que significa essa questo? (24:650). Em alguns casos, a pergunta dirigida ao entrevistador ou observador; isto , pede-se que le formule juzo a respeito de uma propriedade daquilo que est sob observao (p. ex.

440

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

as condies de uma casa, o status de uma pessoa). Em tais casos, mesmo que condies de uma casa ou "status estejam definidos, o observador pode preferir adotar sua pr pria noo acrca do significado dessas expresses. Quando isso acontece, conveniente subdividir a pergunta em com ponentes menores, que possam ser respondidos sem a inter ferncia dos conceitos e preconceitos do observador e que permitam juizo acurado e digno de crdito. Por exemplo, mais conveniente formular perguntas para determinar a quantidade de gua quente e fria disponvel do que perguntar h bastante gua nesta casa?. Erros de lembrana podem ser atribuveis falta de conhceimento ou memria fraca. Em um estudo, por exem plo, E. F. Smith (29) pediu a alguns estudantes que mar cassem numa lista (por le fornecida) os livros j lidos. A lista continha vrios titulos fictcios. No obstante, a quarta parte dos estudantes assinalou um ou mais dsses ttulos fictcios. Para outros resultados anlogos ver (17) e (18). No se pode esperar que um entrevistado tenha lem brana de fatos ocorridos h muito. Quando le afirma ter lido um livro inexistente, provvel que no esteja delibera damente mentindo; o ttulo sa-lhe familiar, e le conclui que deve ter lido o livro ou tem dvida e delibera "arriscar. Erros de resposta podem ser reduzidos, freqentemente, por meio de planejamento de procedimentos alternativos. sses procedimentos podem ser dispendiosos, e o ganho em acuidade no ser compensador. Conseqentemente,
ao considerar a reduo dos erros de resposta, a questo fundamental a de saber quo acurados devem ser os dados. Em muitos casos, uma resposta a essa questo levantar o nvo problema de saber quo custoso ser (em dinheiro e esforo) alcanar dado nvel de acuidade. O nvel de acuidade exigido , obviamente, funo do emprego que tero os dados. Por exemplo, muito maior acuidade a respeito de idades exigida no preparo de tabelas de durao de vida para uso atuarial, do que para a classificao de uma populao em grupos etrios com vistas a anlise de tendncia de opinio pblica [24: 653],

sse problema semelhante a outro j considerado no captulo iii determinao da acuidade com que as medidas devem ser feitas. L, como aqui, preocupam-nos dois tipos de custos: o da inacuidade que certo procedimento pode acarretar, e o do emprgo do procedimento. O planejador.

A FASE OBSERV. DO P L A N E JA M E N T O DA PESQ. PRTICA

441

portanto, deve escolher questionrio e procedimento de avalidao que tornem mnima a soma dsses dois gastos. Pode ser preciso pesquisar para obter estimativa satisfatria dessas despesas. Alguns possveis procedimentos de validao j foram mencionados, mas, vale a pena considerar as alternativas e respectivas vantagens e desvantagens. 1 . Medidas preventivas podem ser tomadas com o f de fazer com que as perguntas sejam interpretadas do modo desejado pelo planejador. O u as perguntas sero prefa ciadas por explicaes que tentem deixar claro seu signifi cado. A adequao das perguntas e dsse prefcio pode ser determinada com auxlio de testes prvios. Por exemplo, num teste prvio, a pergunta "Quanto voc caminhou nos seus estudos?" recebeu de vrios habitantes das zonas rurais a resposta Duas milhas. O planejador do teste ficou surprso com tais respostas, j que o sentido da pergunta pare cia claro a le. O prprio planejador raras vzes um bom juiz para a avaliao da clareza das perguntas. Observaes e crticas, daqules que j se familiarizaram com o tipo de perguntas que se vai fazer e daqules que iro aplicar os resultados das pesquisas, podem ser um bom meio de averiguar a adequao dos itens de um teste. Comisses consultivas e diretoras podem ser chamadas a opinar, sempre que possvel. 2. O teste pode ser elaborado de maneira a permitir verificaes internas de grau de confiana. A incluso de itens falsos, como se notou acima, fornece um alicerce para a avaliao das respostas aos itens verdadeiros. A duplica o das perguntas, no entanto, fornece alicerce ainda melhor. Por exemplo, se desejamos determinar a idade de um entre vistado, a pergunta Qual era a sua idade no ltimo ani versrio? pode ser seguida (no necessariamente de modo imediato) de Qual o dia, ms e ano de seu nascimento? Poderamos, ento, verificar se as duas resposta so com patveis. A compatibilidade no demonstra validade, mas respostas compatveis so muito mais provvelmente acuradas do que as incompatveis. 3. Verificaes de registro podem ser utilizadas para exame da validade de certas respostas. Para ilustrar, se determinamos, por meio de questionrios, o local de nasci-

442

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

mento de uma pessoa e a residncia dos pais, na ocasio do nascimento, possvel uma verificao mediante auxlio de certides de nascimento. Essa verificao pode ser con duzida com base em amostra de uma populao de tais cer tificados.
A maior dificuldade da averiguao por meio de registros . . . a de que, via de regra, uma proporo substancial dos casos "no combina. bem difcil, alm disso, estabelecer uma espcie de acrdo, caso a discrepncia entre o resultado do levantamento e o ndice ver dadeiro se mostre elevada. ...N o podemos esperar que mais de 80 por cento dos dados do Census a respeito de idades se coadunem com os dados colhidos em certificados de nascimento, mesmo que o estudo fique restrito s pessoas nascidas depois de 1915 [24: 654-55].

A utilidade das verificaes por meio de registros depen de, obviamente, da propriedade estudada e da populao em tela. Em certo caso, verificao por meio de registros, con cernente a dados sbre naturalizao, permitiu mais de 90 por cento de acrdo. O custo de tais verificaes pode ser, em certos momentos, relativamente baixo, j que os registros podem estar nas mos das pessoas interessadas (i. , carteiras de motoristas, certides) ou reunidos em uma agncia central (p. ex., nos escritrios da prefeitura). 4. Pode-se repetir entrevistas com amostras da pop lao. Tanto os entrevistadores como as perguntas, no caso de novo contato, so mais cuidadosamente selecionados. Considerando que amostra mais reduzida est em tela, um nmero menor de entrevistadores necessrio, podendo-se escolher os mais hbeis. As perguntas do questionrio ini cial podem ser decompostas em vrias novas questes. A resposta questo original pode ser confrontada com a res posta posterior e, no caso de haver uma discrepncia, o entrevistador poder tentar determinar qual a resposta cor reta. Poder, ainda, em muitos casos, determinar por que uma resposta foi incorreta. Explicaes da resultantes ofe recem subsdios valiosos para a anlise dos dados, e para o planejamento de futuros questionrios. Muitas questes so aditivas; por exemplo, Quantos quartos tem esta casa?, Quantos filhos tem o senhor?, "Quantas vzes voc mudou de residncia nos ltimos cinco anos?. Essas perguntas podem ser decompostas quando se leva a efeito uma segunda entrevista, podendo-se, tambm,

A FASE OBSERV. DO P L A N E JA M E N T O DA PESQ. PRTICA

443

solicitar que o entrevistado enumere as partes que se adicio nam. Para exemplificar, pode-se pedir ao entrevistado que prepare uma lista dos compartimentos de cada pavimento da casa, incluindo poro e sto. Imagine-se que um entrevistado, numa segunda aborda gem, note que deixou de contar um dos compartimentos ao dar a primeira resposta. Uma troca de idias poder revelar que le deixou de incluir um "cantinho de recreao, por le mesmo construdo no poro. Se tais falhas forem fre qentes, resulta ser inapropriada a pergunta original. O que se pode aprender nas repetidas entrevistas permite redu zir a margem de rro nas pesquisas posteriores. 4. Sumrio.

Neste capitulo consideramos vrios ajustamentos prti cos que o planejador da pesquisa pode ter que fazer em seu modlo idealizado. Em primeiro lugar, levamos em conta os problemas oriundos da impossibilidade de encontrar os sujei tos indicados. sses problemas so particularmente agudos quando o observador precisa ir ao ambiente usual do sujeito, precisa usar o telefone para entrar em contato com le, ou precisa persuadi-lo a responder a uma solicitao postal. A gravidade do problema decresce com auxlio de horas mar cadas para as entrevistas, de escolha criteriosa de horas para os contratos, de pessoal habilitado. As perturbaes provo cadas pelas ausncias podem ser compensadas recorrendo a entrevistados substitutos, a novas chamadas, e certa persis tncia na procura dos indivduos que se tem intersse em consultar. O mtodo de Politz-Simmons um novo proce dimento que pode ser utilizado em alguns casos para corrigir os desvios devidos s ausncias, sem recorrer s novas cha madas. As recusas constituem problema que pode ser parcial mente contornado com certas medidas preventivas: publici dade, bons observadores, explicaes dadas ao sujeito, ofe recimento de brindes e adoo de um mtodo que no pro voque reaes desfavorveis. Quando essas medidas se mostrarem insuficientes, a substituio dos sujeitos indicada.

444

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Pode no ser vivel observar as respostas em tdas as desejadas circunstncias, e para todos os estmulos deseja dos. Aqui, faz-se recomendvel extrapolao e interpolao, com base nas anlises de regresso. Caso nenhuma das condies possa ser atendida na prtica, os substitutos verbais podem ser empregados. Desses, h dois tipos: testes e ques tionrios. Nos questionrios parte-se do pressuposto de que o sujeito conhece a propriedade sob investigao; nos testes no se requer sse conhecimento. O planejamento de um teste exige uma definio cien tfica da propriedade que se investiga. Os atributos e as variveis pertinentes precisam ento ser analisados a fim de determinar quais dos seus valores sero usados. Os valores podem ser, em seguida, colocados no teste com o objetivo de permitir determinao da contribuio de cada varivel; por exemplo, mediante uma anlise de varin cia. Uma vez que os itens de um teste tenham sido pla nejados, cabe submet-los apreciao de um corpo de juizes, escolhidos entre a populao que ser estudada. Os resultados das avaliaes dos juizes fornecem um funda mento para a seleo dos itens fidedignos, e capazes de indicar diferenas. Uma vez aplicado o teste, os itens e as respostas podem ser novamente analisados sob o prisma de sua fidedignidade e capacidade de apontar distines. A acuidade pode ser verificada mediante emprgo de popu laes com caractersticas conhecidas ou (preferencialmen te) mediante testes controlados de comportamento. Os questionrios precisam deixar patente ao sujeito o tipo de informao desejada pelo observador. O problema , essencialmente, de comunicao. Testes prvios e comis ses consultivas podem ajudar a esclarecer as perguntas, evitando a ambigidade. Verificaes por meio de registros podem servir para estimar a acuidade das respostas, e a duplicao das perguntas permite medir o grau de confiana a depositar nas respostas. Entrevistas renovadas, aplicadas a uma sub-amostra da amostra inicial, fornecem informaes a respeito da acuidade dos dados originais, e indicam manei ras para que se evite a repetio de certos erros nas pes quisas subseqentes.

A FASE OBSERV. DO P L A N E JA M E N T O

DA PESO. PRTICA

445

Tpicos para discusso.


1. Que razes possveis existem para que algum se furte solicitao de um entrevistado? De que se poderia tratar em cada um dsses casos em que o entrevistado se recusa a colaborar com o entre vistador? 2. Quais so as possveis razes de recusa? Como tratar cada caso? 3. Selecionar um teste' familiar a todos os elementos de um dado grupo. Que evidncia existe para afirmar que o teste mede, efetiva mente, aquilo que se destina a medir? A evidncia adequada? Em caso negativo, como reformular o teste? 4. De que modo se poderia elaborar teste para medir o vocabu lrio de certa pessoa? Como avaliar o teste e as respostas? 5. Esclarecer as condies em que os seguintes itens se trans formam em instrumentos cientficos de utilidade: a) observao parti cipante; b) cmeras cinematogrficas: c) gravadores.

Exerccios.
1. Planejar trs itens para um teste de ascendncia-submisso. Identificar a clula a que cada um pertence, e tornar explcitos os pressupostos de cada um. 2. Imagine-se que trs candidatos se apresentem para o mesmo cargo pblico. Planejar um questionrio que permita prever o resul tado das eleies e a medida em que um candidato pode retirar votos dos outros. 3. Num levantamento intensivo e continuado a respeito da renda de estudantes, como se poderia subdividir a pergunta: "Quanto ganhou voc no ltimo ano? Esboar um teste prvio para determinar a adequao da subdiviso. 4. Suponha-se que em estudo do comportamento eleitoral, vrios sujeitos recusam-se a responder pergunta: "Voc votou na ltima eleio presidencial?" Indicar as observaes que poderiam ser feitas com o objetivo de obter uma resposta. 5. Preparar um modlo observacional para seu projeto de curso.

Leituras sugeridas.
Para introduo ao problema da ausncia, ver Birnbaum e Sirken (4), Hansen e Hurwitz (11) e Hilgard e Payne (14). Para mtodos alternativos de planejamento de teste, consultar Guilford (10), Stouffer (32) e Thurstone (35). Exame particularmente interessante dos erros de resposta pode ser encontrado em Hansen e outros (12), e em Marks e Mauldin (24). Excelente discusso a respeito de verificao de registros e de levantamentos continuados acha-se em Eckler e Pritzker (8).

446

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Referencias c bibliografia.
1. 2. 3. 4.
A b r a m s , M a r k , Possibilities and Problems of Group Interview

5.

6.

7. 8.

9.

10. 11.

12.

ing, Public Opinion Quarterly, X III, 1949, 502-6. G. W ., Personality: a Psychological Interpretation. New York: Henry Holt and Co., 1937. B evis , J. C., "Economic Incentives Used for Mail Questionnaires", Public Opinion Quarterly, X II (1948), 492-93. B ir n b a u m , Z. W . e S ir k e n , M. G., "Bias Due to Non-availa bility in Sampling Surveys", Journal of the American Statis tical Association, X L V (1950), 98-110. C h u r c h m a n n , C. W . e A c k o f f , R. L., A n Experimental Defi nition of Personality", Philosophy of Science, X IV (1947), 304-32. C oo m b s , C. H., Mathematical Models in Psychological Scaling, Journal of the American Statistical Association, X L V I (1951), 480-89. D e m in g , W . E Some Theory of Sampling. New York: John W iley and Sons, 1950. E c k l e r , A . R. e P r it z k e r , L e o n , Measuring the Accuracy of Ennumeration Surveys. Washington, D. C.: Bureau of the Census, 1951. E y s e n c k , H . J. e C r o w n , S id n e y , A n Experimental Study in Opinion-Attitude Methodology, International Journal of O pi nion and Attitude Research, III (1949), 47-86. G u il f o r d , J. P., Psychometric Methods, New York: McGrawHill Book Co., 1936. H a n s e n , M. H . e H u r w it z , W . N., The Problem of Non-res ponse in Sample Surveys, Journal of the American Statistical Association, X L I (1946), 517-29. H a n s e n , M . H ., H u r w it z , W . N., M a r k s , E . S. e M a u l d in , W . P., "Response Error in Surveys, Journal of the American Statistical Association, X L V I (1951), 147-90.
A l lpo rt , H a rtley , H . O., em F r a n k Y
ates , Review of Recent Statistical Developments in Sampling and Sampling Surveys: Methods of Estimating Sampling Error with Discussion, Journal of the Royal Statistical Society, C IX (1946), 12-43.

13.

14. 15. 16. 17.

H ilgard , E . H .

e P a y n e , S. L., Those N o t

at Hom e:

Riddle

for Pollers", Public Opinion Quarterly, V III (1944), 254-61. J o h n s o n , P. O., Statistical Methods in Research. New York: Prentice Hall, Inc., 1949. L in d e m a n , E . C., Social Discovery. New York: Republic Pu blishing Co., 1924. L u c a s , D. B A Rigid Technique for Measuring the Impression Values of Specific Magazine Advertisements", Journal of Applied Psychology, X X IV (1940), 778-90.

A FA SE OBSERV. DO P L A N E JA M E N T O

DA PESQ. PRATICA

447

18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31.

32. 33. 34. 35. 36.

A Controlled Recognition Technique for Measuring Magazine Advertising Audiences", Journal of Marketing, V I (1942), 133-36. L u n d b er g , G. A., Social Research. New York: Longmans, Green and Co., 1946. L u n d b e r g , G. A.; K o m a ro v sk y , M irra e M c I n e r y , M . A., Leisure: A Suburban Study. New York: Columbia University Press, 1934. L u n d b e r g , G. A. e L a r se n , O. N., "Characteritics of Hard-ToReach Individuals in Field Surveys", Public Opinion Quarterly, X III (1949), 487-94. L y n d , R. S. e H. M., Middletown. New York Harcourt, Brace and Co., 1929. Middletown in Transition. New York: Harcourt, Brace and Co., 1938. M a u l d in , W . P. e M a r k s , E. S., "Problems of Response in Enumerative Surveys", American Sociological Review, X V (1950), 649-57. P a r t e n , M ildred , Surveys, Polls and Samples. New York: Harper and B'rothers, 1950. P a y n e , S. L., "Case Studies in Question Complexity, Public Opinion Quarterly, X III (1950), 653-58. P o l it z , A l fred e S im m o n s , W . R An Attempt To Get the Not-at-Homes into the Sample without Call-Backs", Journal of the American Statistical Association, X L IV (1949), 9-31. S h ea t sl ey , P. B., An Analysis of Interviewer Characteristics and Their Relationship to Performance", International Journal of Opinion and Attitude Research, IV (1950-51), 473-98. S m it h , F. F., "Direct Validations of Questionnaire Data", Edu cational Administration and Supervision, X X I (1935), 561-75. S t em b er , H erbert e H y m a n , H erbert , H o w Interviewer Effects Operate through Question Form, International Journal of Opinion and Attitude Research, III (1949-50), 493-512. S t o c k , J. S., "The Problem of Call Backs, in Measurement of Consumer Interest, ed. por C . W . C h u r c h m a n , R. L. A c k o f f e M u r r a y W a x . Philadelphia: University of Pennsylvania Press, 1947. S t o u f f e r , S a m u e l , et al. Measurement and Prediction. Prin ceton: Princeton University Press, 1950. S u c h m a n , E. A. e M c C an dless , B o y d , "W ho Answers Ques tionnaires?", Journal of Applied Psychology, X X IV (1940), 758-69. T er ris , F a y , Are Poll Questions Too Difficult?", Public Opinion Quarterly, X III (1949), 314-19. T h u r s t o n e , L. L. e C h a v e , E. }., The Measurement of Attitudes. Chicago: University of Chicago Press, 1929. A Scale for Measuring Attitudes toward the Church. Chicago: University of Chicago Press, 1930.

C a p tu lo

A FASE OPERACIONAL DO PLANEJAMENTO DA PESQUISA PRTICA * 1. Introduo.


Este captulo dedicado principalmente ao estudante que se inicia no caminho tortuoso da pesquisa e aos cien tistas sociais profissionais que tenham tido reduzida opor tunidade para pesquisar. Consiste o captulo, em grande parte, na apresen tao de um conjunto de opinies. Em tal sentido, no difere muito de outras discusses a propsito de como conduzir a pesquisa. Far-se-, contudo, tentativa de for mular as opinies de modo a torn-las suscetveis de virem a ser avaliadas como hipteses metodolgicas. E ainda sob outro prisma, diferiro as opinies a serem apresentadas de muitas que a literatura contempla: sero formuladas de maneira a se revestirem de algum valor de orientao. Para que uma opinio tenha algum valor de orientao, preciso que a opinio contrria tenha tambm algum sen tido. Em outras palavras, uma opinio com valor de orien tao deve dar realce a uma assero, dentre um conjunto delas, cheias de sentido e mutuamente excludentes, no que se refere a operaes. Opinies do tipo seguinte no tm essa propriedade e, portanto, esto privadas de valor de orientao: (1) (2) As observaes devem ser feitas to cuidado samente quanto possvel. As instrues aos observadores e os relatrios dstes devem ser to claros quanto possvel.

* ste capitulo foi escrito em parceria com Leon Pritzker, Bureau of the Census.

A FASE

OPER. DO P L A N E J. DA PESQUISA

PRTICA

449

Tautologias dessa ordem no do lugar a qualquer alternativa e no dizem ao pesquisador como agir frente a determinada situao (Imagine-se algum fazendo afir maes contrrias quelas!). Tais afirmaes, contudo, po dem afetar o clima intelectual em que se desenvolve a pes quisa. H boas razes para supor que declaraes da esp cie acima referida tendem a produzir clima intelectual geral mente indesejvel. Considere-se, por exemplo, o primeiro enunciado: as observaes devem ser feitas to cuidadosamente quanto possivel. Gasto e ineficcia tremendos podem ser a conse qncia de esforo por atingir um nivel de "cuidado" muito superior ao que requerem os objetivos da pesquisa. Alm disso, muitas de nossas tcnicas so to pouco desenvolvi das que, aplicada a elas, uma palavra como cuidado passa a carecer de sentido. Alguns aspectos do processo de pes quisa no alcanaram, at agora, desenvolvimento algum. Por isso mesmo, no estgio atual de desenvolvimento tcnico das cincias sociais, um princpio como o referido acima pode contribuir para que aparea como obrigatrio um comportamento da mais indesejvel espcie. Para compensar o primarismo de ao em certas reas, outros aspectos da pesquisa, para cuja considerao dispomos de tcnicas relativamente aperfeioadas, so por vzes trata dos com rigor excessivo. Recorre-se, por exemplo, a testes demorados e complexos, quando se poderia utilizar testes menos poderosos, mas tambm menos dispendiosos. Ocor re, ainda, o fenmeno muito comum de dedicar ao contedo de cada questionrio ou ao relatrio de cada observador ateno e trabalho de reviso desproporcionado em relao s vantagens assim obtidas. Consideremos o segundo enunciado: as instrues aos observadores e os relatrios dstes devem ser to claros quanto possvel. Pode ocorrer que a compreenso do obser vador venha a ser toldada ou que sua disposio (e eficin cia) se reduzam, em razo de insistncia a propsito de "clareza", que o fora a colocar-se em guarda contra a menor ambigidade e lhe constrange inteiramente o exerccio do critrio prprio e da imaginao (cientfica). No se deve tomar essas afirmativas como argumentos em prol de misticismo. Por exemplo, os ndices de capaci

450

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

dade de leitura propostos por Flesch (16) tm seu papel no planejamento da pesquisa, mas apenas em base experimental. Parece haver, contudo, duas objees ao princpio de clareza j mencionado. Por um lado, o princpio pode vir a associar-se a uma preocupao desmedida por mincias e distines capazes de levar um advogado ao desespro. Por outro lado, le pode vir a transformar em fetiche a simplicidade das instrues escritas, tendendo a fazer com que o observador mdio sinta estar sendo tratado como um simplrio e tendendo a lev-lo a agir como tal. Tdas atitudes cientficas, invocadoras de cuidado", clareza, simplicidade, etc., granjeiam pblico e, se pouca discordncia provocam, no provocam progresso algum da cincia. A sensaboria, o clich, a tautologia evidenciam a necessidade de pesquisa metodolgica; o aperfeioamento somente pode ter lugar quando reconhecido sse fato. Dois aspectos da exposio que se far neste captulo devem ser esclarecidos. Preocupa-se tal exposio, em gran de parte, com a pesquisa de grande escala. Deve-se isso ao fato de que as fases operacionais da pesquisa de larga escala aparecem mais claramente que as da pesquisa de pequena escala. Dessa observao no se deve concluir que o planejamento operacional da pesquisa de pequena escala possa ser menos completo que o da de grande escala. sse, alis, um perigo contra o qual devemos acautelar-nos, por que a pesquisa de pequena escala a que mais freqen temente padece de insuficincia de planejamento nas fases operacionais. O segundo aspecto da exposio abaixo, que reclama explicao, o abundante uso de exemplos colhidos em pes quisas de levantamento. Tal aspecto se deve, antes de tudo, ao fato de que, nesse tipo de pesquisa, o cientista social atingiu grau de auto-conscincia relativamente alto.

2. O plano operacional.
At agora, a preocupao que mostramos para com o planejamento prtico no exigiu que descssemos s profun didades do pormenor vulgar. A esta altura, entretanto, no pode haver retirada. O pesquisador deve, ao cabo, enfren tar a tarefa sombria de planejar a maneira efetiva de levar

A FASE OPER. DO P L A N E J. DA PESQUISA PRTICA

451

a efeito a pesquisa imaginando tcnicas capazes de con duzir a pesquisa a um resultado. de convenincia utilizar, como prottipo do plano operacional de pesquisa, o plano de produo a que se recor re no campo dos negcios e da indstria. O planejamento operacional da pesquisa , em verdade, planejamento de produo. A pesquisa tem um produto (os resultados e concluses, so geralmente apresentados em relatrio). O produto deve preencher certas especificaes qualitativas e quantitativas. H prazos de produo a serem obedecidos. Embora somente algumas pesquisas sejam realizadas (muito legitimamente) por intersse de lucro, concorda-se, geral mente, com que os gastos devem ser proporcionados ao que se alcana. O plano operacional toma como ponto de partida as esp cificaes assentadas nas fases de planejamento prtico rela tivas a amostragem, estatistica e observao. Tais especifica es constituem conjunto de sugestes para a efetiva reali zao da pesquisa. O planejador operacional deve desem penhar-se das tarefas seguintes: (1) Determinar o custo, praticabilidade e possibi lidade de aceitar as especificaes da pesquisa (i. , avaliar as especificaes). Transformar as especificaes em operaes: em tarefas de pesquisa, orientaes de pesqui sa e instrumentos de pesquisa. Indicar tcnicos para determinar se as especi ficaes esto sendo observadas (i. , manter a pesquisa sob controle"). (Em pesquisa de larga escala) indicar meios para selecionar, preparar e designar pessoal de execuo. (Em pesquisa de larga escala) estabelecer procedimentos administrativos.

(2)

(3)

(4)

(5)

Nas pginas seguintes dste captulo, examinaremos, sucessivamente, cada qual dessas reas de trabalho em que se abre o planejamento operacional. Concluiremos conside rando resumidamente alguns critrios adicionais de que o planejador deve utilizar-se em seu processo de deciso (i. ,

452

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

planejamento). No haver mincias na discusso de um tpico importante: as qualidades pessoais do prprio pla nejador operacional. No fomos levados a essa omisso por ignorncia do assunto a ignorncia no constituiu obs tculo para que escrevssemos ste captulo mas pelo entendimento de que o progresso de uma cincia de mtodo, como tal distinta da arte, s pode resultar de desenvolvimento do prprio mtodo. Pouco se pode duvidar, entretanto, de que at o momento as mais significativas pesquisas sociais foram levadas a efeito por pessoas cuja intuio, critrio e habilidade mostravam grande avano em relao ao mtodo utilizado.

3. Avaliao das especificaes.


No atual estgio de desenvolvimento metodolgico, o melhor instrumento para realizar o trabalho de reviso e ajustamento de solicitaes conflitantes a prpria pesquisa. Em outras palavras, uma pesquisa anterior ou uma pesquisa auxiliar nova e especialmente planejada" "~o melliui' llgio de encontrar base slida para avaliao de especificaes. pesquisa anterior, muito freqentemente, projeta luz sbre o planejamento de pesquisas de cuja realizao se cogita. Em alguns casos, a pesquisa atual sugere forma de reanalisar dados obtidos em pesquisa precedente, de modo a obter-se informao til para o projeto em curso. Tais anlises no podem ser admitidas como automticamente per tinentes ao estudo que, no momento, se faz. Quer isso dizer que o planejador deve decidir quo gerais so as avaliaes formuladas a partir de projetos anteriores. A inexistncia de teoria social e metodolgica torna difcil, em muitos casos, aplicar a um projeto inferncias obtidas com base em outro. sse ponto ser examinado adiante, quando discutirmos a teoria. Uma pesquisa anterior raramente fornecer apio sufi ciente para avaliao de tdas as especificaes relativas a uma pesquisa em realizao. E, todavia, entre os instru mentos mais eficazes para avaliao de planejamento, encon tram-se o estudo piloto, o teste prvio e a tentativa. Correspondem essas denominaes a pesquisas "filhas, que se destinam a facilitar qualquer das fases do planeja-

A FASE O PER. DO P L A N E J. DA PESQUISA PRTICA

453

mento e, em particular, a fase operacional da pesquisa ampla ou pesquisa me". A designao dsses tipos de pesquisa no se faz com significados precisos ou de aceitao geral; muito freqentemente, as denominaes so usadas umas pelas outras. Para facilitar o exame do assunto, propomos seja assentado o seguinte: 1. Estudo pilto Investigao "embrio dirigida a determinar as situaes alternativas com que o pesquisador poder se defrontar durante a efetiva realizao da pesquisa. As alternativas a considerar so as que devem ser manipu ladas pelos procedimentos operacionais. Por isso mesmo, o estudo pilto destina-se a indicar os possveis procedimentos operacionais alternativos. Tais estudos so de carter essen cialmente descritivo. 2. Teste prvio Investigao "embrio dirigida a avaliar um ou mais procedimentos operacionais explicitamente formulados. O teste prvio destina-se, portanto, a indicar os procedimentos operacionais que devem ser usados. Tais estudos so de carter essencialmente valorativo. 3. Tentativa Investigao embrio que possibilita verificao final quanto ao carter exaustivo das operaes alternativas consideradas e quanto eficcia das operaes escolhidas. sse estudo destina-se, portanto, a avaliar o plano operacional como um todo, antes da execuo.

3.1 O estudo pilto.


Face a qualquer circunstncia que reclama ao, impor tante considerar os fatos, isto , a "informao relevante. Para recorrer a exemplo trivial, diremos que um vendedor, desejoso de colocar seus produtos, deve localizar os com pradores potenciais, determinar-lhes as caractersticas, saber quando encontr-los, como chegar a les, etc.. Tais infor maes podem ser fornecidas por outros, mas, se no o forem, far-se- necessrio que o vendedor as obtenha por si mesmo, para atingir seus objetivos. De maneira semelhante, cabe dizer que o planejador deve conhecer os fatos relacionados com a pesquisa, antes de realiz-la. Considerou le tdas as possveis reaes do sujeito? Levou em conta os ambientes

454

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

a que dever se dirigir e as dificuldades que podem surgir face ao interesse de observar ou entrevistar certo sujeito, etc.? A essas e muitas outras questes semelhantes fz-se aluso ao longo dste livro. Alm disso, pode o pesquisador encontrar-se frente necessidade de conhecer com profundidade maior as caracte rsticas das alternativas identificadas. Por exemplo, quantas recusas ou quantas repeties deve le prever relativamente a um dado procedimento operacional ou (preferivelmente) a um conjunto de procedimentos alternativos? Qual ser o custo de uma repetio? Qual o nmero mdio de pessoas que le encontrar em um aglomerado de residncias? Com quantas pessoas poder le comunicar-se por telefone? Em outras palavras, o planejador operacional pode desejar determinar os valores que tomar em considerao no pre paro do procedimento operacional. Estudos pilotos podem, assim, ver-se divididos em duas classes: uma classe abrange os estudos orientados a expor (i. ., a apresentar item por item) as alternativas estudos exploratrios; a outra abrange estudos orientados a deter minar as caractersticas relevantes (i. ., a atribuir valores descritivos) das alternativas estudos valorativos.

3.1.1 Estudos exploratrios.


Os estudos exploratrios podem ter carter de sonda gem: isto , podem ser orientados no sentido de evidenciaj: o que acontecer se tal e tal coisa fr feita. Por exemplo, se iim pesquisador deseja saber que tipo de resposta ser dada a certos estmulos, le poder selecionar uma subamostra da amostra que dever ser estudada ao final, expor tal subamostra aos estmulos e verificar, de maneira efetiva, que respostas sero obtidas. Isso o capacitaria a classificar as respostas possveis, preparando-se operacionalmente para fazer frente a cada qual dessas classes. Por outro lado, pode interessar ao pesquisador conhecer os meios . alternativos de ~que u ti li zar?s.e^ paxa_ob teno.. de certa resposta. Em casos tais, pode apresentar dificuldades maiores a localizao de fontes. No estudo que tem carter de sondagem, a fonte conhecida, o mesmo no se dando no tipo de explorao com carter de busca. Suponha-se, por

A FASE O PER. DO P L A N E J. DA PESQUISA PRTICA

455

exemplo, que o pesquisador deseja assegurar-se de haver tomado em conta cada qual dos possveis meios de aliviar a tenso racial em certa comunidade. Parte de seu problema Que examinar? e Que ser encontrado? Em conse qncia, le deve examinar fontes alternativas e, por isso mesmo e antes de tudo, cabe-lhe determinar para onde voltarse. le poder obter auxlio dos que, no passado, tiveram preocupao com problemas semelhantes ou pode ver-se com pelido a entregar-se a uma anlise do processo em foco, para determinar de onde poder provir possvel alvio da tenso. Um exemplo de explorao com carter de busca pode ser encontrado em trabalho de Terman e Merrill (33), que deram a conhecer a massa enorme de atividade preparatria em que se baseou a reviso do teste de inteligncia StanfordBinet, realizada em 1937.
"Pesquisas preliminares de alcance geral, a propsito de' parti culares tipos de teste e de problemas metodolgicos especiais foram realizados em laboratrio, sob nossa direo, por estudantes graduados escolhidos. . . O estudo de Bailey acrca da capacidade infantil de fazer comparaes de memria e o trabalho de Rulon a propsito do teste de absurdos verbais forneceram informaes de valor com res peito a dois importantes tipos de teste. O experimento de Deal rela tivo capacidade de discernir diferenas de pso com o propsito de avaliar o efeito do uso de diferentes instrues de procedimento, bem como do uso de peses diferentes demonstrou que, para os nveis de idade em que o teste era aplicvel, aumentos geomtricamente iguais nos pesos no produziam capacidade corespondente de discernir tais aumentos nem de discernir as propores em que os aumentos se faziam. Com base nesse estudo, identificamos as sries de pso e as instrues timas, para, afinal, abandonar o teste, devido a le no satisfazer na anlise estatstica dos dados de padronizao" [33: 7-8].

Tenha a explorao carter de sondagem ou de busca, importa sistematiz-la, de modo a assegurar-lhe carter de completude e no-repetio. Isto , deve ser desenvolvido um plano de busca ou sondagem capaz de possibilitar explo rao de carter completo e no-repetitivo. Todos ns j experimentamos a frustrao que h em procurar um alfinte ou moeda tombados no cho. Na maior parte das pesquisas mal organizadas, os mesmos locais so objeto de vrios exa mes, esquecendo-se aqule em que se encontra o alfinte ou a moeda. S o planejamento pode impedir que algo semelhante se d no trabalho de pesquisa.

456

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

3.1.2 Estudos-pilto estimativos.


Alcanar as melhores decises relativas fase opera cional requer, em muitos casos, estimativa de propriedades da populao, do ambiente e/ou dos estmulos relativos a um ou mais procedimentos operacionais. Quantas pessoas iro recusar-se a responder certa pergunta? Qual ser o custo de uma repetio em vrios planos de campo? Quantos dos ele mentos escolhidos para compor a amostra estaro gozando frias durante o perodo de entrevistas? Quantos pais se ressentiro vendo seus filhos serem utilizados como cobaias? Para responder questes dessa ordem, pode-se estudar uma pequena sub-amostra ou amostra diversa colhida da mesma populao, de forma a estimar a varivel em questo, tor nando possvel, dessa maneira, planejamento mais eficaz das operaes subseqentes exigidas pela pesquisa. No raro, o pesquisador hesita em lanar-se a essa dupla pesquisa, pois suspeita que a pesquisa preliminar no far seno con firmar suas conjeturas a propsito do valor da propriedade em questo. Tal esforo, contudo, no deve significar, necessriamente, perda de tempo, dinheiro e trabalho. Ao contrrio, se o estudo estimativo planejado sem perder de vista o projeto-me, os resultados nle obtidos podem, freqentemente, ser incorporados aos que venham a ser, afinal, conseguidos. Tal ponto j foi, alis, acentuado quan do da discusso da amostragem dupla. Suponha-se, por exemplo, que o pesquisador deseja con seguir estimativa da varincia de certa propriedade da popu lao, a fim de determinar qual a necessria extenso da amostra. Valendo-se de pequena sub-amostra, pode le conseguir a esitmativa desejada e, se no houver profundas revises posteriores quanto ao procedimento, os dados que a subamostra proporcionar podero ser incorporados aos obti dos com base na segunda e mais ampla amostra. Em ver dade, pode acontecer, em alguns casos, que a primeira subamostra se revele suficiente para assegurar o desejado nvel de preciso.

3.2 Testes prvios.


O teste prvio pode ser utilizado para avaliao de um ou mais processos operacionais alternativos. Por exemplo, ao planejar um questionrio geralmente desejvel conhecer,

A FASE O PER. DO P L A N E J. DA PESQUISA PRTICA

457

de antemo, a eficcia que le possuir: quo dignas de confiana e acuradas sero as respostas que le provocar? Em princpio, maneira eficiente de responder a essa pergunta consiste em aplicar o questionrio a uma sub-amostra da amostra (final) que a le ser submetida ou aplic-lo a outra amostra (correspondente) da populao a ser estudada. O uso de juizes em planejamento de testes (tal como descrito no captulo ix) um tipo de teste prvio. Testes prvios que se destinam a avaliar deciso rela tiva ao planejamento operacional devem ser levados a efeito, de modo que forneam medidas de e[etividade e no meros dados, s suscetveis de serem avaliados intuitivamente. Quer isso dizer que o teste prvio deve ser planejado metodo logicamente; tudo o que se disse, neste livro, acrca do plane jamento da pesquisa deve ser aplicado ao teste prvio. Em especial, o critrio de efetividade, com respeito ao qual a ava liao se processar, deve ser tornado explcito antecipadamente, bem como explicitadas devem ser as condies sob as quais uma alternativa ser aceita como suficientemente boa. O teste prvio , em verdade, um instrumento experi mental. Chamamo-lo teste prvio e no "experimento, porque, em nosso atual estgio de desenvolvimento, o teste prvio levado a efeito nas mesmas condies em que o a pesquisa final e no em laboratrio. (A propsito dste ponto, mais ser dito adiante, nesta mesma seco). O teste prvio estudo controlado de especificaes alternativas da pesquisa, de seus instrumentos ou planos, estudo que se rea liza com o objetivo de determinar qual dessas alternativas a mais eficaz. Como fizemos sentir anteriormente, o teste prvio pode e, freqentemente, deve consumir considervel poro dos fundos de pesquisa disponveis. Pode ocorrer, contudo (como no caso de estudo pilto de carter estimativo) que se utilize sub-amostra de amostra a ser includa na pesquisa principal, de modo que nesta se aproveitem dados colhidos no teste prvio. Relacionamos abaixo alguns exemplos, hipotticos ou no, de testes prvios: a) Deve-se decidir se os dados necessrios para ce estudo sero colhidos pelo correio ou por entrevista pessoal.

458

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

Se os critrios de custo, qualidade, tempo, etc., puderam ser explicitamente formulados, o teste prvio se revelar til para alcanar-se deciso eficaz. b) Bancroft e W elch (3) apresentaram comunica acrca do uso de teste prvio para determinar se um esquema revisto, proposto para facilitar o levantamento mensal da fra de trabalho, forneceria melhor estatstica de empregos do que o sistema em uso. O critrio utilizado foi o de consi derar agrupamentos maiores de empregados por inclurem maior nmero de trabalhadores em tempo parcial e inclurem tambm os trabalhadores-membros da famlia e, por isso, no-remunerados. Note-se que a exposio por les feita deixa bem claro estarem examinando alternativas:
O nvo esquema foi submetido a teste prvio em abril de 1945 em tdas . . . as reas de amostra, atravs do pas inteiro. sse teste tomou como base amostra de aproximadamente 2.000 residncias esco lhidas aleatriamente a partir da amostra .. . total. As residnciasamostra foram numeradas segundo o esquema antigo, como parte de um procedimento regularmente levado a efeito em abril. Uma semana aps, as residncias-amostras foram numeradas uma segunda vez. com a apli cao do nvo esquema. A informao registrada com base no esquema nvo, bem como a obtida com apoio no esquema anterior fz refe rncia mesma semana de censo. A . . . informao . . . foi . . . tabu lada, de maneira a permitir comparao direta entre as informaes relativas a emprgo, obtidas com o uso de cada qual dos esquemas. [3:307].

No h dvida de que o pesquisador se defrontaria com uma tarefa de realizao impossvel, caso devesse submeter a teste prvio cada qual das mltiplas alternativas imaginveis, ou se tivesse de desenvolver estudo-pilto para considerar t das as questes concernentes s alternativas. Como decidir o planejador acrca da convenincia ou inconvenincia de rea lizar tais estudos? Poder-se-ia responder, murmurando algo a propsito da necessidade de contar com planejadores expe rimentados, inteligentes, capazes de julgamento criterioso, possuidores de intuio profunda e esprito elevado. E po der-se-ia acrescentar, em voz ainda mais baixa, que tais qualidades podem no ser bastantes. Eis um exemplo: Marks e Mauldin (25) apresentaram relatrio a pro psito de teste-prvio realizado como preparao para o Dcimo Stimo Censo Decenal dos Estados Unidos da Am

A FASE O PER. DO P L A N E J. DA PESQUISA PRTICA

459

rica. O teste prvio dizia respeito avaliao de tcnicas de numerao alternativas. Uma das questes levantadas dizia respeito eficcia relativa da auto-numerao (o entre vistado preenchendo o questionrio). Dois formulrios foram imaginados para auxiliar a responder essa questo:
Esquema D: Uma pgina do formulrio . . . continha dez colunas de perguntas dirigidas a membros diversos da residncia - duas colu nas de perguntas para cada indivduo, repetidas cinco vzes. Para preencher essa pgina do formulrio, o entrevistado estava compelido a tomar conhecimento de seu inteiro contedo (18" x 24 ), assustadora mente diminuto. Quando o questionrio foi dado como pronto, aqueles mesmos que o haviam elaborado consideraram-no uma atrocidade. Muito poucos acharam que le pudesse ter alguma aceitao. E, con tudo, le apresentava, quanto ao processamento, grandes vantagens e, por isso mesmo, pareceu conveniente experiment-lo. Esquema A-I: A forma A correspondia a um folhto de 4 pginas de 9"xir (Foi planejado para reunir informaes gerais acrca da moradia) . . . Para cada um dos moradores, usou-se uma Frmula de Enumerao Individual (I). Tratava-se de uma flha de papel de 9"xll". As perguntas foram impressas na frente e no verso, em duas colunas. Embora o tamanho das letras fsse menor que o desejvel, a disposio era razoavelmente aberta" e no dava a impresso de quantidade que se tinha frente ao esquema D [25: 427-28].

Marks e Mauldin continuam, acentuando que no houve correspondncia exata entre o que era (implicitamente) espe rado e o que aconteceu: "A maior parte dos que estavam ligados ao planejamento dos esquemas considerou a combi nao A e I superior ao esquema D, no que se referia a aparncia e comodidade para o entrevistado (24:428). Mas, tome-se conhecimento dos resultados e, o que ainda mais importante, das concluses gerais:
Mais ou menos o mesmo nmero de entrevistados (aproximada mente Vi ) preencheu ambos os formulrios e as propores de rro foram, nos dois casos, aproximadamente, as mesmas. Alm disso, o tempo de preenchimento de um e outro formulrio foi quase exatamente o mesmo. Como ambos os formulrios s foram usados em um muni cpio, os resultados no podem ser considerados definitivos. Contudo aprendemos que, nesses assuntos, nSo seguro confiar fortemente no prprio Critrio [25: 428].

Parece haver uma razo particular e importante, expli cadora do porque a experincia passada e o julgamento criterioso esto longe de constituir guias adequados para

460

P L A N E JA M E N T O

DE

PESQUISA

SOCIAL

orientar decises quanto a planejamento. a ausncia de teoria. Com relao maioria dos aspectos do planejamen to de pesquisa, no sabemos quando, como ou em que exten so generalizar de um estudo para outro. Essa a razo por que os testes prvios devem ser levados a efeito sob condies que so, em essncia, as mesmas requeridas pela pesquisa principal. Essa tambm a razo pela qual os que tentam realizar experimentos metodolgicos no campo das cincias sociais se vm compelidos a contentar-se com menos do que generaliz-los. Considerem-se os exemplos seguintes: a) Weilbacher e W alsh (34) informaram acrca um estudo orientado a esclarecer a seguinte questo: Sau daes nominalmente dirigidas e assinatura de prprio punho tm efeito positivo sbre respostas a questionrios enviados pelo correio? O estudo foi objeto de rigoroso planejamen to. E, apesar disso, note-se o que os autores concluem:
Tm aplicao geral os resultados dste experimento? Se desejs semos manter-nos fiis aos padres, deveramos dizer que os resultados s se aplicam aos ex-alunos membros de uma fraternidade profissional situada na Universidade de Columbia. . . A concluso geral alcanada a de ser aconselhvel maior investigao, com amostra mais extensa de populao menos especializada [34: 336],

h) Durbin e Stuart (12) informaram acrca de uma pesquisa cuidadosamente (e rigorosamente) levada a efeito, com o objetivo de determinar se existiam e quais seriam as diferenas entre as propores de respostas de entrevistados experientes e inexperientes. O experimento assinala um grande passo adiante, no que respeita metodologia dos levantamentos. Em apndice ao relatrio da pesquisa, apa recem as opinies de vrios de seus comentadores. Alguns dos comentrios devidos a Louis Moss (diretor do English Social Survey) dizem diretamente respeito ao assunto em foco:
Algumas das concluses devem . .. ser tidas como de carter extremamente provisrio. Em razo das condies de que se rodeou o experimento, parece altamente possivel que' tais concluses no correspondam a indicaes seguras do que seria de esperar do desen volvimento geral do trabalho. Foi dito, por exemplo, que no h evidncia de acentuada hetero geneidade entre os investigadores. Entretanto, como resultado de tra

A FASE OPE R. DO P L A N E J. DA PESQUISA PRTICA

461

balho experimental no Social Survey verificou-se que, em certos setores de trabalho, existiam diferenas entre os investigadores. . . Da mesma forma, os resultados atuais mostraram que a idade do investigador tinha pouca influncia sbre os resultados obtidos. E, pelo menos uma investigao realizada pelo Social Survey mostrou que a idade do investigador se relacionava com os resultados atingidos. No h d vida de que tais diferenas quanto ao resultado de experimentos so de esperar-se, enquanto no tenhamos conhecimento melhor sbre em que apoiar a padronizao dos mtodos de investigao. Mas, no que respeite ao atual trabalho, havia... ponto muito mais srio a ser consi derado. Fz-se referncia necessidade de acrdo entre os mtodos das diferentes organizaes interessadas *, para que se pudesse con seguir planejamento eficaz da investigao. Devido a sses entendi mentos, os resultados no foram, por um lado, os que se poderiam espe rar se as organizaes se houvessem utilizado de seus mtodos normais de trabalho e, como o relatrio acentuou, os resultados, por isso mesmo, provavelmente subestimaram a diferena entre investigadores experientes e inexperientes. Por outro lado, no foi possvel, ao planejar o experi mento, tomar em considerao muitas difere