Investigacao Por Questionario PDF

D I N M I A CENT RO DE EST UDOS SOBRE A MUDANA SOCIOECONMICA
INVESTIGAO EMPRICA EM CINCIAS SOCIAIS:

Um Guia Introdutrio
Manuela Magalhes Hill & Andrew Hill
WP1998/10
Outubro 1998
ndice
PREFCIO ..................................................................................................................................................................................1
1. A NATUREZA DA INVESTIGAO EMPRICA......................................................................................................................2
2. A ESCOLHA DE UM TEMA: PRINCPIOS GERAIS ...............................................................................................................4
3. PASSOS PARA ESCOLHER UM TEMA.................................................................................................................................5
4. A REVISO DA LITERATURA................................................................................................................................................6
5. O PLANEAMENTO DA INVESTIGAO EMPRICA..............................................................................................................9
5.1. AS RELAES ENTRE AS HIPTESES, OS MTODOS DE INVESTIGAO E OS MTODOS PARA ANALISAR DADOS .........................9
5.2. A RECOLHA DOS DADOS ...................................................................................................................................................15
5.2.1.A fiabilidade das medidas feitas por questionrio...............................................................................................16
5.2.2. A validade das medidas feitas por questionrio.................................................................................................21
5.3. AMOSTRAGEM..................................................................................................................................................................27
5.3.1. Definies: o universo de casos e a amostra de casos .....................................................................................27
5.3.2. A escolha de uma amostra ...................................................................................................................................27
6. ALGUNS PROBLEMAS COM A ANLISE DE DADOS .......................................................................................................32
6.1. O AGRUPAMENTO DE CASOS .............................................................................................................................................32

6.2. PROBLEMAS COM AS CORRELAES PARAMTRICAS (TIPO PEARSON R) ...........................................................................35
6.2.1.O problema da no-linearidade .............................................................................................................................35
6.2.2.O significado estatstico e o significado prtico do coeficiente de correlao .................................................35
2)...................................................................................................36
6.3. PROBLEMAS RELACIONADOS COM O QUI-QUADRADO (
6.3.1.Que Qui-quadrado utilizar? ...................................................................................................................................36
6.3.2. O problema das frequncias esperadas pequenas.............................................................................................37
6.3.3. Qui-quadrado e percentagens..............................................................................................................................37
6.I.3.4. Um Qui-quadrado fora do usual.........................................................................................................................38
6.4. PROBLEMAS RELACIONADAS COM O TESTE T ...................................................................................................................38
6.4.1. O Teste t para duas amostras independentes: o problema das varincias desiguais ...................................39
6.4.2. O Teste t para duas amostras emparelhadas....................................................................................................39
6.4.3. O Teste t do Tolo .............................................................................................................................................40
6.4.4. Teste t e comparaes mltiplas .......................................................................................................................41
6.5. ANLISE DE COMPONENTES PRINCIPAIS VERSUS ANLISE FACTORIAL ..................................................................................43
BIBLIOGRAFIA.........................................................................................................................................................................45
ANEXO......................................................................................................................................................................................46
DINMIA -Centro de Estudos sobre a Mudana Socioeconmica

MANUELA MAGALHES HILL & ANDREW HILL
INVESTIGAO EMPRICA EM CINCIAS SOCIAIS: Um Guia Introdutrio
PREFCIO
O presente working paper destina-se essencialmente a jovens investigadores que ainda no tenham grande experincia
no planeamento de trabalhos empricos. No entanto, o working paper pode tambm ser til para alunos de cincias
sociais (licenciatura ou mestrado) que pretendam, ou necessitem de, fazer investigao emprica.
A ideia de escrever o presente working paper nasceu da experincia dos autores na orientao de teses de mestrado e
doutoramento, em particular, na rea dos Recursos Humanos. Por este motivo, os exemplos apresentados ao longo
deste working paper vm principalmente do contexto dos Recursos Humanos, embora os princpios da investigao
emprica indicados possam ser generalizados a qualquer outra rea das cincias sociais.
So dois os objectivos deste working paper:
Apresentar duma maneira simples e acessvel, os pontos essenciais de uma investigao emprica;
Referir alguns dos problemas que vulgarmente surgem numa tal investigao e dar conselho prtico para os
resolver.
Um guia introdutrio exactamente isso -- introdutrio. Num tal guia no possvel explicar tudo, nem explicar com
detalhe exaustivo os assuntos a tratados. Da que, de vez em quando, oferecemos referncias literatura
especializada de modo que o leitor possa aprofundar o seu conhecimento.
So muitas as investigaes em cincias sociais que utilizam questionrios para recolher os dados. Embora este
working paper aborde brevemente os problemas da fiabilidade e da validade de medidas feitas por questionrio, no
apresenta conselhos sobre a composio de um questionrio. Este assunto tratado separadamente num outro working
paper, complementar a este, intitulado A construo de um questionrio.
1
DINMIA - Centro de Estudos sobre a Mudana Socioeconmica
MAN UELA MAGALHES H ILL & AND REW HILL
1. A NATUREZA DA INVESTIGAO EMPRICA
Tipos de investigao emprica
muito vulgar considerar que h trs tipos distintos de investigao emprica em cincias sociais.
Investigao pura:
O objectivo deste tipo de investigao descobrir factos novos (dados empricos) para testar dedues
feitas de uma teoria que s tem interesse intelectual e que, na altura da investigao, parece no ter
aplicao prtica. O objectivo deste tipo de investigao , essencialmente, enriquecer a literatura numa
rea terica determinada. Por exemplo, nos anos sessenta, desenvolveram-se muitas investigaes puras
em psicologia social sobre a teoria de atribuies.
Investigao aplicada:
O objectivo deste tipo de investigao descobrir factos novos (dados empricos) para testar dedues
(hipteses) feitas de uma teoria que pode, em princpio, ter aplicaes prticas no mdio prazo. Por
exemplo, nos anos setenta e oitenta, houve muitas investigaes que aplicaram aspectos da teoria de
atribuio em busca da causa de um tipo de depresso.
Investigao aplicvel:
O objectivo deste tipo de investigao descobrir factos novos (dados empricos) que sejam capazes de resolver
problemas prticos no curto prazo.
Curiosamente, os trs tipos de investigao no so to diferentes como parecem. O que tm em comum que todos
os tipos de investigao emprica so baseados numa reviso da literatura relevante.
bvio que, numa investigao pura, o tema e as hipteses de investigao so retirados de uma reviso da literatura.
menos bvio, mas igualmente certo, que uma investigao aplicada se baseia numa reviso da literatura (como no
exemplo anterior). Neste caso, o tema talvez no seja retirado da literatura, mas as hipteses so deduzidas das teorias
a apresentadas e, muitas vezes, os mtodos de investigao vm da literatura. Em relao investigao aplicvel, o
tema no depende na literatura -- foi fornecido na forma de um problema prtico que precisa de ser resolvido. Acontece
porm que raramente possvel resolver problemas prticos atravs de uma investigao emprica sem ajuda de uma
reviso da literatura relevante. Por exemplo, suponha que a Administrao de uma empresa encontra um nvel muito
elevado de rotao voluntria nos seus trabalhadores. Este um problema prtico porque um nvel alto de rotao
voluntria faz baixar a produtividade. possvel efectuar uma investigao para resolver o problema, mas o que que a
investigao deve investigar? A literatura na rea da sociologia aplicada indica que a rotao voluntria est
provavelmente relacionada com vrios tipos de atitude, e vrios tipos de insatisfao, dos empregados. Portanto, parece
til investigar estes tipos de atitude e insatisfao efectuando entrevistas ou aplicando um questionrio.
As duas primeiras seces deste working paper tratam mais de investigao pura no sentido que tratam do processo de
investigao e do problema de encontrar um tema para investigar. Portanto, estas seces so especialmente
relevantes para a investigao acadmica, em particular para os alunos que tm de fazer um projecto de fim de
licenciatura ou para aqueles que tenham de elaborar uma tese de mestrado ou doutoramento.
2
O processo de investigao emprica
O processo de investigao no s um processo de aplicao de conhecimentos mas tambm um processo de

planificao e criatividade controlada. Para introduzir a natureza essencial de uma investigao emprica considere-se a
seguinte analogia.
Imagine que parte de Lisboa para passar uns dias no Alentejo. A viagem tem um objectivo ir em trabalho ou ir apenas
de frias. Para tal, vai ter de fazer escolhas ir de carro, de comboio ou de autocarro. Vai ter de planear a viagem --
dia e hora de partida. Vai ter de pensar adiante -- que roupas adequadas levar? -- onde vai ficar?
A investigao emprica tambm pode ser considerada uma viagem. Tal como a viagem ao Alentejo, a viagem da
investigao tem um objectivo e obrigao a fazer escolhas. A viagem da investigao tambm precisa de
planeamento e o investigador tem de pensar adiante. Tal como a viagem ao Alentejo, a viagem da investigao uma
viagem de ida e volta. Comea no Pas Terico chega ao Pas Prtico e termina mais uma vez no Pas
Terico.
Em resumo, a viagem da investigao emprica compreende os seguintes aspectos:
Tem como objectivo contribuir para o enriquecimento do conhecimento na rea em que escolheu fazer a
investigao.
Precisa de escolhas em termos do tema e em termos das hipteses especficas a testar.
Obriga-o a planear os mtodos de recolha de dados.
Precisa que pense adiante para planear as anlises de dados antes de comear a parte emprica da
investigao.
Vejamos ainda o seguinte: para ir de Lisboa ao Alentejo precisa de usar uma ponte para atravessar o rio Tejo e tem
varias opes -- ponte 25 Abril, ponte Vasco da Gama ou ponte de Vila Franca de Xira. Na sua viagem da
investigao, para passar do Pas Terico para o Pas Prtico tambm precisa de usar uma ponte porque h um
abismo grande entre os dois pases (o vale dos investigadores perdidos!). Neste caso, a ponte a hiptese da
investigao. Infelizmente esta ponte no existe pelo que tem de ser construda por si -- mas tem vrias maneiras de a
construir.
O Pas Terico a parte terica da sua investigao e consiste principalmente na reviso de literatura sobre o tema
que escolheu. O Pas Prtico a parte emprica da sua investigao e consiste na planeamento e execuo do
trabalho emprico. Ao efectuar a reviso de literatura vai encontrar teorias, relatrios e artigos sobre investigaes
empricas apresentados por diversos autores. A primeira tarefa ser utilizar essa literatura para deduzir um hiptese, ou
um conjunto de hipteses, que vai testar na parte emprica. A hiptese uma parte muito importante do processo de
investigao porque, como j dissemos, faz uma ponte entre a parte terica e a parte emprica da investigao. Sendo
uma ponte, a hiptese tem um papel fundamental:
A hiptese deve justificar o trabalho da parte emprica da sua investigao.
Para compreender a importncia deste ponto suponha que j terminou o trabalho e escreveu o seu relatrio ou tese.
Quando algum (por exemplo, o arguente, no caso de ser uma tese) for ler a parte emprica do relatrio, ele/ela tem de
ficar convencido de que o trabalho faz sentido e est justificado pela reviso da literatura apresentada na parte
terica do relatrio. Quem for ler a tese, s vai entender o porqu da parte emprica se a hiptese estiver claramente
ligada com a reviso da literatura e claramente ligada com o trabalho emprico. Estas ligaes so o papel da hiptese,
da a hiptese ter sido associada a uma ponte, na analogia.
3
Para encontrar uma hiptese claramente ligada com a reviso da literatura essencial que a reviso da literatura seja
estritamente relevante para o tema da investigao. Mas, obviamente, antes de fazer uma tal reviso preciso
escolher um tema.
2. A ESCOLHA DE UM TEMA: PRINCPIOS GERAIS
Esta seco refere-se a investigao emprica a desenvolver por alunos de mestrado ou doutoramento, e ainda alunos
num ano terminal de licenciatura que tenham de elaborar o projecto final.
Vamos usar a palavra tema para representar um assunto especfico, um problema ou uma linha de investigao,
para os quais existe literatura desenvolvida e sobre os quais h teoria(s) e trabalhos empricos publicados. No usamos
a palavra tema para representar a hiptese da sua investigao. A hiptese vir da sua reviso desta literatura.
A escolha do tema pressupe trs princpios fundamentais:.
O tema deve cumprir as regras da licenciatura ou do mestrado
Isto implica que:

o aluno deve demonstrar que beneficiou dos conhecimentos adquiridos durante a parte escolar do curso
(domnio da literatura e da cultura na rea que desenvolveu, bem como, conhecimento das tcnicas e
realidades na rea).
No caso de um Mestrando, deve ter capacidade para desenvolver investigao ao nvel de ps-graduao
(desenvolver investigao ao nvel de ps-graduao mais exigente que ao nvel de licenciatura).
O tema deve ser adequado em escala
Isto significa que o tema deve ser realstico e manejvel. muito natural desenvolver um projecto ou uma tese de
mestrado demasiado ambiciosos e complicados. Para fazer um projecto ou uma tese de mestrado adequados em
termos de escala numa dada rea muito importante no esquecer que tem de enfrentar vrios constrangimentos
prticos, tais como:
Tempo (o trabalho de investigao precisa sempre de mais tempo do que o previsto)

Acesso literatura relevante
Acesso aos dados
seu conhecimento prvio sobre o tema
Um trabalho de investigao ideal aquele que apresenta uma investigao relativamente curta em escala, mas com
hipteses simples, claras e interessantes.
Deve escolher um tema sobre o qual tem particular interesse
4
Vai gastar muito tempo e muita energia com o trabalho de investigao que vai desenvolver. por isso natural que, no
curso da investigao, haja perodos em que tudo ande mal - vai ter frustraes e encontrar problemas. Se no tiver
muito interesse no tema que escolheu, durante estes perodos difceis, a sua motivao pode baixar ao ponto de pr em
causa a qualidade do seu trabalho.
3. PASSOS PARA ESCOLHER UM TEMA
Para escolher um tema til comear por escolher uma rea de interesse antes de passar para o tema propriamente
dito. Assim, sugerem-se os seguintes passos:
PASSO 1. Objectivo: Encontrar uma rea geral que o interesse

Mtodo:Ler em diagonal alguns livros gerais
Se j decidiu qual a rea geral sobre a qual est interessado em desenvolver a sua investigao, boa ideia comear
mesmo assim por ler em diagonal alguns livros e artigos gerais porque possvel que encontre uma rea que o venha a
interessar mais.
Se ainda no encontrou uma rea interessante para a sua investigao, e no tem nenhuma ideia sobre o que que
gostaria de investigar, os livros gerais so teis porque, normalmente, apresentam teorias e resumos de resultados de
investigaes empricas. Neste passo s importante encontrar uma rea geral e no vale a pena entrar nos
pormenores dos estudos empricos que aparecem na literatura.
Encontrada uma rea geral que o interesse, passe ao passo seguinte:
PASSO 2. Objectivo: Encontrar um tema dentro da rea geral escolhida

Mtodo: Comear a ler artigos nas revistas acadmicas da especialidade
Paradoxalmente, na busca de um tema, muitas vezes mais til usar uma estratgia do fim para o princpio, ou seja,
comear por ler (em diagonal) os artigos mais recentes na rea geral escolhida. Estes artigos podem dar informao
sobre os tpicos actualmente considerados importantes e interessantes. Provavelmente no vai compreender tudo
nestes artigos, mas os artigos que aparecem nas revistas acadmicas contm referncias sobre as teorias relevantes,
livros especializados e outros trabalhos empricos constantes da literatura, que ajudam compreenso.
Convm lembrar que a investigao em Cincias Sociais, pode ser ligada com vrias disciplinas; por exemplo, a
Economia, a Sociologia, a Psicologia, e at a Medicina, pelo que pode ser til consultar tambm os Anurios e os
Abstracts nestas disciplinas. Por exemplo:
Annual Review of Sociology Sociological Abstracts

Annual Review of Psychology Psychological Abstracts
Index Medicus
Paralelamente pode usar vrias fontes de informao disponveis em CD-ROM tais como a Sociofile.
(E sempre h as consultas Internet)
5
Como resultado do Passo 2 deve ficar com um conjunto de informaes, preferivelmente na forma de fotocpias de
artigos seleccionados. Esta informao constituir a literatura relevante para o seu tema. A partir daqui passar para
uma nova fase da sua investigao - fazer uma reviso desta literatura em busca de um hiptese (ou hipteses) para
investigar na parte emprica do seu trabalho.
CONSELHO PRTICO
mais fcil e adequado trabalhar primeiro a literatura sobre o tema,

e deduzir a partir da as hipteses da investigao, do que partir de
hipteses definidas a priori, e ir procura de literatura que as
suporte.
4. A REVISO DA LITERATURA
OBJECTIVO: Encontrar uma (ou mais) Hipteses Gerais.
Para j vamos usar a palavra simples Hiptese para designar Hiptese Geral, mas mais tarde vamos fazer uma
distino entre Hipteses Gerais e Hipteses Operacionais.
MTODO: A reviso da literatura envolve trs partes:
Descrio das teorias e trabalhos empricos

Avaliao das teorias e trabalhos empricos
Comparao das teorias e trabalhos empricos
As Hipteses representam concluses tiradas a partir da avaliao e comparao dos trabalhos apresentados na
literatura, e, portanto, estas duas partes da reviso so muito importantes.
A descrio dos trabalhos empricos
conveniente fazer anotaes e pequenos resumos de cada um dos trabalhos empricos que seleccionou. Essas
anotaes devero incluir, para alm dos resultados e concluses:
A situao em que o trabalho foi feito;
(Pas, local, sector de actividade, tipo de empresa, instituio, organizao, etc.)
A natureza dos casos famlias, grupos sociais, empresas, sectores de actividade, trabalhadores, etc.;
(Se forem empresas -- dimenso, nmero de trabalhadores, regime jurdico, etc..)
(Se forem trabalhadores idade, sexo, profisso, natureza do emprego, etc.)
A amostra de casos;
(Dimenso da amostra, natureza da amostra - por exemplo, amostra por convenincia, amostra aleatria
simples, amostra estratificada representatividade)
As hipteses do trabalho;
6
Os mtodos usados no trabalho;

(entrevistas, questionrios, estudos de casos, etc.)
(Se questionrios a fiabilidade e a validade (se disponveis))
Os mtodos utilizados na analise dos dados.
A avaliao dos trabalhos empricos
Efectuada uma descrio conveniente dos textos recolhidos durante a pesquisa bibliogrfica, torna-se importante
proceder em seguida a uma avaliao sobre os ltimos quatro pontos acima referidos (amostra, hipteses de trabalho e
mtodos utilizados). A avaliao no difcil, s precisa de tentar responder s seguintes perguntas:
A amostra do estudo era adequada? Era representativa do Universo?

(Se no, os resultados s tm valores limitados)
As hipteses eram claras e estavam justificadas pela teoria ou pela reviso da literatura?
(Se no, os resultados podem no ser significativos e as concluses no ser vlidas)
Os mtodos usados no trabalho eram adequados?

(Se no, os resultados no so credveis)
Os mtodos utilizados para analisar os dados foram os mais apropriados? Permitiram testar as hipteses
adequadamente ?
(Se no, os resultados e concluses no so credveis)
A comparao dos trabalhos empricos
Esta a parte mais difcil da reviso da literatura mas essencial se pretender encontrar uma Hiptese interessante e
bem justificada para a parte emprica do seu trabalho.
Uma estratgia que o poder ajudar a efectuar esta comparao a seguinte:

1 - Tente agrupar os trabalhos empricos em dois conjuntos. Um a que chamaremos GRUPO onde as hipteses
testadas so idnticas ou bastante semelhantes entre si, e outro designado por ISOLADOS, formado por trabalhos em
que cada trabalho/autor testou uma hiptese diferente. Assim tem-se:
GRUPO ISOLADOS
2 - Tente agora dividir o GRUPO em dois subgrupos de trabalhos: num deles, as concluses dos trabalhos so
concordantes, e no outro, as concluses so discordantes. Assim:
GRUPO ISOLADOS
Concordantes Discordantes
3 - Tente ainda, dentro de cada subgrupo, formar mais dois subgrupos: um em que o trabalho foi tecnicamente bem
feito, segundo a avaliao que efectuou anteriormente, e outro em que achou que o trabalho foi mal feito. Faa o
mesmo para os trabalhos ISOLADOS. Tem-se assim:
7
GRUPO ISOLADOS
Concordantes Discordantes Bem Mal
Bem Mal Bem Mal
4 - Finalmente, tente formar mais dois subgrupos dentro de cada um dos subgrupos existentes: um grupo em que os
trabalhos usaram mtodos semelhantes (S), e outro grupo em que os trabalhos usaram mtodos muito diferentes
(D).
Nota: no possvel fazer isto para os trabalhos isolados
Assim:
GRUPO ISOLADOS
Concordantes Discordantes Bem Mal
Bem Mal Bem Mal
S1 D1 S2 D2 S3 D3 S4 D4
Porque que se torna til classificar os trabalhos empricos desta maneira? A resposta simples. Basicamente,
podemos definir quatro tipos diferentes de trabalho emprico que pode desenvolver na sua tese, e os vrios subgrupos S
e D indicam que tipo(s) de trabalho(s) ser razovel efectuar com base na literatura associada ao subgrupo. Os quatro
tipos de trabalho emprico so os seguintes:
- RPLICA DE UM TRABALHO ENCONTRADO NA LITERATURA
A rplica utiliza hipteses, mtodos, situao e tipo de amostra iguais aos utilizados no trabalho apresentado na
literatura)
REPLICAR um trabalho apresentado na literatura muito til quando encontramos um estudo isolado bem feito.
Isto porque um tal estudo precisa de ser replicado especialmente, quando os resultados e concluses
parecem potencialmente importantes.
- CONFIRMAO DE UM TRABALHO APRESENTADO NA LITERATURA
8
Neste tipo do trabalho a hiptese, a situao e o tipo de amostra so iguais s do trabalho encontrado na literatura mas
os mtodos de investigao, e talvez os mtodos para analisar dados so diferentes.
A CONFIRMAO til para S1 e S3 porque estes trabalhos utilizaram mtodos semelhantes e portanto
importante confirmar as concluses usando mtodos diferentes. A CONFIRMAO pode tambm ser til no
caso de um trabalho isolado bem feito.
MELHORIA DE UM TRABALHO PUBLICADO NA LITERATURA
Neste tipo de trabalho emprico, as hipteses gerais dum trabalho publicado na literatura so retidas mas as hipteses
operacionais, os mtodos de investigao, a amostragem e os mtodos para analisar os dados, so mais adequados.
A MELHORIA til para S2, D2, S4, D4 bem como para os trabalhos isolados mal feitos porque estes trabalhos
precisam de ser feitos novamente utilizando processos e tcnicas mais correctas.
- EXTENSO DE UM TRABALHO APRESENTADO NA LITERATURA
Este o tipo de trabalho emprico mais criativo. possvel estender um trabalho apresentado na literatura de vrias
maneiras, por exemplo:
Inventando uma hiptese alternativa para explicar os resultados de um trabalho na literatura;

Deduzindo uma hiptese nova, interessante e importante, a partir das concluses do trabalho apresentado
na literatura, se este estiver bem feito.
A EXTENSO til para S1, D1 e trabalhos isolados bem feitos.
5. O PLANEAMENTO DA INVESTIGAO EMPRICA
5.1. As relaes entre as hipteses, os mtodos de investigao e os mtodos para

analisar dados
Como j referimos no incio deste texto, a investigao emprica uma viagem de ida e volta que comea e termina na
literatura. Comea no Pas Terico, chega ao Pas Prtico e volta novamente ao Pas Terico. As etapas desta
viagem podem ser visualizadas esquematicamente na Figura 1.
Figura 1
A LITERATURA 9
HPOTESE GERAL
HIPTESE MTODOS DE
CONCLUSES OPERACIONAL INVESTIGAO
ANLISE DE DADOS RECOLHA

DE DADOS
RESULTADOS
Planeamento
Aco
Inferncia
Feita a reviso da literatura e estabelecida a hiptese geral do seu trabalho, torna-se necessrio operacionalizar a
hiptese geral e seleccionar os mtodos de investigao. S depois que se poder passar recolha e anlise de
dados e apresentao dos resultados. Estes, vo confirmar ou negar a hiptese operacional estabelecida e esta
confirmao ou negao que vai fornecer as concluses do seu trabalho emprico. Estas concluses do evidncia para
comentar a literatura (o que o objectivo principal da investigao).
Suponhamos agora que j efectuou a reviso da literatura e estabeleceu a Hiptese para o trabalho emprico (note que
s tem de inventar a sua prpria Hiptese se usar o tipo de investigao EXTENSO. Se fizer investigaes dos tipos
RPLICA, CONFIRMAO ou MELHORIA, a sua Hiptese j existe na literatura).
A prxima fase do planeamento do trabalho emprico comea na traduo da Hiptese Geral em Hiptese
Operacional. A Hiptese Geral exactamente isso -- geral. A Hiptese Operacional mais especfica e, no caso de os
dados serem analisados usando mtodos estatsticos, a Hiptese Operacional dever ser escrita de modo a indicar a
natureza das operaes estatsticas necessrias para a anlise.
Por exemplo:
HIPTESE GERAL:
Na empresa X, o absentismo est relacionado com a idade dos trabalhadores.
HIPTESE OPERACIONAL:
O nmero de dias de absentismo observado no ano 1998 na empresa X est significativamente

correlacionado com a idade dos trabalhadores.
10
Quando estamos a planear o trabalho emprico essencial pensar na Hiptese Operacional, nos mtodos da
investigao e nas anlises de dados, em conjunto. essencial pensar nestes trs aspectos em conjunto porque,
como a Figura 1 mostra, h interligaes entre estas trs fases do trabalho, e em cada uma delas, h tipos de
constrangimentos ou limitaes que automaticamente tm repercusses nas outras.
So muitos os investigadores inexperientes que no pensam nas anlises de dados

aquando do planeamento do trabalho e, no fim, tm grandes dificuldades em encontrar
mtodos adequados para analisar os dados.
Pensar nos mtodos para analisar dados to importante na fase do planeamento que vamos dar um exemplo para
ilustrar a natureza dos problemas:
Imagine uma empresa em que a Directora de Recursos Humanos se apercebe de que muitos dos operrios numa dada
seco andam insatisfeitos. Como a empresa tem um Consultor na rea de Recursos Humanos, a Directora falou com
ele sobre este assunto e disse que , em sua opinio, a insatisfao provocada por falta da variedade no trabalho na
seco. Pede ento ao Consultor que proceda a uma investigao emprica e diz que a Hiptese Geral do trabalho deve
ser:
HIPTESE GERAL:
A variedade no trabalho est relacionada com a satisfao global no emprego
O Consultor traduz esta hiptese na seguinte Hiptese Operacional:
HIPTESE OPERACIONAL:
Os operrios que tm variedade no trabalho tm um valor mdio de satisfao global superior ao dos
operrios que no tm variedade.
Para medir a satisfao global e a variedade no trabalho, o Consultor elaborou um pequeno questionrio com apenas
duas perguntas.
Pergunta 1. SATISFAO GLOBAL
Em que medida est satisfeito com o seu emprego?
NEM
MUITO SATISFEITO MUITO
INSATISFEITO SATISFEITO
INSATISFEITO NEM SATISFEITO
INSATISEITO
1 2 3 4 5
Pergunta 2. VARIEDADE (Var 1)
Tem variedade no seu trabalho?
NO SIM
0 1
11
O Consultor aplicou o questionrio aos 20 operrios da seco. O Quadro 1 mostra as respostas obtidas, onde a
varivel Var 1 representa a medida da variedade e Sat representa a medida da satisfao global. (Para j ignore a
varivel Var 2 que explicaremos mais adiante).
Quadro 1. Respostas ao questionrio aplicado
OPERRIO VARIEDADE SATISFAO GLOBAL VARIEDADE

VAR 1 SAT VAR 2
1 0 1 0
2 0 2 0
3 0 2 0
4 0 2 0
5 0 3 0
6 1 3 1
7 1 3 1
8 1 4 1
9 1 5 2
10 1 3 3
11 1 2 3
12 1 2 3
13 1 1 3
14 1 1 4
15 1 1 4
16 1 1 4
17 1 1 4
18 1 1 4
19 1 1 4
20 1 1 4
Do Quadro 1 ressalta que 5 operrios (nmeros 1, 2, 3, 4 e 5) consideram que no tm variedade no trabalho. O

Consultor designou este grupo de operrios por Grupo 1. Os outros 15 operrios (nmeros 6 20) que consideram ter
variedade no trabalho foram designados por Grupo 2.
Para testar a Hiptese Operacional o Consultor calculou a valor mdio da satisfao global (varivel Sat) para cada
um dos dois grupos. Estes valores esto apresentados no Quadro 2 .
Quadro 2. satisfao global mdia por grupos de variedade no trabalho
VARIEDADE (VAR 1)
GRUPO (1) GRUPO (2)
(n = 5) (n = 15)
(NO) (SIM)
Valor mdio de SATISFAO 2,00 2,00
Os valores mdios dos dois grupos so iguais e portanto o Consultor tirou a seguinte concluso:
12
CONCLUSO:
A Hiptese deve ser rejeitada. No h relao entre variedade no trabalho e satisfao no emprego.
Mas a Directora de Recursos Humanos no confiou nesta concluso. Ela apercebeu-se que o Consultor cometeu duas
faltas:
Falta 1 - a Hiptese Geral estabelecida pela Directora referia existir uma relao entre variedade no trabalho e
satisfao global. O Consultor foi testar uma hiptese que refere existir diferena entre os valores mdios
da satisfao. A Hiptese Operacional no foi adequada.
Falta 2 - a pergunta feita para medir variedade no trabalho usou uma escala de respostas muito restrita (apenas
duas respostas alternativas SIM e NO). Para avaliar a relao entre duas variveis mais adequado
usar uma escala de resposta mais larga porque a avaliao deve ser feita usando um coeficiente de
correlao.
A Directora decidiu ento fazer ela o seu prprio questionrio reescrevendo a Hiptese Operacional da seguinte forma:
HIPTESE OPERACIONAL 2:
A variedade no trabalho est correlacionada com a satisfao global
Ela substituiu a pergunta 2 por uma nova:
Pergunta 3 . VARIEDADE (Var2)
Existe variedade no seu trabalho?
NENHUMA POUCA MDIA BASTANTE MUITA

0 1 2 3 4
Esta pergunta foi igualmente aplicada aos 20 trabalhadores da investigao do Consultor e os resultados encontram-se
na ltima coluna do Quadro 1.
Antes de testar a sua Hiptese Operacional a Directora resolveu, por curiosidade, calcular os valores mdios da
satisfao global para a sua investigao. Separou ento o grupo de trabalhadores que disseram que no tiveram
NENHUMA variedade no trabalho (valor 0 na nova medida de Variedade Var2) do grupo de trabalhadores que
disseram ter ALGUM GRAU DE VARIEDADE no trabalho (valores 1, 2, 3 ou 4 na nova medida da Variedade Var2). O
Quadro 3 apresenta estes valores mdios.
Quadro 3. Satisfao global mdia por grupos de variedade no trabalho
13
VARIEDADE (VAR 1)
GRUPO (1) GRUPO (2)
(n = 5) (n = 15)
(Nenhuma) (Alguma)
Valor mdio de SATISFAO 2,00 2,00
Mais uma vez os valores mdios so iguais (obviamente !!). Ento, para testar a Hiptese Operacional 2, a Directora
calculou o coeficiente de correlao de Pearson entre a satisfao global (Sat) e a variedade (VAR 2). O valor
encontrado foi -0.482, que um valor significativo (p < 0,05). Este valor suporta a concluso de que os trabalhadores
mais satisfeitos pensam que tm menos variedade no trabalho uma concluso exactamente ao contrrio do que a
Directora esperava!! (lembrese que ela disse ao Consultor que na sua opinio a insatisfao era provocada por falta
de variedade no trabalho).
Para verificar este resultado inesperado, a Directora calculou ainda o coeficiente de correlao no paramtrica de
Spearman. O valor deste coeficiente foi -0,467 (tambm um valor significativo). Ento ela lembrouse que quando
estudou Mtodos Quantitativos lhe foi ensinado que sempre til fazer um grfico dos dados quando se est
interessado na relao entre variveis. E portanto, a Directora resolveu fazer o seguinte grfico
Figura 2
5,5
4,5
Satisfao global
3,5
2,5
1,5
1 case
2 cases
3 cases
0,5
-0,5 0,5 1,5 2,5 3,5 4,5 7 cases
Variedade (VAR2)
14
O grfico mostra que existe uma relao nolinear entre Satisfao e Variedade (Var 2). A Directora calculou ento o
coeficiente de correlao no-linear entre Satisfao e Variedade (Var 2) ajustando uma funo quadrtica aos dados.
O valor encontrado foi 0.810 (p < 0,0001) e portanto ela tirou a seguinte concluso:
CONCLUSO
A Hiptese 2 aceitvel. H correlao significativa, mas nolinear, entre satisfao e variedade. Os operrios mais
satisfeitos tm um grau de variedade intermdio e os operrios mais insatisfeitos no tm nenhuma ou tm muita
variedade no trabalho.
QUE RESULTADOS DEVEMOS TIRAR DESTE EXEMPLO?
CONSELHO PRTICO
Cuidado com os Consultores !!

Na fase do planeamento do trabalho devemos verificar sempre se a Hiptese Operacional
uma boa traduo da Hiptese Geral. (a Directora traduziu bem, mas o Consultor no!).
Depois de estabelecer a Hiptese Operacional necessrio seleccionar mtodos
adequados para recolher os dados (medir as variveis). Aqui devemos pensar adiante para
verificar se, em princpio, as medidas das variveis sero capazes de testar a Hiptese
Operacional duma maneira justa e adequada. Caso contrrio, temos que mudar ou a
Hiptese ou os mtodos para medir as variveis (a Directora mudou os dois).
Paralelamente, preciso escolher os mtodos para analisar os dados e necessrio
verificar se, na prtica, estes mtodos so adequados para testar a Hiptese Operacional.
Se pretendermos usar mtodos estatsticos que assumem pressupostos fortes sobre a
natureza dos dados (por exemplo, linearidade, normalidade, homogeneidade),
conveniente pensar em mtodos alternativas porque muitas vezes os dados no verificam
os pressupostos. Note que, na investigao do Consultor, por causa da natureza da medida
de variedade que s tinha duas respostas pergunta SIM / NO, era impossvel
encontrar uma relao no-linear entre satisfao global e variedade no trabalho. Portanto,
era impossvel calcular uma correlao no-linear, pelo que o trabalho do Consultor no
encontrou a concluso certa.
5.2. A recolha dos dados
Os trs mtodos mais vulgarmente utilizados para efectuar a recolha dos dados, ou seja, para medir as variveis so:
Consulta a estatsticas ou a uma base de dados scioeconomicos j existente.

Entrevista.
Questionrio.
Destes mtodos, o mais vulgar o do questionrio provavelmente porque mais fcil de aplicar e mais fcil de
analisar numa maneira quantitativa. Por causa da popularidade do questionrio vamos tratar principalmente deste
mtodo embora nos devamos lembrar que entrevistas (bem preparadas) tm algumas vantagens. A construo de um
questionrio e a comparao entre questionrios e entrevistas em termos de vantagens e desvantagens um assunto
1
longo demais para tratar neste working paper, e portanto ser tratado separadamente . Aqui vamos apenas tratar dois
aspectos tcnicos das medidas feitas por questionrio: A fiabilidade das medidas e a validade das medidas.
1
Ver Hill, Manuela e Hill, Andrew (1998), A construo de um Questionrio, DINMIA, ISCTE
15
5.2.1.A fiabilidade das medidas feitas por questionrio
Um questionrio pode ser utilizado tanto para obter factos como para medir opinies, atitudes, satisfaes, etc.. Quando
aplicamos um questionrio, as respostas obtidas formam um amostra tirada do universo das respostas possveis.
Quando usamos um questionrio que tem perguntas fechadas (perguntas que tm um conjunto de respostas
alternativas escritas pelo investigador) o universo das respostas alternativas definido pelo conjunto das respostas
alternativas. Por exemplo, considere a seguinte pergunta:
Em que medida est satisfeito com o seu chefe de seco?
Muito pouco Pouco Razoavelmente Bastante Muito

1 2 3 4 5
Nesta pergunta, o universo de respostas possveis definido por cinco respostas e o universo dos valores da satisfao
tem cinco valores possveis (1,2,3,4,5).
Como qualquer outra amostra, a amostra de respostas que obtemos de um questionrio contm provavelmente erros.
Para entender melhor este ponto imagine que aplicmos esta pergunta 50 vezes (uma vez por semana) ao respondente
Jos. Os resultados so apresentados no Quadro 4.
Quadro 4. frequncia das respostas
RESPOSTAS
Muito pouco Pouco Razoavel Bastante Muito

mente
1 2 3 4 5
Frequncia 1 3 41 4 1
evidente que a resposta tpica Razoavelmente, e o valor mais representativo do grau da satisfao o valor 3 (o
valor mdio do grau de satisfao = 3,02). Mas evidente tambm que h variao nas respostas de tempo em tempo.
Esta variao indica a falta de estabilidade temporal na medida da satisfao com o chefe. Os valores 1,2,4 e 5 da
satisfao no so representativos do valor tpico (valor 3) e, em termos estatsticos, estes valores so erros. Mas
de onde vm estes erros? Principalmente so as variaes no estado fsico ou mental do Jos que produzem os erros.
Por exemplo, o valor 1 (muito pouco satisfeito) podia ter acontecido quando o Jos estava deprimido, ou muito cansado,
ou zangado depois de uma discusso com o Chefe. O valor 5 pode ter acontecido quando o Chefe o recomendou para
promoo.
Uma outra fonte de erros est ligada com a natureza das perguntas e as escalas de resposta usadas no questionrio.
2
Por exemplo, perguntas complicados, perguntas mltiplas e escalas de resposta inadequadas ou ilgicas trazem
dificuldades de interpretao por parte dos respondentes e podem produzir erros.
Normalmente, s se aplica o questionrio uma vez e, portanto, s obtemos uma amostra de um s valor (uma resposta)
para cada um das perguntas. Deste modo, no sabemos se o valor observado (a resposta pergunta) ou no
representativo do verdadeiro valor no universo. Por outras palavras, no sabemos se a resposta tpica ou um
erro causado por um estado no tpico do respondente, por uma pergunta mal escrita, ou por outra razo qualquer
por exemplo, o respondente mentiu. Normalmente, aplicamos um questionrio a um conjunto de respondentes e,
portanto, para cada um das perguntas obtemos um conjunto de valores observados. Naturalmente, h variao nos
2
estes aspectos so discutidos em Hill, Manuela e Hill, Andrew (1998), A construo de um Questionrio, DINMIA, ISCTE
16
valores observados porque os respondentes so pessoas diferentes, mas cada um dos valores observados
potencialmente contm erro.
A teoria da fiabilidade baseada no pressuposto de que
VALOR OBSERVADO = VERDADEIRO VALOR + ERRO (1)
E a fiabilidade de uma medida definida como
(2)
Note que a Fiabilidade essencialmente uma medida do erro. No caso ideal, quando no h erro, o verdadeiro valor e o
valor observado so iguais, como se pode ver pela equao (1), e a Fiabilidade igual a 1 (o que indica fiabilidade
perfeita da medida).
Estimativa da fiabilidade (tipo estabilidade temporal)
Como j dissemos anteriormente, uma fonte de erro a falta de estabilidade temporal. possvel estimar este erro
aplicando duas vezes o questionrio ao mesmo grupo de respondentes. Normalmente, o intervalo de tempo entre as
aplicaes deve ser de, pelo menos, uma semana. A correlao entre os valores resultantes da aplicao 1 e da
aplicao 2 do questionrio d uma estimativa do rcio na equao (2) e portanto d uma estimativa da Fiabilidade do
tipo estabilidade temporal.
Estimativas da fiabilidade de um conjunto da perguntas (fiabilidade interna)
Podemos estar interessados em usar um conjunto de perguntas para criar uma varivel nova. Por exemplo, suponha
que queramos criar uma medida da Satisfao Global com o emprego, e suponha que a literatura sobre satisfao no
emprego indica que h quatro componentes da Satisfao Global: Satisfao com o Chefe , Satisfao com o
Ordenado, Satisfao com o Trabalho e Satisfao com os Colegas. Escrevemos as quatro perguntas seguintes para
medir estas componentes, e vamos designar as perguntas por itens no Questionrio. (note que a varivel Satisfao
Global definida por quatro itens)
Pergunta:
Em que medida est satisfeito com:
Muito pouco Pouco Razoavel Bastante Muito
mente
1 2 3 4 5
O seu ordenado X
O seu chefe X
O seu trabalho X
Os seus colegas X
(As respostas apresentadas com um X so as respostas de um s respondente, por exemplo, o Jos)
Neste caso, a nova varivel Satisfao Global, definida por quatro componentes e o valor da Satisfao Global pode
ser calculado como a soma dos valores das respostas aos quatro itens. Para o Jos, o valor da Satisfao Global (1 +
3 + 3 + 5) = 12.
17
Para estimar a Fiabilidade do tipo estabilidade temporal para esta nova varivel Satisfao Global, tnhamos de aplicar o
questionrio pelo menos duas vezes.
Mas, quando uma varivel definida por um conjunto de componentes h uma fonte de erro no ligada com a
estabilidade temporal. Cada um dos itens escritos para medir as componentes uma parte da nova varivel (Satisfao
Global), e os quatro itens devem contribuir igualmente para a Satisfao Global. Mais especificamente, a varincia da
cada um deles deve contribuir igualmente para a varincia dos valores da Satisfao Global e a soma das varincias
dos quatro itens deve ser, no caso ideal, um quarto da varincia da Satisfao Global. Qualquer diferena nas
contribuies pode ser considerada como um erro produzido por falta de consistncia entre os itens. H vrios mtodos
para estimar a fiabilidade ligada com esta fonte de erro e este tipo de fiabilidade chamase Fiabilidade interna. O
) devido ao americano Lee Cronbach.
mtodo mais vulgar para estimar a Fiabilidade interna o coeficiente alpha (
Este coeficiente pode ser interpretado como um coeficiente de correlao.
Para uma medida baseada em k itens o valor de alpha tem a seguinte expresso:
k soma das varincias de cada item

= 1
k 1 varincia total dos k itens
Note que h outros mtodos para estimar a fiabilidade interna. Destes, o mais vulgar o chamado mtodo split half em
que os itens so divididos em dois grupos por exemplo, no nosso exemplo, o Grupo 1 pode conter satisfao com
Ordenado e satisfao com o Trabalho e o Grupo 2 conter satisfao com Chefe e satisfao com os Colegas.
Para cada um dos respondentes o valor total (soma dos valores) dos dois itens em cada um dos grupos calculado e o
coeficiente de correlao entre estes totais d uma estimativa da fiabilidade interna. Mas este mtodo, embora simples,
tem um problema: que h vrias maneiras de dividir os itens (trs maneiras no caso de quatro itens) e os coeficientes
nem sempre concordam entre si. Qual o mtodo certo para agrupar os itens? Tradicionalmente, o mtodo par/mpar
era o utilizado
(Grupo 1 = itens 1 e 3; Grupo 2 = itens 2 e 4) mas um mtodo arbitrrio e portanto, um mtodo muito fraco.
Note-se, contudo, que o mtodo split-half um caso especial do mtodo alpha, sendo o valor do alpha igual ao valor
mdio de todos os coeficientes possveis split half (no nosso exemplo, trs coeficientes). Portanto o coeficiente alpha
prefervel.
A fiabilidade da uma pergunta aberta (Fiabilidade de concordncia)
Por vezes os investigadores querem usar perguntas abertas, ou seja, perguntas para as quais o respondente tem de
construir e escrever as respostas. Quase sempre as respostas dadas s perguntas abertas tm de ser interpretadas.
Considere este exemplo em que o investigador quer classificar a resposta de cada um dos respondentes em termos de
uma ou outra de duas categorias Opinio geralmente favorvel e Opinio geralmente desfavorvel.
Pergunta:
Qual a sua opinio sobre o seu Chefe?
Uma possvel resposta pode ser:
Geralmente simptico mas tem favoritos na seco e s vezes no justo. Tem vontade de ouvir os nossos
problemas e de vez em quando luta por ns contra a gerncia mas s de vez em quando.
18
A opinio deste respondente sobre o Chefe favorvel ou desfavorvel?
Obviamente, a resposta uma mistura de opinies favorveis e desfavorveis, mas o investigador quer classificar a
resposta total como Geralmente Favorvel ou Geralmente Desfavorvel. A deciso precisa de um julgamento
subjectivo porque depende da interpretao do investigador. Mais especificamente, depende do peso(importncia) que
o investigador der s opinies positivas e s opinies negativas na resposta. Dois investigadores podem discordar na
classificao porque do pesos diferentes (por causa dos seus valores e das suas personalidades) e a possibilidade
de variao nas classificaes da mesma resposta indica que o prprio investigador uma fonte de erro na
interpretao das respostas.
A este tipo de fiabilidade ligado com o investigador como fonte do erro d-se o nome de Fiabilidade da concordncia.
Um grau elevado de concordncia entre dois ou mais avaliadores indica um grau elevado de fiabilidade.
Quando estamos perante dois avaliadores possvel estimar a fiabilidade da concordncia usando vrias estatsticas.
Por exemplo, imagine que dois avaliadores avaliaram as respostas pergunta acima para 20 respondentes. O Quadro 5
apresenta os resultados.
Quadro 5. cruzamento das avaliaes feitas s respostas pergunta aberta

AVALIADOR 2
Geralmente Geralmente
TOTAL
favorvel desfavorvel
Geralmente
6 2 8
Favorvel
AVALIADOR 1 Geralmente
5 7 12
Desfavorvel
TOTAL 11 9 20
H dois tipos de mtodos para avaliar a fiabilidade da concordncia:
Mtodo 1 Utiliza correlaes (Coeficiente ou Cramrs V no caso em que os avaliadores usam mais do que duas
2
categorias). Estas correlaes so relacionadas com Qui quadrado ( ).
= Cramer ' s V =
2 2
e
n n(k 1)
Onde n o nmero total de respostas e k o nmero de categorias usadas pelos avaliadores
Mtodo 2 - Utiliza as percentagens dos casos em que os dois avaliadores concordam na classificao.
No nosso exemplo, o valor do coeficiente 0,328, pelo que no significativo (p > 0,05) e a percentagem dos
casos em que os avaliadores concordam dada por [(6 + 7)/20 ] 100 = 65 %.
Temos aqui um problema porque o valor 65% revela um grau de concordncia razovel (ou pelo menos no mau), mas
o valor do coeficiente no significativo, o que indica que as classificaes dos avaliadores no so
significativamente concordantes.
A razo deste problema que a percentagem (Mtodo 2) no corrige as concordncias que podem acontecer por
acaso. No exemplo, o avaliador 1 classificou 8 respostas como Geralmente Favorvel e o avaliador 2 classificou 11
respostas como Geralmente Favorvel. Portanto, nesta situao, em mdia, [(8 11) / 20] = 4.4 respostas seriam
classificadas como Geralmente Favorvel s por acaso. Analogamente, em mdia, [(12 9) / 20] = 5,4 respostas
19
seriam classificadas como Geralmente Desfavorvel s por acaso. Portanto, o nmero de respostas onde os
avaliadores concordaram, (6 + 7) = 13, inclui (4,4 + 5,4) = 9,8 casos onde a concordncia pode ter acontecido s por
acaso.
luz deste facto, obvio que a percentagem de concordncia deve ser corrigida. Uma estatstica que faz esta
correco o coeficiente Kappa. O valor de Kappa indica a proporo dos casos em que os avaliadores concordam
nas suas classificaes depois de fazer a correco para a concordncia que acontece por acaso. Se esse valor for
igual a 1,00 existe concordncia perfeita entre os avaliadores. normal multiplicar o valor de Kappa por 100 para dar a
percentagem de concordncia entre os avaliadores e este valor apresenta a melhor medida de Fiabilidade da
concordncia.
Para o exemplo dos dados do Quadro 5 o valor de Kappa dado por
(13 9,8)
Kappa = = 0,314
(20 9,8)
Portanto, os avaliadores concordaram em 31,4% das suas classificaes (depois da correco) -- o que um valor
fraco. luz deste valor, no h grande surpresa que o valor calculado para o coeficiente no seja significativo.
possvel calcular o valor Kappa quando os avaliadores classificam as respostas em mais de duas categorias. Note-
se, contudo, que os avaliadores tm de usar o mesmo conjunto de categorias (i.e., no exemplo, os dois avaliadores tm
de usar as categorias Geralmente Favorvel e Geralmente Desfavorvel. No possvel um avaliador usar
Favorvel/Desfavorvel e o outro usar Agressivo/Passivo ou qualquer outro conjunto de categorias).
CONSELHO PRTICO SOBRE FIABILIDADE
1. muito importante dar ateno fiabilidade das medidas feitas por questionrio porque
no vale a pena tirar concluses a partir de medidas que no tenham fiabilidade
adequada.
2. A escala seguinte d uma indicao aproximada dos para avaliar o valor da uma
medida de fiabilidade.
Maior que 0,9 .... Excelente

Entre 0,8 e 0,9 . Bom
Entre 0,7 e 0,8 . Razovel
Entre 0,6 e 0,7 . Fraco
Abaixo de 0,6 . Inaceitvel
3. O valor de alpha aumenta com:
(a) nmero de itens (perguntas) no questionrio;

(b) correlaes mais elevadas entre os itens (perguntas);
Portanto, se quiser criar uma nova varivel a partir dum conjunto de perguntas dum
questionrio, vale a pena usar mais perguntas do que as necessrias e seleccionar depois
um conjunto suficientemente grande delas que estejam bem correlacionadas entre si.
4. Para calcular o valor do coeficiente alpha use a opo SCALE e a sub-opo

RELIABILITY ANALYSIS no SPSS (note que possvel usar esta opo para
seleccionar um conjunto de componentes ptimas). Use a sub-opo SCALE IF ITEM IS
DELETED para avaliar rapidamente o valor do coeficiente alpha para vrias
combinaes de componentes.
5. O coeficiente da fiabilidade interna split half pode ser calculado usando a opo
SCALE no SPSS, mas como j dissemos o coeficiente alpha prefervel.
20
6. Como medida da fiabilidade da concordncia, o coeficiente Kappa tem a vantagem de

ser mais claro e mais simples de interpretar do que o coeficiente Phi (). A vantagem do
coeficiente de, por ser um coeficiente de correlao, o SPSS dar a sua significncia.
Sugere-se pois o clculo dos dois coeficientes porque o SPSS no permite a avaliao
da significncia de Kappa.
7 Para calcular o valor das estatsticas Phi () e Kappa como estimativas da fiabilidade da
concordncia use a sequncia de opes SUMMARIZE, CROSSTABS e STATISTICS
(dentro da opo CROSSTABS).
8. Para aumentar a fiabilidade da concordncia na classificao das respostas de

perguntas abertas, ou em entrevistas, muito til elaborar uma sistema para classificar
as respostas. Por outras palavras, conveniente elaborar uma grelha de respostas, ou
tipos de respostas, que pertenam a cada uma das categorias usadas para fazer a
classificao. Quando os avaliadores usam o mesmo sistema para classificar as
respostas a fiabilidade da concordncia (normalmente!) aumenta.
5.2.2. A validade das medidas feitas por questionrio
Fiabilidade e validade de uma medida no so a mesma coisa, e tm uma relao estranha. Uma medida pode ter boa
fiabilidade mas ter pouca validade e, sem fiabilidade adequada, a medida no pode ter validade adequada. Em termos
lgicos, podemos afirmar:
A existncia de fiabilidade adequada necessria, mas no suficiente, para garantir validade adequada
Uma medida tem validade se for uma medida da varivel que o investigador pretende medir. Mas no verdade dizer
que uma medida vlida ou no vlida -- h graus da validade. Vejamos isto com o seguinte exemplo: suponha que
um investigador pretende medir a caracterstica pessoal generosidade das pessoas. Para isso, elaborou a seguinte
pergunta:
SIM NO
uma pessoa generosa?
Acha que as respostas a esta pergunta vo ser sempre verdadeiras? Provavelmente no! Na nossa sociedade a
generosidade uma caracterstica admirada -- tem grande valor social ( ao contrrio da avareza). Quase todas as
pessoas gostam de ser consideradas generosas e portanto muitas pessoas que, na realidade, so pouco generosas,
vo mentir nas suas respostas pergunta. pois pouco provvel que a pergunta d uma medida razoavelmente vlida
da generosidade porque a pergunta vai medir, em parte, a tendncia em responder duma maneira socialmente
aceitvel. Falaremos mais sobre esta tendncia mais adiante porque isto um factor que muitas vezes influncia a
validade das medidas feitas por questionrio.
Tipos de validade
H trs tipos principais de validade:
Validade de contedo
Validade terica
Validade prtica
O exemplo acima apresentado, focou a validade terica de uma s pergunta, mas normalmente s possvel estimar a
validade de uma medida obtida atravs de um conjunto de perguntas (i.e. um conjunto de itens). Por exemplo, suponha
21
que um investigador quer medir a Satisfao Global no emprego usando perguntas do tipo do exemplo da seco 5.2.1.
Estas perguntas so itens para medir componentes da Satisfao Global (satisfao com o Chefe, satisfao com o
Trabalho, satisfao com o Ordenado e satisfao com os Colegas). Uma maneira de obter a medida de Satisfao
Global somar os valores numricos das respostas aos quatro itens. Neste caso o investigador tem de examinar a
validade dessa medida de Satisfao Global. No possvel examinar a validade dos itens (perguntas individuais)
porque impossvel distinguir entre respostas genunas e respostas falsas.
1. VALIDADE DE CONTEDO
No caso de uma varivel ser construda a partir de um conjunto de componentes h uma hierarquia como a apresentada
na Figura 3. A varivel formada por vrias componentes. Normalmente, cada uma das componentes tem, por sua vez,
vrios aspectos (C1, C2, CL1, CL2 ) e sobre cada aspecto sero feitas uma ou vrias perguntas (PC1,, PCL2).
Figura 3
Varivel construda Satisfao Global
Componentes Chefe Trabalho Ordenado Colegas

(C) (T) (O) (CL)
Aspectos C1 C2 T1 T2 O1 O2 CL1 CL2
Itens (PC1) (PC2 ) (PT1) (PT2) (PO1) (PO2 ) (PCL1) (PCL2)

(Conjuntos de Perguntas)
A validade de contedo engloba os dois aspectos seguintes:
A representatividade das componentes
Teoricamente h um Universo de componentes a partir do qual a varivel Satisfao Global deve ser definida. Se a
literatura sobre Satisfao Global referir que o Universo formado pelas quatro componentes satisfao com o Chefe,
satisfao com o Trabalho, satisfao com Ordenado e satisfao com Colegas, ento a varivel Satisfao Global
do nosso exemplo ter validade de contedo adequada em termos de representatividade das componentes.
Suponha, contudo, que a literatura diz que o Universo de componentes para a varivel Satisfao Global deve incluir,
para alm destas quatro, as componentes satisfao com a Gerncia e satisfao com Condies do Ambiente.
Neste caso, as quatro componentes no so totalmente representativas do Universo, e a validade de contedo da
medida de Satisfao Global ser mais baixa.
A representatividade dos itens como medidas das componentes
Tal como mostra a figura 3, cada uma das componentes tem normalmente um conjunto de aspectos. Para medir a
componente por forma a que a medida de Satisfao Global tenha validade de contedo adequada, os itens devem ser
representativos do Universo de Aspectos.
Assim, para construir uma medida de Satisfao Global que tenha validade de contedo adequada, preciso encontrar
o Universo de Aspectos para cada uma das componentes. Por exemplo, no caso da componente satisfao com o
22
Trabalho, h vrios Aspectos do trabalho com os quais um respondente pode estar satisfeito ou no, tais como: o grau
de responsabilidade que possui, o grau de variedade do seu trabalho, o grau de interesse pelo trabalho que
desempenha, o grau de controle sobre os mtodos usados, o grau de fadiga etc.. Usando a literatura sobre a rea (e
bom senso!) possvel construir uma lista com todos os Aspectos importantes do trabalho com os quais o respondente
pode estar ou no satisfeito. Estes Aspectos formam o Universo de Aspectos. Os itens (perguntas) escolhidos para
medir a componente devem ser representativos deste universo. Normalmente, a pergunta associada a cada um dos
Aspectos deve contribuir para que a medida (no exemplo, Satisfao Global) tenha validade de contedo adequada.
Note que no possvel calcular um valor numrico para a validade de contedo
2. A VALIDADE TERICA
Uma medida tem uma boa validade terica se for uma medida da varivel que o investigador pretender medir. H trs
tipos de validade terica que tratam de aspectos ligeiramente diferente do conceito.
Validade convergente
Validade discriminante
Validade factorial
Validade convergente
Uma medida ( M1X ) da varivel X tem validade convergente se a medida concordar bem com outras medidas da
mesma varivel, por exemplo, M2X, M3X, M4X que j sejam aceites como medidas adequadas da varivel X. O grau da
concordncia estimado por meio do coeficiente de correlao. Para ter validade convergente adequada as correlaes
entre M1X e M2X, entre M1X e M3X e entre M1X e M4X devem ser significativas. (nota: normal usar duas ou trs outras
medidas para avaliar a validade convergente de uma medida M1X).
Validade discriminante
Uma medida da varivel X tem validade discriminante se no estiver correlacionada significativamente com medidas de
variveis que teoricamente no esto relacionadas com a varivel X. Por exemplo M1X no deve ter correlaes
significativas com as medidas M1Y e M1Z das variveis Y e Z .
Campbell e Fiske (1959) propuseram uma tcnica sofisticada chamada multi mtodo multi trao para avaliar as
validades convergente e discriminante simultaneamente. Mas esta tcnica complicada e principalmente usada no
contexto de psicometria.
Validade factorial
Este tipo de validade terica til quando o investigador quer definir e medir uma nova varivel usando um conjunto de
perguntas num questionrio. possvel definir a nova varivel aplicando a tcnica de Anlise Factorial tcnica
semelhante tcnica de Anlise de Componentes Principais. O peso ou saturao de cada um dos itens (perguntas
que, em conjunto, vo definir a nova varivel) no factor representa a validade factorial do item (pergunta).
Voltemos ao exemplo apresentado para construir a varivel Satisfao Global. Suponha que a literatura refere que a
varivel Satisfao Global tem seis componentes -- satisfao com o Trabalho, Ordenado, Chefe, Colegas,
23
Administrao e Ambiente de trabalho. Para cada uma destas seis componentes foi elaborada uma pergunta, o que no
dar grande validade de contedo, mas permite um exemplo mais simples. (Normalmente, como evidente na Figura 3,
cada uma das componentes tem vrios Aspectos e cada um deles est ligado com pelo menos um item pergunta no
questionrio). O questionrio foi preenchido por 60 respondentes como parte de um inqurito sobre absentismo e os
dados so apresentados no Anexo. Os resultados da Anlise Factorial encontram-se no Quadro 6.
Quadro 6. Resultados da Anlise Factorial
VARIVEL FACTOR
(PERGUNTA) 1
TRABALHO 0,712
ORDENADO 0,595
CHEFE 0,688
COLEGAS 0,651
ADMINISTRAO 0,782
AMBIENTE 0,440
O factor obtido uma combinao linear dos itens e representa a nova varivel Satisfao Global. importante notar
duas coisas: primeiro, o peso de um item representa a correlao entre o item e o factor; segundo, os itens no tm
pesos iguais. Por exemplo o item relacionado com o ambiente de trabalho tem menor peso (0,440) que o item
relacionado com o prprio trabalho (0,712) . Este facto implica que a satisfao com o trabalho mais importante do
que a satisfao com o ambiente de trabalho na definio e medida da Satisfao Global.
O coeficiente de validade factorial de cada um dos itens o peso do item no factor. Por exemplo, a validade factorial
do item Em que medida est satisfeito com o seu trabalho? 0,712.
3. A VALIDADE PRTICA
So muitos os mtodos para avaliar a validade prtica de uma medida. Os dois mtodos clssicos so:
A validade preditiva (Predictive validity)
A validade simultnea (Concurrent validity)
A validade preditiva
A validade preditiva de uma medida a validade que essa medida tem para predizer valores noutra varivel.
Por exemplo, suponha que o Director(a) de Recursos Humanos queria usar um teste para seleccionar
empregados. Obviamente, no vale a pena usar o teste se o valor que um candidato obteve no teste no
conseguir predizer bem o seu desempenho no emprego. O coeficiente de validade preditiva do teste a
correlao entre os valores do teste e os valores de uma medida de desempenho no emprego. Para estimar
este coeficiente preciso recolher valores do teste, num dado momento, para uma amostra de candidatos
seleccionados sem utilizao do teste como parte do processo de seleco. Mais tarde, preciso recolher
os valores de desempenho para os candidatos seleccionados. A correlao entre os valores do teste e os
valores de desempenho representa o coeficiente de validade preditiva.
24
A validade simultnea
Neste tipo de validade, os valores da varivel a predizer so recolhidos ao mesmo tempo (aproximadamente)
que os valores do teste. Por exemplo, o Director(a) de Recursos Humanos pode obter os valores do teste e os
valores de desempenho no emprego para uma amostra dos empregados da empresa. A correlao entre os
valores do teste e os valores de desempenho uma estimativa da validade simultnea do teste.
A diferena entre os coeficientes de validade preditiva e simultnea parece no ser grande --- mas pode s-lo.
Isto porque na validade simultnea o coeficente da validade calculado a partir dos dados dos empregados
enquanto que no caso de validade preditiva o coeficiente de validade calculado a partir dos dados dos
candidatos. natural que os valores de avaliao de desempenho dos empregados abranja uma gama restrita
dos valores de desempenho, e portanto, a diferena entre a validade preditiva e a validade simultnea pode ser
grande. , contudo, possvel corrigir o valor do coeficiente de validade simultnea, tornando mais fcil e mais
barato calcular este coeficiente de validade prtica. (vide Murphy & Davidshofer: 1988).
25
CONSELHO PRTICO SOBRE VALIDADE
A influncia da tendncia em dar respostas socialmente desejveis
Suponha que pretende usar perguntas dum questionrio para medir atitudes, opinies ou
satisfaes, mas no quer usar as perguntas para criar uma nova varivel (como Satisfao
Global no nosso exemplo). Por outras palavras, pretende analisar as respostas a cada
pergunta individualmente. Neste caso, vale a pena ter em conta a natureza das perguntas.
Se considerar que as respostas podem ser muito influenciadas por valores sociais
(lembrese do exemplo da questo uma pessoa generosa?) essencial utilizar um
questionrio annimo. Provavelmente o anonimato no vai eliminar totalmente o problema,
mas ajuda.
possvel aplicar uma medida da tendncia de usar respostas socialmente desejveis

(por exemplo a medida do Edwards (1957) para corrigir as respostas do questionrio ou
para eliminar da amostra os respondentes que mostram fortemente esta tendncia).
possvel tambm construir a sua prpria medida desta tendncia (vide Hill: 1986), mas este
processo complicado e requer muito tempo. Vale mais a pena tentar escrever as
perguntas de modo mais neutro, se for possvel, e test-las numa amostra pequena.
A validade de contedo
Se quiser usar um conjunto de perguntas para definir e medir uma nova varivel (como
Satisfao Global no exemplo), a validade de contedo importante. Portanto, antes de
escrever as perguntas ,use a literatura para encontrar todas as componentes relevantes e
todos os Aspectos das componentes da varivel que quer definir.
A validade factorial
Se quiser criar uma varivel nova a partir de um conjunto de perguntas:
Use a tcnica de Anlise factorial. No use a tcnica de Componentes Principais

(explicaremos a razo mais adiante na seco 6.5). A Anlise factorial no uma tcnica
uma famlia de tcnicas. Para criar uma varivel nova melhor usar o tipo de Anlise
factorial designada por Anlise factorial Alpha porque esta tcnica cria uma nova varivel
(um factor) em que as medidas da varivel tm o valor do coeficiente alpha (a fiabilidade
interna) mximo. Para fazer uma Anlise factorial (tipo alpha) use as seguintes opes do
SPSS:
DATA REDUCTION
FACTOR
EXTRACTION
Dentro da opo Extraction use
METHOD = ALPHA
CORRELATION MATRIX
EIGENVALUES GREATER THAN 1
MAXIMUM ITERATIONS = 50
Se a anlise conduzir a duas ou mais factores, e s quer um factor, deve repetir a anlise
usando a opo
Number of factors = 1 (em vez da opo Eigenvalues greater than 1)
Para calcular os valores dos casos da nova varivel (i.e. o factor) use as opes
SCORES
SAVE AS VARIABLES
METHOD = REGRESSION
Estas opes criam uma nova varivel (FAC_1) no seu ficheiro de dados.
No se esquea de o GRAVAR !!
Notas:
26
1. Os valores (scores) da nova varivel tomam em linha de conta os pesos dos itens no factor obtido atravs da anlise factorial, e
no so simplesmente a soma dos valores das respostas aos itens (perguntas) do questionrio. melhor usar os scores do que
a soma simples dos valores das respostas -- especialmente no caso em que os pesos das variveis no factor no so
aproximadamente iguais.
2. essencial verificar se o valor do coeficiente KaiserMayerOlkin (KMO) adequado para fazer a anlise factorial. Este valor
deve ser, pelo menos, igual a 0,6 e preferivelmente igual a 0,8 ou mais. Use a opo DESCRIPTIVES dentro da opo FACTOR
no SPSS para verificar o valor de KMO.
5.3. Amostragem
5.3.1. Definies: o universo de casos e a amostra de casos
Uma investigao lida normalmente com um conjunto de casos. Os casos podem ser pessoas, empresas, sectores da
indstria, pases ou qualquer outra entidade que o investigador queira considerar.
Ao conjunto total dos casos d-se o nome de Populao ou Universo de casos. [Vamos usar a palavra Universo
porque muitas pessoas pensam (incorrectamente) que, neste contexto, a palavra Populao s se refere situao
em que os casos so pessoas]. Suponha ento que um investigador quer estudar as polticas dos hotis Portugueses, e
suponha que h um total de 8500 hotis no pas. Neste caso o Universo o conjunto dos 8500 hotis. Note que o
investigador que define o Universo. Um investigador que s queira analisar a actividade hoteleira em Lisboa definiria o
Universo como sendo o conjunto de todos os hotis em Lisboa.
Acontece, porm, que muitas vezes o investigador no tem tempo, nem recursos suficientes, para analisar cada um dos
casos do Universo, pelo que, nesta situao, s possvel considerar uma parte dos casos que constituem o Universo.
Esta parte de casos uma amostra do Universo. Assim, o que o investigador pretende ou pode fazer, na maioria das
situaes, analisar os dados da amostra, tirar concluses, e extrapolar as concluses para o Universo. Mas este
processo de extrapolao das concluses pode correr bem ou pode correr mal. Se a amostra dos casos for retirada
do Universo de modo que seja representativa desse Universo, possvel aceitar, com razovel confiana, que as
concluses obtidas utilizando a amostra possam ser extrapoladas para o Universo. Mas, se a amostra for retirada sem
ter sido tida em considerao a sua representatividade, no possvel extrapolar as concluses para o Universo com
confiana. Da que se torna importante escolher uma amostra representativa.
5.3.2. A escolha de uma amostra
H duas famlias de mtodos para escolher uma amostra:
Os mtodos de amostragem casual
Os mtodos de amostragem no casual (tambm chamada dirigida)
OS MTODOS DE AMOSTRAGEM CASUAL
27
Os mtodos de amostragem casual so preferveis quando pretendemos extrapolar para o Universo os resultados
obtidos a partir da amostra porque tm duas grandes vantagens:
n possvel demonstrar a representatividade da amostra;

n possvel estimar (estatisticamente) o grau de confiana com o qual as concluses tiradas da amostra se
aplicam ao Universo.
Os mtodos mais vulgares de amostragem casual podem ser de vrios tipos:
n Amostragem aleatria simples

n Amostragem sistemtica
n Amostragem estratificada
n Amostragem por clusters
n Amostragem multi-etapas
n Amostragem multi-fsica
Explicaes claras e simples destes mtodos (e dos mtodos de amostragem no casual) podem ser encontradas em
Reis, Melo, Andrade e Calapez (1996) e portanto no vamos aqui explicar todos eles.
De entre os mtodos de amostragem casual, o mtodo de amostragem estratificada e o mtodo de amostragem por
clusters so talvez os mais teis e utilizados em Cincias Sociais.
Mtodo de amostragem estratificada
Este mtodo especialmente til quando se pretende obter uma amostra representativa de um Universo grande
segundo vrias variveis pr-identificadas. Por exemplo, suponha que pretendamos estudar as polticas dos hotis
nacionais e queramos analisar os resultados em termos de dimenso e local geogrfico dos hotis. Para isso devemos
seleccionar uma amostra de hotis a partir do conjunto de hotis nacionais que seja representativa em termos de
dimenso (nmero de trabalhadores) e local. Para termos uma amostra estratificada precisamos de efectuar os
seguintes passos:
Decidir quanto ao nmero e natureza dos estratos.
Por exemplo:
Dimenso: 3 estratos --- (menos de 50 trabalhadores, 51 100, mais de 100)
Local: 3 estratos --- (Norte, Centro, Sul)
Encontrar uma lista de todos os hotis em Portugal que inclua; nome, local e dimenso)
A partir desta lista construir um Quadro para caracterizar o Universo. (Quadro 7 em baixo)
Decidir qual o tamanho da amostra -- qual a fraco de amostragem (por exemplo, 10% do Universo)
Seleccionar uma amostra aleatria de 10% dos hotis em cada um dos estratos (Quadro 8)
28
Quadro 7. Caracterizao do Universo
DIMENSO
Menos de 50 51 - 100 Mais de 100 TOTAL

NORTE 1100 740 160 2000
REGIO
CENTRO 900 500 100 1500
SUL 3500 1200 300 5000
TOTAL 5500 2440 560 8500
Quadro 8. Caracterizao da amostra = 10% do Universo
DIMENSO
Menos de 50 51 - 100 Mais de 100 TOTAL

NORTE 110 74 16 200
REGIO
CENTRO 90 50 10 150
SUL 350 120 30 500
TOTAL 550 244 56 850
Note que em cada uma das clulas do Quadro 8 o nmero de casos (hotis) igual a 10% do nmero de casos na
clula correspondente no Universo. A amostra representativa do Universo se a amostra de casos em cada um das
clulas for escolhida por amostragem aleatria.
Mtodo de amostragem por clusters
Este mtodo til quando temos um Universo grande mas os casos so agrupados em unidades. Por exemplo,
suponha que queramos estudar a relao entre o absentismo voluntrio no emprego e a satisfao dos empregados
dos hotis de Lisboa. Neste caso o Universo o conjunto de todos os empregados dos hotis de Lisboa. Mas neste
Universo h grupos ou clusters de casos -- o conjunto de empregados em cada um dos hotis forma um cluster. Para
escolher uma amostra por clusters devemos seguir os seguintes passos:
Encontrar uma lista dos hotis de Lisboa;

Decidir qual o nmero de hotis sobre os quais a investigao vai ser aplicada (Por exemplo 10%);
Escolher 10% dos hotis por amostragem aleatria;
Efectuar a investigao sobre todos os empregados dos hotis que constituem a amostra de 10% .
OS MTODOS DE AMOSTRAGEM NO CASUAL
Estes mtodos no so aconselhveis quando se pretende extrapolar para o Universo os resultados ou concluses
obtidos com a amostra, mas podem ser teis no incio de um investigao por exemplo, para testar as primeiras
verses dos questionrios.
29
Dentro deste tipo de mtodos os mais vulgares so:
Amostragem por convenincia

Amostragem por quotas
mtodo de amostragem por convenincia
Neste mtodo os casos escolhidos so os casos que so facilmente disponveis (muitas vezes, os amigos dos
amigos!). O mtodo tem vantagens por ser rpido, barato e fcil. As desvantagens so que os resultados e
concluses s se aplicam amostra, no podendo ser extrapolados para o Universo. Isto porque no h
garantia de que a amostra seja razoavelmente representativa do Universo (muitas vezes no bvio o que o
Universo!).
mtodo de amostragem por quotas
Este mtodo anlogo ao mtodo de amostragem estratificada mas com uma diferena importante. Em vez de
se escolher uma amostra aleatria dentro de cada uma dos estratos na etapa final (Passo 5 no exemplo
acima), escolhe-se uma amostra no-aleatria (de tamanho determinado pela fraco de amostragem). s
vezes, as amostras dentro dos estratos so pouco diferentes das amostras por convenincia, e quase sempre
h um enviesamento na seleco dos casos. Portanto no necessariamente razovel extrapolar para o
Universo os resultados e concluses tirados da amostra. Contudo, e em geral, este mtodo melhor do que o
da amostragem simplesmente por convenincia.
CONSELHO PRTICO SOBRE AMOSTRAGEM
1. Restrio da investigao
No contexto de um projecto de licenciatura ou de uma tese de Mestrado o tempo para fazer

investigao limitado. Portanto de bom senso restringir a natureza e tamanho da
investigao. possvel fazer isto por meio da escolha de um tema em que a investigao
pode ser feita num Universo pequeno de casos -- por exemplo, todos os empregados de
uma empresa. Neste caso no preciso escolher uma amostra, e portanto no h
problemas de amostragem. verdade que num tal estudo no possvel extrapolar as
concluses a outras empresas no mesmo sector, mas isto no importa; o que importa que
o trabalho seja bem feito.
2. A estruturao de uma amostra estratificada
Numa investigao relativamente simples provavelmente melhor usar uma amostra por
clusters ou uma amostra estratificada. Mas como decidir quanto aos estratos de uma
amostra estratificada? No difcil. S precisa de pensar nos objectivos da investigao.
No exemplo do estudo sobre as polticas dos hotis nacionais o objectivo identificar as
polticas. razovel pensar que os hotis de maior dimenso tenham talvez polticas
diferentes dos hotis de menor dimenso (muitas vezes os grandes hotis fazem parte de
uma grande empresa multinacional e os pequenos hotis pertencem a uma famlia) e,
portanto, dimenso deva ser utilizada para estratificar a amostra. tambm razovel
considerar que os hotis tm vrios tipos de clientes, por exemplo, turistas, pessoas de
negcio, viajantes comerciais etc.. Provavelmente, a grande maioria dos turistas vo para
os hotis do Algarve e uma parte menor para os hotis de Lisboa. A maioria dos clientes
dos hotis de Lisboa e do Porto so provavelmente pessoas de negcios. assim provvel
que os hotis que tm tipos de clientes diferentes tenham polticas diferentes, portanto pode
ser til utilizar tambm Local para estratificar a amostra.
Convm notar que, em muitas das investigaes, a reviso da literatura que deu luz aos
objectivos do estudo muito til na escolha das variveis para estratificar a amostra.
30
3. O problema da representatividade de uma amostra reduzida
Na maioria das situaes, o nmero de questionrios recebidos no coincide com o

nmero de casos da amostra h sempre um conjunto de pessoas ou instituies que no
respondem ao questionrio ou no do a informao solicitada. Vamos usar o termo
amostra reduzida quando a amostra obtida apenas uma parte da amostra alvo (a amostra
completa), ou seja, da amostra inicialmente planeada. Isto um problema muito vulgar no
caso de questionrios enviados por correio. Se a amostra alvo foi escolhida por meio de
mtodos aleatrios, a existncia de uma amostra reduzida traz problemas relativos sua
representatividade. Se a amostra alvo for bem planeada, ela representativa do Universo,
mas no h garantia de que a amostra reduzida tambm o seja. Se, por exemplo, a
amostra alvo foi escolhido utilizando o mtodo por quotas o problema parece mais fcil de
resolver pois relativamente fcil encontrar mais casos num estrato onde haja falta de
casos quaisquer casos que tenham as caractersticas do estrato servem. (Mas lembrese
que se utilizar o mtodo por quotas, a amostra alvo no necessariamente representativa
do Universo). O problema mais difcil resolver no caso de uma amostra estratificada.
Neste caso h quatro possibilidades:
Persuadir os inquiridos que no deram resposta a preencher o questionrio. ( muito

provvel que este processo aumente o tamanho da amostra, mas menos provvel que
resolva inteiramente o problema).
Escolher casos alternativos para obter a amostra alvo (A vantagem obvia, mas as
desvantagens so que precisa de tempo e no certo que seja possvel obter suficientes
casos adicionais).
Analisar as caractersticas dos norespondentes para decidir se ser provvel que a

falta de informao destes casos tenha introduzido um enviesamento na amostra. (A
desvantagem aqui que a deciso no totalmente objectiva, e um processo difcil. Mas
h literatura nesta rea e, por vezes, possvel corrigir os dados (vide: Moser e
Kalton:1986).
Provavelmente a soluo mais prtica (mesmo que no seja a melhor soluo)

comparar a amostra reduzida com uma amostra do mesmo tamanho retirada por quotas do
Universo. Se a diferena for pequena em todos os estratos, a amostra reduzido pode ser
tratada como sendo uma amostra por quotas. Se a diferena for grande em alguns dos
estratos relativamente fcil aumentar o nmero de casos tal como se faz numa amostra
por quotas (ou eliminar casos usando um mtodo aleatrio).
Para ilustrar este processo usaremos o exemplo da investigao das polticas dos hotis
nacionais. O quadro 7 mostra que o Universo tem 8500 casos no total. A amostra
estratificada com a fraco amostral de 10% formada por 850 casos e apresentada no
quadro 8. Imagine que s obtivemos os 600 casos do Quadro 9, o que representam uma
fraco amostral do Universo igual a (600 100)/8500 = 7,059%. O quadro 10 apresenta o
nmero de casos para cada um dos estratos para uma amostra de 7,059% dos casos do
Universo. Para calcular o nmero de casos em cada estrato do Quadro 10 calcula-se a
percentagem dos casos no estrato no Universo e multiplica-se esta percentagem por 600.
Por exemplo, no estrato Dimenso (51 100) no Norte h 740 casos do Universo de 8500
casos. Portanto este estrato contm (740 100)/ 8500 = 8,7% dos casos no Universo.
Numa amostra por quota que tem 600 casos, o estrato Dimenso (51 100) no Norte deve
ter (8,7 600)/100 = 52 casos.
Quadro 9. A amostra reduzida de 600 casos
DIMENSO
Menos Mais de
51 - 100 TOTAL
de 50 100
REGIO NORTE 80 50 10 140
CENTRO 60 40 10 110
SUL 240 90 20 350
TOTAL 380 180 40 600
31
Quadro 10. A amostra por quotas de 600 casos
DIMENSO
Menos 51 - 100 Mais de TOTAL
de 50 100
NORTE 78 52 11 141
REGIO
CENTRO 64 35 7 106
SUL 247 85 21 354
TOTAL 389 172 39 600
evidente que a amostra reduzida e a amostra por quotas de 600 casos so relativamente
semelhantes. Para obter uma amostra por quotas perfeita s precisamos de eliminar 15 casos e obter
mais 15 casos. Neste exemplo podemos dizer que a amostra reduzida razoavelmente representativa
do Universo como amostra estratificada. Mas o exemplo no tpico, e geralmente mais razovel
concluir que a amostra adequada como uma amostra por quotas.
H outras maneiras de resolver o problema da representatividade da amostra, como sejam, utilizando

ponderadores. Neste caso aconselhvel consultar um especialista em estatstica.
6. ALGUNS PROBLEMAS COM A ANLISE DE DADOS
Nesta seco discutiremos vrias questes prticas (problemas e solues) relacionadas com a anlise estatstica de
dados. Para ilustrar alguns pontos vamos usar o conjunto de dados apresentado em Anexo. Estes dados representam
os resultados de um inqurito realizado numa fbrica onde a ausncia ao emprego era um problema preocupante. Antes
de ler esta seco convm ler a descrio (em Anexo) da natureza e objectivos deste inqurito.
6.1. O agrupamento de casos
Por vezes torna-se til (ou necessrio) usar uma varivel contnua para agrupar os casos em dois grupos. Por exemplo,
suponha que queramos usar os dados do Anexo para comparar os casos que tm um nvel elevado de absentismo
(AUSNCIA) com os casos que tm um nvel baixo de absentismo . Para fazer isto temos de recodificar a varivel
AUSNCIA noutra varivel (por exemplo, AUSEN_2) que s vai ter dois valores (Baixa Ausncia = 1 e Alta Ausncia =
2). Os casos que tm valor 1 na varivel AUSEN_2 constituem o Grupo 1 (Baixa Ausncia) e os casos que tm valor 2
constituem o Grupo 2 (Alta Ausncia). Os trs mtodos mais vulgares para fazer este tipo de recodificao so:
Partio pelo valor mdio da varivel que se pretende agrupar

Partio pela mediana.
O mtodo de Grupos Extremos
Partio pelo valor mdio da varivel que se pretende agrupar

.
O valor mdio da varivel AUSNCIA 10,43. Portanto, os casos com valores de AUSNCIA inferior a 10,43 tm o
valor 1 na varivel AUSEN_2 e formam o Grupo 1. Os casos com valores iguais ou superiores a 10,43 vo ter o valor 2
na varivel AUSEN_2 e formam Grupo 2.
32
Este mtodo s aceitvel se a distribuio da varivel contnua (AUSNCIA) for aparentemente simtrica.
Para efectuar este tipo de agrupamento de casos use os seguintes comandos do SPSS:
TRANSFORM
RECODE
INTO DIFFERENT VARIABLE
input variable = (neste exemplo, AUSNCIA)
output variable = (neste exemplo, AUSEN_2)
OLD AND NEW VALUES
Partio pela mediana.
Este mtodo anlogo ao mtodo (a) mas utiliza a mediana em vez do valor mdio da varivel contnua. A mediana da
varivel AUSNCIA 10,16. Portanto, os casos no Grupo 1 vo ter valores de AUSNCIA inferiores a 10,16 e os casos
no Grupo 2 vo ter valores iguais ou superiores a 10,16.
Este mtodo mais til do que o anterior porque pode ser utilizado quando a distribuio da varivel contnua
(AUSNCIA) simtrica ou assimtrica.
Infelizmente tanto o primeiro mtodo como o segundo trazem problema. Olhemos para a figura 4 que apresenta a
distribuio da AUSNCIA, e recordemos que o valor da mediana igual a 10,16. A matriz de dados apresentada em
Anexo revela que o caso 3, que pertence ao Grupo 1, tem o valor 10 na varivel AUSNCIA e que, por exemplo, o caso
14, que pertence ao Grupo 2, tem o valor 11 na varivel AUSNCIA. A diferena de AUSNCIA entre os dois casos
pequena (11 10 ), ou seja, 1 dia de ausncia. Mas os dois casos pertencem a grupos diferentes!. Ainda pior, o
valor mdio da varivel AUSNCIA para os casos do Grupo 1 5,96, e o valor mdio para os casos do Grupo 2
14,92, portanto a diferena entre o caso 3 e o caso tpico do Grupo 1 (o caso mdio do grupo1) (10 5,96) = 4,04 , e
esta diferena maior que a diferena entre os casos 3 e 14 que pertencem a grupos diferentes!. O caso 3 pouco
representativo dos casos do Grupo 1 em termos de AUSNCIA ( e o caso 14 pouco representativo dos casos do
Grupo 2). Infelizmente casos como o 3 e 14 no so casos isolados, h vrios outros casos que mostram este problema
da falta de representatividade.
Figura 4
AUSNCIA
10
7
Nmero de casos
1
Expected
0
-4 -2 0 2 4 6 8 10 12 14 16 18 20 Normal
ausncias
33
Para resolver esta problema possvel usar outro mtodo para efectuar a partio dos dados.
O mtodo de Grupos Extremos
Neste mtodo vamos retirar um conjunto de casos no meio de distribuio. Para isso preciso estabelecer dois valores
da varivel contnua (AUSNCIA) como valores de cut-off. Isto pode ser feito de duas maneiras:
Mtodo 1. Quando a distribuio for relativamente simtrica
Valor inferior de cut -off = Valor mdio (ou mediana) - 0,25 desvios padro (d.p.)
Valor superior de cut-off = Valor mdio (ou mediana) + 0,25 desvios padro (d.p)
O Grupo 1 formado por todos os casos com valores abaixo do valor inferior de cutoff.
O Grupo 2 formado por todos os casos com valores acima dovalor superior de cutoff.
No nosso exemplo, o desvio padro da varivel AUSNCIA 5,53, portanto tem-se:
Usando o valor mdio (10,43)
O valor inferior de cutoff = 10,43 (5,53 0,25) = 9,048

O valor superior de cut off = 10,43 + ( 5,53 0,25) = 11,812
Usando a mediana (10,16)
os cutoffs so 10,16 (5,53 0,25) = 8,778

10,16 + (5,53 0,25) = 11,543
Mtodo 2. Quando a distribuio assimtrica
O valor inferior de cut off = Mediana - (0,25 intervalo interquartil) = 8,165

O valor superior de cut off = Mediana + (0,25 intervalo interquartil) = 12,155
So duas as vantagens do mtodo de partio pelos Grupos Extremos. Por um lado, este mtodo evita situaes
semelhantes s dos casos 3 e 14 no exemplo, e por outro, pode aumentar o poder de uma anlise onde se pretenda
comparar os grupos de casos. (Se existir uma diferena genuna entre os grupos de casos, mais provvel que a
anlise a consiga encontrar). Mas tambm h desvantagens: por um lado a amostra fica mais reduzida do que a
amostra inicial, e por outro, aps a eliminao dos casos intermdios, pode acontecer que a amostra no seja
representativa do Universo.
Portanto, se usar o mtodo dos Grupos Extremos, e tiver uma amostra aleatria estratificada escolhida
para ser representativa de um Universo, essencial verificar que, depois de eliminar os casos, a amostra
ainda fica representativa do Universo. (Se no o for, elimine menos casos e verifique mais uma vez a
representatividade).
34
6.2. Problemas com as correlaes paramtricas (Tipo Pearson r)
6.2.1.O problema da no-linearidade
Quando estamos a analisar dados deparamo-nos por vezes com uma correlao pequena entre duas variveis quando
a teoria prev a existncia de uma correlao maior. Nesta situao importante testar a relao entre as variveis (isto
faz-se com a opo Graphs no SPSS). Ser que a relao entre as variveis no- linear?.
Se a relao for no-linear tem duas opes:
Transformar uma, ou as duas variveis, de modo que a relao entre elas passe a ser linear;
(Note que s vezes esta transformao pode complicar a interpretao da correlao).
Se a relao no-linear tiver uma forma relativamente regular, ajuste uma curva. (Para fazer isto use as opes
STATISTICS / REGRESSION / CURVE ESTIMATION no SPSS. O comando CURVE ESTIMATION calcula
automaticamente uma correlao no-linear).
Note que teoricamente a coeficiente de correlao do Pearson precisa da uma distribuio

bivariada normal que mostre homogeneidade e um comportamento linear. Mas o mais
importante destes pressupostos a linearidade do comportamento.
6.2.2.O significado estatstico e o significado prtico do coeficiente de correlao
Numa amostra grande, o coeficiente de correlao pode ter significado estatstico aceitvel mas pouco significado
prtico. Afirmar isto o mesmo que dizer que se o investigador recolher uma segunda amostra de dados (do mesmo
Universo), muito provvel que o novo coeficiente de correlao tenha um valor semelhante ao valor da primeira
amostra. Podemos assim dizer que o coeficiente de correlao da primeira amostra fivel. Mas nem uma nem outra
das correlaes permitiria ao investigador predizer, com exactido, o valor de uma das variveis para um dado caso
(observao) com base no valor da outra varivel. Por exemplo, para uma amostra de 400 casos, um coeficiente de
correlao (r) entre as variveis A e B igual a 0,1 estatisticamente significativo (p < 0,05), mas a percentagem da
varincia dos valores de A explicada pela varincia dos valores de B s r x 100 = [ (0,1) x 100 ] = 1%. Este valor
2 2
no tem significado prtico.
Geralmente mais importante avaliar o significado estatstico de um coeficiente de correlao, mas no caso em que o
investigador quer usar uma das variveis para prever valores noutra varivel, importante avaliar o significado prtico
tambm.
35
6.3. Problemas relacionados com o Qui-quadrado (2)
6.3.1.Que Qui-quadrado utilizar?
Nos dados apresentados em Anexo h duas variveis dicotomizadas --- SEXO e AUSEN_2. Imagine que usamos o
programa SPSS para calcular o valor do Qui-quadrado para estas variveis. O output obtido encontra-se nos quadros
11 e 11 (a).
Quadro 11.
Cruzamento Sexo x AUSEN2
Ausen2
AUSNCIA AUSNCIA
Total
ABAIXO DA ACIMA DA
MEDIANA MEDIANA
Count 16 18 34
MASCULIN
Expecte
O
d Count 17,0 17,0 34,0
SEXO
Count 14 12 26
FEMININO Expecte
d Count 13,0 13,0 26,0
Count 30 30 60
TOTAL Expecte
d Count 30,0 30,0 60,0
Quadro 11(a)
Chi-Square Tests
Asymp. Exact Exact

Sig. Sig. Sig.
Value df (2-sided) (2-sided) (1-sided)
Pearson b
,271 1 ,602
Chi-Square
Continuity a
,068 1 ,794
Correction
Likelihood Ratio ,272 1 ,602
Fisher's Exact
,795 ,397
Test
N of Valid Cases 60
a. Computed only for a 2x2 table
b. 0 cells (,0%) have expected count less than 5. The minimum expected
count is 13,00.
O Quadro 11 (a) apresenta trs tipos (e trs valores) de Qui-quadrado -- Pearson (que o Qui-quadrado normal), o
Likelihood ratio e o Yates continuity correction. Qual deles usar? Neste exemplo, os trs tipos conduzem mesma
concluso, mas por vezes podem conduzir a concluses diferentes.
Normalmente usamos o valor do Qui-quadrado de Pearson, mas este valor e o do Likelihood ratio so quase idnticos,
e quando a dimenso da amostra aumenta ficam cada vez mais idnticos. A vantagem do Likelihood ratio que
36
menos influenciado pelo tamanho da amostra, e portanto no caso de amostras pequenas ( por exemplo, menos que 25
casos) melhor usar o Likelihood ratio.
A maioria dos livros de estatstica mais antigos referem que, no caso de o valor do Qui-quadrado ser calculado sobre
uma tabela de contingncia 2 x 2, importante usar o continuity correction. Mas isto no bem verdade! S preciso
usar o continuity correction quando os totais marginais na tabela so fixos e no variam de uma amostra para outra. No
mbito da investigaes em Cincias Sociais isso pouco provvel e portanto, geralmente, no preciso usar o
continuity correction.
6.3.2. O problema das frequncias esperadas pequenas
A nota (b) colocada por baixo do Quadro 11(a) indica 0 cells (0%) have expected count less than 5. Isto pode ser
comprovado no Quadro 11 que apresenta as frequncias esperadas 17, 17, 13. Aqui no h problema pois todos os
valores so superiores a 5. Mas por vezes uma ou mais clulas tm frequncias esperadas inferiores a 5, e quando
20% (ou mais) das clulas tm frequncias esperadas inferiores a 5, o valor do Qui-quadrado no valido. Para corrigir
este problema, possvel usar o teste exacto de Fisher, mas infelizmente este teste s se aplica aos cruzamentos do
tipo 2 x 2. No caso de termos cruzamentos com mais de duas categorias, pelo menos numa das variveis, possvel
juntar nveis (categorias) de uma ou das duas variveis. Por exemplo, se tivermos 5 categorias para a varivel IDADE
(menos que 21, 21 30, 31-40, 41 50, e mais que 50) possvel reduzir o nmero de categorias at 3 (por exemplo,
menos que 21, 21 40. mais que 40). Esta reduo aumentar os valores das frequncias esperadas em cada clula e
portanto pode ajudar a resolver o problema. Mas se quiser fazer uma tal reduo -- cuidado! importante reduzir o
nmero de categorias de modo a ficar com um conjunto de categorias que faam sentido.
6.3.3. Qui-quadrado e percentagens
Nunca aplique o teste do Qui-quadrado a percentagens!. Para visualizar a situao considere o seguinte exemplo:
Um estudo sobre a satisfao dos 65 clientes dos hotis com duas (**) ou quatro (****) estrelas produziu os dados do
quadro 12.
O valor do Qui-quadrado para este quadro igual a 2,229, P > 0,10. Obviamente no existe relao significativa entre
satisfao dos clientes e tipo de hotel. Se transformamos as frequncias do Quadro 12 em percentagens (em coluna,
em linha e total) temos o quadro 12 (a).
Quadro 12
TIPO DE HOTEL
TOTAL
**** **
Nmero de clientes
12 18 30
Satisfeitos
Nmero de clientes 35
8 27
Insatisfeitos
TOTAL 20 45 65
37
Quadro 12.a
(% EM COLUNA) (% EM LINHA) (% TOTAL)

Tipo de hotel Tipo de hotel Tipo de hotel
**** ** **** ** **** **
% Sat. 60 40 40 60 19 28
% Insat 40 60 23 77 12 41
Qui-quadrado= 8,0 6,78 3,44
(p < ,01) (p < ,01) (p < .06)
Segundo os valores do Qui-quadrado calculados a partir das percentagens encontramos relao significativa entre a
satisfao dos clientes e o tipo de hotel, mesmo no caso da (% total) onde a significncia da relao fraca (6%).
evidente que as concluses para os trs tipos de percentagem so muito diferentes da concluso tirada da anlise das
frequncias do Quadro 12. Repetimos -- Nunca aplique o teste do Qui-quadrado a percentagens!
6.3.4. Um Qui-quadrado fora do usual
O Qui-quadrado um teste de hiptese nula. A tcnica compara um conjunto de frequncias observadas com um
conjunto de frequncias esperadas com base na hiptese nula. Normalmente as frequncias esperadas so as
frequncias esperadas ao acaso, mas possvel usar frequncias esperadas com base numa teoria.
Por exemplo, tomemos os dados do Anexo e suponhamos que tnhamos uma teoria que nos diz que 25% dos
empregados estariam pouco satisfeitos com o Chefe, 50% estariam razoavelmente satisfeitos e 25% estariam muito
satisfeitos. Sendo a amostra de 60 casos, 25% corresponde a 15 empregados e 50% a 30 empregados. Estes valores
podem ser usados como sendo as frequncias esperadas. As frequncias observadas so calculadas a partir da matriz
de dados no Anexo. Estas frequncias so apresentadas no quadro seguinte:
Quadro 13.
Pouco satisfeito Razoavelmente Muito satisfeito

satisfeito
Frequncias observadas 11 20 29
Frequncias esperadas 15 30 15
Qui-quadrado = 17,467, g.l. = 2, p < 0,001
Neste caso verifica-se que a distribuio observada significativamente diferente da distribuio esperada com base na
teoria h muito mais empregados satisfeitos com o Chefe do que o investigador esperava com base na teoria. Parece
pois que o investigador precisa de outra teoria!
6.4. Problemas relacionadas com o Teste t
H vrios tipos da Teste t
38
O teste t para uma s amostra

O teste t para duas amostras independentes
O teste t para duas amostras emparelhadas
Nesta Seco s vamos tratar de problemas dos ltimos dois tipos do Teste t porque estes so os tipos mais
vulgarmente utilizados em cincias sociais aplicadas.
6.4.1. O Teste t para duas amostras independentes: o problema das varincias desiguais
O objectivo do teste t para duas amostras independentes calcular uma estatstica t para testar a hiptese nula que a
diferena entre os dois valores mdios de uma varivel dependente obtidos a partir de duas amostras independentes
(ou seja, dois grupos de casos independentes) seja zero. Por exemplo, no caso dos dados do anexo, possvel testar
se a AUSNCIA mdia difere significativamente entre trabalhadores do sexo masculino e trabalhadores do sexo
feminino.
O problema do Teste t que exige que a varincia da varivel dependente no difira significativamente entre as duas
amostras (no exemplo, homens e mulheres). No caso em que este pressuposto no vlido preciso calcular o valor
da estatstica t de outra maneira.
O SPSS aplica automaticamente um teste de igualdade das varincias (o teste F de Levene), e tambm calcula
automaticamente dois valores da estatstica t o primeiro para utilizar quando o pressuposto de varincia vlido, e o
outro para utilizar quando o pressuposto no vlido. Para escolher o valor da estatstica t adequado, o investigador
precisa de olhar para a significncia da estatstica F apresentada pelo SPSS como parte do output. Se o valor de F for
significativo (p <0,05), preciso utilizar o valor de t associado com a expresso Equality of variances not assumed no
SPSS output. Se o valor de F no for significativo, utilize o valor de t associado com a frase Equality of variance
assumed.
6.4.2. O Teste t para duas amostras emparelhadas
Neste contexto amostras emparelhadas so amostras relacionadas, ou seja, no independentes. Por exemplo,
imagine que em Janeiro 1998 aplicmos um questionrio a uma amostra de 100 pessoas para medir a Satisfao
Global no emprego. Em Junho 1998 aplicmos a mesma medida s mesmas pessoas mais uma vez. Nesta
investigao temos uma varivel dependente (Satisfao Global) e uma varivel independente (momento de
aplicao do questionrio). A varivel independente s tem dois nveis (valores) -- Janeiro e Junho. No fim temos duas
amostras de dados (valores de Satisfao Global) -- uma amostra retirada em Janeiro e outra retirada em Junho. Mas
as duas amostras de dados no so independentes -- so relacionadas porque foram fornecidas pelas mesmas
pessoas, o que implica que provvel que os dados retirados em Janeiro estejam significativamente correlacionados
com os dados retirados em Junho. Por causa de no serem independentes, as duas amostras de dados no podem ser
analisadas por meio de um Teste t para amostras independentes. Temos de aplicar o Teste t para amostras
emparelhadas (tambm chamada amostras relacionadas, amostras correlacionadas ou amostras dependentes).
Na aplicao do Teste t para amostras emparelhadas o objectivo testar a hiptese nula que a diferena entre os dois
valores mdios da varivel dependente (Satisfao global) igual a zero. No nosso exemplo, seria testar que a
satisfao mdia global no diferiu entre Janeiro e Junho de 1998.
O teste t para amostras emparelhadas aplicvel quando:
39
Um s grupo de casos d valores da varivel dependente duas vezes (isto , em dois momentos ou em
duas situaes diferentes).
ou
Dois grupos de casos, relacionados de certa forma, do valores da varivel dependente. Nesta situao
essencial que cada um dos casos no Grupo 1 esteja relacionado com um s caso no Grupo 2. Por
exemplo , o Grupo 1 um grupo de homens e o Grupo 2 formado pelas mulheres dos homens. Mas a
relao entre os casos dos dois Grupos pode ser da outra forma. Por exemplo, os casos pode estar
seleccionados de modo que o nvel de inteligncia de cada um dos casos do Grupo 1 seja igual ao nvel de
inteligncia de um s caso do Grupo 2. Nesta situao os casos dos dois grupos esto relacionados em
termos de inteligncia.
O problema com o Teste t para amostras emparelhadas que precisa de uma codificao dos dados fora do usual no
SPSS. Para utilizar o SPSS correctamente essencial que os nveis da varivel independente sejam representados
como variveis diferentes no ficheiro de dados. Por exemplo, a varivel independente do nosso exemplo Momento de
aplicao do questionrio, mas no ficheiro de dados temos de colocar os nveis desta varivel (Janeiro e Junho) como
duas variveis. Os valores destas variveis para cada caso so os valores da Satisfao Global. No adequado criar
uma varivel Momento no ficheiro de dados porque impossvel codificar os dois valores da Satisfao Global numa
tal varivel.
fcil esquecer que o Teste t para amostras emparelhadas precisa de uma codificao fora
do normal, e muito fcil abusar deste Teste -- como vamos demonstrar na prxima
Seco.
6.4.3. O Teste t do Tolo
As opes para usar a teste t para amostras emparelhadas no SPSS so:
STATISTICS
COMPARE MEANS
PAIRED-SAMPLE T TEST
Quando so seleccionadas estas opes, o computador mostra um painel para seleccionar as variveis, e o
investigador tem de fazer entrar duas variveis. No h problemas se o ficheiro de dados estiver bem construdo para
fazer o Teste t para amostras emparelhadas e se o investigador perceber o significado do teste .
Mas considere as variveis do Anexo IDADE e ANTIGUIDADE NA EMPRESA. Um investigador pode usar estas
variveis para fazer uma Teste t para amostras emparelhadas pensando que um s grupo de casos deu valores para
estas variveis e portanto preciso um Teste t para amostras emparelhadas.
Este Teste t aquilo que designamos por um Teste t do Tolo porque as variveis IDADE e
ANTIGUIDADE NA EMPRESA so duas variveis dependentes totalmente diferentes.
pouco interessante saber que o valor mdio da IDADE significativamente maior que o
valor mdio da ANTIGUIDADE NA EMPRESA. (Seria impossvel encontrar o contrrio!).
Se no compreender isto imagine que as variveis eram PESO e ALTURA. Provavelmente

so poucas as pessoas que querem investigar se, num amostra de empregados, os
empregados so, em mdia, mais pesados do que altos. Seria uma investigao ridcula.
Da que preciso muita cautela ao escolher o tipo de Teste t para analisar os seus dados.
40
6.4.4. Teste t e comparaes mltiplas
Por vezes o investigador pretende comparar dois grupos de casos em termos de um conjunto de variveis usando o
teste t. Por exemplo, no caso dos dados apresentados em Anexo suponha que queramos comparar dois grupos de
empregados -- Grupo 1 (Ausncia baixa) e Grupo 2 (Ausncia alta) em termos de um conjunto de oito variveis
dependentes: Antiguidade na empresa, Idade e seis medidas de satisfao (satisfao com Trabalho, Ordenado, Chefe,
Colegas, Administrao e Ambiente no trabalho). Para agrupar os casos vamos usar o mtodo (b) da seco 6.1,
portanto os casos do Grupo 1 tm valores de AUSNCIA abaixo da mediana e os casos do Grupo 2 tm valores de
AUSNCIA acima da mediana. O quadro 14 apresenta os valores mdios das variveis dependentes.
Quadro 14. Aplicao do Teste t para comparaes mltiplas
Grupo
Significncia
Varivel t
do t
ausncia baixa ausncia alta
Antiguidade na
empresa 14,50 9,47 2,083 p = 0,042
Idade 46,29 35,20 3,764 p < 0,0001
Trabalho 2,37 1,70 3,912 p < 0,0001
Ordenado 2,27 1,77 3,060 p = 0,003
Chefe 2,63 1,97 3,721 p < 0,0001
Colegas 2,43 1,70 4,269 p < 0,0001
Administrao 2,13 1,57 3,113 p = 0,003
Ambiente 2,17 1,80 2,257 p = 0,028
Quando pretendemos aplicar um conjunto de testes t h trs passos a seguir:
2
1 Comparar os dois grupos usando o teste T de Hotelling. Este um teste multivariado para comparar os dois
2
grupos em termos do conjunto inteiro das variveis dependentes. Um valor significativo de T indica que pelo
menos uma, e talvez mais, das variveis dependentes significativa, e neste caso podemos passar ao passo
2
2. Se o valor de T no for significativo no h nada mais a fazer porque nenhuma das variveis dependentes
pode ser considerada significativa.
2
No caso dos dados do exemplo, T = 47,974 (p = 0,00009), portanto continuamos para o passo 2
2 Fazer um conjunto de testes t com correco Bonferroni.

Porque que precisamos de fazer um correco, e o que a correco Bonferroni?
O teste t um teste de hiptese nula (os valores mdios dos dois grupos so iguais) e normalmente queremos
rejeitar esta hiptese ao nvel de p = 0,05. Com base no quadro 14, que tambm apresenta os valores do teste
t para todas as variveis, parece que podemos rejeitar a hiptese nula para todas as variveis. Mas no bem
assim. O valor 0,05 a probabilidade de rejeitar a hiptese nula quando esta hiptese verdadeira, e portanto
o valor 0,05 (o nvel de significncia) um nivel (probabilidade) de erro. Tecnicamente chamase a este
erro, erro do Tipo 1. Este erro a probabilidade de concluirmos, incorrectamente, que os valores mdios dos
dois grupos no so iguais. Alm disso, a probabilidade de erro quando fazemos s um teste t. Quando
aplicamos uma famlia (conjunto) de testes, a probabilidade de erro aumenta porque h uma probabilidade
de erro associada com cada um dos testes. Se usarmos k testes, e quisermos utilizar o nvel de significancia
41
= 0,05, a probabilidade de pelo menos um dos testes dar concluses erradas (o que chamada a taxa
do erro da famlia)
A taxa de erro da famlia = = 1 - (1 - )

k
No caso do nosso exemplo em que h oito variveis tem-se:
= 1 - (1 0,05) = 0,337
8
Esta probabilidade de erro no aceitvel e para manter a taxa de erro da famlia ao nvel de p = 0,05
preciso fazer uma correco.
A correco mais vulgarmente utilizada a correco de Bonferroni . Esta correco muito simples, basta
dividir a taxa de erro da famlia que queremos manter pelo nmero de testes. No nosso exemplo, queremos
aplicar o teste t a oito variveis e pretendemos usar uma taxa de erro da famlia p = 0,05. Portanto calculamos
0,05 / 8 = 0,00625. Para ser considerado significativo ao nvel p = 0,05 o valor do t em cada um dos testes
3
deve ser significativo ao nvel p = 0,00625, e isto precisa de um valor t = 2,84 (vide as Tabelas de Dunn ).
Repare-se que pelo quadro 14, todas as variveis dependentes tm valores de t significativos antes de fazer a
correco. Efectuada a correco, duas das variveis dependentes tm valores de t no significativos
(Antiguidade na empresa e Satisfao com o ambiente no trabalho).
3 Verifique as correlaes entre as variveis dependentes.
No caso ideal estas variveis no devem estar significativamente correlacionadas. Para o nosso exemplo, o
quadro 15 revela que todas as variveis ligadas com satisfao esto correlacionadas entre si, mas nenhuma
delas tem correlao elevada com a varivel Idade. ento razovel pensar que os vrios tipos de satisfao
representam aspectos diferentes da uma varivel -- Satisfao Global no emprego (vide Quadro 6 na
seco sobre validade factorial). Portanto possvel que os resultados dos testes t, mesmo com correces
de Bonferroni, sejam artificiais. Talvez os grupos Ausncia Alta e Ausncia Baixa s difiram em termos de
Satisfao Global (e Idade por no estar correlacionada com as vrios tipos de satisfao).
Quadro 15.
Correlations
TRABAL ORDENADO CHEFE COLEGAS ADMIN AMBIENTE

Idade ,135 ,212 ,159 ,273 ,130 ,109
TRABAL 1,000 ,476 ,403 ,453 ,650 ,284
ORDENADO 1,000 ,383 ,462 ,470 ,193
CHEFE 1,000 ,375 ,489 ,452
COLEGAS 1,000 ,522 ,278
ADMIN 1,000 ,305
AMBIENTE 1,000
Numa situao como esta em que muitas das variveis dependentes esto correlacionadas entre si seria melhor realizar
uma anlise factorial com estas variveis e aplicar o teste t aos valores dos factores. A anlise factorial (tipo alpha)
3
Estas tabelas so as tabelas dos valores crticos para o teste de comparaes mltiplas Bonferroni. Ver por exemplo em Howell, D.C.
(1992). Statistical Methods for Psychology, Duxbury Press, An Imprint of Wadsworth Publishing Company, Belmont, California.
42
aplicada s seis medidas de satisfao produziu os valores ( scores) do factor Satisfao Global para todos os casos.
O valor mdio dos scores para cada grupo de trabalhadores apresentado no Quadro 16.
( Note que a natureza do factor Satisfao Global apresentada no Quadro 6)
Quadro 16.
Grupo
Varivel t Significncia de t
ausncia baixa ausncia alta
Satisfao Global 0,508 -0,508 5,142 p <0,0001
Idade 46,29 35,20 3,764 p < 0,0001
2 2
O teste T de Hotelling aplicado ao conjunto das variveis Satisfao Global e Idade d um valor T = 42,364 (p <
0,000001). Portanto, os grupos de Ausncia Baixa e Ausncia Alta diferem significativamente em termos do
conjunto destas variveis. Para fazer uma correco de Bonferroni (com taxa da famlia p = 0,05) calcula-se 0,05 /2 =
0,025. Ressalta do quadro 16 que as duas variveis, Idade e Satisfao Global, so significativas aps a correco (
ambos os valores da significncia so inferiores a 0,025).
6.5. Anlise de componentes principais versus Anlise factorial
Estas tcnicas parecem semelhantes mas tm objectivos diferentes. A anlise de Componentes Principais tem como
objectivo principal a anlise da varincia total de cada um das variveis num conjunto de variveis. Teoricamente a
varincia total de cada varivel pode ser decomposta em trs partes:
Varincia comum (varincia partilhada com as outras variveis do conjunto com as quais a varivel est
correlacionada).
Varincia especfica (varincia que s pertence varivel e que no partilhada com as outras variveis
do conjunto).
Varincia associada com o erro
As trs partes so aditivas, ou seja:
Varincia Total = Varincia comum + Varincia especfica + Varincia erro
Sendo uma anlise de varincia total, a tcnica de Componentes Principais uma anlise que inclui varincia associada
com o erro.
Teoricamente a correlao entre duas variveis s depende da varincia comum, e o objectivo principal da Anlise
Factorial analisar a varincia comum num conjunto de variveis para entender, ou explicar, as correlaes entre
essas variveis.
possvel usar as duas tcnicas para agrupar variveis em termos de Componentes ou Factores, e possvel usar as
duas tcnicas para reduzir a complexidade de um conjunto de dados. Mas quando as medidas das variveis no tm
fiabilidade perfeita (e portanto as medidas contm erro -- o que normal no caso de variveis tais como opinies,
43
atitudes e satisfaes) melhor no analisar a varincia associada com o erro. Portanto nestes casos prefervel
usar a tcnica de Anlise Factorial.
No vamos dar conselho prtico sobre as opes no SPSS para fazer uma Anlise Factorial porque h vrios tipos de
Anlise Factorial e muitas opes. Se quiser fazer uma tal anlise melhor pedir conselho a um profissional de
estatstica.
44
BIBLIOGRAFIA
BABBIE, E. & HALLEY, F. (1995) Adventures in Social Research: Data analysis using SPSS for Windows. Thousano
Oaks California: Pine Forge Press.
BRYMAN, A. & CRAMER, D. (1993) Anlise de Dados em Cincias Sociais. Introduo s Tcnicas Utilizando o SPSS.
Oeiras: Celta.
CAMPBELL, D.T. & FISKE, D.W. (1959) Convergent and discriminant validation by the multitrait multimethod matrix.
Psychological Bulletin, 56, 81 105.
EDWARDS, A.L. (1957) The social desirability variable in personality assessment and research. New York: Dryden
HILL, A.B. (1986) The influence of social desirability on the Ai3 measure of anal character. British Journal of Medical
Psychology, 59, 105 109.
HILL, M. M. & HILL, A.B. (1998) A construo de um questionrio. Lisboa: Dinmia.
rd
HOWELL, D.C. (1992) Statistical methods for Psychology 3 edition. Belmont, Ca.: Duxbury press.
MOSER, C.A. & KALTON, G. (1986) Survey Methods in Social Investigation. Aldershot, U.K.: Gower Publishing
Company.
MURPHY, K.R. & DAVIDSHOFER, C.O. (1988) Psychological Testing: Principles and Applications. Englewood Cliffs,
NJ: Prentice Hall International Inc.
REIS, E., MELO, P., ANDRADE, R. & CALAPEZ, T. (1996) Estatstica Aplicada. Lisboa: Edies Slabo, LDA.
45
ANEXO
O Director do Departamento de Produo queixa-se que os limites de produo no esto a ser atingidos por causa do
elevado absentismo observado na empresa e pede ao Director de Recursos Humanos para estudar o problema e
analisar em que medida este absentismo pode ser reduzido.
A partir de uma lista de possveis factores relacionados com o absentismo, o Director de Recursos Humanos aplicou um
pequeno questionrio aos 60 trabalhadores do departamento de Produo.
As primeiras perguntas desse questionrio diziam respeito ao sexo, idade do trabalhador, antiguidade na empresa e
seco onde trabalha e as seis ltimas perguntas procuravam medir o grau de satisfao sobre vrios aspectos do
emprego. Recolheu ainda o nmero de dias no ltimo ano que o trabalhador se ausentou do servio sem justificao. A
partir destes dados construiu um ficheiro com as seguintes variveis:
SECO: (1, 2 ou 3)
SEXO: (1 - Masculino; 2 Feminino)
ANTIGUIDADE: N de anos de trabalho na empresa
IDADE Idade do trabalhador
TRABALHO: Grau de satisfao com o trabalho que desempenha
ORDENADO: Grau de satisfao com o ordenado
CHEFE: Grau de satisfao com o chefe
COLEGAS: Grau de satisfao com os colegas
ADMINIST: Grau de satisfao com a administrao
AMBIENTE: Grau de satisfao com o ambiente no trabalho
AUSNCIA: N de dias/ano de ausncia ao trabalho sem justificao
As variveis TRABALHO, ORDENADO, CHEFE e COLEGAS ADMINIST e AMBIENTE foram codificadas numa escala
de 1 a 3, onde 1 - pouco satisfeito, 2 razoavelmente satisfeito e 3 muito satisfeito.
A varivel AUSEN2 apresentada na ltima coluna do ficheiro de dados uma recodificao da varivel AUSNCIA em
duas categorias: 1 - ausncia baixa (abaixo da mediana); 2 - ausncia alta (acima da mediana).
46
FICHEIRO DE DADOS
Caso Seco Sexo Antiguid Idade Trabalho Ordenad Chefe Colegas Admin Ambiente Ausncia Ausen2
o
1 1 2 3 32 3 3 3 3 2 2 4 1
2 3 1 10 38 2 3 2 1 1 2 17 2
3 2 2 8 45 2 2 3 2 1 2 10 1
4 3 1 5 59 2 2 1 2 1 2 7 1
5 3 2 32 57 2 2 3 2 1 2 3 1
6 2 1 8 28 3 3 2 2 2 1 19 2
7 1 1 11 40 2 2 3 2 2 3 4 1
8 1 2 4 46 3 3 3 3 2 2 8 1
9 3 2 1 19 3 2 2 2 2 3 12 2
10 2 1 5 52 2 2 2 1 1 2 11 2
11 1 2 3 43 3 2 3 1 3 1 14 2
12 3 2 5 37 2 2 3 3 2 2 8 1
13 2 1 8 22 2 3 3 2 1 2 15 2
14 1 1 17 49 2 2 3 3 2 2 11 2
15 3 2 8 60 3 3 3 3 3 2 0 1
16 1 2 2 21 1 2 2 1 1 2 18 2
17 2 1 14 46 2 2 1 2 1 2 8 1
18 2 2 9 36 2 1 1 2 1 1 17 2
19 2 2 14 42 3 3 3 2 3 2 5 1
20 3 1 15 56 2 3 3 3 3 2 10 1
21 1 2 -1 -1 3 2 1 3 2 1 7 1
22 2 2 30 54 1 1 2 1 1 2 11 2
23 1 2 7 39 2 2 3 2 2 3 2 1
24 1 1 50 63 2 2 3 3 2 3 10 1
25 3 1 18 38 2 2 2 2 2 3 11 2
26 1 2 -1 -1 2 2 2 3 2 2 9 1
27 3 2 25 44 2 1 2 1 1 2 8 1
28 2 1 1 20 1 2 2 2 1 1 20 2
29 2 1 15 41 1 2 3 2 1 2 9 1
30 3 1 3 30 3 3 3 3 3 3 18 2
31 3 1 20 33 3 3 3 2 3 3 8 1
32 3 2 15 45 1 2 3 2 2 1 10 2
33 1 1 5 24 1 1 2 1 2 3 19 2
34 2 1 15 54 1 2 1 1 1 1 15 2
35 1 2 8 25 3 2 3 2 3 2 9 1
36 3 2 1 18 2 1 1 1 1 1 19 2
37 3 1 7 41 2 2 3 3 3 2 5 1
38 2 1 4 51 3 1 3 2 2 3 2 1
39 3 2 30 69 2 2 3 2 2 2 9 1
40 3 1 14 33 1 2 1 2 1 2 14 2
41 2 1 15 45 2 2 3 3 2 3 6 1
42 3 1 24 46 3 2 3 3 3 2 2 1
43 1 2 8 34 1 1 2 1 1 2 17 2
44 3 2 3 22 1 1 1 1 1 1 16 2
45 1 1 8 31 2 1 3 1 2 2 11 2
46 2 1 13 30 1 1 2 1 1 1 20 2
47 2 1 9 34 2 2 2 2 2 1 9 1
48 3 1 15 44 3 3 3 3 3 2 2 1
49 1 1 9 26 2 2 3 2 2 3 16 2
50 3 1 10 42 2 2 3 2 1 2 2 1
51 1 2 7 30 1 2 2 3 2 2 11 2
52 2 1 8 57 2 3 2 3 3 2 2 1
53 3 1 4 22 1 1 1 1 2 1 19 2
54 3 2 25 49 3 3 2 3 3 3 2 1
55 1 1 4 35 2 1 2 3 2 2 13 2
56 2 2 30 50 1 2 2 2 1 2 12 2
57 1 1 15 53 3 3 3 2 3 2 9 1
58 2 1 6 52 2 2 1 1 2 2 17 2
59 2 1 7 45 3 1 2 3 2 2 11 2
60 2 2 20 55 1 2 1 2 1 1 13 2
47

Investigacao Por Questionario PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Investigacao Por Questionario PDF

Enviado por

Direitos autorais:

Formatos disponíveis

D I N M I A CENT RO DE EST UDOS SOBRE A MUDANA SOCIOECONMICA

INVESTIGAO EMPRICA EM CINCIAS SOCIAIS:

1. A NATUREZA DA INVESTIGAO EMPRICA......................................................................................................................2

2. A ESCOLHA DE UM TEMA: PRINCPIOS GERAIS ...............................................................................................................4

3. PASSOS PARA ESCOLHER UM TEMA.................................................................................................................................5

5. O PLANEAMENTO DA INVESTIGAO EMPRICA..............................................................................................................9

6. ALGUNS PROBLEMAS COM A ANLISE DE DADOS .......................................................................................................32

6.1. O AGRUPAMENTO DE CASOS .............................................................................................................................................32

DINMIA -Centro de Estudos sobre a Mudana Socioeconmica

So dois os objectivos deste working paper:

1. A NATUREZA DA INVESTIGAO EMPRICA

Tipos de investigao emprica

O processo de investigao emprica

O processo de investigao no s um processo de aplicao de conhecimentos mas tambm um processo de

Em resumo, a viagem da investigao emprica compreende os seguintes aspectos:

A hiptese deve justificar o trabalho da parte emprica da sua investigao.

2. A ESCOLHA DE UM TEMA: PRINCPIOS GERAIS

A escolha do tema pressupe trs princpios fundamentais:.

O tema deve cumprir as regras da licenciatura ou do mestrado

Isto implica que:

O tema deve ser adequado em escala

Tempo (o trabalho de investigao precisa sempre de mais tempo do que o previsto)

Deve escolher um tema sobre o qual tem particular interesse

3. PASSOS PARA ESCOLHER UM TEMA

PASSO 1. Objectivo: Encontrar uma rea geral que o interesse

Encontrada uma rea geral que o interesse, passe ao passo seguinte:

PASSO 2. Objectivo: Encontrar um tema dentro da rea geral escolhida

Annual Review of Sociology Sociological Abstracts

mais fcil e adequado trabalhar primeiro a literatura sobre o tema,

OBJECTIVO: Encontrar uma (ou mais) Hipteses Gerais.

MTODO: A reviso da literatura envolve trs partes:

Descrio das teorias e trabalhos empricos

A descrio dos trabalhos empricos

Os mtodos usados no trabalho;

Os mtodos utilizados na analise dos dados.

A avaliao dos trabalhos empricos

A amostra do estudo era adequada? Era representativa do Universo?

Os mtodos usados no trabalho eram adequados?

A comparao dos trabalhos empricos

Uma estratgia que o poder ajudar a efectuar esta comparao a seguinte:

Concordantes Discordantes Bem Mal

Bem Mal Bem Mal

Concordantes Discordantes Bem Mal

Bem Mal Bem Mal

- RPLICA DE UM TRABALHO ENCONTRADO NA LITERATURA

- CONFIRMAO DE UM TRABALHO APRESENTADO NA LITERATURA

MELHORIA DE UM TRABALHO PUBLICADO NA LITERATURA

- EXTENSO DE UM TRABALHO APRESENTADO NA LITERATURA

Inventando uma hiptese alternativa para explicar os resultados de um trabalho na literatura;

A EXTENSO til para S1, D1 e trabalhos isolados bem feitos.

5. O PLANEAMENTO DA INVESTIGAO EMPRICA

5.1. As relaes entre as hipteses, os mtodos de investigao e os mtodos para

ANLISE DE DADOS RECOLHA

Na empresa X, o absentismo est relacionado com a idade dos trabalhadores.

O nmero de dias de absentismo observado no ano 1998 na empresa X est significativamente

So muitos os investigadores inexperientes que no pensam nas anlises de dados

A variedade no trabalho est relacionada com a satisfao global no emprego

O Consultor traduz esta hiptese na seguinte Hiptese Operacional:

Pergunta 1. SATISFAO GLOBAL

Em que medida est satisfeito com o seu emprego?

Pergunta 2. VARIEDADE (Var 1)

Tem variedade no seu trabalho?

Quadro 1. Respostas ao questionrio aplicado