Você está na página 1de 97

Margarida Pocinho Pgina i

Psicometria e clinimetria





Margarida Pocinho


















2013

LIES DE PSICOMETRIA:

DO PROJECTO MEDIDA



Margarida Pocinho Pgina ii
Psicometria e clinimetria


ndice
Psicometria ............................................................................................................... 4
Directrizes Internacionais para a Utilizao de Testes ........................................................6
Conceber o instrumento de observao .......................................................................... 10
Planificao e construo de um questionrio/ teste ....................................................... 10
Construo e padronizao de instrumentos de medida .................................................. 11
A administrao ................................................................................................................................. 15
Testar o instrumento de observao ................................................................................................. 17
Estudo Piloto ...................................................................................................................................... 45
Estratgias estatisticas de anlise de dados ...................................................................................... 45
Bibliografia ............................................................................................................... 1
ANEXOS: ..........................................................................................................................4
INTERNATIONAL TEST COMMISSION ................................................................................................... 5



Margarida Pocinho Pgina iii
Psicometria e clinimetria



Quadro 1: grelha de deciso dos testes ............................................................................ 48
Quadro 2: grelha de deciso dos testes psicomtricos ..................................................... 50
Quadro 3: captulos das monografias, dissertaes e tesesErro! Marcador no
definido.
Quadro 4: Texto das monografias, dissertaes e teses.... Erro! Marcador no definido.
Quadro 5: estrutura de um projecto de investigao ........ Erro! Marcador no definido.
Quadro 6: exemplo 1 de uma estrutura monogrfica ....... Erro! Marcador no definido.
Quadro 7: exemplo 2 de uma estrutura monogrfica ....... Erro! Marcador no definido.
Quadro 8: Elementos a serem includos nos diferentes captulosErro! Marcador no
definido.
Quadro 9: proporo dos contedos ................................. Erro! Marcador no definido.

Figura 1: Opes de Medida ............................................................................................ 11
Figura 2: construo de um questionrio de raiz ............................................................. 12
Figura 3: etapas da construo de uma escala ................................................................. 13
Figura 4: adaptao de um questionrio ao contexto cultural ......................................... 14
Figura 5: o processo de adaptao cultural ...................................................................... 14
Figura 6: identificar os testes estatisticos ........................................................................ 46
Figura 7:exemplos de capas para relatrios cientficos .... Erro! Marcador no definido.





Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 4
Psicometria Lies

PSICOMETRIA

Em termos etimolgicos, Psicometria provm do grego psyk, que significa alma, e
metron, que significa medida ou medio, e uma rea da Psicologia que faz a ponte
entre a Estatstica e a Psicologia. Sua definio consite no conjunto de tcnicas
utilizadas para mensurar, de forma adequada e comprovada experimentalmente, um
conjunto ou uma gama de comportamentos que se deseja conhecer melhor.
O Psiclogo psicometrista possui, no seu ambito de actuao e formao, caractersticas
que lhe permitem manusear os testes psicolgicos de acordo com alguns critrios
bsicos. Estes so: Validade, Fidedignidade e Padronizao. Qualquer teste que se
preste validao e, posteriormente ao uso, deve ser fruto de pesquisas nessa rea.
A evoluo da pesquisa cientfica baseada no clculo em Psicologia pouco incerto em
sentido estrito, porm sabe-se que (sir) Francis Galton foi o fundador do primeiro
laboratrio voltado s medies antropomtricas
1
, em Londres, no ano de 1884. "Ele
entendia que a discriminao sensorial era a base do desempenho intelectual, e que
medidas adequadas, neste sentido, seriam capazes de indicar diferenas entre os mais e
os menos capazes (Anastasi, Psychological testing, 1988).
Hermann Ebbinghaus, no ano de 1885, comea os primeiros estudos experimentais
sobre a memria. Com base nas suas experiencias, Ebbinghaus formulou coeficientes
sobre como se d a aquisio de memria a partir de um conjunto de letras ordenadas de
forma no-lgica.
Se a realizao de experimentos deu psicologia o seu status de cincia, a insero
profissional ocorreu atravs da avaliao psicolgica. O exemplo mais emblemtico,
neste sentido, a contribuio de Ebbinghaus que serviu de modelo para construo de
itens em avaliao psicolgica. Contudo, a teoria que iria fundamentar a prtica de
avaliao psicolgica estava j sendo delineada na Inglaterra sob influncia da teoria da
evoluo de Charles Darwin, atravz de Galton, primo de Darwin.

1
A antropometria trata das medidas fsicas do corpo humano
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 5
Psicometria Lies
No Reino Unido, Galton conheceu James McKeen Cattell (1860-1944) e, juntos,
formularam, pela primeira vez, provas que consistiam em medidas de discriminao
sensorial, de tempo e de reaco.
Em sentido diferente e por diversas crticas que estes possuiam dos testes anteriores de
inteligncia, o francs "Alfred Binet (1857-1911) e seu parceiro Thodore Simon
desenvolveram, a pedido da comisso francesa para a investigao dos interesses da
educao, o primeiro teste de inteligncia para diferenciar crianas retardadas e crianas
normais em seus mais variados graus" (Passarelli, 1995). Esta escala de classificao
tem sua data de origem em 1905 e, desde ento, sofreu diversas modificaes na sua
origem e no seu nome. Actualmente, apesar das variaes e verses (Long ou short), ele
conhecido como Teste Stanford-Binet de Inteligncia.
A psicometria uma metodologia Quantitativa que por sua vez conjunto de mtodos
que apela para procedimentos matemticos, mesmo no estudo dos fenmenos sociais e
humanos, cujo objectivo primordial a medio de tais fenmenos. um processo de
inquirio para a compreenso de um problema, enquadrado por uma teoria composta
de variveis medidas com nmeros e analisada atravs de procedimentos estatsticos,
tendo em vista determinar se para um dado nvel de probabilidade, podem os dados
serem generalizados.
Estes mtodos pressupem a quantificao de dados atravs de estatsticas padronizadas
e a interpretao de dados, segundo a tcnica estatstica, que, por sua vez, pressupe a
colheita de dados (amostragem), a verificao dos dados (validade) e a interpretao dos
dados (correlao, associao, diferenas, aderncias, etc.).
A PSICOMETRIA (Medidas em Psicologia) um ramo da Psicologia que se utiliza
dos conhecimentos da Estatstica para a mensurao dos fenmenos psicolgicos
(construtos) de um indivduo ou grupos, suas habilidades, aptides, atitudes,
conhecimentos, inteligncia ou traos de personalidade. uma disciplina
iminentemente tcnica, com seus prprios fundamentos tericos. Sua principal
aplicabilidade na testagem e na avaliao psicolgica (LAP- Laboratrio de
Avaliao Psicolgica, 2007, p. 1).

Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 6
Psicometria Lies

DIRECTRIZES INTERNACIONAIS PARA A UTILIZAO DE TESTES

Em 1992, a International Test Comission (ITC) iniciou um projecto para preparar
orientaes para a traduo e adaptao de testes e instrumentos psicolgicos. Vrias
organizaes ajudaram o ITC na preparao daquelas directrizes: European Association
of Psychological Assessment, European Test Publishers Group, International
Association for Cross-Cultural Psychology, International Association of Applied
Psychology, International Association for the Evaluation of Educational Achievement,
International Language Testing Association and International Union of Psychological
Science. . Uma comisso de 12 representantes destas organizaes trabalharam durante
vrios anos para preparar 22 orientaes e, posteriormente, essas directrizes foram
testadas em campo (ITC-International Test Commission, 2008).
Em 1999 o Conselho da International Test Commission (ITC) dos Estados Unidos e a
Task Force on Tests and Testing da European Federation of Professional Psychologists
Associations (EFPPA) adoptaram um conjunto de Directrizes, oficialmente publicadas
por ocasio da Assembleia Geral da ITC, em 24 de Julho de 2000, em Estocolmo (ver
anexo).
As directrizes, foram organizadas em quatro categorias:
1. Contexto
a. Os efeitos das diferenas culturais que no so relevantes para os
objectivos do estudo devem ser minimizados
b. A duplicao de construtos a medir nas populaes de interesse deve ser
avaliada.
2. Construo, desenvolvimento e Adaptao
a. Os autores do Teste/ editores devem garantir que o processo de
Construo, Desenvolvimento e Adaptao tem em conta as diferenas
lingusticas e culturais entre as populaes para as quais os instrumentos
adaptados ou as verses se destinam
b. Os autores do Teste/ editores devero fornecer provas de que a
linguagem de todas as instrues, as rubricas e itens, bem como o manual
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 7
Psicometria Lies
so adequadas para todas as culturas e populaes para os quais o teste
ou instrumento se destina.
c. Os autores do Teste/ editores devem apresentar provas de que a escolha
das tcnicas de testagem, formatos dos itens, protocolos e procedimentos
so familiares a todas as populaes se destina.
d. Os autores do Teste/ editores devero fornecer provas de que o contedo
dos itens e materiais orientadores so familiares a todas as populaes se
destina.
e. Os autores do Teste/ editores devem implementar uma avaliao
sistemtica, tanto lingustica como psicolgica, para melhorar a preciso
do processo de adaptao e compilar evidncias acerca da equivalncia
linguistica.
f. Os autores do Teste/ editores devem garantir que o projecto de recolha de
dados permite o uso de tcnicas estatsticas adequadas para estabelecer
equivalncia entre os itens das diferentes verses lingusticas do teste ou
instrumento.
g. Os autores do Teste/ editores devem aplicar tcnicas estatsticas
adequadas (1) estabelecer a equivalncia entre as diferentes verses do
teste ou instrumento, e (2) identificar as componentes ou aspectos
problemticos do instrumento que podem ser inadequados para uma ou
mais das populaes a que se destinam
h. Os autores do Teste/ editores devem fornecer informaes sobre a
avaliao da validade em todas as populaes-alvo para quem a verses
adaptadas so destinados.
i. Os autores do Teste/ editores devem fornecer dados estatsticos da
equivalncia das questes para todas as populaes a que se destina.
j. Questes no equivalentes entre as verses destinadas a diferentes
populaes, no devem ser usadas na preparao de uma escala comum
ou para comparar essas populaes. No entanto, elas podem ser teis no
aumento da validade de contedo reportado a cada populao.

3. Administrao
a. Os autores do Teste e administradores devem tentar antecipar os tipos de
problemas que podem ser esperados, e tomar as medidas apropriadas
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 8
Psicometria Lies
para corrigir esses problemas atravs da preparao de materiais e
instrues adequadas.
b. Os administradores dos testes devem ser sensveis a uma srie de
factores relacionados compreenso dos materiais, procedimentos
administrativos, e os modos de resposta que podem influenciar a
validade das inferncias que se podem retirar dos scores
c. Os factores ambientais que podem influenciar os resultados de um teste
ou instrumento dvem ser semelhantes entre as populaes para que as
diferenas no sejam atribudas a esses factores
d. Instrues para administrao do teste devem estar nos idiomas de
origem e de destino para minimizar a influncia de fontes indesejveis de
variao entre as populaes.
e. O manual do teste deve especificar todos os aspectos da administrao
que exigem uma anlise do novo contexto cultural.
f. O administrador deve ser discreto e a sua interao com o examinado
deve ser minimizada. As regras explcitas que so descritas no manual de
administrao devem ser seguidas

4. Documentao / Intrepretao dos Scores
a. Quando um teste ou instrumento adaptado para uso noutra populao, a
documentao das mudanas devem ser fornecidos, junto com a prova da
equivalncia.
b. As diferenas de pontuao entre as amostras a quem foi administrado o
teste ou instrumento no devem ser tomada pelo valor absoluto dos
scores. O pesquisador tem a responsabilidade de justificar as diferenas
com outras evidncias empricas.
c. As comparaes entre as populaes s podem ser feitas ao nvel da
invarincia que foi estabelecida para as pontuaes da escala.
d. O autor do teste deve fornecer informaes especficas sobre a forma em
que os contextos socioculturais e ecolgicos das populaes podem
afectar o desempenho, e deve sugerir procedimentos para explicar esses
efeitos na interpretao dos resultados.
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 9
Psicometria Lies
Estas diretrizes tornaram-se um quadro de referncia para muitos psiclogos que
trabalham na rea da traduo e adaptao dos testes.
A Comisso para a Adaptao Portuguesa das Directrizes Internacionais para a
Utilizao de Testes agrupou colaboradores da Faculdade de Psicologia e de Cincias da
Educao/Universidade do Porto, do CEGOC-TEA, Departamento de Educao e
Psicologia/Universidade do Minho, da Faculdade de Psicologia e de Cincias da
Educao/Universidade de Lisboa, da Faculdade de Psicologia e de Cincias da
Educao/Universidade de Coimbra e do Instituto Superior de Psicologia
Aplicada/Lisboa e produziram um manual que foi editado pela CEGOC-TEA, com
autorizao da Comisso para a Adaptao Portuguesa das Directrizes Internacionais
para a Utilizao de Testes, mas como a sua venda proibida.
Se tiver necessidade de consultar o documento contacte Antnio Menezes Rocha,
Director Associado do CEGOC-TEA atravs do e-mail: amrocha@cegoc.pt. O original
das directizes pode ser consultado no anexo 3.
hoje comum que estudantes acadmicos, profissionais de sade, profissionais da rea
social e outros adultos, crianas ou idosos consultem um psiclogo para que este o
avalie, sobretudo se existem dificuldades, ou se de algum modo as
atitudes/comportamentos se afastam um pouco da normalidade. Em regra, o psiclogo
comea por ouvir quem o procura ou aqueles que sabem ou podem fornecer dados
necessrios construo de uma histria clnica. Assim, no inicio so recolhidas
informaes (desenvolvimento fsico e emocional) que do sentido a todos os resultados
que se obtm posteriormente na avaliao psicomtrica.
No se pode avaliar ningum, sem enquadrar devidamente essa avaliao na histria
pessoal do sujeito avaliado. Alm disso, quaisquer interpretaes de testes requerem
uma longa preparao terica, que s um psiclogo tem acesso. Em Portugal, para alm
das directrizes supra citadas, ainda no existem regras que regulem a utilizao dos
testes psicomtricos.
Existem, de facto, testes psicomtricos que todos conhecem e que por vezes efectuam,
at por brincadeira. So testes que permitem avaliar, factores quer da personalidade,
quer da inteligncia, mas que no devem ser analisados fora do contexto da sua
utilizao: acadmico, clnico, social, organizacional, etc..

Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 10
Psicometria Lies
CHEGOU A VEZ DE APLICAR AS NOES ESTUDADAS, NESTA
ETAPA, AO SEU PRPRIO TRABALHO. COMECE POR
PESQUISAR ESCALAS DE MEDIDA PARA PODER APLICAR E
DAR INICIO A UM TRABALHO DE PSICOMETRIA QUE
ORIGINAR UM ARTIGO CIENTIFICO SOBRE ESSA TEMTICA.

CONCEBER O INSTRUMENTO DE OBSERVAO

A primeira operao da fase de observao consiste em conceber um instrumento capaz
de produzir todas as informaes adequadas e necessrias para testar as hipteses. Este
instrumento ser frequentemente, mas no obrigatoriamente, um Exame de diagnstico,
uma escala, um questionrio ou um guio de entrevista. Alguns deles requerem, por
vezes, um pr-inqurito como complemento da fase exploratria.

PLANIFICAO E CONSTRUO DE UM QUESTIONRIO/ TESTE
Para se compreender qualquer actividade humana complexa necessrio dominar a
linguagem e o tipo de abordagem que lhe feita pelos tipos que a realizam. O mesmo
acontece quando se trata de compreender a investigao cientfica. necessrio que se
compreenda, pelo menos em parte, a linguagem cientfica e os mtodos a que a cincia
recorre para resolver os problemas.
A planificao e construo de um teste de interesse neste ponto porque, possibilita-
nos um modo de obter informaes, as pessoas reagem a uma quantidade de estmulos
estruturados, isto acontece essencialmente na pesquisa comportamental.
Um teste um procedimento sistemtico em que se apresenta, aos indivduos, um
conjunto de itens que medem um atributo. Estas pesquisas possibilitam ao investigador
atribuir scores individuais, que presumivelmente indicam o grau em que os indivduos
possuem o atributo que est a ser medido.
A construo de um teste vai da validao, fidedignidade, aferio at padronizao.
Quando construmos um questionrio temos de ter ateno s normas a ter em conta na
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 11
Psicometria Lies
sua construo, seleco dos itens, administrao padronizada, aos obstculos que se
nos colocam bem como a forma mais eficiente de construo e administrao.


Por isso, o primeiro passo decidir o que queremos e como queremos medir, no
perdendo de vista a qualidade da medida (fig.1)

FIGURA 1: OPES DE MEDIDA

CONSTRUO E PADRONIZAO DE INSTRUMENTOS DE MEDIDA
Questionrio uma ferramenta desenhada para obter e documentar exposies, ou para
guiar a obteno e a documentao de exposies, a serem lembradas pelos sujeitos de
um estudo epidemiolgico (Pocinho, 2007; White, Armstrong, & Saracci, 1992).
H duas tcnicas predominantes para o desenvolvimento de escalas multi-itens de
medidas de sade: a clinimtrica e a psicomtrica. A primeira, usada na prtica clnica,
assenta no julgamento de pacientes, mdicos e outros profissionais a respeito de
fenmenos clnicos, que abrangem vrias caractersticas ou atributos dos pacientes, no
relacionados entre si. A estratgia psicomtrica, usada em psicologia e em testes de
inteligncia, sustenta-se em tcnicas estatsticas e tem como objectivo (no exclusivo)
desenvolver uma escala (ou escalas mltiplas) que mea caractersticas ou atributos
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 12
Psicometria Lies
nicos do indivduo (Pocinho, 2007; Marx, Bombardier, Hogg-Johnson, & Wright,
1999; Wright & Feinstein, 1992)
O desenvolvimento da escala, para ambas as estratgias, feito em dois estgios: a
construo e a reduo de itens, sendo que a diferena se opera no ltimo estgio. A
construo de itens, semelhante para as duas, define o contedo do instrumento e
assegura que todas as variveis importantes sejam consideradas para incluso na escala.
A partir da base conceptual do que se deseja medir, chega-se aos diferentes domnios ou
dimenses que explicam o fenmeno; define-se o contedo da escala e garante-se que
todos os tpicos importantes sejam includos. Os itens so provenientes de mltiplas
fontes: julgamento clnico/individual do profissional, pesquisas anteriores, opinies de
pacientes, consenso de especialistas ou modelos estatsticos. O contedo da escala a
primeira etapa, e os itens individuais so seleccionados tendo em vista medir os
atributos que podem explicar o fenmeno. No final, o conjunto dos itens deve ser
ajuizado para se verificar se existe uma representao adequada de todos os aspectos
pertinentes do fenmeno em estudo (fig. 2)

FIGURA 2: CONSTRUO DE UM QUESTIONRIO DE RAIZ

A reduo de itens elimina itens redundantes ou inapropriados, diminuindo o nmero a
um total que seja praticvel de administrar, assegurando, ao mesmo tempo, que a escala
mea o constructo ou o fenmeno clnico de interesse. A forma de se proceder reduo
diferente em cada estratgia (fig. 3).
Construo
PSICOMETRIA CLINIMETRIA
JULGAMENTO DE PACIENTES, MDICOS E OUTROS
PROFISSIONAIS A RESPEITO DOS FENMENOS CLINICOS TCNICAS ESTATISTICAS
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 13
Psicometria Lies

FIGURA 3: ETAPAS DA CONSTRUO DE UMA ESCALA
Na clinimtrica, as avaliaes dos pacientes determinam quais os itens que devero ser
includos na escala final; aps hierarquizao dos itens segundo o seu impacto, sero
includos na escala final os itens mais importantes e de maior frequncia ou severidade,
conforme avaliado pelos pacientes, respeitando-se a multidimensionalidade do
constructo. Todas as dimenses que ajudam a explicar o constructo (ou o fenmeno
clnico que se quer medir) devem estar representadas na escala final. Na psicomtrica,
so usadas vrias tcnicas estatsticas para reduzir o nmero de itens e distribu-los em
dimenses: matriz de correlaes, Alpha de Cronbach, Anlise Factorial e outras
(Pocinho, 2007).
O desenvolvimento da mensurao fruto de uma transformao e evoluo global ao
longo de vrios sculos. Concorrem nesse desenvolvimento as transformaes que
foram ocorrendo nas prprias sociedades, o desenvolvimento das cincias, as sucessivas
mudanas sociais, culturais e econmicas e por ltimo na prpria forma de ver o
Homem ao longo deste ltimos vinte sculos.
Se optarmos por adaptarmos um instrumento em vez de construirmos de raiz, ento o
processo de validao tem outros trmites (fig. 4).
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 14
Psicometria Lies

FIGURA 4: ADAPTAO DE UM QUESTIONRIO AO CONTEXTO CULTURAL

Em vez da construo dos itens e respectiva preocupao com o contedo e as fontes
que os produziro, precede-se traduo e adaptao quer lngua, quer a todo o
contexto cultural que envolve a medida e que podemos sintetizar o processo de
adaptao cultural da seguinte forma (fig 5).

FIGURA 5: O PROCESSO DE ADAPTAO CULTURAL

Como j referimos, a construo de um teste pressupe regras claras, sem
ambiguidades, condio essencial para se obter um bom instrumento de medida. Isto
exige-nos uma ateno redobrada, medir torna-se pois num aspecto essencial dos testes
mas necessrio que no se confundam, nem se misturem atributos. Torna-se
Adaptao transcultural
TRADUO E ADAPTAO AO NOVO IDIOMA ADAPTAO AO NOVO CONTEXTO CULTURAL
JULGAMENTO MULTIDISCIPLINAR JURI BILINGUE
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 15
Psicometria Lies
imprescindvel que cada medida mea apenas um atributo. A definio dessas regras o
que se chama de padronizao
Uma das componentes das escalas o facto de serem constitudas por um grande
nmero de itens. Com efeito inicialmente h necessidade de uma grande pool de itens
para depois se proceder sua reduo, que por vezes trs a quatro vezes menor na
verso final.
A forma inicial de escolha de itens pode ser, por um lado pela validade facial, ou seja,
por aquilo que aparentemente parecem ter a ver com o que pretendemos testar, por
outro, podem ser requeridos a um jri que pode ser constitudo por cientistas ou
profissionais do mbito do nosso estudo, que com autoridade podem indicar ou rever os
itens que estaro ligados ao nosso estudo.
Quanto ao tipo de itens, estes podem ser abertos/fechados ou restritos.
Os primeiros utilizam-se quando pretendemos respostas do tipo projectivo. As suas
vantagens situam-se no facto de desejarmos por exemplo conhecer as habilidades e
processos que um indivduo ao ser testado usa para chegar resposta.
Os itens restritos, so aqueles de escolha forada (verdadeiro-falso/escolha mltipla), as
vantagens situam-se ao nvel da relativa rapidez e objectividade na correco que
efectuamos.
As principais desvantagens dos itens restritos, o facto de estes poderem ser facilmente
avaliados, mas esto sujeitos aleatoriedade das respostas. No caso dos itens
abertos/fechados, a principal desvantagem ou dificuldade situa-se ao nvel da pontuao
pois esta torna-se mais demorada.
Para que este instrumento seja capaz de produzir a informao adequada dever conter
perguntas sobre cada um dos indicadores previamente definidos e formul-las com um
mximo de preciso. Mas esta preciso no obtida imediatamente, necessrio testar
o instrumento de observao.

A ADMINISTRAO
A administrao conjuntamente com a seleco dos itens, uma das fases mais
importantes para que este se torne num excelente meio de medio, ou seja, que tenha
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 16
Psicometria Lies
ptimas qualidades psicomtricas. A objectividade requerida num teste -lhe conferida
pela padronizao, criando-lhe condies, do mais uniforme possvel, para os
indivduos examinados com o mesmo teste (Freeman, 1980).
O teste ao ser administrado, deve ser feito de forma definida, sob condies uniformes,
a uma amostra de examinados, representativa do grupo a que se destina (Aiken, 1982).
deste grupo que se estabelece as normas, ou seja a amostra de padronizao.
Nunnally refere que amostra de padronizao deve conter no mnimo 300 indivduos,
sendo aconselhvel uma amostra de 1000 sujeitos, ou ainda mais se possvel (Nunnally,
1978). Bryman e Cramer no referem um numero fixo, mas uma relao de 3 a 5
indivduos por varivel (Bryman & Cramer, 2003), o que nos parece mais lgico, uma
vez que diferencia escalas de 10 itens das escalas com 100.
Autores como Golden, Freeman Aiken e Anastasi, alertam-nos para a necessidade de
padronizar as condies circundantes de administrao, assim questes como
legibilidade, cor, forma tamanho, etc., tornam-se essenciais no pr-teste, pois podem
provocar diferentes interpretaes e variaes na resposta que se pretende. O pr-teste
no mais do que um processo de seleco, rejeio, adio e refinamento dos itens, e
sua localizao na escala em funo do nvel de dificuldade. Torna-se importante
observar se os sujeitos compreendem as questes, se a administrao difcil, bem
como o tempo que demora a responder ao teste, isto porque nem sempre possvel fazer
o tipo de administrao planeado (Anastasi, Testes psicolgicos, 1977; Freeman, 1980;
Aiken, 1982; Golden, Sawicki, & Franzen, 1984).
Um dos aspectos essenciais na questo da padronizao de um teste, o facto de esperar
que diferentes pessoas a quem o teste possa ser administrado, medindo o mesmo
atributo, em termos de resultados, possam ser semelhantes.
essencial compreendermos a necessidade de existirem normas para a compreenso
dos resultados de um teste, a amostra da padronizao deve ser representativa da
populao, o que nos vai dar os valores de realizao mdia dessa populao. A
distribuio dos resultados situa na curva de distribuio normal.
A exigncia de objectividade de um teste deste tipo, obriga, por facilidade de
interpretao a que sejam fornecidas tabelas com os valores mdios obtidos na
populao a quem passamos o pr-teste, ou mesmo de uma populao especfica onde o
teste foi empregue. essencial realizar-se estudos preliminares para ver se determinado
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 17
Psicometria Lies
tipo de teste adequado a uma populao que desejamos estudar, e essa adequao pode
ser dada pelas medidas padronizadas. As normas e distribuio dos resultados so
afectadas pela representatividade da amostra, bem como o podem ser pela proporo de
cada sexo, distribuio geogrfica, nvel socioeconmico e idade.
A padronizao da administrao pois um aspecto essencial na planificao e
construo de um teste, antes mesmo de ver a garantia que esse teste nos oferece, bem
como a sua validade e adequabilidade.

TESTAR O INSTRUMENTO DE OBSERVAO
A exigncia de preciso varia consoante se trate de um questionrio ou de um guio de
entrevista. O guio de entrevista o suporte da mesma. Mesmo quando est muito
estruturado, fica nas mos do entrevistador. Pelo contrrio, o questionrio destina-se
frequentemente pessoa interrogada; lido e preenchido por ela. , pois, importante
que as perguntas sejam claras e precisas, isto , formuladas de tal forma que todas as
pessoas interrogadas as interpretem da mesma maneira.
Num questionrio dirigido a jovens e tendo por objecto a prtica do desporto
encontrava-se a seguinte pergunta: Os seus pais praticam desporto? Esta pergunta
parece simples e clara e, no entanto, est mal formulada e conduz a respostas no
utilizveis. Em primeiro lugar, a palavra pais imprecisa. Trata-se do pai e da me ou
de um conjunto familiar mais alargado? Depois, que responder se apenas um deles
pratica desporto? Uns respondero sim, pensando que basta que um deles seja
desportista; outros diro no, achando que a pergunta abrange ambos. Assim, para
designar o mesmo estado de coisas obter-se-o sins nuns e nos noutros. Estas
respostas no eram utilizveis e toda a parte da investigao que andava volta desta
pergunta deve de ser abandonada. Alm da exigncia de preciso, ainda necessrio
que a pessoa interrogada esteja em condies de dar a resposta, que a conhea e no
esteja constrangida ou inclinada a escond-la.
Para nos assegurarmos de que as perguntas sero bem compreendidas e as respostas
correspondero, de facto, s informaes procuradas imperioso testar as perguntas.
Esta operao consiste em apresent-las a um pequeno nmero de pessoas pertencentes
s diferentes categorias de indivduos que compem a amostra. Neste processo pode
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 18
Psicometria Lies
descobrir-se que um termo como eutansia no compreendido por toda a gente.
Pode tambm chegar-se concluso que existem perguntas que provocam reaces
afectivas ou ideolgicas e cujas respostas deixam de ser utilizveis. Por este meio
identificam-se ainda outros tipos de perguntas, como aquelas s quais as pessoas no
gostam de responder e, por conseguinte, se forem absolutamente necessrias prefervel
no as colocar no incio do questionrio, pois pode influenciar a resposta s seguintes
(Quivy & Campenhoudt, 1992).
No que diz respeito ao guio de entrevista, as exigncias so diferentes. a forma de
conduzir a entrevista que deve ser experimentada, tanto ou mais do que as prprias
perguntas contidas no guio. No falamos aqui do guio de entrevista muito estruturado,
cujas exigncias so semelhantes s do questionrio. sobretudo quando se trata de
uma entrevista semidirectiva que as coisas se tornam muito diferentes. No entanto,
cuidado: um guio de entrevista pouco estruturado no significa que o investigador
tenha cometido omisses ou sido negligente durante a fase de construo, significa, que,
por diversas razes ligadas aos seus objectivos de investigao, no julgou desejvel
que o tipo de construo da sua entrevista transparecesse atravs das perguntas (Quivy
& Campenhoudt, 1992). Neste caso, trata-se de levar a pessoa interrogada a exprimir-se
de forma muito livre acerca dos temas sugeridos por um nmero restrito de perguntas
relativamente amplas para deixar o campo aberto a respostas diferentes daquelas que o
investigador teria podido explicitamente prever no seu trabalho de construo. Aqui as
perguntas ficam, portanto, abertas e no induzem as respostas nem as relaes que
podem existir entre elas.
A estrutura das hipteses e dos conceitos no est rigorosamente reproduzida no guio
de entrevista, mas no est por isso menos presente no esprito de quem a conduz. O
entrevistado deve continuamente levar o seu interlocutor a exprimir-se sobre os
elementos desta estrutura sem lha revelar. O sucesso de uma entrevista deste tipo
depende, claro, da composio das perguntas, mas tambm, e sobretudo, da
capacidade de concentrao e da habilidade de quem conduz a entrevista. Assim,
importante testar-se. Isto pode fazer-se gravando algumas entrevistas e ouvindo como
foram conduzidas (Quivy & Campenhoudt, 1992).

Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 19
Psicometria Lies

FIDEDIGNIDADE
Termos como: garantia, preciso e fidelidade significam o mesmo, ou seja, apesar de
no existir consenso, ambos significam fidedignidade, termo corrente nos meios
acadmicos e pelo qual optamos neste manual.
As duas caractersticas essenciais de um teste robusto so a garantia e a validade.
Significa pois, at ponto que as qualidades psicomtricas de um teste so precisas e
verdadeiras.
A fidedignidade de um teste consiste na possibilidade de ele fornecer resultados
consistentes em vrias medies (Freeman, 1980; Aiken, 1982).
Para Freeman fidedignidade de um teste no tem a ver com a construo do teste, mas
sim com a administrao deste. Questes como a predisposio dos indivduos para
realizar um teste, diferenas entre indivduos, habilidades, efeito da prtica, condies
fsicas do examinado na administrao do teste, competncia dos examinadores, so no
entender de Freeman factores importantes a ter em conta na administrao de um teste.
A garantia em parte uma consequncia das condies em que a prova aplicada. A
fidedignidade exprimida em termos estatsticos por um ndice estatstico, o coeficiente
de fidedignidade que indica at que ponto os indivduos de um grupo obtm resultados
relativamente consistentes quando se procede a duas medies utilizando o mesmo teste
ou duas formas equivalentes de um teste e se calcula a correlao (Freeman, 1980).
A fidedignidade traduzida neste termos pelas diferentes pontuaes dos observadores,
bem como pela estabilidade temporal do atributo ou atributos medidos, obtendo-se
assim a correlao entre dois testes paralelos ou duas aplicaes do mesmo teste (teste-
reteste). traduzida, tambm pela consistncia interna, ou seja, a homogeneidade dos
itens do teste, mostrando-nos se estes (nas sub-partes) medem o mesmo atributo.
Ao falarmos assim de fidedignidade, falamos concretamente de dois aspectos essenciais
que esta mede: fidedignidade externa - consistncia de um teste ao longo do tempo
(estabilidade temporal); fidedignidade interna - se o atributo que a escala se prope
medir consistente e se mantm apenas a medio de um nico atributo (Kline, 1987).
A garantia de um teste traduz-se num valor decimal (positivo) que assume valores entre
o 0,00 e 1,00. Significa que 0,00 a ausncia de garantia e 1,00 garantia perfeita.
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 20
Psicometria Lies
Anastasi refere que a fidedignidade pode ser definida como o grau de consistncia entre
duas medidas da mesma coisa (Anastasi, Testes psicolgicos, 1977). Nunnally diz que o
coeficiente de garantia a correlao entre dois testes (Nunnally, 1978). Prieto e Muiz
definem Fidedignidade como capacidade de um instrumento fornecer resultados
consistentes em aplicaes repetidas. Esta noo, em geral, utilizada para abarcar os
dois aspectos diferentes da fidedignidade: a externa e a interna.
A fidedignidade interna a noo que se usa mais vulgarmente e refere-se ao grau de
consistncia entre todos os itens de uma medida. Quando se mede a consistncia interna
obtm-se um coeficiente de confiabilidade que, segundo Bryman e Cramer, bom
se for superior a 0,8 (Bryman & Cramer, 2003). Prieto e Muiz apresentam critrios
mais alargados e consideram inadequado um coeficiente abaixo de 0,60, adequado com
algumas carncias os coeficientes entre 0,60 e 0,70, adequado entre 0,70 e 0,80,
bom entre 0,80 e 0,85 e excelente os que se encontram acima de 0,85 (Prieto &
Muiz, 2000).
Como refere Golden no existe um tipo ideal de teste, estes incluem sempre algum erro
(Golden, Sawicki, & Franzen, 1984). Aiken refere erros do tipo sistemtico e erros do
tipo no sistemtico. Os primeiros influenciam as pontuaes dos testes, mas no
afectam a garantia. Os segundos podem baixar a garantia, uma vez que so
imprevisveis (Aiken, 1982).
A existncia de vrios modos de estimao de garantia ou fidedignidade, como a
consistncia interna, as formas paralelas e o teste reteste, tm em conta a necessidades
de quem administra o teste, o tipo de itens, bem como aquilo que o teste pretende medir,
fornecendo dados que nos ajudam a diminuir a varincia do erro.


CONSISTNCIA INTERNA
A consistncia interna significa a consistncia dos resultados ao longo do teste quando
este aplicado uma vez, ou seja, a preciso da medio efectuada num determinado
momento (Freeman, 1980). S podemos dizer que um instrumento tem consistncia
interna se todas as suas sub partes medirem a mesma caracterstica. A consistncia
interna diz respeito s estimativas de garantia, baseando-se na correlao mdia entre os
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 21
Psicometria Lies
itens (Freeman, 1980). Ao requerer uma s aplicao, trata-se da melhor forma de
avaliar os erros de medio, bem como mais econmico.
De entre as formas que existem para determinar a consistncia interna temos: o mtodo
metade-metade, a correlao item-restante, o coeficiente alfa de Cronbach e a
correlao mdia entre itens. Para determinar a consistncia externa temos o teste-
reteste e as formas equivalentes.

METADE-METADE DE SPEARMAN-BROWN
Postula que se pode chegar a uma medida de fidedignidade s com uma aplicao de
uma de forma de um teste. Correlacionam-se as duas metades de um teste, aleatorizando
os itens, ou com base nos itens pares e impares. Este mtodo tem muita afinidade com o
mtodo das formas equivalentes.
Na fidedignidade pelo mtodo Metade-Metade, produz-se uma espcie de forma
alternativa, dividindo uma escala em duas partes. Este mtodo avalia o grau de
consistncia entre itens, determinando a consistncia interna da escala, embora no
possa medir a estabilidade temporal, oferece a vantagem de uma nica aplicao. Este
mtodo assume que todos os itens contribuem de igual forma para a mensurao de um
constructo mental.
O coeficiente de correlao obtido atravs desta tcnica Metade-Metade tende a gerar
uma estimao inferior da escala na sua totalidade j que a correlao aqui obtida
relativa a metade do teste. As escalas com elevado nmero de itens geram
fidedignidades maiores. Com o objectivo de superar esta dificuldade foi criada uma
frmula para ajustar o coeficiente de correlao para toda a escala.
A equao que define este tipo de correlao a frmula de previso Spearman-Brown:

onde o nmero de "testes" combinadoxx' a fiabilidade do actual "teste". A
frmula prev a confiabilidade de um novo teste composto se replicar o actual critrio N
vezes (ou, de forma equivalente, a criao de um teste com N formas paralelas do actual
exame). Assim, N = 2 implica a duplicao do tamanho do teste, adicionando os itens
com as mesmas propriedades que as do actual exame (em funo do aumento do
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 22
Psicometria Lies
nmero de itens de uma medida). Valores de N inferior a um pode ser usado para prever
o efeito de reduzir um teste.
A frmula tambm pode ser reorganizado para prever o nmero de repeties
necessrias para atingir um grau de fiabilidade:

Esta frmula comumente utilizada por psicometristas para prever a confiabilidade de
um teste aps mudar o tamanho do teste. Esta relao particularmente util para a
diviso de metade-metade ( e respectivos mtodos de estimativa de confiabilidade.
A frmula tambm til para a compreenso da relao entre o teste no-linear e
confiabilidade sobre o tamanho do teste
Se o teste longo / curto no paralelo ao actual teste a previso no ser rigorosamente
exactos. Por exemplo, se um teste altamente confivel foi alongado, acrescentando
muitos itens pobres, estes influenciam negativamente a confiabilidade que
provavelmente ser muito inferior ao previsto por esta frmula.
A anlise atravs da teoria do item resposta fornece uma informao muito mais precisa
permitindo prever mudanas na qualidade da medio, adicionando ou removendo itens
individuais.

CORRELAO ITEM RESTANTE
A crescente quantidade e implemento da estatstica na rea da informtica possibilitam
ganhos em termos de tempo. O que h alguns anos era um processo moroso tornou-se
agora numa operao simples e rpida.
A correlao item-restante uma outra frmula de conhecer a fidedignidade de um
teste, consegue-se atravs da correlao entre o respectivo item e a soma dos itens sem o
item que se escolheu.
A correlao item-restante permite eliminar os itens que apresentam correlaes em
relao a outros itens. Pode ocorrer a diminuio de muitos itens, mas isso no invalida
este tipo de mtodo uma vez que a sua aplicao permite mais garantia.

Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 23
Psicometria Lies
ALFA DE CRONBACH
O coeficiente alfa de Cronbach () foi desenvolvido para calcular a confiabilidade de
um teste. O valor de aumenta com o nmero de questes da escala; assim, escalas
com vinte questes freqentemente apresentam valores de prximo de 0,90 (Streiner,
1993). O coeficiente alfa de Cronbach o resultado da aplicao de uma frmula que
serve para determinar a fidedignidade atravs da consistncia interna, que varia entre 0
(zero) e 1 (um). Uma regra consensual entre a comunidade cientfica que um de
0,6-0,7 indica uma fidedignidade aceitvel, 0,8-0,95 indica que boa e 0,95 ou
superior no desejvel pois indica que os items podem ser totalmente
redundantes.
Para o caso das escalas somativas de respostas dicotmicas utilizada a frmula KR-20
e KR-21 de Kuder-Richardson utilizados como medidas da consistncia interna [as
respostas a todos os itens que integram a escala devem estar codificados em 0 e 1
(incorrecto vs. correcto; discordo vs. concordo; falso vs. verdadeiro, etc.)]. O
coeficiente KR-21 uma simplificao do coeficiente KR-20, na qual se pressupe que
todos os itens tm varincia igual. A sua importncia meramente histrica, uma vez
que a respectiva determinao visava exclusivamente simplificar os procedimentos de
clculo manual, numa poca anterior existncia generalizada de software estatstico
(Alferes, 2008)

METADE-METADE DE GUTTMAN
Trata-se agora de considerar uma outra frmula de estimar a garantia e que pode ser
interpretado como o alfa de Cronbach. Trata-se de conceber os itens em dois grandes
grupos e tratar estes como itens nicos, mas assume varincias diferentes das duas
metades, em relao ao coeficiente metade-metade de Spearman-Brown.

TESTE-RETESTE:
FORMA NICA
Esta outra das formas de estimao da garantia/fidedignidade. Trata-se da
administrao de um mesmo teste em duas ocasies diferentes ao mesmo grupo de
indivduos. O coeficiente de garantia obtm-se pela correlao entre as pontuaes
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 24
Psicometria Lies
obtidas em cada uma das aplicaes obtidas do teste (Freeman, 1980).Es te tipo de
estimao parte do princpio de que as caractersticas de um teste tm alguma
estabilidade temporal.
Ao interpretar os resultados do coeficiente de Teste-Reteste devem ter-se em conta
algumas das limitaes deste mtodo. Ex: fadiga, diferentes condies ambientais, erros
de administrao cometidos pelo examinador, bem como o efeito de memria que pode
ocorrer durante a segunda administrao.
Torna-se ento numa obrigao a necessidade de limitar o nmero de vezes que o
indivduo examinado com a mesma prova. Em vez de retestes frequentes, os
elementos so obtidos examinando maior nmero de indivduos em vez de os examinar
vrias vezes.
Apresenta-nos algumas vantagens como o facto de o contedo ser completamente
equivalente nas duas ocasies, o facto de ser mais fcil elaborar uma forma nica de um
teste do que duas (Freeman, 1980).
Em termos de desvantagens, trata-se de um mtodo demorado. As modificaes
ocasionais pelo facto de se ter apreendido e desenvolvido aptides. Os indivduos j
no so os mesmos (Freeman, 1980). Ainda dentro da opinio deste autor, embora o
coeficiente de garantia seja relativamente elevado quando se usa a mesma forma de
teste, a influncia da evocao no to grande como possa parecer.

FORMAS EQUIVALENTES
As formas paralelas, que na sua forma ideal sero formas alternativas, consistem na
administrao de dois testes, equivalentes, aos mesmos indivduos (Freeman, 1980).
Esta forma considera que o nmero de itens tm de ser o mesmo, bem como os tipos de
itens devem ser uniformes quanto ao contedo, operaes ou dimenses implicveis,
nveis e amplitude da dificuldade e correcta soluo. A distribuio da dificuldade deve
ser idntica, assim como devem ter o mesmo grau de homogeneidade no que respeita s
operaes ou dimenses medidas. As mdias ou desvios padres das duas formas
devem ser idnticos. A mecnica de aplicao e apuramento deve ser semelhante nas
duas formas (Freeman, 1980).
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 25
Psicometria Lies
Este mtodo de estimao da garantia por formas equivalentes apresenta vantagens
como os possveis efeitos de uma prtica especfica ou de uma evoluo, pois os itens
das duas verses no so os mesmos.
Apresenta tambm algumas desvantagens, nomeadamente ao nvel da construo e
padronizao. Isto , assegurar a verdadeira equivalncia das duas formas.
De um modo geral os valores do coeficiente alfa so muito prximos dos valores
obtidos pela correlao entre as formas alternativas. No entanto, se a correlao das
duas formas alternativas for significativamente mais baixa, significa que algum erro de
medida est presente. Um baixo coeficiente de fidedignidade obtido atravs da
correlao de duas formas paralelas, significa que os dois testes no medem a mesma
coisa, ou seja, no so duas formas alternativas (Freeman, 1980)

VALIDADE DE UM TESTE
A validade procura responder a dois pontos ou questes essenciais que se levantam na
construo e aplicao de um teste, primeiro se o teste est mesmo a medir o que
desejvamos, em segundo se as informaes tm algum relevo para o estudo que
desejamos.
Aquilo que partida pode parecer ser uma boa abordagem para a mensurao numa
base intuitiva (validade facial), pode no ser vlido pelos mtodos e padres de
investigao (Nunnally, 1978).
Poder um teste ser valido e no ser fidedigno e vice-versa?. Aiken refere que um teste
pode ser fidedigno sem ser vlido, mas no pode ser vlido sem ser fidedigno. que
enquanto a garantia ou fidedignidade normalmente afectada por erros no sistemticos
que tm a ver com a administrao e com a apresentao (critrios externos) a validade
pode ser afectada por erros sistemticos. A existncia de fiabilidade adequada
necessria, mas no suficiente, para garantir a validade adequada.
Relativamente validade dos testes, no raras vezes se refere que um dado teste
psicolgico que pode ser vlido numa situao no o noutra, ou, ainda, que existem
nveis diferentes de magnitude de validade de um teste. Este modo de falar sobre a
validade dos testes psicolgicos , no mnimo, confuso. Para confundir ainda mais, o
grande psicometrista Samuel Messick refere que a validade um julgamento avaliativo
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 26
Psicometria Lies
que conjuga a evidncia emprica e as racionalizaes tericas com a adequao e
propriedade de inferncias e aces baseadas em saturaes de testes ou outros modos
de avaliao (Messick, 1989). Este modo de entender e definir a validade dos testes, que
assumido pela prpria American Psychological Association (American Psychological
Association, 1985), tornou o tema um verdadeiro labirinto.
Com efeito se fizermos uma reviso literatura da literatura tradicional e actual sobre o
tema, encontramos um elenco sem fim de expresses ou tipos de validade que um teste
pode ter. Vejamos alguns deles:
1. Validade de construto (tambm chamado de validade de conceito, validade
conceptual, validade de construo, validade hipottico-dedutiva) (Cronbach &
Meehl, 1955);
2. Validade de contedo (Cronbach & Meehl, 1955; Haynes, Richard, & Kubany,
1995);
3. Validade de critrio, tambm chamada Validade preditiva (Cronbach & Meehl,
1955);
4. Validade concorrente (Cronbach & Meehl, 1955);
5. Validade aparente ou facial (Mosier, Problems and designs of cross-validation,
1951; Mosier, Problems and designs of cross-validation, 1951);
6. Validade generalizvel ou inferncial (Mosier, A critical examination of the
concepts of face validity, 1947; Mosier, Problems and designs of cross-
validation, 1951; Messick, 1989);
7. Validade discriminante (Campbell & Fiske, 1959);
8. Validade convergente (Campbell & Fiske, 1959);
9. Validade incremental (Bryant, 2000);
10. Validade factorial (Guilford, 1946);
11. Validade lgica (Cronbach L. J., 1949);
12. Validade emprica (empirical validity) (Cronbach L. J., 1949);
13. Validade consequencial (Messick, 1989);
14. Validade intrnseca (Gulliksen, 1950);
15. Validade substantiva (Messick, 1989);
16. Validade estrutural (Messick, 1989);
17. Validade externa (Messick, 1989; Emory, 1985);
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 27
Psicometria Lies
18. Validade interna tambm denominadas por validades de critrio, de contedo e
de construto (Emory, 1985);
19. Validade de hiptese tambm chamada de Validade indireta (Weber, 1990;
Janis, 1965);
20. Validade posditiva que o oposto de validade preditiva (Haynes, Richard, &
Kubany, 1995).
Encontramos, ainda referencia a mais tipos de validade em vrios programas
informticos de tratamento de dados, contudo no identificmos a sua origem. So elas:
21. Validade curricular (curricular validity): constitui uma extenso da validade de
contedo e consiste em verificar o aumento da aprendizagem (se se descobre que
h aumento de aprendizagem em dois testes com validade de contedo, ento se
verifica validade curricular);
22. Validade diferencial (differential validity): validade de uma bateria de testes
avaliada pela capacidade de predizer diferenas no desempenho em dois ou mais
critrios;
23. Validade cruzada (cross validity): confirmar a validade dos resultados a partir de
um novo exame com estudo emprico feito com uma segunda amostra
independente;
24. Validade de grupos mistos (mixed-group validity): duas amostras com formatos
diferentes no trao ou diferentes probabilidades em expressar dado
comportamento so comparadas;
25. Validade mltipla (multiple validity): um teste tem validade mltipla quando
estiver associado a uma amostra vasta de critrios;
26. Validade ecolgica (ecologial validity): o quanto um instrumento psicolgico
mede factores espaciais, temporais e situacionais do campo de aplicao;
27. Validade sinttica (synthetic validity): validade de teste complexo ou de uma
bateria de testes baseada no facto de que vrios factores foram representados
num nico escore composto;
28. Validade condicional (conditional validity): a validade do teste depende do uso
que dele se faz;
29. Validade incondicional (unconditional validity): a validade do teste depende do
construto sendo medido e no do uso que dele se faz.
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 28
Psicometria Lies
Parece, ento, que a inteno de Messick de "integrar" os diferentes aspectos de
validade dos testes psicolgicos, de facto introduziu enorme confuso.
Borsboom, Mellenbergh e Van-Heerden colocam muito bem esse problema ao
afirmarem: O conceito de validade com o qual os tericos esto interessados parece
estranhamente divorciado do conceito que pesquisadores tm em mente quando
colocam a questo da validade. Isso deve-se a que, no sculo passado, a questo da
validade evoluiu da questo de se a gente mede o que se pretende medir para a questo
de se as relaes empricas entre scores de um teste se emparelham com relaes
tericas numa rede nomolgica2 e, finalmente, para a questo de se interpretaes e
aces baseadas em scores de testes so justificadas no somente luz de evidncia
cientfica, mas com respeito a consequncias sociais e ticas do seu uso (Borsboom,
Van-Heerden, & Mellenbergh, 2003).
Pasquali refere que desde o trabalho de Cronbach e Meehl dos meados do sculo
passado, o conceito de validade dos testes vem perdendo o seu sentido original. Embora
os autores quisessem precisamente salvar esse conceito, a introduo do modelo da rede
nomolgica, concebida dentro da viso do positivismo lgico veio, na verdade, destruir
o conceito de validade, originalmente concebido por Kelly na dcada de 1920 e, depois,
por Cattell. O conceito de validade, foi totalmente descaracterizado com a definio do
mesmo dada pelo grande psicometrista Samuel Messick, em 1989. Pasquali refora a
necessidade da redescoberta do conceito para salvar as bases da Psicometria (Pasquali,
2007).
Quanto a ns um teste psicolgico um conjunto constitudo de comportamentos que o
sujeito deve exibir. Ele um teste se todos os comportamentos envolvidos no conjunto
se referem "mesma coisa" (construto), a questo da unidimensionalidade. Ademais,
alguns sujeitos podem ser capazes de executar todos os comportamentos envolvidos,
outros sujeitos, apenas alguns dos comportamentos e outros, ainda, nenhum dos
comportamentos.
A base da argumentao consiste em se entender que validade constitui uma
propriedade do instrumento de medida e que no tem nada a ver com a ideia de que ela
consistiria num julgamento sobre o significado dos scores de um teste, retomando,

2
nomological network
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 29
Psicometria Lies
assim, o sentido original que Kelly (1927) quis dar a esse conceito, ao afirmar que um
teste vlido quando mede aquilo que supostamente deve medir.
Recorrendo a um exemplo de Pasquali, imagine que construmos um metro, feito de
ferro, para medir o comprimento das coisas. Medimos um pedao de pau e conseguimos
uma medida do mesmo. Em seguida, aquecemos o metro e medimos novamente o
pedao de pau e a medida alterou-se (Pasquali, 2007). Coloca-se aqui uma questo; ser
que na segunda vez que o utilizmos ele j no mede o comprimento? O mesmo se pode
passar com um arma que fica com a mira descalibrada.
Claro que sim, no entanto est medindo errado. bvio que o metro continua
medindo aquilo para o qual ele foi feito para fazer, isto , medir comprimento. Isto
validade. Continua medindo o comprimento, um facto, no entanto est a faze-lo
sem preciso, erradamente, porque o metro, com o calor (factores perturbadores no
uso do instrumento) ficou descalibrado. Mas a presena de factores perturbadores
corriqueira em qualquer empreitada cientfica (as chamadas variveis estranhas ou
confounding variables). De qualquer forma, o instrumento estar calibrado ou no,
questo de preciso, no de validade, porque ele continua medindo aquilo para o qual
ele foi construdo. Assim, continua sendo verdadeiro que o metro mede comprimento
(validade), embora na prtica ele o faa erradamente (preciso). Dessa forma, validade
responde a se algo verdadeiro ou falso, enquanto preciso responde a se algo est
correcto ou errado. A primeira questo diz respeito a um problema ontolgico e a
segunda a um problema psicomtrico (de mensurao) ou metodolgico. No caso dos
testes psicolgicos, os dois problemas so relevantes e importantes, mas um no o
outro. Assim, conclui-se que os parmetros de validade e preciso so caractersticas
do instrumento de medida, do teste, e no da medida feita de um objecto. Esta ltima
confivel e legtima se o instrumento que a produziu for vlido (pertinente, relevante)
e preciso (calibrado). Quem garante a qualidade da medida a qualidade do
instrumento. E a validade do instrumento diz respeito exclusivamente pertinncia do
instrumento com respeito ao objecto que se quer medir; a questo da referncia.
Existem algumas linhas matemticas que referem que a Anlise Factorial, pelo mtodo
das Componentes Principais, pode no ser a tcnica mais adequada quando temos uma
escala de medida dicotmica.

Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 30
Psicometria Lies
Para que no restem dvidas que os dados provm de uma populao normal
multivariada, devemos fazer o Teste de esfericidade de Bartlett que testa a hiptese da
matriz das correlaes ser a matriz da identidade com determinante igual a 1.
Resultados como os que podem ser observados no quadro que se segue demonstram que
o teste Bartlett tem associado um nvel de significncia inferior a 0,05, o que leva
rejeio da hiptese da matriz das correlaes na populao ser a identidade, mostrando
que a correlao que existe entre as variveis.

Quadro 1: Teste KMO e Bartlett - GDS
Kaiser-Meyer-Olkin (KMO) 0,932
Teste da esfericidade de Bartlett Qui-quadrado (aproximao) 5994,603
gl 378
p 0,000


Se o nvel de significncia fosse superior a 0,05, dever-se-ia reconsiderar a utilizao
deste modelo factorial.
Um outro indicador da fora da relao, entre as variveis, o Coeficiente de
Correlao Parcial. O Kaiser-Meyer-Olkin (KMO), que varia entre zero e um, compara
as correlaes simples com as correlaes parciais observadas entre as variveis. Sendo
que a deciso de uma Anlise Factorial com um KMO <0,5 inaceitvel; entre [0,5
0,6[ m; entre [0,6 0,7[ pouco razovel, mas aceitvel; entre [0,7 0,8 [ aceitvel;
entre [0,8 0,9[ boa deciso e de [0,9 a 1] muito boa deciso.
No nosso caso, acima apresentado pode observar-se um KMO de 0,932, o que revela
que a Anlise Factorial tem uma adequao muito boa para usar na medida psicometrica
em anlise.

A RECOLHA DOS DADOS
A terceira operao da fase de observao a recolha dos dados. Esta constitui a
execuo do instrumento de observao. Esta operao consiste em recolher ou reunir
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 31
Psicometria Lies
concretamente as informaes determinadas junto das pessoas ou das unidades de
observao includas na amostra.
Proceder-se- por observao directa quando a informao procurada estiver
directamente disponvel. O guio de observao destina-se ento ao prprio observador,
e no a um eventual entrevistado. Por conseguinte, a sua redaco no est sujeita a
restries to precisas como, por exemplo, as do questionrio. No sendo uma
observao directa, a recolha de dados estatsticos existentes, de documentos escritos
(textos, opsculos...) ou pictricos (cartazes, fotografias...), levanta igualmente
problemas especficos que sero evocados no ltimo ponto desta etapa.
Pelo contrrio, a observao indirecta, por meio de questionrio ou de guio de
entrevista, deve vencer a resistncia natural ou a inrcia dos indivduos. No basta
conceber um bom instrumento, preciso ainda p-lo em prtica de forma a obter-se
uma proporo de respostas suficiente para que a anlise seja vlida. As pessoas no
esto forosamente dispostas a responder, excepto se virem nisso alguma vantagem
(falar um pouco, por exemplo) ou se acharem que a sua opinio pode ajudar a fazer
avanar as coisas num domnio que consideram importante. O investigador deve,
portanto, convencer o seu interlocutor da importncia da sua participao. por isso
que geralmente se evita enviar um questionrio pelo correio, confiando-o, de
preferncia, se o custo no for excessivo, a inquiridores. O papel do inquiridor , neste
caso, o de criar nas pessoas interrogadas uma atitude favorvel, a disposio para
responderem francamente s perguntas e, por fim, entregarem o questionrio
correctamente preenchido. Caso se trate de um questionrio enviado por via postal,
importante que a apresentao do documento no seja dissuasiva e que este seja
acompanhado por uma carta de introduo, curta, clara, concisa e motivante.
Antes de abordar, nas pginas seguintes, o panorama das principais categorias de
mtodos de recolha de dados, bom insistir na antecipao. Esta no uma operao da
observao propriamente dita, mas deve ser uma preocupao constante do
investigador, ao elaborar o seu instrumento de observao. Na fase seguinte, a anlise
das informaes, os dados observados sero submetidos a diversas operaes
estatsticas que visam dar--lhes a forma exigida pelas hipteses de investigao. por
isso que necessrio sublinhar que a escolha do instrumento de observao e a recolha
dos dados devem inscrever-se no conjunto dos objectivos e do dispositivo metodolgico
da investigao.
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 32
Psicometria Lies
A escolha de um mtodo de inqurito por questionrio junto de uma amostra de vrias
centenas de pessoas impede que as respostas individuais possam ser interpretadas
isoladamente, fora do contexto previsto pelos investigadores. , pois, prefervel saber
partida que os dados recolhidos nestas condies s fazem sentido quando tratados de
modo estritamente quantitativo, que consiste em comparar as categorias de respostas e
em estudar as suas correlaes. Pelo contrrio, outros processos de recolha de dados
poro de lado qualquer possibilidade de tratamento quantitativo e exigiro outras
tcnicas de anlise das informaes reunidas.
A escolha dos mtodos de recolha dos dados influencia, portanto, os resultados do
trabalho de modo ainda mais directo: os mtodos de recolha e os mtodos de anlise dos
dados so normalmente complementares e devem, portanto, ser escolhidos em conjunto,
em funo dos objectivos e das hipteses de trabalho. Se os inquritos por questionrio
so acompanhados por mtodos de anlise quantitativa, os mtodos de entrevista
requerem habitualmente mtodos de anlise de contedo, que so muitas vezes, embora
no obrigatoriamente, qualitativos. Resumindo, importante que o investigador tenha
uma viso global do seu trabalho e no preveja as modalidades de nenhuma destas
etapas sem se interrogar constantemente acerca das suas implicaes posteriores.
Precisemos, alm disso, que as perguntas que constituem o instrumento de observao
determinam o tipo de informao que obteremos e o uso que dela poderemos fazer na
anlise dos dados. Se nos interessamos, por exemplo, pelo sucesso escolar de alunos,
podem ser considerados trs nveis de preciso na informao: insucesso ou sucesso, o
lugar (primeiro, segundo, terceiro..., ltimo) e a percentagem de pontos obtidos em
relao ao total. A informao recolhida depender da pergunta que figura no
instrumento de observao. Ao fazer a anlise, os dados qualitativos (o insucesso-
sucesso) no so tratados da mesma forma que os dados originais (o lugar) ou os
quantitativos (a percentagem).
Neste exemplo observamos uma vez mais a interdependncia entre a observao e a
anlise dos dados. Temos ento de antecipar e de nos interrogar regularmente para cada
resposta prevista: Ser que a pergunta que coloco vai dar-me a informao e o grau de
preciso de que necessito na fase posterior? Ou ainda: Para que deve servir esta
informao e como vou poder medi-la e relacion-la com as outras?
Existem, de facto, regras muito precisas para a construo dos testes. disso que
dissertaremos de seguida.
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 33
Psicometria Lies
Apenas conhecemos correctamente um mtodo de investigao depois de o termos
experimentado. Antes de escolhermos um , portanto, indispensvel asseguramo-nos,
junto de investigadores que dominem bem, da sua pertinncia em relao aos objectivos
especficos de cada trabalho, s suas hipteses e aos recursos de que dispomos. Os
panoramas que apresentamos no substitui, de forma alguma, esta maneira de proceder,
mas pensamos que pode ser til para a preparar.
O termo mtodo j no aqui entendido no sentido lato de dispositivo global de
elucidao do real, mas num sentido mais restrito, o de dispositivo especfico de recolha
ou de anlise das informaes (assunto desta sexta etapa), destinado a testar hipteses
de investigao. Neste sentido restrito, a entrevista de grupo, o inqurito por
questionrio ou a anlise de contedo so exemplos de mtodos de investigao.
No mbito da aplicao prtica de um mtodo podem ser utilizadas tcnicas especficas,
como, por exemplo, as tcnicas de amostragem. Trata-se ento de procedimentos
especializados que no tm uma finalidade em si mesmo. Da mesma forma, como j
referimos, os dispositivos metodolgicos fazem necessariamente apelo a disciplinas
auxiliares, como, a matemtica, a estatstica, medicina, psicologia social
S sero aqui consideradas as grandes categorias de mtodos que permitem recolher
informaes para posterior anlise, de forma a no nos perdermos em pormenores, que,
por serem tratados superficialmente, seriam de qualquer forma inteis..

O INQURITO POR QUESTIONRIO
Consiste em colocar a um conjunto de inquiridos, geralmente representativo de uma
populao, uma srie de perguntas relativas sua situao social, profissional ou
familiar, s suas opinies, sua atitude em relao a opes ou a questes humanas e
sociais, s suas expectativas, ao seu nvel de conhecimentos ou de conscincia de um
acontecimento ou de um problema, ou ainda sobre qualquer outro ponto que interesse os
investigadores. O inqurito por questionrio de perspectiva sociolgica distingue-se da
simples sondagem de opinio pelo facto de visar a verificao de hipteses tericas e a
anlise das correlaes que essas hipteses sugerem. Por isso, estes inquritos so
geralmente muito mais elaborados e consistentes do que as sondagens. Dado o grande
nmero de pessoas geralmente interrogadas e o tratamento quantitativo das informaes
que dever seguir-se, as respostas maior parte das perguntas so normalmente pr-
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 34
Psicometria Lies
codificadas, de forma que os entrevistados devem obrigatoriamente escolher as suas
respostas entre as que lhes so formalmente propostas (Quivy & Campenhoudt, 1992).
O questionrio chama-se de administrao indirecta ou heteroadministrao
quando o prprio inquiridor o completa a partir das respostas que lhe so fornecidas
pelo inquirido. Chama-se de administrao directa ou autoadministrao quando
o prprio inquirido que o preenche. O questionrio ento entregue em mo por um
inquiridor encarregado de dar todas as explicaes teis, ou endereado indirectamente
pelo correio, online ou por qualquer outro meio equivalente. Os processos que no
implicam a presena do entrevistador merecem pouca confiana e s excepcionalmente
devem ser utilizados na investigao, dado que as perguntas so muitas vezes mal
interpretadas e o nmero de respostas geralmente demasiado fraco. Em contra partida,
utiliza-se cada vez mais frequentemente o telefone neste tipo de questionrios.
O inqurito especialmente adequado no conhecimento de uma populao enquanto tal:
as suas condies e modos de vida, os seus comportamentos, os seus valores ou as suas
opinies. A anlise de um fenmeno social que se julga poder apreender melhor a partir
de informaes relativas aos indivduos da populao em questo, como o impacto de
uma poltica familiar ou a introduo da microinformtica no ensino.
De uma maneira geral, os casos em que necessrio interrogar um grande nmero de
pessoas e em que se levanta um problema de representatividade. A vantagem deste
mtodo a possibilidade de quantificar uma multiplicidade de dados e de proceder, por
conseguinte, a numerosas anlises de correlao. A grande limitao a
superficialidade das respostas, que no permite a anlises de certos processos, como por
exemplo a evoluo do trabalho clandestino ou a das concepes ideolgicas profundas.
Por conseguinte, os resultados apresentam-se muitas vezes como simples descries,
desprovidas de elementos de compreenso penetrantes. A individualizao dos
entrevistados, que so considerados independentemente das suas redes e relaes
sociais. Para que o mtodo seja digno de confiana devem ser preenchidas vrias
condies: rigor na escolha da amostra, formulao clara e unvoca das perguntas,
correspondncia entre o universo de referncia das perguntas e o universo de referncia
do entrevistado, atmosfera de confiana no momento da administrao do questionrio,
honestidade e conscincia profissional dos entrevistadores. Na prtica, as principais
dificuldades provm, geralmente, da parte dos entrevistadores, que nem sempre esto
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 35
Psicometria Lies
suficientemente formados e motivados para efectuarem este trabalho exigente e muitas
vezes desencorajador (Quivy & Campenhoudt, 1992).

COMPETENCIAS NECESSRIAS
1. Tcnicas de amostragem.
2. Tcnicas de redaco, de codificao e de explorao das perguntas, incluindo
as escalas de atitude.
3. Gesto de redes de entrevistadores.
4. Iniciao aos programas informticos de gesto e anlise de dados de inquritos
(SPSS, SPAD, SAS...).
5. Estatstica descritiva e anlise estatstica dos dados.
6. No caso mais frequente, em que o trabalho efectuado em equipa e recorrendo a
servios especializados, no indispensvel que todos os investigadores sejam
pessoalmente formados nos domnios mais tcnicos.

A ENTREVISTA
Nas suas diferentes formas, os mtodos de entrevista distinguem-se pela aplicao dos
processos fundamentais de comunicao e de interaco humana. Correctamente
valorizados, estes processos permitem ao investigador retirar das entrevistas
informaes e elementos de reflexo muito ricos e variados. Ao contrrio do inqurito
por questionrio, os mtodos de entrevista caracterizam-se por um contacto directo entre
o investigador e os seus interlocutores e por uma fraca directividade por parte daquele.
Instaura-se, assim, em princpio, uma verdadeira troca, durante a qual o entrevistado
exprime as suas percepes de um acontecimento ou de uma situao, as suas
interpretaes ou as suas experincias, ao passo que, atravs das suas perguntas abertas
e das suas reaces, o investigador facilita essa expresso, evita que ela se afaste dos
objectivos da investigao e permite que o interlocutor aceda a um grau mximo de
autenticidade e de profundidade cujo contedo ser objecto de uma anlise de contedo
sistemtica, destinada a testar as hipteses de trabalho (Quivy & Campenhoudt, 1992).
A entrevista semidirectiva, ou semidirigida, certamente a mais utilizada em
investigao social. semidirectiva no sentido em que no inteiramente aberta nem
encaminhada por um grande nmero de perguntas precisas. Geralmente, o investigador
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 36
Psicometria Lies
dispe de uma srie de perguntas-guias, relativamente abertas, a propsito das quais
imperativo receber uma informao da parte do entrevistado. Mas no colocar
necessariamente todas as perguntas pela ordem em que as anotou e sob a formulao
prevista. Tanto quanto possvel, deixar andar o entrevistado para que este possa falar
abertamente, com as palavras que desejar e pela ordem que lhe convier. O investigador
esforar-se- simplesmente por reencaminhar a entrevista para os objectivos cada vez
que o entrevistado deles se afastar e por colocar as perguntas s quais o entrevistado no
chega por si prprio no momento mais apropriado e de forma to natural quanto
possvel.
A entrevista centrada, mais conhecida pela sua denominao inglesa, focused interview,
tem por objectivo analisar o impacto de um acontecimento ou de uma experincia
precisa sobre aqueles que a eles assistiram ou que neles participaram; da o seu nome. O
entrevistador no dispe de perguntas preestabelecidas, como no inqurito por
questionrio, mas sim de uma lista de tpicos precisos relativos ao tema estudado. Ao
longo da entrevista abordar necessariamente esses tpicos, mas de modo livremente
escolhido no momento de acordo com o desenrolar da conversa. Neste quadro
relativamente flexvel no deixar de colocar numerosas perguntas ao seu interlocutor.
Em certos casos, como no mbito da anlise de histrias de vidas, os investigadores
aplicam um mtodo de entrevista extremamente aprofundado e pormenorizado, com
muito poucos interlocutores. Neste caso, as entrevistas, so muito mais longas, por isso
divididas em vrias sesses (Quivy & Campenhoudt, 1992).
O mtodo de entrevista especialmente adequado na anlise do sentido que os actores
do s suas prticas e aos acontecimentos com os quais se vem confrontados: os seus
sistemas de valores, as suas referncias normativas, as suas interpretaes de situaes
conflituosas ou no, as leituras que fazem das prprias experincias, etc.; na anlise de
um problema especfico: os dados do problema, os pontos de vista presentes, o que est
em jogo, os sistemas de relaes, o funcionamento de uma organizao, etc.; na
reconstituio de um processo de aco, de experincias ou de acontecimentos do
passado.
Uma das vantagens deste mtodo o grau de profundidade dos elementos de anlise
recolhidos uma vez que a flexibilidade e a fraca directividade da entrevista permite
recolher os testemunhos e as interpretaes dos interlocutores, respeitando os prprios
quadros de referncia (linguagem e as suas categorias mentais).
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 37
Psicometria Lies
Mas se a flexibilidade pode trazer vantagens, tambm pode colocar limites e problemas,
pois o mtodo pode por um lado intimidar aqueles que no consigam trabalhar com
serenidade sem tcnicas directivas precisas, por outro pode levar a pensar que esta
relativa flexibilidade os autoriza a conversarem de qualquer maneira com os
interlocutores. Um outro problema que a flexibilidade do mtodo poder levar a
acreditar numa completa espontaneidade do entrevistado e numa total neutralidade do
investigador. As formulaes do entrevistado esto sempre ligadas relao especfica
que o liga ao entrevistador e este ltimo s pode, portanto, interpret-las validamente se
as considerar como tais. A anlise de uma entrevista deve, portanto, incluir uma
elucidao daquilo que as perguntas do investigador, a relao de troca e o mbito da
entrevista induzem nas formulaes do interlocutor. Considerar estes ltimos
independentemente de um contexto to marcante seria revelar uma grande ingenuidade
epistemolgica (Quivy & Campenhoudt, 1992).
COMPETENCIAS NECESSRIAS
Conhecimento terico e prtico elementar dos processos de comunicao e de
interaco interindividual, formao prtica nas tcnicas de entrevista


A OBSERVAO DIRECTA
Mtodos de investigao que capta os comportamentos no momento em que eles se
produzem e em si mesmos, sem a mediao de um documento ou de um testemunho.
O campo de observao do investigador , em princpio, infinitamente, amplo e s
depende, em definitivo, dos objectivos do seu trabalho e das suas hipteses de partida.
A partir delas, o acto de observar ser estruturado, na maior parte dos casos, por uma
grelha de observao previamente constituda.
As modalidades concretas da observao em investigao social so muito diferentes,
consoante o investigador adopte, por exemplo, um mtodo de observao participante
de tipo etnolgico ou, pelo contrrio, um mtodo de observao no participante, cujos
processos tcnicos so muito formalizados.
A observao participante de tipo etnolgico , logicamente, a que melhor responde, de
modo global, s preocupaes habituais dos investigadores em cincias sociais. Consiste
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 38
Psicometria Lies
em estudar uma comunidade durante um longo perodo, participando na vida colectiva.
O investigador estuda ento os seus modos de vida, de dentro e pormenorizadamente,
esforando-se por perturb-los o menos possvel. A validade do seu trabalho assenta,
nomeadamente, na preciso e no rigor das observaes, bem como no contnuo
confronto entre as observaes e as hipteses interpretativas. O investigador estar
particularmente atento reproduo ou no dos fenmenos observados, bem como
convergncia entre as diferentes informaes obtidas, que devem ser sistematicamente
delimitadas. a partir de procedimentos deste tipo que as lgicas sociais e culturais dos
grupos estudados podero ser reveladas o mais claramente possvel e que as hipteses
podero ser testadas e afinadas (Quivy & Campenhoudt, 1992).
Os mtodos de observao no participante apresentam, por seu lado, perfis muito
diferentes, sendo o seu nico ponto comum o facto de o investigador no participar na
vida do grupo, que, portanto, observa do exterior. A observao tanto pode ser de
longa como de curta durao, feita revelia ou com o acordo das pessoas em questo,
ou ainda realizada com ou sem a ajuda de grelhas de observao pormenorizadas.
Estas grelhas definem de modo muito selectivo as diferentes categorias de
comportamentos a observar. As frequncias e as distribuies das diferentes classes de
comportamento podem ento eventualmente ser calculadas para estudar as correlaes
entre estes comportamentos e outras variveis destacadas pelas hipteses.
O mtodo particularmente adequado anlise do no verbal e daquilo que a revela: as
condutas de institudas e os cdigos de comportamento, relao com o corpo, os
modos de vida e os traos culturais, a organizao espacial dos grupos e da sociedade,
etc. A autenticidade relativa dos acontecimentos em comparao com as palavras e com
os escritos, j que mais fcil mentir com a boca do que com o corpo (Quivy &
Campenhoudt, 1992).
As dificuldades deste mtodo esto relacionadas quer com a aceitao do observador
pelos grupos em questo, quer com o problema do registo. O investigador no pode
confiar unicamente na sua recordao dos acontecimentos apreendidos ao vivo, dado
que a memria selectiva e eliminaria uma grande variedade de comportamentos cuja
importncia no fosse imediatamente aparente. Como nem sempre possvel, nem
desejvel, tomar notas no prprio momento, a nica soluo consiste em transcrever os
comportamentos observados imediatamente aps a observao. Na prtica, trata-se
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 39
Psicometria Lies
muitas vezes de uma tarefa muito pesada, devido fadiga e as condies de trabalho por
vezes esgotantes.
O problema da interpretao das observaes a utilizao de grelhas de observao
muito formalizadas facilita a interpretao, mas, em contra partida, esta arrisca-se a ser
relativamente superficial e mecnica perante a riqueza e a cumplicidade dos processos
estudados.
A soluo passa por usar este mtodo como complemento de outros mtodos, com
procedimentos tcnicos mais precisos, ou ainda, quando possvel, na colaborao de
vrios investigadores, o que confere uma certa intersubjectividade s observaes e
sua interpretao.

Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 40
Psicometria Lies


COMPETENCIAS NECESSRIAS
A nica verdadeira formao em observao a prtica. No bastam algumas semanas
de trabalho para tornar mais perspicaz o olhar do perito. necessrio um confronto
longo e sistemtico entre a reflexo terica inspirada na leitura dos bons autores, e os
comportamentos observveis na vida colectiva para produzir os observadores mais
penetrantes.

RECOLHA DE DADOS PREEXISTENTES: DADOS SECUNDRIOS E DADOS DOCUMENTAIS
O investigador recolhe documentos por duas razes completamente diferentes. Ou
tenciona estud-los por si prprios, como quando examina a forma como um pedido de
um exame de diagnstico complementar influencia o auto-diagnstico, ou espera
encontrar neles informaes teis para estudar outro objecto, como, por exemplo, na
investigao de dados estatsticos sobre o desemprego ou na busca de casos com
tuberculose nos arquivos de um hospital. No primeiro caso, os problemas encontrados
derivam da escolha do objecto de estudo ou da delimitao do campo de anlise, e no
dos mtodos de recolha de informaes propriamente ditos. Assim, apenas
consideramos o segundo caso.
frequente, o trabalho de um investigador necessitar de dados macrossociais, que
apenas organismos oficiais poderosos, como os institutos nacionais de estatstica, tm
condies para recolher. Alis, se estes organismos existem, principalmente para
oferecerem aos responsveis e aos investigadores dados abundantes e dignos de
confiana que aqueles no poderiam recolher por si prprios. Por outro lado, as
bibliotecas, os arquivos e os bancos de dados, sobre todas as suas formas, so ricos em
dados que apenas esperam pela ateno dos investigadores. , portanto, intil consagrar
grandes recursos para recolher aquilo que j existe, ainda que a apresentao dos dados
possa no ser totalmente adequada e deva sofrer algumas adaptaes (Quivy &
Campenhoudt, 1992).

Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 41
Psicometria Lies

O MTODO CLNICO
Pressupe a colheita, anlise e sntese dos dados ou observaes, assim como formular e
testar hipteses, com o intuito de obter informao til que ser, depois, usada no
processo de deciso aplicado a cada indivduo. A todo esse processo, desde a colheita da
informao at deciso e discusso desta com o doente e o estabelecimento de um
plano teraputico, d-se o nome de Mtodo Clnico. Este, tal como o Mtodo Cientfico
na sua globalidade, tem evoluido ao longo do tempo e tem sido alvo de algumas
controvrsias (Faculdade de Medicina da Universidade do Porto, 2000).
O raciocnio clnico um processo, ainda hoje, no totalmente compreendido. Sabe-se,
porm, que ele tem por base mltiplos factores, como a experincia e a aprendizagem, o
raciocnio dedutivo e indutivo, a interpretao de evidncia cientfica, que varivel em
reprodutibilidade e validade, e a intuio que um aspecto difcil de definir.
Com o objectivo de melhorar o raciocnio clnico, vrias tentativas de anlise
quantitativa dos vrios factores nele envolvidos tm sido feitas (ex: estudo dos
processos cognitivos envolvidos no raciocnio clnico, criao de sistemas de apoio
deciso, etc). Embora estas tentativas tenham sido teis no avano da compreenso do
raciocnio clnico, todas elas tm problemas tericos ou prticos que limitam a sua
aplicabilidade prtica clnica diria. Estas tentativas de aplicao do rigor e lgica
inerentes ao mtodo quantitativo tm, no entanto, proporcionado grandes avanos na
compreenso do raciocnio clnico, e permitiram identificar modos de melhorar este
processo, tornando-o mais eficaz e eficiente.
Usando um modelo simplificado, pode descrever-se o Mtodo Clnico como um
processo dividido em pelo menos 3 fases.

HISTRIA CLNICA E EXAME FSICO
A primeira fase consiste na colheita da Histria Clnica, atravs de entrevista ou da
consulta de processo clnico. A Histria Clnica deve incluir a seguinte informao:
identificao do doente, motivo da consulta, histria da doena actual, antecedentes
pessoais, histria social e ocupacional, antecedentes familiares e a reviso de sintomas
por aparelhos e sistemas. Esta colheita de informao avana em funo de um processo
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 42
Psicometria Lies
iterativo de formulao e refutao de hipteses diagnsticas, que levam, na maior parte
dos casos, a um diagnstico correcto, j nesta fase.
Ainda nesta primeira fase tem lugar a realizao do Exame Fsico ou anlise do registo
deste, com especial nfase nos rgos provavelmente envolvidos na doena actual. Este
exame deve ser completo e sistematizado e guiado pelas hipteses formuladas na
colheita da Histria Clnica.
Esta primeira fase muito importante pois nesta fase que se devem obter, de forma
rigorosa, completa, vlida e precisa, os dados ou observaes que estaro na base do
raciocnio que levar formulao do diagnstico. Esta colheita de dados ou
observaes deve ser feita com "o rigor cientfico".

EXAMES AUXILIARES DE DIAGNSTICO
Numa segunda fase, analisa-se, se necessrio, o conjunto de exames auxiliares do
diagnstico que julguem pertinentes para a verificao das possibilidades diagnsticas
levantadas na fase anterior. O profissional deve conhecer, pormenorizadamente, as
caractersticas operacionais de cada exame (sensibilidade, especificidade, valores
preditivos e exactido), as suas indicaes especficas e os potenciais riscos e benefcios
que a sua utilizao tem (Faculdade de Medicina da Universidade do Porto, 2000).

TRIANGULAO DOS DADOS CLNICOS E DOS EXAMES AUXILIARES DE DIAGNSTICO
Numa terceira fase faz-se a integrao da informao proveniente das vrias fontes
disponveis (histria clnica, exame fsico e exames auxiliares de diagnstico). Uma das
formas de fazer esta integrao da informao usando um mtodo quantitativo
designado Anlise Bayesiana. Este mtodo permite, a partir do conhecimento da
probabilidade de um indivduo ter uma doena antes de um qualquer exame ser
realizado (probabilidade pr-teste ou probabilidade antecedente), e tendo conhecimento
sobre as caractersticas do exame (sensibilidade e especificidade), calcular a
probabilidade de existncia de doena aps o conhecimento do resultado desse exame
(probabilidade ps-teste ou probabilidade posterior). O modelo matemtico que,
provavelmente, mais se lhe adequa o epidemiolgico, mas chama-se a ateno para a
importncia do raciocnio clnico na sua compreenso.
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 43
Psicometria Lies

PROCESSO DE ELABORAO DOS DADOS
Na cincia factual, os dados so passveis de serem submetidos a testes (so testveis ou
contrastveis) e corrigveis, pelo que os dados cientficos no so mais permanentes que
as ideias, hipteses e teorias com as quais so produzidos.
Dados so evidncias? A resposta que toda evidncia um dado, mas nem todo dado
evidncia. So evidncias os dados que so relevantes para uma ideia, ou seja, os dados
passam a ser evidncia quando postos em relao com a hiptese formulada durante o
planeamento da investigao. Daqui se entende a expresso investigao cientifica
baseada em evidencias (Teixeira, 2001).
O conjunto de dados obtidos a partir do experimento constitui o grupo de dados brutos.
Os dados brutos podem conter qualquer informao. H que refinar esses dados, com a
finalidade de se dispor de informao relevante e de uso geral. O refinamento faz parte
do processo de elaborao. Os seus estadios so:
Standartizao, normalizao ou normatizao: os dados precisam ser apresentados de
acordo com critrios de aceitao geral (por exemplo, as unidades do Systme
internacional d'Units para registro dos dados de exames de laboratrio clnico);
Exame crtico, na busca de erros de observao: de um lado, este exame obedece aos
critrios estabelecidos pela prpria disciplina a que se filia o experimento; por outro
lado, os dados devem tambm ser examinados, criticamente, segundo consideraes
tericas referentes aos erros de observao;
Reduo dos dados brutos s mdias e disperso em torno das mdias, com o que, ao
invs de lidarmos com inmeros valores, passamos a lidar com um enunciado nico,
que representa o conjunto todo;
Anlise de tabelas; projeco dos dados em grficos para anlise de tendncias,
descoberta de associaes e de correlaes, etc.
As questes devero ser formuladas de tal maneira que a pesquisa em bases de dados
se torne fcil e devero ser divididas em grupos: questes sobre o doente, sobre a
interveno, sobre a comparao entre estratgias e sobre os resultados com interesse. A
maioria das questes clnicas relacionam-se com perguntas sobre o tratamento,
prognstico, diagnstico, riscos, economia, qualidade. No que respeita procura da
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 44
Psicometria Lies
evidncia, no prtico (ou sempre necessrio) que os clnicos identifiquem e
assimilem criticamente toda a evidncia relacionada a uma questo particular. O que
mais prtico procurar revises bem-feitas, sistemticas e correctamente conduzidas da
literatura cientfica as quais se constituem, normalmente, como base de dados de
revises clnicas e so apresentadas de uma forma elegante e de fcil consulta. A
pesquisa de bases de dados, tais como a Medline ou a Embase, pode ser completamente
frustrante, devido maneira como os artigos so posicionados. Se no se usarem
estratgias selectivas de pesquisa para encontrar os artigos relacionados com as questes
formuladas, mais vale no perder esse tempo. No que respeita a avaliao da evidncia,
aps a identificao da evidncia cientfica, torna-se necessrio avaliar a sua validade e
relevncia. Existem vrios guias que auxiliam a reviso da literatura mdica, quer de
uma forma genrica quer de uma forma especializada. Aps se ter verificado a validade
desta informao, ser ento necessrio decidir se essa evidncia relevante para um
doente particular. Ter, simplesmente, a evidncia disponvel no significa,
necessariamente, que ela est em uso ()
PRATICA BASEADA EM EVIDENCIA
Implementar uma Prtica Baseada em Evidencias (PBE) na prtica clnica nem sempre
fcil mas, quando funciona, muito recompensador. A experincia sugere que o
processo se torna automtico quando uma massa crtica dos mdicos, enfermeiras e
fisioterapeutas, audiologistas, radiologistas, cardiopneumologistas e outros tcnicos de
sade so treinados e motivados para a sua aplicao. Uma maneira simples de comear
este processo atravs da implementao, junto dos alunos ou estagirios, das rotinas
de reviso de artigos cientficos a partir de um problema clnico concreto. Desde que
correctamente facilitado ser possvel, numa hora, apresentar criticamente um artigo
cientfico em pequenos grupos e discutir as suas implicaes para a prtica clnica.
medida que o grupo v tendo algum treino neste tipo de reunies ser possvel discutir
mais do que um artigo por hora. As reunies de discusso de casos clnicos funcionam
como uma boa fonte, boa para a elaborao de questes. A implementao das
indicaes, protocolos de diagnstico e tratamento, ter tanto mais xito quanto maior
for o envolvimento de todo a equipa de sade neste formato de formao. A utilizao
deste modelo no s na formao ps-graduada, mas tambm na formao prgraduada
constituir um elemento decisivo para uma futura prtica baseada na evidncia. ()
Para os tcnicos, esta prtica permite-lhes estabelecer rotinas de desenvolvimento das
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 45
Psicometria Lies
suas bases de conhecimento, aumentar a compreenso dos mtodos de pesquisa e
promover a crtica sobre o uso desses dados, aumentar a confiana nos processos de
tomada de deciso, aumentar a literacia informtica e as tcnicas de pesquisa de dados,
melhorar os hbitos de leitura. Para as equipas teraputicas propicia uma estrutura para
a resoluo de problemas e para a formao, permitindo aos mais novos uma
contribuio til para a equipa. Para os doentes assegura um uso mais eficaz dos
recursos e uma melhor comunicao com eles sobre o racional subjacente s tomadas de
deciso (Teixeira, 2001, p. 7).

ESTUDO PILOTO
Antes da execuo da experincia definitiva, um experimento praticamente idntico a
esta, preliminar e exploratrio, usualmente realizado; ele denominado estudo piloto.
O estudo piloto til em vrios aspectos da investigao, orientando o pesquisador
quanto constituio dos grupos de estudo, s caractersticas da soluo desejada,
adequao das tcnicas utilizadas e exequibilidade da pesquisa.

ESTRATGIAS ESTATISTICAS DE ANLISE DE DADOS
A maioria dos investigadores principiantes enfrenta srias dificuldades quando tem de
usar a anlise estatstica. apontado como provveis causas o ensino de Estatstica que,
frequentemente, tem um enfoque matemtico ou de receita que no conduzem ao
aproveitamento desta ferramenta e o consequente despoletar de uma ansiedade
matemtica, que pode levar os estudantes a evitar o seu uso. Essa situao conduz, no
raras vezes, dependncia de outros para seleccionar a estatstica adequada ao seu
projecto. O objetivo desta lio ajudar a ter uma idia da potencialidade da estatstica
apropriada a sua pesquisa.
Primeiro examine seu estudo, identifique o que quer com sua anlise estatstica,
devendo, para isso, especificar claramente as vrias questes a que quer que sua anlise
estatstica responda (conhecer a associao ou verificar as diferenas). Comece por
escrever as suas questes de pesquisa e hipteses. Depois identifique a varivel
dependente e independente bem como os seus nveis de mensurao. Apos estar na
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 46
Psicometria Lies
posse dessa informao consulte a figura que se segue e vai ver que tudo comea a ficar
mais fcil.


FIGURA 6: IDENTIFICAR OS TESTES ESTATISTICOS
Como segundo passo na escolha da estatstica apropriada, verifique se sua varivel
dependente adequada para a estatstica paramtrica. A estatstica paramtrica
envolve pelo menos dois pressupostos iniciais: o primeiro se a varivel dependente
segue uma distribuio normal e, o segundo, se os dados entre diferentes sujeitos so
independentes ou emparelhados/relacionados. Portanto, uma varivel dependente
qualitativa ou categrica no se enquadra neste tipo de estatstica, devendo usar o
enfoque da estatstica no paramtrica.
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 47
Psicometria Lies
Assim recorremos a estatstica paramtrica quando analisamos variveis
dependentes contnuas. Se essas variveis violam os pressupostos e no tem como
corrigir essa violao, ento deve utilizar a estatstica no paramtrica. S tem duas
opes: ou aprende a lidar com a Estatstica no paramtrica ou ento aumenta o
tamanho da amostra.
Examine cada varivel dependente uma por uma nesse processo. Nem todas tero as
mesmas caractersticas. Um erro comum, por exemplo, assumir que pode usar sempre
o mesmo teste estatstico se os grupos experimentais so equivalente em idade, gnero,
anos de estudos e outras variveis demogrficas. Idade e anos de estudo so duas
variveis geralmente analisadas com estatstica paramtrica. O gnero e a etnia so
variveis nominais e por isto devem ser analisadas com Estatstica no paramtrica.
Definir quais as estratgias estatsticas a utilizar exige o conhecimento das lies
anteriores. As mais robustas estratgias estatsticas exigem que as variveis apresentem
propriedades intervalares para que sejam obtidos resultados fidedignos. Contudo na
investigao com seres humanos nem sempre possvel termos variveis quantitativas,
por isso para cada teste estatstico paramtrico existe um equivalente no paramtrico
mas destes ltimos existem vrios que no tem equivalente paramtrico.
Por exemplo se tanto a nossa varivel dependente (VD) quanto a independente (VI)
forem nominais e quisermos conhecer a associao entre elas podemos recorrer ao qui-
quadrado (x
2
) da independncia; se ambas forem ordinais podemos recorrer ao rho de
spearman mas se forem quantitativas e cumprirem com os restantes pr-requisitos da
estatistica paramtrica (simtricas, mesocurticas e distribuio normal) podemos utilizar
o teste r de Pearson.
Se em vez de querermos ver umas associao ou correlao pretendermos verificar se
existem diferenas na distribuio de uma varivel (VD) em funo de outra com nivel
de mensurao nominal e dicotmica (VI) ento podemos utilizar o teste t de Student
para amostras independentes (caso estejam cumpridos os prerequisitos impostos VD
i, quantitativa, simtrica e apresente distribuio aproximadamente normal) ou o seu
equivalente no paramtrico u de Mann-Whitney (caso no estejam cumpridos os pr-
requisitos da estatistica paramtrica mas a VD tenha um nivel de mensurao no
minimo ordinal).
Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 48
Psicometria Lies
Se a figura anterior no o deixou muito esclarecido experimente consultar o quadro que se segue. Otestes estatsticos paramtricos esto
assinados com um asterisco (*)
QUADRO 1: GRELHA DE DECISO DOS TESTES
Testes para uma
amostra
NIVEIS DE MENSURAO
Nominal Ordinal Quantitativa
TESTE DE QUI-QUADRADO DA ADERNCIA TESTE DE KOLMOROGOV-SMIRNOV -TESTE DE KOLMOROGOV-SMIRNOV
-TESTE T PARA UMA AMOSTRA *


Variveis Independentes
Qualitativas Quantitativa
V
a
r
i

v
e
i
s

D
e
p
e
n
d
e
n
t
e
s

Nominal
Nominal/ dicotomica Ordinal/ Grupo
TESTE DE QUI-QUADRADO DA INDEPENDENCIA
TESTE DE QUI-QUADRADO DA INDEPENDENCIA

KAPPA DE COHEN
MACNEMAR
Q DE COCHRAN
Ordinal
TESTE DE QUI-QUADRADO DA INDEPENDENCIA RHO DE SPEARMAN
RHO DE SPEARMAN
TESTE DE U DE MANN-WHITNEY W DE WILCOXON; FRIEDMAN
TESTE DE H DE KRUSKAL-WALLIS KAPPA DE COHEN

MACNEMAR
TESTE DE QUI-QUADRADO DA INDEPENDENCIA
Quantitativa
TESTE T DE STUDENT PARA DADOS INDEPENDENTES *
RHO DE SPEARMAN
TESTE T DE STUDENT PARA N EMPARELHADOS *
TESTE DE U DE MANN-WHITNEY W DE WILCOXON
TESTE ANOVA DE UM CRITRIO E RESPECTIVO POST-
HOC * R DE PEARSON *
TESTE DE H DE KRUSKAL-WALLIS e U POR GRUPO
RHO DE SPEARMAN
TESTE ANOVA PARA MEDIDAS REPETIDAS *
TESTE FRIEDMAN

Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 49
Psicometria Lies
Supondo que suas variveis dependentes tivessem uma distribuio normal ou que sua
amostra fosse suficientemente grande, deve verificar todas as possibilidades de anlise:
univariada , bivariada, mltipla e multivariada, se for o caso. A anlise univariada
quando a varivel analisada per se, anlise bivariada quando uma varivel dependente
relacionada com uma nica varivel independente, anlise mltipla quando se analisa
uma varivel dependente em funo de vrias variveis independentes, e anlise
multivariada, quando se analisa vrias variveis dependentes contnuas em funo de
variveis independentes categricas ou quando se analisa a estrutura das variveis,
visando a reduo do nmero de variveis.
O quadro anterior no esgota as analises estatsticas, alis existem outras tantas quantas
as que apresentamos aqui, contudo mostra as mais utilizadas nas anlises univariadas e
bivariadas.
As tcnicas utilizadas na avaliao psicolgica tm provocado questionamentos nas
comunidades cientficas e profissionais brasileiras, tanto no que se refere qualidade
dos instrumentos, de maneira geral, ao uso que os psiclogos fazem dos instrumentos,
bem como em relao validade geral dos resultados da avaliao psicolgica. O
presente trabalho teve como objetivo identificar as principais informaes psicomtricas
a respeito dos instrumentos psicolgicos presentes em seus manuais, tais como editora,
data de publicao, varivel medida, padronizao, validade e preciso (Noronha,
Primi, & Alchieri, 2004, p. 1).
Existe, tambm, um conjunto de tcnicas estatsticas comummente utilizadas na
avaliao das qualidades psicometricas das escalas. No quadro 2, nas colunas da direita
(tipo de estatsticas) podem observar-se as estatsticas mais utilizadas para verificar os
fenmenos descritos na primeira coluna.

Margarida Pocinho; Jorge Conde; Telmo Pereira

Margarida Pocinho Pgina 50
Psicometria Lies
QUADRO 2: GRELHA DE DECISO DOS TESTES PSICOMTRICOS

Tipo de estatisticas
Descritivas Anlises Bivariadas Outras anlises mais robustas
Para verificar a consistncia temporal entre dois itens
Nmero de casos vlidos, mdia e desvios padro no caso
das variveis quantitativas e frequncias e percentagens
no caso das qualitativas
Pearson, Kappa de Cohen ou
Spearman dependendo do nvel
de mensurao
Fornecer modelos matemticos para a explicao de
teorias cognitivas e comportamentais
Nmero de casos vlidos, mdia e desvios padro No se aplica
Matriz de correlao e respectivos niveis de significancia;
Matriz determinante e inversa;
Matriz anti imagem;
Soluo factorial inicial com as respectivas comunalidades, valores prprios e variancia explicada;
Medidas de adequao da amostra de Kaiser-Meyer-Olkin e de esfericidade de Bartlett's test;
Matriz factorial no rodada incluindo pesos factoriais, comunalidades e valores prprios; soluo
factorial rodada incluindo padro de rotao e matriz de transformao. No caso das rotaes oblquas
para alm do padro de rotao necessria a matriz da estrutura, a matriz dos coeficientes factoriais e a
matriz da coovariancia.
Para alm das estatsticas referidas, so teis os grficos: scree plot dos valores prprios e loading plot
dos primeiros factores.
Estudo da dimensionalidade e reduo de variveis Nmero de casos vlidos, mdia e desvios padro No se aplica
Estudo da relao entre itens;
Identificar itens problemticos (consistncia interna;
reprodutibiliade, etc)
Nmero de casos vlidos, mdia e desvios padro

Coeficiente de correlao inter-
item e intraclass
Hotelling's T-square para a igualdade das mdias e Teste de aditividade;
Tukey's;
Estimativas de fidedignidade
[Alpha de Cronbach (baseado na correlao mdia inter-item):
metade-metade de spearman-brown (split-half);
Guttman (limite inferior de fidedignidade);
modelo paralelo para varincias iguais e para a igualdade das medias;
ANOVA (no caso de dados ordinais Friedmans chi-square e coeficiente de concordncia
de Kendall e no caso de dados dicotmicos a estatstica Q de Cochran)]



I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 1 08-03-2013

BIBLIOGRAFIA
Aiken, L. R. (1982). Psychological testing and assessment (4. edio ed.). Boston:
Allier & Bacon, Inc.
Alferes, V. R. (2008, 08 21). Psicometria: Anlise da consistncia interna de Escalas
Somativas Dicotmicas . Retrieved 02 06, 2009, from SPSS: PROGRAMAS E
ROTINAS COMPLEMENTARES (SYNTAX FILES):
http://www.fpce.uc.pt/niips/spss_prc/psicom/kr_20_21/kr_20_21.htm
American Psychological Association. (1985). Standards for educational and
psychological testing. Washington: American Psychological Association, Inc.
Anastasi, A. (1988). Psychological testing. New York: Macmillan Publishing
Company.
Anastasi, A. (1977). Testes psicolgicos ( 2 edio ed.). So Paulo: Editora
Pedaggica e Universitria Lda.
Borsboom, D., Van-Heerden, J., & Mellenbergh, G. J. (2003). Validity and truth.
Internal Report .
Bryant, F. B. (2000). Assessing the validity of measurement. In L. G. (Orgs.),
Reading and understanding more multivariate statistics (pp. 99-146). Washington:
American Psychological Association.
Bryman, A., & Cramer, D. (2003). Anlise de dados em cincias sociais. Introduo
s tcnicas utilizando o SPSS para windows (3 Edio ed.). Oeiras: Celta.
Campbell, D. T., & Fiske, D. W. (1959). Convergent and discriminant validation by
the multitrait-multimethod matrix. Psychological Bulletin , pp. 81-105.
Cronbach, L. .., & Meehl, P. (1955). Construct validity in psychological tests.
Psychological Bulletin , 4, pp. 281-302.
Cronbach, L. J. (1949). Essentials of psychological testing.
Eco, U. (2002). Como se faz uma tese em cincias humanas (9 ed.). Lisboa: Editorial
Presena.
Emory, C. (1985). Business research methods The Irwin Series in Information and
Decision Sciences ( 3 edio ed.). Illinois: Homewood.
Faculdade de Medicina da Universidade do Porto. (2000). Medicina e Cincia - Do
Mtodo Cientfico ao Mtodo Clnico. (Servio de Bioestatstica e Informtica
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 2 08-03-2013
Mdica) Retrieved Fevereiro 9, 2009, from MedStatWeb: um curso de estatistica
mdica na Web:
http://stat2.med.up.pt/cursop/print_script.php3?capitulo=medicina_ciencia&numero=
6&titulo=Medicina%20e%20Ci%C3%83%C2%AAncia
Freeman, F. (1980). Teoria e Prtica dos Testes Psicolgicos (2 Edio ed.). Lisboa:
Fundao Calouste Gulbenkian.
Golden, C. J., Sawicki, R. F., & Franzen, M. D. (1984). Test construction. In M. H. G.
Goldstein, Handbook of psychological Assessment. New York: Pergaman Press.
Guilford, J. P. (1946). New standards for test evaluation. Educational and
Psychological Measurement, , pp. 427-439.
Gulliksen, H. (1950). Intrinsic validity. American Psychologist , pp. 511-517.
Haynes, S. N., Richard, D. C., & Kubany, E. S. (1995). Content validity in
psychological assessment: A functional approach to concepts and methods.
Psychological Assessment , 3, pp. 238-247.
ITC-International Test Commission. (2008). International Test Commission
Guidelines Index. Retrieved Fevereiro 09, 2010, from International Test Commission:
http://www.intestcom.org/guidelines/index.php
Janis, I. L. (1965). The problem of validating content analysis. In N. L. H. D.
Lasswell, Language of politics. Cambridge: MIT Press.
Kline, P. (1987). A handbook of test construction: Introduction to psychometric
design. London: Routledge Kegan & Paul.
LAP- Laboratrio de Avaliao Psicolgica. (2007). Introduo Psicometria (curso
on-line). Retrieved Janeiro 5, 2010, from LAP- Laboratrio de Avaliao Psicolgica:
http://www.lap-am.org/ativ_concluida1.html
Marx, R., Bombardier, C., Hogg-Johnson, S., & Wright, J. (1999, Fevereiro).
Clinimetric and Psychometric Strategies for Development of a Health Measurement
Scale. Jourrnal of Clinical Epidemiology , 52 (2), pp. 105-111.
Matos, M. (1994, Janeiro). Normas para apresentao de dissertaes: Bases
Essenciais. Retrieved Janeiro 2009, from paginas.fe.up.pt/~mam/normas.pdf
Messick, S. (1989). Validity. Em R. Linn (Org.), Educational measurement (3 Edio
ed.). New York: American Council on Education and Macmillan Publishing
Company.
Mosier, C. (1947). A critical examination of the concepts of face validity. Educational
and Psychological Measurement , 7, pp. 191-205.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 3 08-03-2013
Mosier, C. (1951). Problems and designs of cross-validation. Educational and
Psychological Measurement , 11, pp. 5-12.
Noronha, A. P., Primi, R., & Alchieri, J. C. (2004, Dezembro). Psychometrics
parameters: an analysis of the psychological tests commercialized in Brazil.
Psicologia: cincia e profisso , 24 (4), pp. 88-89.
Nunnally, J. C. (1978). Tests and measurements. New York: McGraw-Hill.
Pasquali, L. (2007). Validade dos Testes Psicolgicos: Ser Possvel Reencontrar o
Caminho? Psicologia Teoria e Pesquisa , 23, pp. 099-107.
Passarelli, B. (1995). Teoria das Mltiplas Inteligncias aliada Multimdia na
Educao: Novos Rumos Para o Conhecimento. Retrieved 02 17, 2009, from
http://www.futuro.usp.br/producao_cientifica/artigos/multiplasintelig.pdf
Pocinho, M. T. (2007). Factores socioculturais, depresso e suicidio no idoso
alentejano. Tese de Doutoramento, ICBAS, Cincias Biomdicas, Porto.
Prieto, G., & Muiz, J. (2000, Novembro). Un modelo para evaluar la calidad de los
tests utilizados en Espaa. Retrieved Fevereiro 02, 2009, from Papeles del Psiclogo:
http://www.cop.es/tests/modelo.htm.
Quivy, R., & Campenhoudt, L. V. ( 1992). Manual de Investigao em Cincias
Sociais. Lisboa: Gradiva.
Teixeira, J. M. (2001, NOVEMBRO/DEZEMBRO). Medicina baseada na evidncia.
Sade Mental , III (Editorial), pp. 5-8.
Weber, R. P. (1990). Basic content analysis (2. Edio ed.). Newbury Park: Sage
Publications.
White, E., Armstrong, B., & Saracci, R. (1992). Principles of Exposure Measurement
in Epidemiology. New York: Oxford University Press.
Wright, J. G., & Feinstein, A. (1992). A comparative contrast of clinimetric and
psychometric methods for constructing indexes and rating scales. Journal Clinical
Epidemiology , 45, 1201-1218.


I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 4 08-03-2013

ANEXOS:


I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 5 08-03-2013


INTERNATIONAL TEST COMMISSION


INTERNATIONAL TEST COMMISSION






INTERNATIONAL GUIDELINES
FOR TEST USE



Version 2000



I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 6 08-03-2013

The Council of the International Test Commission (ITC) formally adopted the
Guidelines at its June 1999 meeting in Graz, Austria.

The European Federation of Professional Psychologists Associations Task Force on
Tests and Testing also endorsed the Guidelines at its July 1999 meeting in Rome.

The Guidelines were officially published at the General Meeting of the ITC on 24
July, 2000 in Stockholm. The Guidelines are copyright of the ITC, 1999. The ITC is a
non-stock corporation incorporated in the USA.

For further information on the ITC or for permission to quote from or reproduce the
contents of this document, please contact the Secretary of the ITC:
Prof Jacques Grgoire, ITC Secretary,
Universit catholique de Louvain,
Facult de Psychologie,
Place du Cardinal Mercier, 10,
1348 Louvain-la-Neuve,
Belgium.
Email: gregoire@deva.ucl.ac.be

For further information regarding the Guidelines, contact:
Prof Dave Bartram, ITC President,
SHL Group plc, The Pavilion, 1 Atwell Place,
Thames Ditton, KT7 0NE, Surrey, England.
Email: dave.bartram@shlgroup.com

I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 7 08-03-2013
See also the ITC website (from which copies of the Guidelines can be obtained):
http://www.intestcom.org

Contents
Acknowledgements 9
Introduction and background 11
The need for international Guidelines 11
Development of the Guidelines 13
The Guidelines 17
Key purpose 17
Scope of the Guidelines 17
Who the Guidelines are for 19
Contextual factors 20
Knowledge, Understanding, and Skill 21
1 Take responsibility for ethical test use 25
1.1 Act in a professional and ethical manner 25
1.2 Ensure they have the competence to use tests 25
1.3 Take responsibility for their use of tests 26
1.4 Ensure that test materials are kept securely 26
1.5 Ensure that test results are treated confidentially. 27
2 Follow good practice in the use of tests 28
2.1 Evaluate the potential utility of testing in an assessment situation 28
2.2 Choose technically sound tests appropriate for the situation 28
2.3 Give due consideration to issues of fairness in testing 29
2.4 Make necessary preparations for the testing session 31
2.5 Administer the tests properly 32
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 8 08-03-2013
2.6 Score and analyse test results accurately 33
2.7 Interpret results appropriately 34
2.8 Communicate the results clearly and accurately to relevant others 35
2.9 Review the appropriateness of the test and its use 36
References 37
Appendix A: Guidelines for an outline policy on testing. 39
Appendix B: Guidelines for developing contracts between parties involved in the
testing process. 41
Appendix C: Points to consider when making arrangements for testing people with
disabilities or impairments 44
Appendix D. Conditions governing the translation of the ITC Guidelines on Test Use.
47

I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 9 08-03-2013
Acknowledgements

The Guidelines were prepared for the ITC Council by Professor Dave Bartram. The
author is grateful for the assistance provided by Iain Coyne in the execution of this
project and is grateful to the following individuals who took part in the 1997 Dublin
workshop and who provided such valuable input to the development of the present
Guidelines.
Ms Dusica Boben, Produktivnost, SLOVENIA;
Mr Eugene Burke, British Psychological Society, England;
Dr Wayne Camara, The College Board, USA;
Mr Jean-Louis Chabot, ANOP, FRANCE;
Mr Iain Coyne, University of Hull, England;
Dr Riet Dekker, Swets and Zeitlinger, Netherlands;
Dr Lorraine Eyde, US Office of Personnel Management, USA;
Prof Rocio Fernandez-Ballesteros, EAPA, SpAIN;
Mr Ian Florance, NFER-NELSON, England;
Prof Cheryl Foxcroft, Test Commission of South Africa, South Africa;
Dr John Fremer, The College Board, USA;
Ms Kathia Glabeke, Commissie Psychodiagnostiek, BELGIUM;
Prof Ron Hambleton, University of Massachusetts at Amherst, USA;
Dr Karin Havenga, Test Commission of South Africa, South Africa;
Dr Jurgen Hogrefe, Hogrefe & Huber Verlagsgruppe, Germany;
Mr Ralf Horn, Swets and Zeitlinger, Germany;
Mr Leif Ter Laak, Saville and Holdsworth Ltd, England;
Dr Pat Lindley, British Psychological Society, England;
Mr Reginald Lombard, Test Commission of South Africa, South Africa;
Prof Jose Muniz, Spanish Psychological Association, Spain;
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 10 08-03-2013
Ms Gill Nyfield, Saville & Holdsworth Ltd, England;
Dr Torleiv Odland, Norsk Psykologforening, Norway;
Ms Berit Sander, Danish Psychologists Association,DENMARK;
Prof Francois Stoll, Federation Suisse des Psychologues, Switzerland.

The author is also grateful to the many other individuals and organisations who
provided feedback during the various stages of consultation and in conference
presentations.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 11 08-03-2013
Introduction and background

The need for international Guidelines

The focus of the International Test Commission (ITC) project is on guidelines for
good test use and for encouraging best practice in assessment. The work so far carried
out by the ITC to promote good practice in test adaptations (Hambleton, 1994; Van de
Vijver, F. & Hambleton, R., 1996) is an important step towards assuring uniformity in
the quality of tests adapted for use across different cultures and languages. At its
meeting in Athens in 1995, the ITC Council accepted a proposal to broaden this
concern to include guidelines on the fair and ethical use of tests, from which standards
for training and specifying the competence of test users could be derived.

There are a number of reasons why guidelines on test use are needed at an
international level.
Countries differ greatly in the degree, if any, of statutory control they can exercise
over the use of testing and its consequences for those tested. Some national
professional societies have statutory registration of psychologists, others do not; some
have mechanisms for the control of standards of test use by non-psychologists, others
do not. The existence of a set of internationally-accepted guidelines would provide
national psychological associations and other relevant professional bodies and
organisations with a degree of support in the endeavours of such organisations to
develop standards in countries where such standards are currently either lacking in
some respect or non-existent.
Patterns of access, in terms of the rights to purchase or use test materials, vary greatly
from country to country. In some countries, access is restricted to psychologists, in
others to users registered with formally approved national test distributors, in yet
others, test users may be free to obtain materials without restriction from suppliers in
their country or directly from suppliers abroad.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 12 08-03-2013
A number of well-known instruments have appeared on the Internet in violation of
copyright, without acknowledgement of the test authors or publishers, and without
regard to issues of test security.
Within the occupational testing arena, the greater international mobility of labour has
increased the demand for tests to be used on job applicants from a number of different
countries - often with the tests being administered in one country on behalf of a
potential employer in another country.
Development work is being carried out in the USA and in the UK on the use of
Internet for distance- or remote-assessment in both occupational and educational
settings. This raises a whole host of issues relating to standards of administration and
control over the testing process, including test security.

Aim and objectives

The long-term aim of this project includes the production of a set of guidelines that
relate to the competencies (knowledge, skills, abilities and other personal
characteristics) needed by test users. These competencies are specified in terms of
assessable performance criteria. These criteria provide the basis for developing
specifications of the evidence of competence that would be expected from someone
seeking qualification as a test user. Such competencies need to cover such issues as:
professional and ethical standards in testing,
rights of the test taker and other parties involved in the testing process,
choice and evaluation of alternative tests,
test administration, scoring and interpretation,
report writing and feedback.

Insofar as they directly relate to test use, the Guidelines also have implications for:
standards for test construction,
standards for user-documentation - e.g., technical and user manuals,
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 13 08-03-2013
standards for regulating the supply and availability of tests and information about
tests.

The present Guidelines represent the work of specialists in psychological and
educational testing (i.e. psychologists, psychometricians, test publishers and test
developers) drawn from a number of countries. The intention of this document is not
to invent new guidelines, but to draw together the common threads that run through
existing guidelines, codes of practice, standards and other relevant documents, and to
create a coherent structure within which they can be understood and used.
Development of the Guidelines

The Guidelines should be considered as benchmarks against which existing local
standards can be compared for coverage and international consistency. By using the
Guidelines as benchmarks or the basis from which to develop locally applicable
documents (e.g. standards, codes of practice, statements on test taker rights), a high
level of consistency across national boundaries will be promoted.

Work on the Guidelines began by drawing together materials concerned with test
standards, codes of practice, test use, etc., from a number of countries3. While
drawing on all of these sources, the present Guidelines have been particularly
influenced by:
The Australian Psychological Society (APS) Supplement to guidelines on the use of
Psychological Tests (Kendall et al., 1997).
The British Psychological Society (BPS) Level A and Level B standards for
occupational test use (Bartram, 1995, 1996).
The American Educational Research Association (AERA) , American Psychological
Association (APA), & National Council on Measurement in Education (NCME)
(1985) Standards for educational and psychological testing.

3
A list of all the materials that informed this process is available on request from the authors.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 14 08-03-2013
American Association for Counseling and Development (AACD) Responsibilities of
Users of Standardized Tests (Schafer, W.D, 1992).
The CPA (Canadian Psychological Association, 1987) Guidelines for Educational and
Psychological Testing.
The APS document has been particularly valuable as it pulls together much of what is
contained in the BPS and American publications as well as drawing on South African
National Institute for Psychological Research (NIPR) publications and various
publishers guidance for test users. It also embodies much of what has come out of
Joint Committee on Testing Practices (JCTP) Test User Qualifications Working
Groups (TUQWG) seminal work on a data-based approach to promoting good test
use (e.g., Eyde et al, 1988, 1993; Moreland et al., 1995), and the work of the JCTP on
the Code of Fair Testing Practices in Education (JCTP, 1988; Fremer, Diamond, &
Camara, 1989). Appendix B drew from the more recent work of the JCTP (JCTP,
2000) on test taker rights and responsibilities.

The content of the primary sources was analysed and statements categorised under 14
main headings. Where appropriate single statements were written to capture the
common meaning of a number of statements from different sources. Statements were
also modified in format such that they provided completion of a common stem (e.g.:
Competent test users will endeavour to...., or Competent test users can....).

This initial structure of 14 main sections and their content was embodied in the first
draft Framework Document. This formed the material for an international workshop
held in Dublin in July 1997. The purpose of the ITC Workshop was to consider and
critically evaluate all aspects of a framework document, with a view to producing a
draft set of guidelines that would have international currency and acceptance. During
the workshop, the Framework Document was examined in detail, with refinements
being proposed in terms of form, structure and content. Following the workshop, the
document was extensively revised (Version 2.0) and circulated to all those who
attended for comment. A draft consultation document (Version 3.1) was prepared that
incorporated all the comments and suggestions submitted regarding Version 2.0.

I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 15 08-03-2013
Copies of the Version 3.1 consultation document and a structured response form were
widely circulated to key individuals and organisations for comment. A total of 200
were distributed. A total of 28 detailed responses were received including corporate
responses from the APA, the BPS and some other European professional associations.
In the summer of 1998 the Guidelines were revised in the light of these comments,
and 200 copies (Version 4.1) were sent out for further consultation. A total of 18
formal responses were received to this second round of consultation. In addition,
supportive informal comments were provided by many recipients of the consultation
documents by email or in meetings.

In producing the current version of the Guidelines (Version 2000), every effort has
been made to take account of all these responses. Without exception, the responses
were helpful and constructive.4

These Guidelines are to be seen as supportive rather than constraining. We need to
ensure that the Guidelines embody universal key principles of good test use, without
attempting to impose uniformity on legitimate differences in function and practice
between countries or between areas of application.

The proposed structure differentiates three main aspects of competence:
Professional and ethical standards of good practice that affect the way in which the
process of testing is carried out and the way in which test users interact with others
involved in the process.
The knowledge, understanding and skills relating to the process of testing: what test
users need to be able to do.

4
A detailed report on the results of the first consultation was submitted to the ITC Council meeting in
August, 1998. A report on the second consultation together with Version 5.0 of the Guidelines was
submitted to the ITC Council when it met in June 1999. Version 2000 contains some minor editorial
amendments to Version 5.0.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 16 08-03-2013
The knowledge and understanding that are necessary to inform and underpin the
process of testing.
These three components differ, yet are inextricably inter-twined in practice.
The Guidelines start from a key purpose. This can be characterised as the mission
statement for test users. It provides the focus from which the guidelines are
developed. Each guideline defines an aspect of test user competence that contributes
to the key purpose.

Together with the key purpose, the scope statement describes to whom the Guidelines
apply, the forms of assessment to which they relate, and the assessment contexts.


This document contains:
Key purpose and scope statements.
Specifications of test user competencies in relation to ethical test use.
Specifications of test user competencies in relation to good practice in the use of tests.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 17 08-03-2013
The Guidelines
Key purpose

A competent test user will use tests appropriately, professionally, and in an ethical
manner, paying due regard to the needs and rights of those involved in the testing
process, the reasons for testing, and the broader context in which the testing takes
place.

This outcome will be achieved by ensuring that the test user has the necessary
competencies to carry out the testing process, and the knowledge and understanding
of tests and test use that inform and underpin this process.

Scope of the Guidelines

Any attempt to provide a precise definition of a test or of testing as a process, is
likely to fail as it will tend to exclude some procedures that should be included and
include others that should be excluded. For the purpose of these Guidelines, the terms
test and testing should be interpreted broadly. Whether an assessment procedure is
labelled a test or not is immaterial. These Guidelines will be relevant for many
assessment procedures that are not called tests or that seek to avoid the designation
test. Rather than provide a single definition, the following statements attempt to
map out the domain covered by the Guidelines.

Testing includes a wide range of procedures for use in psychological, occupational
and educational assessment.
Testing may include procedures for the measurement of both normal and abnormal or
dysfunctional behaviours.
Testing procedures are normally designed to be administered under carefully
controlled or standardised conditions that embody systematic scoring protocols.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 18 08-03-2013
These procedures provide measures of performance and involve the drawing of
inferences from samples of behaviour.
They also include procedures that may result in the qualitative classification or
ordering of people (e.g., in terms of type).
Any procedure used for testing, in the above sense, should be regarded as a test,
regardless of its mode of administration; regardless of whether it was developed by a
professional test developer; and regardless of whether it involves sets of questions, or
requires the performance of tasks or operations (e.g., work samples, psycho-motor
tracking tests).

Tests should be supported by evidence of reliability and validity for their intended
purpose. Evidence should be provided to support the inferences that may be drawn
from the scores on the test. This evidence should be accessible to the test user and
available for independent scrutiny and evaluation. Where important evidence is
contained in technical reports that are difficult to access, fully referenced synopses
should be provided by the test distributor.

The test use Guidelines presented here should be considered as applying to all such
procedures, whether or not they are labelled as psychological tests or educational
tests and whether or not they are adequately supported by accessible technical
evidence.

Many of these Guidelines will apply also to other assessment procedures that lie
outside the domain of tests. They may be relevant for any assessment procedure that
is used in situations where the assessment of people has a serious and meaningful
intent and which, if misused, may result in personal loss or psychological distress (for
example, job selection interviews, job performance appraisals, diagnostic assessment
of learning support needs).

The Guidelines do not apply to the use of materials that may have a superficial
resemblance to tests, but which all participants recognise are intended to be used only
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 19 08-03-2013
for purposes of amusement or entertainment (e.g., life-style inventories in magazines
or newspapers).

Who the Guidelines are for

The Guidelines apply to the use of tests in professional practice. As such they are
directed primarily towards:
The purchasers and holders of test materials;
Those responsible for selecting tests and determining the use to which tests will be
put;
Those who administer, score or interpret tests;

Those who provide advice to others on the basis of test results (e.g., recruitment
consultants, educational and career counsellors, trainers, succession planners);
Those concerned with the process of reporting test results and providing feedback to
people who have been tested.

The Guidelines will be of relevance to others involved in the use of tests as defined
above. These include:
the developers of tests,
the suppliers of tests,
those involved in the training of test users,
those who take tests and their relevant others (e.g., parents, spouses, partners),
professional bodies and other associations with an interest in the use of psychological
and educational testing, and
policy makers and legislators.

I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 20 08-03-2013
While aimed primarily at professional practice, most aspects of the good practice
embodied in the Guidelines will also be of relevance to those who use tests solely for
research purposes.

The Guidelines are not intended to cover every type of assessment technique (e.g.,
unstructured or semi-structured interviews, assessed group activities) or every
situation in which assessment occurs (e.g., employment assessment centres). Yet
many of the Guidelines are likely to be applicable in assessment situations and for
purposes more general than those concerned primarily with psychological and
educational testing (for example, the use of assessment centres for employmee
placement or selection, semi-structured and structured interviews, or assessment for
selection, career guidance and counselling).
Contextual factors

The Guidelines are applicable internationally. They may be used to develop specific
local standards through a process of contextualisation. It is recognised that there are
many factors which affect how standards may be managed and realised in practice.
These contextual factors have to be considered at the local level when interpreting the
Guidelines and defining what they would mean in practice within any particular
setting.

The factors that need to be considered in turning Guidelines into specific standards
include:
social, political, institutional, linguistic, and cultural differences between assessment
settings;
the laws of the country in which testing is taking place;
existing national guidelines and performance standards set by professional
psychological societies and associations;
differences relating to individual versus group assessment;
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 21 08-03-2013
differences related to the test setting (educational, clinical, work-related and other
assessment);
who the primary recipients of the test results are (e.g., the test-takers, their parents or
guardian, the test-developer, an employer or other third party);
differences relating to the use of test results (e.g., for decision-making, as in selection
screening, or for providing information to support guidance or counselling); and
variations in the degree to which the situation provides opportunity for the accuracy
of interpretations to be checked in the light of subsequent information and amended if
needed.


Knowledge, Understanding, and Skill

Knowledge, understanding and skill underpin all the test user competencies. The
nature of their content and level of detail are likely to vary between countries, areas of
application and as a function of the level of competence required to use a test.

The Guidelines do not contain detailed descriptions of these. However, when applying
the Guidelines for use in specific situations the relevant knowledge, skills, abilities
and other personal characteristics will need to be specified. This specification is part
of the process of contextualisation, through which generic guidelines are developed
into specific standards. The main areas descriptions of knowledge, understanding and
skills need to cover include the following.

Relevant declarative knowledge.
This includes:
knowledge of basic psychometric principles and procedures, and the technical
requirements of tests (e.g., reliability, validity, standardisation);
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 22 08-03-2013
knowledge of tests and measurement sufficient to enable the proper understanding of
test results;
knowledge and understanding of relevant theories and models of ability, of
personality or other psychological constructs, or of psychopathology, as necessary to
properly inform the choice of tests and the interpretation of test results; and
knowledge of the tests and the test suppliers relevant to ones area of practice.

Instrumental knowledge and skills
These include:
knowledge and skills relating to specific assessment procedures or instruments,
including the use of computer-based assessment procedures;
specialised knowledge of and practitioner skills associated with using those tests that
are within ones repertoire of assessment tools; and
knowledge and understanding of the construct or constructs underlying test scores,
where this is important if valid inferences are to be drawn from the test results.


The Guidelines cover:

General personal task-related skills

This includes:
the performance of relevant activities such as test administration, reporting, and the
provision of feedback to test takers and other clients;
oral and written communication skills sufficient for the proper preparation of test
takers, test administration, the reporting of test results, and for interaction with
relevant others (e.g., parents, or organisational policy makers); and
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 23 08-03-2013
interpersonal skills sufficient for the proper preparation of test takers, the
administration of tests, and the provision of feedback of test results.

Contextual knowledge and skills

This includes:
knowing when and when not to use tests;
knowing how to integrate testing with other less formal components of the assessment
situation (e.g., biographical data, unstructured interview and references etc.); and
knowledge of current professional, legal, and ethical issues relating to the use of tests,
and of their practical implications for test use.

Task management skills

This includes:
knowledge of codes of conduct and good practice relating to the use of tests, test data,
the provision of feedback, the production and storage of reports, the storage of and
responsibility for test materials and test data; and
knowledge of the social, cultural, and political context in which the test is being used,
and the ways in which such factors might affect the results, their interpretation and the
use to which they are put.

Contingency management skills

This includes:
knowing how to deal with problems, difficulties, and breakdowns in routine;
knowing how to deal with a test taker's questions during test administration etc.; and
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 24 08-03-2013
knowing how to deal with situations in which there is the potential for test misuse or
for misunderstanding the interpretation of test scores.

I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 25 08-03-2013

1 Take responsibility for ethical test use


Competent test users should:
1.1 Act in a professional and ethical manner

1.1.1 Promote and maintain professional and ethical standards.
1.1.2 Have a working understanding of current professional and ethical issues and
debates relating to the use of tests in their field of application.
1.1.3 Implement an explicit policy on testing and test use.5
1.1.4 Ensure that people who work for or with them adhere to appropriate
professional and ethical standards of behaviour.
Conduct communications with due concern for the sensitivities of the test taker and
other relevant parties.
Represent tests and testing in a positive and balanced manner in communications with
and through the media.
1.1.7 Avoid situations in which they may have or be seen to have a vested interest in
the outcome of the assessment, or where the assessment might damage the
relationship with their client.
1.2 Ensure they have the competence to use tests

1.2.1 Work within the limits of scientific principle and substantiated experience.
1.2.2 Set and maintain high personal standards of competence.
1.2.3 Know the limits of their own competence and operate within those limits.

5
An example policy outline is attached as Appendix A.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 26 08-03-2013
1.2.4 Keep up with relevant changes and advances relating to the tests they use, and
to test development, including changes in legislation and policy, which may impact on
tests and test use.
1.3 Take responsibility for their use of tests

1.3.1 Only offer testing services and only use tests for which they are qualified.
1.3.2 Accept responsibility for the choice of tests used, and for the recommendations
made.
1.3.3 Provide clear and adequate information to participants in the testing process
about the ethical principles and legal regulations governing psychological testing.
1.3.4 Ensure that the nature of the contract between test-taker and tester is clear and
understood.6
1.3.5 Be alert to any unintended consequences of test use.
1.3.6 Endeavour to avoid doing harm or causing distress to those involved in the
testing process.
1.4 Ensure that test materials are kept securely

1.4.1 Ensure secure storage of and control access to test materials
1.4.2 Respect copyright law and agreements that exist with respect to a test
including any prohibitions on the copying or transmission of materials in electronic or
other forms to other people, whether qualified or otherwise.
1.4.3 Protect the integrity of the test by not coaching individuals on actual test
materials or other practice materials that might unfairly influence their test
performance.
1.4.4 Ensure that test techniques are not described publicly in such a way that their
usefulness is impaired

6
An example contract between test user and test taker is attached as Appendix B.

I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 27 08-03-2013
1.5 Ensure that test results are treated confidentially.

1.5.1 Specify who will have access to results and define levels of confidentiality.
1.5.2 Explain levels of confidentiality to individuals before tests are administered.
1.5.3 Limit access to results to those with a right to know.
1.5.4 Obtain the relevant consents before releasing results to others.
1.5.5 Protect data kept on file so that only those who have a right of access can
obtain them.
1.5.6 Establish clear guidelines as to how long test data are to be kept on file.
1.5.7 Remove names and other personal identifiers from databases of results that are
archived, for research use, development of norms or other statistical purposes.

I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 28 08-03-2013
2 Follow good practice in the use of tests


2.1 Evaluate the potential utility of testing in an assessment situation

Competent test users will:
2.1.1 Produce a reasoned justification for the use of tests.
2.1.2 Ensure there has been a thorough analysis of the clients needs, reasons for
referral, or of the diagnostic category, condition, or job for which assessment is being
used.
Establish that the knowledge, skills, abilities, aptitudes or other characteristics, which
the tests are intended to measure, are correlates of relevant behaviours in the context
about which inferences are to be drawn.
Seek other relevant collateral sources of information.
2.1.5 Assess the advantages and disadvantages of using tests compared with other
sources of information.
2.1.6 Ensure that full use is made of all available collateral sources of information.
2.2 Choose technically sound tests appropriate for the situation

Competent test users will:
2.2.1 Examine current information covering the range of potentially relevant tests
(e.g., from specimen sets, independent reviews, expert advice), before selecting a test
to use.
2.2.2 Determine that the tests technical and user documentation provides sufficient
information to enable evaluation of the following:
a) scope or coverage and representativeness of test content, appropriateness of
norm groups, difficulty level of content etc.;
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 29 08-03-2013
b) accuracy of measurement and reliability demonstrated with respect to relevant
populations;
c) validity (demonstrated with respect to relevant populations) and relevance for
the required use;
d) freedom from systematic bias in relation to the intended test taker groups;
e) acceptability to those who will be involved in their use, including perceived
fairness and relevance;
f) practicality, including time required, costs, and resource needs.
2.2.3 Avoid the use of tests that have inadequate or unclear supporting technical
documentation;
2.2.4 Use tests only for those purposes where relevant and appropriate validity
evidence is available.
2.2.5 Avoid judging a test solely on the basis of face value, test-user testimonials, or
advice from those with a vested commercial interest.
2.2.6 Respond to requests from relevant interested parties (e.g. test takers, parents,
managers) by providing sufficient information to allow them to understand why the
test was chosen.

2.3 Give due consideration to issues of fairness in testing

When tests are to be used with individuals from different groups (e.g., groups
differing in terms of gender, cultural background, education, ethnic origin, or age),
competent test users will make all reasonable efforts to ensure that:
2.3.1 The tests are unbiased and appropriate for the various groups that will be
tested.
2.3.2 The constructs being assessed are meaningful in each of the groups
represented.
Evidence is available on possible group differences in performance on the test.
Evidence relating to differential item functioning (DIF) is available, where relevant.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 30 08-03-2013
2.3.5 There is validity evidence to support the intended use of the test in the various
groups.
2.3.6 Effects of group differences not relevant to the main purpose (e.g., differences
in motivation to answer, or reading ability) are minimised.
In all cases, Guidelines relating to the fair use of tests are interpreted in the context of
local policy and legislation.7

When testing in more than one language (within or across countries8), competent test
users will make all reasonable efforts to ensure that:
2.3.8 Each language or dialect version has been developed using a rigorous
methodology meeting the requirements of best practice.
2.3.9 The developers have been sensitive to issues of content, culture and language.
2.3.10 The test administrators can communicate clearly in the language in which the
test is to be administered.
2.3.11 The test takers level of proficiency in the language in which the test will be
administered is determined systematically and the appropriate language version is
administered or bilingual assessment is performed, if appropriate.

When tests are to be used with people with disabilities, competent test users will make
all reasonable efforts to ensure that:
2.3.12 Advice is sought from relevant experts on the potential effects of the various
disabilities on test performance.
2.3.13 Potential test takers are consulted and their needs and wishes are given proper
consideration.

7
The Guidelines in this section focus on what is best practice. However, in many countries, issues
relating to the fair use of tests must also take account of national laws (e.g., the Americans with
Disabilities Act, 1990, in the USA, or the Race Relations Act, 1976, in the UK).
8
These Guidelines relate not only to different national languages and dialects, but also to special forms
of communication, such as sign language, used to overcome the effects of forms of disability.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 31 08-03-2013
2.3.14 Adequate arrangements are made when test takers include people with
hearing, visual or motor impairments, or other disabilities (e.g., learning impairments,
dyslexia .).
2.3.15 Use of alternative assessment procedures, rather than modifications to tests, is
considered (e.g., other more suitable tests, or alternative structured forms of
assessment).
2.3.16 Relevant professional advice is sought if the degree of modification required
for use by those with disabilities is beyond the experience of the test user.
2.3.17 Modifications, when necessary, are tailored to the nature of the disability and
are designed to minimize impact on score validity.
2.3.18 Information regarding the nature of any modifications made to a test or testing
procedure is provided to those who interpret or act upon the test scores whenever the
withholding of such information might otherwise result in biased interpretation or an
unfair decision.

2.4 Make necessary preparations for the testing session

The competent test user will make all reasonable efforts to:
2.4.1 Provide relevant parties in a timely manner with clear information concerning
the purpose of testing, ways in which they might best prepare for the test session, and
the procedures to be followedr.
2.4.2 Advise test takers of the linguistic or dialectic groups for which the test is
considered appropriate.
2.4.3 Send test takers approved practice, sample, or preparation materials where
these are available and where this is consistent with recommended practice for the
tests concerned.
2.4.4 Explain clearly to test takers their rights and responsibilities9.

9
See Appendix B.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 32 08-03-2013
2.4.5 Gain the explicit consent of test takers or their legal guardians or
representatives before any testing is done.
2.4.6 Explain, when testing is optional, the consequences of taking or not taking the
test to relevant parties so that they can make an informed choice.
2.4.7 Make the necessary practical arrangements by ensuring that:
a) preparations conform to those stipulated in the publishers manual;
b) locations and facilities for testing have been arranged well in advance, and the
physical environment is accessible, safe, quiet, free from distractions and appropriate
for the purpose;
c) sufficient materials are available and have been checked to ensure there are no
marks left by previous users on question booklets or answer sheets;
d) staff who will be involved in the administration are competent;
e) appropriate arrangements have been made for the testing of people with
disabilities10.
2.4.8 Anticipate likely problems and counteract them through thorough preparation
of materials and instructions.
2.5 Administer the tests properly

The competent test user will:
2.5.1 Establish rapport by welcoming test-takers and briefing them in a positive
fashion.
2.5.2 Act to reduce test-taker anxiety and avoid creating or reinforcing unnecessary
anxiety.
2.5.3 Ensure potential sources of distraction (e.g., wristwatch alarms, mobile
phones, pagers) are removed.
2.5.4 Ensure test-takers have the materials they require for taking the test before it
begins.

10
See Appendix C.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 33 08-03-2013
2.5.5 Administer tests under appropriate supervised conditions.
2.5.6 Wherever possible, administer test instructions in the primary language of the
test takers, even where the test content is designed to provide evidence of knowledge
or skills in a non-primary language.
2.5.7 Adhere strictly to the directions and instructions as specified in the test manual
while making reasonable accommodations for persons with disabilities.
2.5.8 Read instructions clearly and calmly.
2.5.9 Provide adequate time for examples to be completed.
2.5.10 Observe and record deviations from test procedures.
2.5.11 Monitor and record response times accurately where appropriate.
2.5.12 Ensure all materials are accounted for at the end of each testing session.
2.5.13 Administer tests by modes that permit adequate and appropriate levels of
supervision and authentication of the identity of the test takers.
2.5.14 Ensure those assisting the administration have had proper training.
2.5.15 Ensure test takers are not left unattended or subjected to distracting activities
during a supervised test session.
2.5.16 Provide appropriate assistance to test takers who show signs of undue distress
or anxiety.
2.6 Score and analyse test results accurately

Competent test users will:
2.6.1 Follow carefully the standardised procedures for scoring.
2.6.2 Carry out appropriate raw score conversions to other relevant types of scale.
2.6.3 Choose scale types relevant to the intended use of the test scores.
2.6.4 Check score scale-conversions and other clerical procedures for accuracy.
2.6.5 Ensure that invalid conclusions are not drawn from comparisons of scores with
norms that are not relevant to the people being tested or are outdated.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 34 08-03-2013
2.6.6 Compute, where appropriate, composite scores using standard formulae and
equations.
2.6.7 Employ procedures to screen test results to recognise improbable or
unreasonable scores.
2.6.8 Clearly and accurately label scales in reports, and provide clear identification
of norms, scales types, and equations used.
2.7 Interpret results appropriately

Competent test users will:
2.7.1 Have a good professional understanding of the tests theoretical or conceptual
basis, technical documentation and guidance on the use and interpretation of the scale
scores.
2.7.2 Have a good understanding of the scales used, the characteristics of the norm
or comparison groups, and the limitations of the scores.
2.7.3 Take steps to minimise the effects on test interpretation of any biases the test
interpreter may have towards members of the test takers cultural group.
2.7.4 Use appropriate norm or comparison groups where available.
2.7.5 Interpret results in the light of available information about the person being
tested (including age, gender, schooling, culture and other factors) with due regard for
the technical limitations of the test, the assessment context, and the needs of those
with a legitimate interest in the outcome of the process.
2.7.6 Avoid over-generalising the results of one test to traits or human
characteristics which are not measured by the test.
2.7.7 Consider each scales reliability, error of measurement and other qualities
which may have artificially lowered or raised results when interpreting scores.
2.7.8 Give due consideration to the available evidence of validity, with respect to
the construct being measured for members of the test takers relevant demographic
groups (e.g., cultural, age, social class, and gender groups).
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 35 08-03-2013
2.7.9 Use passing scores (cut-scores) in test interpretation only when evidence of the
validity for the pass scores is available and supports its use.
2.7.10 Be aware of negative social stereotyping that may pertain to members of the
test takers group (e.g., cultural group, age, social class, and gender) and avoid
interpreting tests in a manner that perpetuates such stereotyping.
2.7.11 Take into account any individual or group variations from standard procedures
in test administration.
2.7.12 Take into account any evidence of prior experience with the test where there
are data available relating to the effect of such experience on test performance.

2.8 Communicate the results clearly and accurately to relevant others

Competent test users will:
2.8.1 Identify appropriate parties who may legitimately receive test results.
With the informed consent of the test takers, or their legal representatives, produce
written or oral reports for relevant interested parties.
Ensure that the technical and linguistic levels of any reports are appropriate for the
level of understanding of the recipients.
2.8.4 Make clear that the test data represent just one source of information and
should always be considered in conjunction with other information.
2.8.5 Explain how the importance of the test results should be weighted in relation
to other information about the people being assessed.
2.8.6 Use a form and structure for a report that is appropriate to the context of the
assessment.
2.8.7 When appropriate, provide decision-makers with information on how results
may be used to inform their decisions.
2.8.8 Explain and support the use of test results used to classify people into
categories (e.g., for diagnostic purposes or for job selection).
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 36 08-03-2013
2.8.9 Include within written reports a clear summary, and when relevant, specific
recommendations.
2.8.10 Present oral feedback to test takers in a constructive and supportive manner.
2.9 Review the appropriateness of the test and its use

Competent test users will:
2.9.1 Monitor and periodically review changes over time in the populations of
individuals being tested and any criterion measures being used.
2.9.2 Monitor tests for evidence of adverse impact.
2.9.3 Be aware of the need to re-evaluate the use of a test if changes are made to its
form, content, or mode of administration.
2.9.4 Be aware of the need to re-evaluate the evidence of validity if the purpose for
which a test is being used is changed.
2.9.5 Where possible, seek to validate tests for the use to which they are being put,
or participate in formal validation studies.
2.9.6 Where possible, assist in updating information regarding the norms, reliability
and validity of the test by providing relevant test data to the test developers,
publishers or researchers.



I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 37 08-03-2013
References



American Educational Research Association, American Psychological Association, &
National Council on Measurement in Education. (1985). Standards for Educational
and Psychological Testing. Washington DC: American Psychological Association.
Bartram, D. (1995). The Development of Standards for the Use of Psychological
Tests in Occupational Settings: The Competence Approach. The Psychologist, May,
219-223.
Bartram, D. (1996). Test Qualifications and Test Use in the UK: The Competence
Approach. European Journal of Psychological Assessment, 12, 62-71.
Canadian Psychological Association. (1987). Guidelines for Educational and
Psychological Testing. Ottawa: Canadian Psychological Association.
Eyde, L. D., Moreland, K. L. & Robertson, G. J. (1988). Test User Qualifications: A
Data-based Approach to Promoting Good Test Use. Report for the Test User
Qualifications Working Group. Washington DC: American Psychological
Association.
Eyde, L. D., Robertson, G. J., Krug, S. E. et al (1993). Responsible Test Use: Case
Studies For Assessing Human Behaviour. Washington DC: American Psychological
Association.
Fremer, J., Diamond, E. E. & Camara, W. J. (1989). Developing a Code of Fair
Testing Practices in Education. American Psychologist, 44, 1062-1067.
Hambleton, R. (1994). Guidelines for adapting educational and psychological tests: A
progress report. European Journal of Psychological Assessment, 10, 229-244.
Joint Committee on Testing Practices. (1988). Code of Fair Testing Practices in
Education. Washington DC: Joint Committee on Testing Practices.
Joint Committee on Testing Practices. (2000). Rights and Responsibilities of Test
Takers: Guidelines and Expectations. Washington DC: Joint Committee on Testing
Practices.
I TC I nternational Guidelines for Test Use
Copyright International Test Commission 1999. 38 08-03-2013
Kendall, I., Jenkinson, J., De Lemos, M. & Clancy, D. (1997). Supplement to
Guidelines for the use of Psychological Tests. Australian Psychological Society.
Moreland, K. L., Eyde, L. D., Robertson, G. J., Primoff, E. S. & Most, R. B. (1995).
Assessment of Test User Qualifications: A Research-Based Measurement Procedure.
American Psychologist, 50, 14-23.
Schafer, W. D. (1992). Responsibilities of Users of Standardized Tests: RUST
Statement Revised. Alexandria, VA: American Association for Counseling and
Development.
Van de Vijver, F. & Hambleton, R. (1996). Translating tests: some practical
guidelines. European Psychologist , 1, 89-99.


I TC I nternational Guidelines for Test Use

Margarida Pocinho Pgina 39
Appendix A: Guidelines for an outline policy on testing.

The following guidelines relate to the need for organizations to consider their policy on
testing in a systematic manner and to ensure that everyone involved is clear as to what
the policy is. The need for an explicit policy on testing is not confined to large
organisations. Small and medium-sized enterprises that use testing, as well as large
ones, should pay regard to testing policy in the same way as they do to health and
safety, equal opportunities, disability and other areas relating to good practice in the
management, treatment and care of personnel.

While the following considerations or requirements may need to be adapted for use by
individual test users operating as sole professional practitioners, it remains important
that they have a clear understanding of their own policy and can communicate it to
others.

A policy on testing is produced in order to:
- ensure personal and organisational aims are met;
- ensure that potential misuse is avoided;
- demonstrate commitment to good practice;
- ensure test use is appropriate for its purpose;
- ensure tests do not discriminate unfairly;
- ensure evaluations are based on comprehensive, relevant information;
- ensure tests are only used by qualified staff.

A policy on testing will need to cover most if not all the following issues:
- proper test use;
- security of materials and scores;
- who can administer tests, score and interpret tests;
I TC I nternational Guidelines for Test Use

Margarida Pocinho Pgina 40
- qualification requirements for those who will use the tests;
- test user training;
- test taker preparation;
- access to materials and security;
- access to test results and test score confidentiality issues;
- feedback of results to test takers;
- responsibility to test takers before, during and after test session;
- responsibilities & accountability of each individual user.

Any policy needs to be regularly reviewed and updated as advances in testing, or
changes in practice occur.

Relevant parties need to have access to and be informed about the policy on testing.

Responsibility for any organisations testing policy should reside with a qualified test
user who has the authority to ensure implementation of and adherence to the policy.
I TC I nternational Guidelines for Test Use

Margarida Pocinho Pgina 41
Appendix B: Guidelines for developing contracts between parties involved in the testing
process.

Contracts between the test user and test takers should be consistent with good practice,
legislation and the test users policy on testing. The following is provided as an example
of the sort of matters such a contract might cover. The details will vary as a function of
the assessment context (e.g., occupational, educational, clinical, forensic) and local or
national regulations and laws.

Contracts between test user, test takers and other parties are often implicit and unspoken
(at least in part). Making clear the expectations, roles and responsibilities of all parties
can help to avoid misunderstanding, harm, and litigation.

For their part, the test user will endeavour to:
b.1 inform test takers of their rights regarding how their test scores will be used and
their rights of access to them11;
b.2 give adequate prior warning of any financial charges that may be entailed by the
testing process, who will be responsible for their payment, and when payment will be
due;
b.3 treat test takers with courtesy, respect and impartiality regardless of race, gender,
age, disability, etc.;
b.4 use tests of proven quality, appropriate for the test takers, and appropriate for the
assessment purpose;
b.5 inform test takers prior to testing about the purpose of the assessment, the nature
of the test, to whom test results will be reported and the planned use of the results;

11
Legislation varies between countries on this issue. For example, the current UK Data Protection Act
provides rights of access to data stored on computer different from those for data written on paper.
I TC I nternational Guidelines for Test Use

Margarida Pocinho Pgina 42
b.6 give advance notice of when the test will be administered, and when results will
be available, and whether or not test takers or others may obtain copies of the test, their
completed answer sheets, or their scores12;
b.7 have a trained person administer the test and have the results interpreted by a
qualified person;
b.8 ensure test takers know if a test is optional and, when it is, the consequences of
taking or not taking the test;
b.9 ensure test takers understand the conditions, if any, under which they may re-
take tests, have tests re-scored, or have their scores cancelled;
b.10 ensure test takers know that they will have their results explained to them as
soon as possible after taking the test in easily understood terms;
b.11 ensure test takers understand that their results are confidential to the extent
allowed by law and best practice;
b.12 inform test takers who will have access to their results, and the conditions which
scores will be released;
b.13 ensure that test takers are aware of the procedures for making complaints or
notifying problems;

The test user will inform test-takers that they are expected to:
b.14 treat others with courtesy and respect during the testing process;
b.15 ask questions prior to testing if uncertain about why the test is to be
administered, how it will be administered, what they will be required to do and what
will be done with the results;
b.16 inform an appropriate person about any condition that they believe might
invalidate the test results or which they would wish to have taken into consideration;

12
While tests and answer sheets are not normally passed on to others, there is some variation between
countries in practice relating to what test takers or others are permitted to have. However, there is much
greater variation in the expectations of test takers concerning what information they will be given. It is
important that contracts make clear what they will not be given as well as what they will.
I TC I nternational Guidelines for Test Use

Margarida Pocinho Pgina 43
b.17 follow the instructions of the test administrator;
b.18 be aware of the consequences of not taking a test if they choose not to take it,
and be prepared to accept those consequences;
b.19 ensure that, if required to pay for any the testing service(s), payment is made by
the agreed date.
I TC I nternational Guidelines for Test Use

Margarida Pocinho Pgina 44
Appendix C: Points to consider when making arrangements for testing people with
disabilities or impairments

Considerable care and expertise is needed when the mode of administration of a test has
to be changed to accommodate the needs of people with disabilities. As always, local
and national law and practice13 need to be considered, and the individuals rights to
privacy must be respected. In seeking information regarding types and levels of
disability, inquiries should only seek information relating to each persons ability to
undertake the activities required to complete the test. Particular care needs to be
exercised in relation to employment testing14.

There is no simple rule of thumb that can be used to ensure that a test is administered
fairly for people with all types of disability. It is a matter of professional judgement as
to whether it is better to use some alternative form of assessment, or to modify the test
or its mode of administration. In practice, it is rarely possible to norm modified tests on
sufficient samples of people with equivalent disability in order to ensure comparability
of the test with the standardised version. However, where data exist on, for example, the
effects of changing time limits, use of Braille or audiotape spoken versions of tests, such
data should guide the user in making the necessary accommodations. While full
standardization of a modified version may not be possible, pilot testing on small
samples of individuals should be carried out whenever practical.

Given the dearth of information about the performance of people with disabilities on
tests (whether modified or not), it is often more appropriate for test result to be used in a
more qualitative manner. They can be used to give an indication of the characteristic

13
In the United States, for example, attention must be paid to the provisions of the Americans with
Disabilities Act (1990). In the UK, the Disability Discrimination Act (1995), Employment Code of
Practice states that employers are required to revise tests or the way the results of such tests are
assessed to take account of specific disabled candidates.
14
For detailed guidance on this in the United States, see Eyde, Nestor, Heaton and Nelson (1994).
I TC I nternational Guidelines for Test Use

Margarida Pocinho Pgina 45
being assessed (ability, motivation, personality, etc.), which can be supplemented and
supported by information gathered using other methods.

For individual assessment, the assessor can usually tailor the assessment procedures to
the capabilities of the person who is being assessed. However, particular issues arise in
group testing (e.g., for selection into employment). Here there may be practical
difficulties involved in varying the mode of administration for particular individuals
within a group administration setting. Furthermore, all parties may see differences in
treatment as being unfair. For example if more time is given for test completion, those
with the disability may be conscious that they are being treated differently, and those
without the disability may feel that the extra time provides an unfair advantage.

Advice on special needs can usually be obtained from relevant disability organisations
as well as the individual test takers. It is generally helpful (where the law permits) to ask
the individual directly in a non-threatening and supportive way if there are any
considerations that need to be taken into account15. In many cases such consultation
will enable suitable modifications to be made to the test taking environment without
requiring changes to the test itself.

The following outline protocol provides a general guide to the process of deciding
whether to modify testing and how to carry out the modification. Essentially, disability
may contribute no variance to test scores, contribute construct relevant variance or
construct irrelevant variance. In the first case, no modifications are necessary. In the
final case, modifications should be aimed at removing the irrelevant source of variance
(by suitable modification of the test conditions or substitution of a more suitable test).
For the second case (construct relevant variance), however, modification to the test will
affect the relevance of the test scores.


15
In the UK, the Disability Discrimination Act (1995) also places some obligation on the individual to
raise awareness of their needs.
I TC I nternational Guidelines for Test Use

Margarida Pocinho Pgina 46
Is the disability likely to have an effect upon test performance? Many people have
disabilities that would not affect test performance. In such cases, it would be
inappropriate to make accommodations for them.
If the disability is likely to affect test performance, then is the effect on performance
incidental to the construct being measured? For example, a person with an arthritic hand
may have trouble with a speeded test which involves writing. If the ability to perform
manual tasks rapidly is part of the construct being measured, then the test should not be
changed. However, if the purpose is to assess visual checking speed, then an alternative
mode of response would be appropriate.
When the particular disability is incidental to the construct being measured but is likely
to affect the individuals performance on the test, then modification of the procedure
may be considered.
Users should always consult the test manual and the publisher for guidance on
modification and for information regarded alternative formats and procedures.
Users should also consult relevant disability organisations for advice and guidance on
the possible implications of a specific disability, relevant literature or documentation,
and the sort of adaptations or accommodations that may prove helpful.
Any modifications made to the test or test administration procedures should be carefully
documented along with the rationale behind the modification.

I TC I nternational Guidelines for Test Use

Margarida Pocinho Pgina 47
Appendix D. Conditions governing the translation of the ITC Guidelines on Test Use.


The following conditions apply to official versions of the International Test
Commission (ITC) Guidelines. The conditions delegate authority for checking the
quality and accuracy of translation to the local national Psychological Association.

There is only to be one official translation in each country.
Copyright of the original version remains vested in the ITC. The ITC will give
permission for an official version to be produced under the auspices of the local national
Psychological Association, subject to a copy being lodged with the ITC and the
Psychological Association taking responsibility for the accuracy of the translation.
A letter formally approving the accuracy of the translation, from the relevant officer of
the local national Psychological Association, must be lodged with the ITC.
The ITC will reserve the right to distribute copies of that translation itself without
payment to the Psychological Association, and will want to have the guidelines
available through the ITC website.
The official version should be referred to as:
"International Test Commission (ITC) Guidelines on Test Use: [Language] Version.
Translation authorised by the [full name of the Psychological Association]"
The official version should have both the logo of the Psychological Association and that
of the ITC clearly displayed.
The Guidelines themselves should be made available either free of charge or on a not-
for-profit basis. Locally developed supporting documents, applications, qualification
procedures, etc that build on the Guidelines may be charged for on a commercial basis.
Normal copyright rules apply, and permission will need to be sought by people wishing
to publish extracts. In relation to the locally translated version, the ITC delegates the
giving of permission for this to the local Psychological Association responsible for the
translation. A notice to this effect should appear on the Guidelines document.