Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 10

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun.

2005 17

Qualidade de testes psicológicos

Orlete Maria Pompeu de Lima – FMA e Universidade do Paraná


Ana Paula Porto Noronha – Universidade São Francisco

Resumo
O presente estudo teve como objetivo avaliar a análise da qualidade de testes promovida por psicólogos, assim como
determinar seu consenso. Participaram do estudo seis psicólogos e 14 estudantes de pós-graduação em psicologia. Os
dois grupos de sujeitos avaliaram quatro testes utilizando um instrumento de avaliação de testes psicológicos, de forma
que houve, além da avaliação de cada grupo, a comparação entre eles. O acerto das respostas dos sujeitos em comparação
com o gabarito foi investigado por meio do coeficiente de correlação de Pearson. Os resultados indicaram bons índices
de concordância e, em apenas um teste, a avaliação dos alunos da pós-graduação foi superior ao dos avaliadores
psicólogos.
Palavras-chave: Testes psicológicos; Avaliação psicológica; Qualidade de testes; Parâmetros psicométricos.

Psychological test qualities

Abstract
The present study aimed to assess the quality analysis of psychological tests done by psychologists, as well to verify
their agreement. Six psychologists and 14 psychology graduate students participated on this study. Both subject
groups evaluated four tests using an instrument of assessment of psychological tests, allowing a comparison between
them and an evaluation of each group. The participants’ answers were correlated with the right answers using the
Pearson’s test. The results showed a good internal consistency, and only in one test, the graduate students’ evaluation
was better than the psychologists’ one.
Keywords: Psychological instruments; Psychological assessment; Test qualities; Psychometric parameters.

Introdução No Brasil, a construção de testes foi bastante ace-


lerada entre os anos 1930 e 1960, sem grandes preo-
A busca pela qualidade das ações profissionais dos cupações com os parâmetros psicométricos por parte
psicólogos tem sido anseio de pesquisadores, como dos pesquisadores, talvez por causa da precariedade de
Bartram (1998), que aponta em seu artigo a necessi- recursos tecnológicos utilizados nas técnicas estatísticas
dade de um guia para estabelecimento de diretrizes (Nick, 1988). A pesquisa para construção, adaptação e
internacionais para a padronização e o uso dos testes padronização de testes psicológicos é relativamente
psicológicos. Ao lado disso, Turner, DeMers, Fox e recente, e atualmente pode-se contar com o auxílio da
Reed (2001) organizaram um guia de responsabilida- informática para a escolha da amostra e para as aná-
des para o uso de testes padronizados. Os critérios lises estatísticas de forma mais rápida e precisa. En-
referentes à qualidade são identificados freqüente- tretanto, Pasquali (1999) relata que pesquisadores
mente em publicações estrangeiras sobre avaliação brasileiros, em determinado momento, utilizam instru-
psicológica ou instrumentos de avaliação (Canadian mentos estrangeiros, sem maiores preocupações com
Psychological Association, 1996, Adánez, 1999, a verificação da qualidade e da aplicabilidade desses
Oakland, 1999; AERA, APA & NCME, 1999 e Inter- no contexto cultural brasileiro.
national Test Commission, 2001) e mais raramente em A relevância do tema justifica-se na medida em
trabalhos nacionais (Pasquali, 1998). que os testes psicológicos são definidos como instru-

Endereço para correspondência (segunda autora)


Rua Alexandre Rodrigues Barbosa, 45
Centro, Itatiba-SP
CEP: 13.251-900
ana.noronha@saofrancisco.edu.br
18 Orlete Maria Pompeu de Lima, Ana Paula Porto Noronha

mentos de medida em Psicologia e que devem apre- a qualidade técnica necessária e indispensável para o
sentar certas características que justifiquem, ao pro- exercício profissional. Noronha, Freitas, Sartori e Ottati,
fissional, utilizar os resultados que produzem. Nesse (2001) realizaram uma pesquisa para analisar a pre-
sentido, Oakland (1996) argumenta que os testes são sença de informações relativas aos dados de identifi-
produzidos e utilizados, em maior quantidade e quali- cação e aos dados de aplicação e de avaliação nos
dade, em países que possuem o sistema educacional manuais de 21 testes de inteligência, que possuíam
bem-desenvolvido e que valorizam a tecnologia e as manual em português. Os resultados foram desani-
diferenças individuais. madores, considerando-se que nos instrumentos fo-
Com o objetivo de verificar até que ponto os testes ram encontrados alguns que não apresentavam os
estrangeiros utilizados pelos profissionais brasileiros, dados de identificação (nome, autor, editor e data de
em diferentes campos, têm sido submetidos tanto aos publicação), embora metade deles tenha apresentado
processos de padronização e/ou adaptação como de todos os itens dos aspectos avaliados.
análise das características metrológicas em amostras Em outra pesquisa, Noronha, Freitas, Sartori e Ottati
brasileiras, Sisto, Codenotti, Costa e Nascimento (2002) estudaram a construção de 26 testes psicoló-
(1979) publicaram um artigo, que apesar de ter sido gicos de inteligência, comercializados no Brasil, para
realizado há quase três décadas, suas conclusões não verificar a presença ou a ausência de estudos de va-
se diferenciaram muito do cenário atual. Os resulta- lidade e precisão e também identificar se os testes
dos indicaram que nenhum dos nove testes analisados estrangeiros possuíam padronização brasileira. Os
cumpriu pelo menos 40% das condições que foram resultados indicaram que no que se refere à validade
propostas, isto é, não apresentaram comprovações ou e precisão, 75% dos testes nacionais têm esse tipo de
informações no que se refere à precisão, validade e estudo, enquanto nos testes estrangeiros, 90% desen-
padronização dos resultados (normas, tabelas, tipos volveram algum estudo. Em relação à padronização
de amostras, faixa etária, sexo e nível socioeconômi- dos instrumentos, 25% dos testes nacionais não infor-
co e/ou cultural). mavam os estudos realizados e nos instrumentos es-
Outras pesquisas têm apontado insatisfações quanto trangeiros, 40%.
à ausência de instrumentos de qualidade para o pro- No que se refere ao número de sujeitos incluídos
fissional poder fazer uso com alguma segurança na nos estudos de padronização dos testes, segundo os
elaboração de seus diagnósticos. Entre elas, uma pes- dados apresentados nas pesquisas, a variabilidade pre-
quisa com psicólogos de Brasília realizada por Azeve- sente leva a refletir com urgência sobre a questão
do, Almeida, Pasquali e Veiga (1996), para identificar (Hinkle, Wiersma & Jurs 1994). A ausência de pa-
os instrumentos psicológicos mais utilizados na práti- drões específicos pode, de alguma forma, justificar a
ca profissional e levantar a opinião deles a respeito disparidade do número de sujeitos encontrados nos
deles, concluiu que a maioria dos inquiridos acredita instrumentos. Tal fato se justifica pela ausência de
no valor dos testes e que esses medem o que preten- parâmetros nacionais sólidos a respeito da constru-
dem medir, desde que utilizados como uma ferramen- ção de instrumentos.
ta adicional e de acordo com os princípios éticos, mas Quanto à fundamentação teórica dos instrumen-
apontam a falta de estudos prévios que justifiquem a tos, Pasquali (1996) comenta a falta de teorização da
validade de seu uso. medida das ciências psicossociais e dos construtos
Essa mesma inadequação quanto à qualidade dos avaliados, ressaltando a visão positivista da psicome-
testes psicológicos pôde ser verificada em outros paí- tria. Para ele faz-se necessária uma visão mais cogni-
ses pelos achados de Almeida, Prieto, Muñiz e Bar- tivista, para a melhor definição psicológica dos traços
tram (1998) com psicólogos de Portugal, Espanha e latentes a serem avaliados. Almeida (1999) aponta
países ibero-americanos. Foram identificados proble- também a necessidade de um maior esforço dos pes-
mas quanto ao uso inadequado dos testes psicológicos, quisadores quanto aos aspectos teóricos das variá-
falta de domínio do instrumento, avaliação incorreta, veis avaliadas, isto é, a fundamentação teórica deve
falta de desenvolvimento dos testes, entre outros. explicitar a teoria sobre o construto ou objeto psicoló-
Outros artigos sobre o tema confirmam o descuido gico a ser medido e definir o desenvolvimento do ins-
em relação à grande parte dos instrumentos psicoló- trumento e a definição constitutiva e operacional do
gicos comercializados no Brasil, que não apresentam construto.

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun. 2005


Qualidade de testes psicológicos 19

Outro aspecto importante sobre os testes psicoló- de preparo dos profissionais que trabalham com ava-
gicos é a questão relativa à interpretação dos resulta- liação psicológica.
dos. Halperin e McKay (1998), na revisão de testes O Conselho Federal de Psicologia constituiu em 2001
usados com crianças e adolescentes, detectaram que uma comissão consultiva em avaliação psicológica, que
alguns testes possuem poucos estudos psicométricos, teve como tarefa apreciar a qualidade dos testes psico-
principalmente os projetivos, portanto afirmam que lógicos que estavam em uso no Brasil. Essa comissão
dados isolados pouco contribuem para o entendimen- listou os critérios para a análise dos instrumentos e con-
to do psicólogo e que é recomendável o uso do teste vidando consultores nas áreas de conhecimento dos
como um instrumento auxiliar de coleta de dados. testes psicológicos, para auxiliar na elaboração do pa-
Segundo Garb (2000) pode-se esperar que os re- recer final de cada instrumento (Conselho Federal de
cursos da informática fiquem cada vez mais impor- Psicologia, 2003). O presente estudo teve como objeti-
tantes para a qualidade da avaliação psicológica. vo avaliar a análise da qualidade de testes promovida
Embora a validade ainda não tenha sido claramente por psicólogos, assim como determinar o consenso en-
estabelecida para muitos programas atuais de avalia- tre eles no que se refere à análise.
ção automatizados, o autor faz recomendações para
a busca de qualidade na construção e avaliação de Método
novos programas de computador, além de comentar,
no artigo, sobre a ética no uso de computadores para Participantes
fazer julgamentos. Os participantes do presente trabalho foram divi-
Os problemas mais graves e mais freqüentes na didos em dois grupos:
avaliação psicológica, com ênfase nos testes, segun- Grupo 1 – Seis psicólogos, sendo 83,3% mulheres (f=5)
do os psicólogos, foram tema da pesquisa realizada e 16,7% (f=1) homens, com idade média de 42 anos
por Noronha (1999) em sua tese de doutorado, cujos (DP=6,04) e com uma média 15,16 anos de formados
resultados reafirmam a falta de pesquisas e de instru- (DP=4,66). Em relação à área de atuação, 16,7% (f=1)
mentos nacionais para aferição dos recursos utiliza- atuam na área clínica, escolar e docência, 50% (f=3)
dos na avaliação psicológica, como o problema mais na clínica e organizacional, 16,7% (f=1) na clínica,
grave e mais freqüente. Ainda são utilizados muitos organizacional e trânsito e 16,7% (f=1) na clinica e
testes, criados no começo do século XX, e, ao contrá- orientação vocacional.
rio de todas as outras inovações tecnológicas, como a Grupo 2 – 14 psicólogos, alunos de pós-graduação em
informática, a saúde e as telecomunicações, os testes psicologia de uma instituição particular do interior de
psicológicos permanecem, basicamente, imutáveis. São Paulo, sendo 50% mulheres (f=7) e 50% (f=7)
Para Noronha (1999) as críticas atribuídas aos tes- homens, com idade média de 37 anos (DP=9,17) e
tes psicológicos são inúmeras no que se relaciona à com média de 8,96 anos de formação (DP=7,83). Em
inconsistente fundamentação teórica, à ausência de relação à área de atuação 7,1% (f=1) atuam somente
estudos recentes e de adaptações para diferentes re- na área clínica, 28,7% (f=4) na organizacional, 7,1%
alidades, ao alto custo de determinados materiais e à (f=1) na docência, 7,1% (f=1) na pesquisa, 14,3% (f=2)
falta de orientações precisas quanto à construção e na clínica e docência, 21,5% (f=3) na clínica e trânsi-
ao uso dos instrumentos psicológicos. Isso evidencia to, 7,1% (f=1) na clínica, organizacional e pesquisa e
a necessidade de avanços na área, como a verifica- 7,1% (f=1) na pesquisa e forense.
ção sistemática de seus parâmetros para a constru-
ção, o uso e a comercialização dos testes psicológicos. Material
Sob essa perspectiva, Sisto, Sbardelini e Primi Foram utilizados os seguintes materiais para a rea-
(2001) ponderam que as dúvidas quanto à qualidade lização da pesquisa:
dos testes psicológicos não estimularam a busca das • Ficha de dados de identificação, para levantamento
soluções; em contrapartida, induziram ao uso dos re- de dados, como idade, sexo, tempo de formado, nome
cursos escassos disponíveis, assim como ao abuso de da instituição de formação, cursos de pós-graduação,
métodos pouco científicos. Além disso, os autores área de atuação profissional e tempo de atuação.
denunciam a carência de desenvolvimento tecnológi- • Quatro testes psicológicos: Bateria de Provas de Ra-
co nacional condizente com a nossa cultura e a falta ciocínio (BPR-5) - Formas A e B (Primi & Almeida

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun. 2005


20 Orlete Maria Pompeu de Lima, Ana Paula Porto Noronha

2000); Inventário Fatorial de Personalidade, IFP (Pas- positivos quando o avaliador respondeu “sim” para
quali, Mazzarello & Ghesti1997); Teste de Desempe- item atendido e quando o item não se aplica, sendo
nho Escolar, TDE, (Stein, 1994); 16 PF (Cattell, Cattell, atribuído valor 2. Para as respostas assinaladas com
2000). “não” foi atribuído valor zero. Quando o avaliador
não respondeu, isto é, não assinalou nenhuma das
1. Instrumento de análise da qualidade dos testes alternativas para o item, foi atribuído valor 1, signifi-
(Anexo 1) cando que nada se pode afirmar, nem que errou e
O instrumento utilizado constituiu-se de 47 ques- nem que acertou a resposta (entre zero = não aten-
tões organizadas em duas partes relativas à descrição de e 2 = atende).
geral e à qualidade do teste. No primeiro bloco estive-
ram relacionadas informações pertinentes a nome, Resultados
editora, ano de publicação, variável avaliada, entre
outras. Já o segundo relacionou informações sobre a A avaliação da qualidade dos instrumentos estuda-
construção e os parâmetros psicométricos. Cada tes- dos permitiu algumas análises. A correção das res-
te foi analisado e para o estabelecimento do gabarito postas dos avaliadores em razão do gabarito
de correção, consultou-se o manual do teste. Todas estabelecido pelas autoras foi investigada por meio do
as avaliações efetuadas pelos juízes e avaliadores dos coeficiente de correlação de Pearson. Os resultados
testes foram comparadas com o gabarito respectivo, são apresentados nas Tabelas 1 a 8, sendo uma por
para verificar o índice de acertos. Na avaliação do instrumento, e representam as avaliações realizados
instrumento foram considerados como indicadores pelo Grupo 1 (psicólogos).

Tabela 1 – Coeficiente de correlação de Pearson entre os avaliadores psicólogos e o gabarito no teste BPR-5
Correlação S i g.
P ar 1 Gabarito BPR-5 e Avaliador 1 0,688 0,000
P ar 2 Gabarito BPR-5 e Avaliador 2 0,889 0,000
P ar 3 Gabarito BPR-5 e Avaliador 3 0,757 0,000
P ar 4 Gabarito BPR-5 e Avaliador 4 0,561 0,000
P ar 5 Gabarito BPR-5 e Avaliador 5 0,211 0,155
P ar 6 Gabarito BPR-5 e Avaliador 6 0,680 0,000

Os resultados de avaliação do teste BPR-5 são A análise da Tabela 2 indica os resultados da cor-
apresentados na Tabela 1. As correlações encontra- reção do TDE. Nesse sentido, todas as correlações
das foram significativas, exceção feita à correção do foram significativas, exceto a do avaliador 1. As cor-
avaliador 5. As análises dos demais avaliadores se relações variaram entre 0,293 a 0,895, embora nesse
correlacionaram positivamente com o gabarito, com teste apenas a correlação de um avaliador com o ga-
coeficientes entre 0,561 (4o avaliador) a 0,889 (2º ava- barito tenha sido superior a 0,50, revelando menos
liador). acertos dos avaliadores.

Tabela 2 – Coeficiente de correlação de Pearson entre os avaliadores psicólogos e o gabarito no teste TDE
Correlação S i g.
P ar 1 Gabarito TDE e Avaliador 1 0,205 0,166
P ar 2 Gabarito TDE e Avaliador 2 0,895 0,000
P ar 3 Gabarito TDE e Avaliador 3 0,449 0,002
P ar 4 Gabarito TDE e Avaliador 4 0,342 0,019
P ar 5 Gabarito TDE e Avaliador 5 0,293 0,045
P ar 6 Gabarito TDE e Avaliador 6 0,298 0,042

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun. 2005


Qualidade de testes psicológicos 21

Tabela 3 – Coeficiente de correlação de Pearson entre os avaliadores psicólogos e o gabarito no teste IFP
Correlação S i g.
P ar 1 Gabarito IFP e Avaliador 1 0,290 0,048
P ar 2 Gabarito IFP e Avaliador 2 0,439 0,002
P ar 3 Gabarito IFP e Avaliador 3 0,090 0,546
P ar 4 Gabarito IFP e Avaliador 4 0,224 0,130
P ar 5 Gabarito IFP e Avaliador 5 0,138 0,356
P ar 6 Gabarito IFP e Avaliador 6 0,171 0,251

Os resultados da correção do teste IFP que se autor não apresenta o teste como adaptado, mas
encontram na Tabela 3 indicam que apenas os coefi- no decorrer do manual o cita como versão brasi-
cientes de Pearson relacionados aos avaliadores 1 e leira”. “Na ficha catalográfica o autor diz que o
2 são estatisticamente significativos e, portanto, se cor- teste foi originado (porque não cita adaptação),
relacionam com o gabarito do teste IFP. Diferente- porém na página 33 do manual ele se reporta que
mente dos outros testes analisados, esse não o teste nasceu de uma adaptação modificada do
apresentou correlações superiores a 0,50. Nesse tes- teste EPPS.” Essas observações justificam a possi-
te foram apresentados comentários dos avaliadores bilidade de ter havido confusão no direcionamento das
nos formulários sobre as informações no manual: “O respostas.
Tabela 4 – Coeficiente de correlação de Pearson entre os avaliadores psicólogos e o gabarito no teste 16PF
Correlação S i g.
P ar 1 Gabarito 16P F e Avaliador 1 0,174 0,242
P ar 2 Gabarito 16P F e Avaliador 2 0,079 0,599
P ar 3 Gabarito 16P F e Avaliador 3 0,183 0,219
P ar 4 Gabarito 16P F e Avaliador 4 0,821 0,000
P ar 5 Gabarito 16P F e Avaliador 5 0,353 0,015
P ar 6 Gabarito 16P F e Avaliador 6 0,232 0,117

A análise da Tabela 4 indica que os avaliadores 4 e qualidade do 16PF. Os coeficientes variaram entre
5 obtiveram coeficientes de correlação de Pearson 0,079 e 0,821, sendo que a mais alta correlação entre
significativos com o gabarito referente à análise da gabarito–correção foi relativa ao avaliador 4.
Tabela 5 – Coeficiente de correlação de Pearson entre os avaliadores alunos da pós-graduação e o gabarito
no teste BPR-5
Correlação S i g.
P ar 1 Gabarito BPR-5 e Avaliador 1 0,683 0,000
P ar 2 Gabarito BPR-5 e Avaliador 2 0,555 0,000
P ar 3 Gabarito BPR-5 e Avaliador 3 0,565 0,000
P ar 4 Gabarito BPR-5 e Avaliador 4 0,688 0,000
P ar 5 Gabarito BPR-5 e Avaliador 5 0,644 0,000
P ar 6 Gabarito BPR-5 e Avaliador 6 0,540 0,000
P ar 7 Gabarito BPR-5 e Avaliador 7 0,126 0,397
P ar 8 Gabarito BPR-5 e Avaliador 8 0,766 0,000
P ar 9 Gabarito BPR-5 e Avaliador 9 0,180 0,225
P ar 10 Gabarito BPR-5 e Avaliador 10 0,547 0,000
Par 11 Gabarito BPR-5 e Avaliador 11 0,736 0,000
P ar 12 Gabarito BPR-5 e Avaliador 12 0,780 0,000
P ar 13 Gabarito BPR-5 e Avaliador 13 0,544 0,000
P ar 14 Gabarito BPR-5 e Avaliador 14 0,807 0,000

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun. 2005


22 Orlete Maria Pompeu de Lima, Ana Paula Porto Noronha

No que se refere à avaliação realizada pelo superior a 0,50. Os dados podem ser visualizados
grupo 2, os resultados revelaram que aproxima- na Tabela 5.
damente 86% (f=12) dos avaliadores obtiveram Os resultados apresentados da Tabela 6 são re-
resultados estatisticamente significativos na com- ferentes à correção do TDE. Nesse sentido os da-
paração com o gabarito do teste BPR-5, embora dos revelaram que 78,6% (f=11) dos avaliadores
os avaliadores 7 e 9 tenham apresentado resulta- obtiveram resultados significativamente correlacio-
dos não significativos. Ainda nesse sentido, o me- nados com o gabarito do teste TDE, sendo que as
nor coeficiente encontrado nesse instrumento foi correlações significativas variaram entre 0,31 a 0,86.

Tabela 6 – Coeficiente de correlação de Pearson entre os avaliadores alunos da pós-graduação e o gabarito


no teste TDE

Correlação S i g.
P ar 1 Gabarito TDE e Avaliador 1 0,345 0,018
P ar 2 Gabarito TDE e Avaliador 2 0,579 0,000
P ar 3 Gabarito TDE e Avaliador 3 0,319 0,029
P ar 4 Gabarito TDE e Avaliador 4 0,256 0,083
P ar 5 Gabarito TDE e Avaliador 5 0,779 0,000
P ar 6 Gabarito TDE e Avaliador 6 0,634 0,000
P ar 7 Gabarito TDE e Avaliador 7 0,103 0,492
P ar 8 Gabarito TDE e Avaliador 8 0,702 0,000
P ar 9 Gabarito TDE e Avaliador 9 0,335 0,021
P ar 10 Gabarito TDE e Avaliador 10 0,086 0,565
Par 11 Gabarito TDE e Avaliador 11 0,539 0,000
P ar 12 Gabarito TDE e Avaliador 12 0,825 0,000
P ar 13 Gabarito TDE e Avaliador 13 0,684 0,000
P ar 14 Gabarito TDE e Avaliador 14 0,457 0,001

Tabela 7 – Coeficiente de correlação de Pearson entre os avaliadores alunos da pós-graduação e o gabarito


no teste IFP

Correlação S i g.
P ar 1 Gabarito IFP e Avaliador 1 0,518 0,000
P ar 2 Gabarito IFP e Avaliador 2 0,228 0,123
P ar 3 Gabarito IFP e Avaliador 3 0,260 0,078
P ar 4 Gabarito IFP e Avaliador 4 0,234 0,114
P ar 5 Gabarito IFP e Avaliador 5 0,474 0,001
P ar 6 Gabarito IFP e Avaliador 6 0,349 0,016
P ar 7 Gabarito IFP e Avaliador 7 0,425 0,003
P ar 8 Gabarito IFP e Avaliador 8 0,404 0,005
P ar 9 Gabarito IFP e Avaliador 9 0,356 0,014
P ar 10 Gabarito IFP e Avaliador 10 0,451 0,001
Par 11 Gabarito IFP e Avaliador 11 0,597 0,000
P ar 12 Gabarito IFP e Avaliador 12 0,644 0,000
P ar 13 Gabarito IFP e Avaliador 13 0,246 0,096
P ar 14 Gabarito IFP e Avaliador 14 0,284 0,053

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun. 2005


Qualidade de testes psicológicos 23

A Tabela 7 refere-se à análise da qualidade do tram na Tabela 8. Dos 14 coeficientes de correlação


IFP. Os achados indicaram que 9 coeficientes são de Pearson, 10 se revelaram estatisticamente signi-
significativos, embora as correlações tenham sido ficativos, sendo que os resultados dos avaliadores 2,
menores do as avaliações dos outros instrumentos, 3, 5 e 14 são os não significativos. As correlações
variando entre 0,24 e 0,59. O instrumento avaliado nesse caso não foram muito altas, variando entre 0,30
pelo grupo 2 foi o 16PF, cujos resultados se encon- e 0,55.

Tabela 8 – Coeficiente de correlação de Pearson entre os avaliadores alunos da pós-graduação e o gabarito


no teste 16PF

Correlação S i g.
P ar 1 Gabarito 16P F e Avaliador 1 0,492 0,000
P ar 2 Gabarito 16P F e Avaliador 2 0,266 0,071
P ar 3 Gabarito 16P F e Avaliador 3 -0,142 0,340
P ar 4 Gabarito 16P F e Avaliador 4 0,404 0,005
P ar 5 Gabarito 16P F e Avaliador 5 -0,010 0,948
P ar 6 Gabarito 16P F e Avaliador 6 0,511 0,000
P ar 7 Gabarito 16P F e Avaliador 7 0,557 0,000
P ar 8 Gabarito 16P F e Avaliador 8 0,529 0,000
P ar 9 Gabarito 16P F e Avaliador 9 0,557 0,000
P ar 10 Gabarito 16P F e Avaliador 10 0,334 0,022
Par 11 Gabarito 16P F e Avaliador 11 0,383 0,008
P ar 12 Gabarito 16P F e Avaliador 12 0,301 0,040
P ar 13 Gabarito 16P F e Avaliador 13 0,301 0,040
P ar 14 Gabarito 16P F e Avaliador 14 0,252 0,088

Tabela 9 – Porcentagem dos coeficientes de correlação de Pearson significativos entre os avaliadores


psicólogos e os avaliadores alunos da pós-graduação e com o gabarito por teste

Porcentagem de coeficientes de Porcentagem de coeficientes de


Testes correlação significativos entre avaliador- correlação significativos entre avaliador-
gabarito (p<0,05%) gabarito (p<0,05%)
Psicólogos Pós-graduados Psicólogos Pós-graduados

BPR-5 83,3 86 17,7 14

TDE 83,3 78,6 17,7 21,4

IFP 33,3 64,3 67,7 35,7

16P F 33,3 71,4 67,7 28,6

A comparação entre grupos, no que se refere aos psicólogos (Grupo 1). Ainda nesse sentido, conside-
coeficientes de correlação entre a correção e o gaba- rando as correlações superiores a 0,50, em relação ao
rito, pode ser encontrada na Tabela 9, que por sua BPR-5 o Grupo 1 apresentou 83,3%, enquanto o Gru-
vez, apresenta um resumo do percentual dos coefici- po 2, 86%; no que diz respeito ao TDE, no Grupo 1 foi
entes de correlação. Em apenas um teste (TDE) o encontrada apenas uma correlação superior a 0,50
grupo de psicólogos pós-graduados (Grupo 2) obteve (17,7%), enquanto no Grupo 2, 50%. A correção do
menos coeficientes significativos do que o grupo de IFP pelo Grupo 1 em comparação ao gabarito não

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun. 2005


24 Orlete Maria Pompeu de Lima, Ana Paula Porto Noronha

gerou nenhuma correlação superior a 0,50, enquanto forma, os resultados desse trabalho revelaram que há
no Grupo 2 foram encontradas 3 (21,4%), e, por últi- necessidade de implantação de melhor compreensão
mo, a avaliação do 16PF resultou em 17,7% de coefi- dos conceitos de qualidade de um teste entre os psi-
cientes superiores a 0,50, já no Grupo 2, 28,6%. cólogos (Noronha, 1999; Noronha, Freitas, Sartori &
Ottati, 2001, 2002a, 2002b).
Considerações finais Embora o presente estudo não tenha tido a preten-
são de identificar a relação de domínio dos conceitos
Considerando o objetivo do presente estudo, ou seja, dos participantes apresentados no instrumento nem
o de avaliar a análise da qualidade de testes promovi- verificar o quanto cada um deles compreende a tare-
da por psicólogos, assim como determinar o consenso fa de análise da qualidade de instrumentos, os acha-
entre eles no que se refere à análise, os resultados dos revelaram alguma dificuldade na execução da
permitiram reflexões interessantes. A análise da tarefa. Isso foi revelado pelos baixos coeficientes de
qualidade de testes, disparada oficialmente pelo Con- correlação encontrados entre gabaritos e avaliações.
selho Federal de Psicologia em 2001, embora em um À guisa de considerações finais, registra-se a im-
primeiro momento estivesse restrita a especialistas na portância da colaboração dos psicólogos que partici-
área de avaliação e testagem psicológicas, em longo param da pesquisa. Houve diversas manifestações
prazo deve ser uma prática incorporada ao trabalho deles acerca do aprendizado adquirido com as repeti-
do psicólogo que faz uso de instrumentos padroniza- das investigações sobre a qualidade dos testes psico-
dos. Compete ao profissional estabelecer seus crité- lógicos avaliados, bem como a sugestão, por parte dos
rios de testagem, e em razão disso estabelecer os que exercem a docência, de que o instrumento seja
instrumentos que estejam adequados às necessidades usado no ensino das disciplinas de avaliação psicoló-
da população, da queixa ou do construto avaliado, en- gica. Sugere-se que novos estudos possam ser de-
tre outros fatores importantes. senvolvidos com outros instrumentos e grupos de
Sob essa perspectiva o trabalho de “análise de tes- participantes.
tes” deve ser administrado pelos próprios psicólogos
constantemente. Assim sendo, espera-se que esse
profissional possua os domínios necessários para rea- Referências
lizar tais análises, o que exigiria dele clareza dos prin-
cípios descritos nos manuais dos testes psicológicos, Adánez, G. P. (1999). Procedimientos de construcción y análisis
que devem conter informações sobre a fundamenta- de tests psicométricos. Em S. M. Wechsler & R. S. L Guzzo
(Orgs.). Avaliação psicológica: perspectiva internacional
ção teórica dos instrumentos, descrição da aplicação,
(pp. 57-100). São Paulo: Casa do Psicólogo.
avaliação e interpretação dos resultados e indicação
da literatura científica utilizada. Almeida, L. S. (1999). Avaliação psicológica: exigências e
desenvolvimento nos seus métodos. Em S. M. Wechsler
Com o propósito de determinar se o nível de conhe- & R. S. L Guzzo, (Orgs.). Avaliação psicológica:
cimento dos participantes (psicólogo ou psicólogo pós- perspectiva internacional (pp. 41-55). São Paulo: Casa
graduado) poderia gerar melhores avaliações dos testes, do Psicólogo.
realizou-se o estudo com aluno da pós-graduação, a Almeida, L. S., Prieto, G., Muñiz, J. & Bartram, D. (1998). O
fim de testar a diferença entre eles. O resultado en- uso dos testes em Portugal, Espanha e países Ibero-
contrado indicou que de maneira geral o Grupo 2 (pós- Americanos. Psychological, 20, 27-40.
graduação) apresentou mais acertos em relação ao American Educational Research Association (AERA),
gabarito preparado pelas autoras do que o Grupo 1 (psi- American Psychology Association (APA) & National
cólogos), o que reafirma a asserção amplamente dis- Council on Measurement in Education (NCME) (1999).
cutida por diferentes autores (Almeida, 1999; Noronha, Standards for Educational and Psychological Testing.
New York: American Educational Research Association.
1999; Pasquali, 1999; Sisto, Sbardelini & Primi, 2001),
no que se refere à necessidade de aprimoramento pro- Azevedo, M. M., Almeida, L. S., Pasquali, L. & Veiga, H. M.
S. (1996). Utilização dos testes psicológicos no Brasil:
fissional e de formações mais consistentes.
dados de estudo preliminar em Brasília. Em L. S.
Ao lado disso, o movimento pela busca da qualida- Almeida, S. Araújo, M. M. Gonçalves, C. Machado &
de dos testes psicológicos não pode ser desvencilha- M. R. Simões (Orgs.). Avaliação psicológica: formas e
do da própria formação em psicologia. De alguma contextos (Vol. 4, pp. 213-219). Braga, Portugal.

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun. 2005


Qualidade de testes psicológicos 25

Bartram, D. (1998). The need for International Guideliness apresentadas em manuais de testes de inteligência.
on Standards for Test use a review of European and Psicologia em Estudo, 8(1), 89-95.
International Initiatives. European Psychologist, 3(2), Oakland, T. (1996). Qualities that will influence test in and
155-163. assessment practice with children and youth toward
Canadian Psychological Association – CPA (1996). the beginning of the twenty-first century: international
Guidelines for Educational and Psychological Testing. perspectives. Psicologia Escolar e Educacional, 1(1),
Ontario, Canadá: CPA. Disponível em: http:// 11-18.
www.cpa.ca/guide9.html Oakland, T. (1999). Developing standardized tests. In S. M.
Cattel, R. B. & Cattel, A. K. S. (2000). 16 PF – Maual Wechsler & R. S. L Guzzo, (Org.) Avaliação
Técnico, 5a Edição. Rio de Janeiro: CEPA. psicológica: perspectiva internacional (pp. 101-118).
Conselho Federal de Psicologia (2003). Resolução no 02/ São Paulo: Casa do Psicólogo.
2003. Disponível em: http:\\www.pol.org.br. Acessado Pasquali, L. (1996). Questões epistemológicas na medida
em: 02/11/2003. psicológica. In L. S. Almeida, S. Araujo, M. M. Gonçalves,
Garb, H. N. (2000). Computers will become increasingly C. Machado & M. R. Simões (Orgs.), Avaliação
important for psychological assessment: not that psicológica: formas e contextos (Vol. 4). Braga, Portugal:
there’s anything wrong with that. Psychological Associação dos Psicólogos Portugueses.
Assessment, 12(1), 31-39. Pasquali, L. (1998). Princípios de elaboração de escalas
Halperin, J. M. & Mckay, K. E. (1998). Psychological testing psicológicas. Revista de Psiquiatria Clínica, 25(5),
for children and adolescent psychiatrists: a review of 206-213.
the past 10 years. Journal of the American Academy of Pasquali, L. (1999). (Org.). Instrumentos psicológicos:
Child and Adolescent Psychiatry, 37(6), 575-584. manual prático de elaboração. Brasília: LabPAM/IBAP.
Hinkle, D. E., Wiersma, W. & Jurs, S. G. (1994). Applied Pasquali, L., Mazzarello, M. A. & Ghesti, I. (1997). Inventário
statistics for the behavioral sciences. Boston, USA: Fatorial de Personalidade. São Paulo: Casa do Psicólogo.
Houghton Mifflin Company. Primi, R. & Almeida, L. S. (2000). Bateria de Provas de
International Test Commission (ITC) (2000). Guidelines on Raciocínio – BPR-5. São Paulo: Casa do Psicólogo.
adapting tests: International Test Commission. Russell, M. T. & Karol, D. (2000). Dezesseis PF:
Disponível em: http://www.intestcom.org. questionário dos 16 fatores de personalidade. Rio de
Nick, E. (1988). Vivências relativas ao trabalho em avaliação Janeiro: CEPA.
psicológica: dificuldades, limites e perspectivas para o Sisto, F. F., Codenotti, N., Costa, C. A. J. & Nascimento, T.
Brasil. Anais do XVIII. Reunião Anual de Psicologia. C. N. (1979). Testes psicológicos no Brasil: que medem
Ribeirão Preto, SBPRP. realmente. Revista Educação e Sociedade, 2, 152-165.
Noronha, A. P. P. (1999). Avaliação psicológica segundo São Paulo: Cortez.
psicólogos: usos e problemas com ênfase nos testes. Sisto, F. F., Sbardelini, E. T. B. & Primi, R. (2001). Contextos
Tese de Doutorado. PUCCamp, Campinas. e questões da avaliação psicológica. São Paulo: Casa
Noronha, A. P., Freitas, F. A., Sartori, F. A. & Ottati, F. (2001). do Psicólogo.
Informações contidas nos manuais de testes de Stein, L. M. (1994). Teste de Desempenho Escolar – TDE.
inteligência publicados no Brasil. Psicologia em São Paulo: Casa do Psicólogo.
Estudo, 6(2), 101-106.
Turner, S. M., DeMers, S. T., Fox, H. R. & Reed, G. M. (2001).
Noronha, A. P., Sartori, F. A., Freitas, F. A. & Ottati, F. (2002a). APA’s Guideliness for Test user qualifications an
Informações contidas nos manuais de testes de executive summary. American Psychologist, 56(12),
personalidade. Psicologia em Estudo, 7(1), 143-149. 1099-1113.
Noronha, A. P., Freitas, F. A., Sartori, F. A. & Ottati, F. (2002b).
Parâmetros psicométricos de testes de inteligência.
Interação em Psicologia, 6(2), 195-201.
Noronha, A. P. P., Vendramini,C. M. M., Canguçu, C., Souza, Recebido: abril/2005
C. V. R., Cobêro, C., Paula, L. M., Lima, O. M. P., Guerra, Reformulado: junho/2005
P B. C. & Fillizati, R. (2003). Propriedades psicométricas Aprovado: junho/2005

Sobre as autoras:
Orlete Maria Pompeu de Lima é psicóloga, mestre em Psicologia pela Universidade São Francisco e docente da FMA e Universidade
do Paraná (UNIPAR).
Ana Paula Porto Noronha é psicóloga, mestre e doutora em Psicologia pela Pontifícia Universidade Católica de Campinas, docente do
Programa de Estudos Pós-Graduados em Psicologia da Universidade São Francisco e bolsista de Produtividade em Pesquisa do CNPq.

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun. 2005


26 Orlete Maria Pompeu de Lima, Ana Paula Porto Noronha

Anexo

PSIC - Revista de Psicologia da Vetor Editora, v. 6, nº 1, p. 17-26, Jan./Jun. 2005

Você também pode gostar