Você está na página 1de 11

Avaliação Psicológica

ISSN: 1677-0471
revista@ibapnet.org.br
Instituto Brasileiro de Avaliação Psicológica
Brasil

Arie Laros, Jacob; Ribeiro de Jesus, Girlene; Akemi Karino, Camila


Validação brasileira do teste não-verbal de inteligência SON-R 2½-7[a]
Avaliação Psicológica, vol. 12, núm. 2, agosto, 2013, pp. 233-242
Instituto Brasileiro de Avaliação Psicológica
Ribeirão Preto, Brasil

Disponível em: http://www.redalyc.org/articulo.oa?id=335027505014

Como citar este artigo


Número completo
Sistema de Informação Científica
Mais artigos Rede de Revistas Científicas da América Latina, Caribe , Espanha e Portugal
Home da revista no Redalyc Projeto acadêmico sem fins lucrativos desenvolvido no âmbito da iniciativa Acesso Aberto
ARTIGO

Validação brasileira do teste não-verbal


de inteligência SON-R 2½-7[a] 1,2
Jacob Arie Laros3, Girlene Ribeiro de Jesus, Camila Akemi Karino
Universidade de Brasília, Brasília-DF, Brasil

RESUMO
Este artigo apresenta estudos realizados no Brasil referentes à evidência de validade de construto do teste SON-R 2½-7[a], versão
abreviada do SON-R 2½-7, que possui estudos de normatização e validação realizados em vários países europeus. O SON-R 2½-7[a]
é um instrumento não-verbal que avalia amplas áreas de inteligência para crianças entre 2½ e 7 anos. Os dados da amostra nacional
de normatização brasileira com 1.200 crianças foram analisados utilizando tanto análise fatorial exploratória como análise fatorial
confirmatória. Os resultados apóiam a distinção adotada no teste entre a escala de execução e a escala de raciocínio. Os resultados
indicam uma boa validade de construto do SON-R 2½-7[a] e sugerem que o teste é uma ferramenta promissora para a avaliação das
habilidades cognitivas de crianças no Brasil.
Palavras-chave: teste não-verbal de inteligência; validade de construto; SON-R 2½-7[a].

ABSTRACT – Brazilian validation of the nonverbal intelligence test SON-R 2½-7[a]


This article presents studies realized in Brazil related to evidence of the construct validity of the SON-R 2½-7[a], the abridged
edition of the SON-R 2½-7, a nonverbal test with normatization and validation studies realized in various European countries.
The SON-R 2½-7[a] measures broad areas of intelligence for children between 2½ and 7 years of age. Data of a national sample
of 1,200 children of the normatization study in Brazil were analyzed, using both exploratory and confirmatory factor analysis.
The results support the distinction adopted in the test between a performance and a reasoning scale. The findings indicate a good
construct validity of the SON-R 2½-7[a] and suggest that it is a promising tool for the evaluation of cognitive abilities of young
children in Brazil.
Keywords: nonverbal test of intelligence; construct validity; SON-R 2½-7[a].

RESUMEN – Validación brasileña de la prueba no verbal de inteligencia SON-R 2½-7[a]


Este artículo presenta estudios realizados en Brasil relacionados con las evidencias de validez de constructo del test SON-R 2½-7[a],
una versión abreviada del SON-R 2½ -7 que tiene estudios de estandarización y validación realizados en varios países europeos. El
SON-R 2½-7[a] es un instrumento no verbal que evalúa áreas amplias de inteligencia para niños entre 2½ y 7 años. Los datos de la
muestra nacional de normalización de 1.200 niños brasileños se analizaron mediante análisis factorial exploratorio y el análisis factorial
confirmatorio. Los resultados apoyan la distinción adoptada para la prueba entre la escala de ejecución y la escala de razonamiento. Los
resultados indican una buena validez de constructo del SON-R 2½ -7[a] y sugieren que la prueba es una herramienta prometedora para
la evaluación de las capacidades cognitivas de los niños en Brasil.
Palabras clave: prueba no verbal de inteligencia; validez de constructo; SON-R 2½-7[a].

Muitas definições de inteligência foram apresenta- por muitos anos, os principais testes de inteligência fo-
das ao longo de um século de pesquisa, desde as con- ram construídos tendo como base as teorias psicométri-
cepções iniciais de Binet, nas quais a inteligência se refe- cas de Spearman e Thurstone.
ria à soma de processos mentais, até as concepções mais Spearman (1904, 1927) desenvolveu a teoria de in-
modernas que têm como base os modelos hierárquicos teligência geral, afirmando que toda atividade mental in-
(Horn & Blankson, 2012). Observa-se que a busca em telectual envolveria uma única capacidade, indicando a
compreender o que é inteligência está estritamente ligada existência de processos cognitivos comuns aos diferentes
à busca de como mensurar a inteligência, uma vez que o tipos de atividades mentais. Em outras palavras, o desem-
instrumento é meio para avaliação do construto. Assim, penho nos testes de inteligência depende principalmente

1
Este artigo é resultado da tese de doutorado da segunda autora, sob a orientação do primeiro autor.
2
Trabalho realizado com apoio do Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) e do Fundo SON da Rijksuniversiteit Groningen (RuG), Holanda.
3
Endereço para correspondência: Universidade de Brasília, Instituto de Psicologia – IP, Instituto Central de Ciências (ICC) / Ala Sul, sala A1-061/4, Laboratório
de Métodos e Técnicas de Avaliação – META, 70910-900, Brasília-DF. Tel.: (61) 3107-6902. E-mail: jalaros@gmail.com

Avaliação Psicológica, 2013, 12(2), pp. 233-242 233


Laros, J. A., Jesus, G. R., & Karino, C. A.

de uma única capacidade mental geral, o fator g. A vari- Depois de reanalisar os bancos de dados, Carroll formu-
ância específica de cada teste na teoria de Spearman foi lou seu modelo hierárquico de inteligência. O primeiro
considerada como variância de erro. Segundo essa teoria, estrato na teoria de Carroll contém 65 fatores específicos
um conjunto de testes apresenta uma série de fatores s ligados ao formato das tarefas dos testes de inteligência.
(variância específica) e um fator g (Wasserman, 2012). No segundo estrato, esses fatores específicos são agrupa-
Enquanto Spearman acreditava que as correlações dos em oito fatores amplos, a saber: Inteligência Fluida,
entre os subtestes de inteligência eram altas, indicando Inteligência Cristalizada, Memória e Aprendizagem
um fator comum, Thurstone (1938) desenvolveu a hi- Geral, Percepção Visual, Percepção Auditoria, Fluência
pótese da existência de diversos fatores independentes de Ideias, Velocidade de Processamento Cognitivo e
(Hogan, 2006). A teoria de Thurstone ficou conhecida Velocidade de Decisão. O terceiro estrato corresponde
como a teoria de capacidades mentais primárias. Segundo ao fator geral, também chamado de fator g, que agrega
essa teoria, a inteligência deveria ser descrita em termos os oito fatores amplos do segundo estrato. O fator g re-
de um perfil composto por várias habilidades mentais, e flete a existência de operações cognitivas comuns a todas
não em termos de um único índice. Somente anos depois as atividades mentais. Esse fator corresponde ao fator g
de desenvolver a sua teoria, Thurstone veio a admitir a de Spearman. A publicação do trabalho monumental de
possibilidade de existir um fator g como um fator de or- Carroll, Human Cognitive abilities: A survey of factor analytic
dem maior (Wasserman, 2012). studies (Carroll, 1993), marcou o início de um processo
Depois das teorias de Spearman e Thurstone, apa- que finalmente levou a um consenso na comunidade
receram as teorias hierárquicas que concordaram com científica com enfoque psicométrico quanto à pertinên-
a existência de diversas habilidades cognitivas, porém cia de um modelo multidimensional e hierárquico da
acrescentaram que essas habilidades estão organizadas inteligência.
em uma estrutura hierárquica cujo topo tem apenas um No final da década de 1990, McGrew e Flanagan
fator dominante (Hogan, 2006). Em certo sentido, o sur- elaboraram a teoria CHC (Cattell-Horn-Carroll) sobre
gimento das teorias hierárquicas de inteligência signifi- a inteligência, propondo um modelo que sintetizava a
cou uma integração da teoria de um único fator geral e teoria Gc-Gf de Cattell-Horn (Horn & Noll, 1997) e
a teoria de múltiplos fatores. Uma das primeiras teorias a Teoria de Três Estratos de Carroll (1993), enfatizan-
hierárquicas foi a teoria de Cattell (1963), na qual ele di- do a presença de uma estrutura intelectual hierárquica
ferencia inteligência fluida de inteligência cristalizada. de três níveis (McGrew, 2009; Schneider & McGrew,
Cattell criticou o teste de Binet por ser excessivamente 2012). Na teoria CHC são diferenciados 10 fatores am-
verbal e dependente da escolaridade das pessoas e propôs plos (Inteligência Fluida, Conhecimento Quantitativo,
um teste de inteligência perceptual, baseado principal- Inteligência Cristalizada, Leitura e Escrita, Memória
mente em figuras, tais como matrizes e labirintos para de Curto Prazo, Processamento Visual, Processamento
evitar viés cultural. Auditivo, Armazenamento e Recuperação da Memória
Inteligência cristalizada na teoria de Cattell é definida de Longo Prazo, Velocidade de Processamento e Rapidez
como as habilidades cognitivas influenciadas por acultu- de Decisão) e pouco mais de sessenta fatores específicos
ração, escolarização e desenvolvimento da linguagem. Já subjacentes aos fatores amplos. Esse modelo vem gra-
a inteligência fluida é definida como a representação de dualmente sendo empregado como uma nomenclatura
raciocínio e a habilidade de resolver problemas novos. padrão entre pesquisadores e profissionais no entendi-
Tanto inteligência cristalizada, como inteligência fluida mento da inteligência.
compõe-se de diversos fatores mais específicos, razão pela Embora no modelo CHC a inteligência fluida (Gf)
qual a teoria do Cattell pode ser classificada como uma esteja situada em um nível hierárquico mais específi-
teoria hierárquica. Uma vez que Cattell elaborou essa te- co que o fator geral, ela é, dentre os fatores amplos, a
oria junto com Horn (Horn, 1965; Horn, 1994; Horn & que mais se associa à concepção do fator g de Spearman
Blankson, 2012; Horn & Noll, 1997), a teoria é referida (1904, 1927). A teoria CHC passou a identificar o fator
como a teoria Cattell-Horn. Porém, a teoria de Cattell é g como sendo mais próximo à inteligência fluida (Gf),
mais conhecida como a teoria das inteligências cristalizada referindo-se à habilidade de raciocinar em situações no-
e fluida, ou simplesmente, como a teoria Gc-Gf. vas, diferentemente da inteligência cristalizada (Gc) que
Outra teoria hierárquica de suma importância é a se refere à habilidade de aplicar definições, métodos e
teoria de três estratos de Carroll (1993, 2012). Carroll procedimentos, aprendidos previamente, para lidar com
desenvolveu a sua teoria por meio de uma reanálise de situações problema (McGrew, 2009). A inteligência Gf
centenas de conjuntos de dados relacionados à estru- é, portanto, a habilidade mais importante na previsão da
tura da inteligência. O pesquisador decidiu reanalisar capacidade geral de adaptação às situações novas, pouco
os conjuntos de dados com técnicas avançadas que não estruturadas, que requerem autonomia intelectual.
estavam disponíveis na época das primeiras análises. A No Brasil, alguns estudiosos do campo da inteligência
utilização das mesmas técnicas em todos os conjuntos têm construído instrumentos e realizado pesquisas com
de dados possibilitou a comparabilidade dos resultados. o intuito de compreender melhor e aferir a inteligência

234 Avaliação Psicológica, 2013, 12(2), pp. 233-242


Validação do SON-R 2½-7[a]

fluida (Pasquali, 2005; Primi, 2001). O presente trabalho para habilidades de linguagem específicas, tanto nos con-
também se configura como uma contribuição para esse teúdos quanto nas instruções, o que colocariam membros
campo de estudo, especialmente no âmbito da psicologia de minorias culturais em desvantagem. Esse argumento
infantil, uma vez que tem como objetivo geral investigar também se aplica a pessoas com problemas de linguagem e
evidências da validade do teste não-verbal de inteligência auditivos. Para todos esses grupos, um baixo desempenho
SON-R 2½-7[a] no Brasil. no teste poderia refletir, primariamente, um conhecimen-
to verbal pobre, em vez de raciocínio ou habilidade para
Os testes SON aprendizagem pobre. Tais críticas levaram a um aumento
no uso de testes não-verbais de inteligência, uma vez que
Os testes SON (Snijders-Oomen Não-verbal) estes testes dependem minimamente do conhecimento
devem seu nome à criadora do primeiro teste, doutora adquirido e da habilidade verbal de uma pessoa.
N. Snijders-Oomen (Snijders-Oomen, 1943). A autora Uma das grandes vantagens dos testes não-verbais
desenvolveu uma bateria de testes que incluiu diversas diz respeito à maior facilidade para adequação a diferen-
tarefas não-verbais relacionadas à habilidade espacial e tes culturas, uma vez que o processo de adaptação de
ao raciocínio abstrato e concreto. Inteligência foi defi- testes não-verbais é menos complicado do que o exigido
nida por Snijders-Oomen em termos do potencial para para testes que utilizam linguagem escrita ou falada como
a aprendizagem. O objetivo do primeiro teste SON era parte do seu conteúdo. Não obstante, o fato de os testes
oferecer uma alternativa para os testes não-verbais de não-verbais não exigirem tradução não significa que es-
execução empregados naquela época e possibilitar que tes instrumentos possam ser utilizados sem um estudo
funções como abstração, simbolismo e entendimento de empírico que verifique sua adequação à cultura na qual
situações comportamentais ficassem mais acessíveis para será utilizado.
a avaliação não-verbal. Na construção do primeiro teste Os testes SON são indicados como exemplo de
SON buscou-se diminuir a influência da escolaridade testes com conteúdo cultural reduzido e que têm como
das crianças e das vivências familiares nos resultados do foco a inteligência fluida, isto é, o potencial para apren-
teste. Dessa forma, o primeiro teste SON buscou medir der. Essas foram as principais razões que impulsionaram
a inteligência fluida em vez da inteligência cristalizada. o desenvolvimento de estudos com o SON-R 2½-7[a]
O SON-R 2½-7[a] é a versão abreviada do SON-R no Brasil. Ademais, no contexto brasileiro, praticamente
2½-7, a última versão dos testes SON para crianças en- não há teste não-verbal de inteligência destinado a toda a
tre 2½ e 7 anos. Esse instrumento de origem holande- faixa etária contemplada pelo SON-R 2½-7[a].
sa, que foi normatizado e validado em vários países de De acordo com dados do Conselho Federal de
Europa, consiste em seis subtestes, a saber: Categorias, Psicologia (disponíveis no site deste órgão), até dezem-
Analogias, Situações, Histórias, Mosaicos e Padrões. bro de 2011, somente os seguintes testes de inteligência
A versão abreviada do teste composta pelos subtestes para crianças encontram-se com avaliação favorável: o
Categorias, Situações, Mosaicos e Padrões foi norma- Teste Não-Verbal de Raciocínio para Crianças - TNVRI
tizada para o Brasil em 2008 (Laros, Tellegen, Jesus, & (Pasquali, 2005); as Escalas de Inteligência Wechsler para
Karino, no prelo) e foi aprovada pelo Conselho Federal Crianças, o WISC-III (Figueiredo, 2002) e o WISC-IV
de Psicologia em 2012 como um teste psicológico em (Sisto, Rueda, Noronha, Santos & Castro, 2012); o Teste
condições de uso profissional. Não-Verbal de Inteligência para Crianças – o teste R-2
Os testes tradicionais de inteligência geral, como o (Oliveira, Rosa & Alves, 2000); a Escala de Maturidade
Stanford-Binet e os testes de inteligência Wechsler, se Mental Colúmbia – o CMMS (Alves, & Duarte, 2001);
centram mais na inteligência cristalizada, ou seja, mais o teste Matrizes Progressivas de Raven (Angelini, Alves,
no resultado final da aprendizagem do que no potencial Custódio, Duarte, & Duarte, 1999) e o Test of Non-verbal
para a aprendizagem. Segundo Tellegen e Laros (2004, Intelligence – o TONI-3, forma A (Santos, Noronha, &
2005), testes de inteligência que aferem principalmen- Sisto, 2006). Nesse contexto, a presente pesquisa visa
te o resultado final da aprendizagem subestimam o contribuir com o campo de avaliação de habilidades cog-
potencial para a aprendizagem de pessoas que tiveram nitivas de crianças, pois pretende demonstrar evidên-
poucas oportunidades para adquirir conhecimento e cias de validade para o teste não-verbal de inteligência
habilidades cognitivas. Em particular, membros de mi- SON-R 2½-7[a].
norias étnicas, pessoas com baixo nível socioeconômico
e pessoas com problemas de aprendizagem estariam em Método
desvantagem quando testadas com um teste tradicional
de inteligência geral. Participantes
De acordo com Tellegen e Laros (2005), os testes Inicialmente, foi realizado um estudo piloto para
tradicionais de inteligência vêm sendo criticados em seu avaliar os aspectos gerais do teste. Essa primeira etapa foi
conteúdo por defensores de testes de inteligência cultural- realizada em Brasília, com 130 alunos, dos quais 92 de
mente justos. Testes tradicionais geralmente fazem apelo uma creche e 38 do Centro Educacional da Audição e

Avaliação Psicológica, 2013, 12(2), pp. 233-242 235


Laros, J. A., Jesus, G. R., & Karino, C. A.

Linguagem (CEAL). Todos os alunos do CEAL apresen- 10 grupos de idade entre 3 anos e 3 meses a 7 anos e 9
tavam surdez profunda. Dos 130 participantes, a maioria meses, cada grupo constituído por 120 crianças, sendo
(52,3%) era do sexo masculino e a idade média das crian- tolerável uma variação de três meses em relação à ida-
ças foi 5,0 anos (DP = 1,2). de pretendida. Não foram incluídas na amostra crianças
A amostra da pesquisa principal ficou composta com deficiência auditiva ou motora. Ao todo, a pesquisa
por 1.200 crianças, divididas equitativamente quanto à foi realizada nas cinco regiões brasileiras, em 13 esta-
idade e ao sexo. As crianças do estudo piloto não foram dos diferentes, contemplando 36 cidades, conforme a
incorporadas na pesquisa principal. Foram estabelecidos Tabela 1.

Instrumento se à criança que copie uma forma que lhe é apresentada


O SON-R 2½-7[a] é um teste não-verbal de inteli- utilizando um lápis. Os itens inicialmente são demonstra-
gência composto por quatro subtestes, a saber: Mosaicos, dos pelo examinador e, no decorrer da aplicação, a crian-
Categorias, Situações e Padrões, administrados nesta or- ça precisa copiar a figura sem ajuda. Exemplos dos itens
dem. Os quatro subtestes compõem a Escala de Raciocínio dos quatro subtestes podem ser encontrados no Manual
(Categorias e Situações) e a Escala de Execução com en- and Research Report do SONR 2½-7 que está disponível
foque espacial (Mosaicos e Padrões). no website dos testes SON (www.testresearch.nl).
O subteste Categorias possui 15 itens e um exem-
plo. Nos primeiros sete itens, quatro ou seis cartões pre- Procedimento
cisam ser postos na categoria correta. Os itens seguintes Inicialmente, o SON-R 2½-7[a] passou por um
são de múltipla escolha nos quais a criança deve esco- processo de validação das figuras do subteste Categorias.
lher, entre os cinco objetos, os dois adequados à catego- Esse subteste foi aplicado em cinco crianças com idades
ria em análise. na faixa etária do teste. Tanto esse quanto os demais sub-
O subteste Situações possui 14 itens e um exemplo. testes foram revisados por três especialistas da área de
Na primeira parte do subteste são apresentadas metades avaliação psicológica que trabalham com crianças. Os
de quatro figuras. Depois de ter recebido os cartões com problemas detectados nessa fase foram solucionados para
as metades faltantes, a criança precisa colocar a metade que o mesmo pudesse ser aplicado no estudo piloto.
certa, completando corretamente o desenho. A segunda Depois de obter aprovação do Comitê de Ética em
parte desse subteste é de múltipla escolha. Cada item Seres Humanos, o estudo piloto foi realizado na cidade
consiste no desenho de uma situação em que uma ou de Brasília em duas instituições que atendem crianças na
duas peças estão faltando. As peças corretas precisam faixa etária de interesse do teste. O manual utilizado no
ser escolhidas entre várias alternativas a fim de deixar a estudo piloto foi previamente traduzido para o português
situação consistente. e passou por várias revisões de conteúdo e por revisão
O subteste Mosaicos é composto por 15 itens e um de língua portuguesa. O tempo médio de aplicação do
exemplo. Na primeira parte, a criança precisa copiar pa- SON-R 2½-7[a] no estudo piloto foi de 50 min.
drões simples de mosaicos numa moldura utilizando 3 A pesquisa de validação ocorreu junto com a pes-
a 5 quadrados vermelhos. Na segunda parte, requer-se quisa de normatização do teste e as aplicações ocorreram
da criança que padrões de mosaicos sejam copiados com em escolas, durante o horário de aula, ou em igrejas e na
quadrados vermelhos, amarelos e vermelhos/amarelos. casa da criança, em horário previamente agendado. Todas
O subteste Padrões é formado por 16 itens. Solicita- as aplicações foram individuais, efetuadas por psicólogos

236 Avaliação Psicológica, 2013, 12(2), pp. 233-242


Validação do SON-R 2½-7[a]

e estudantes de psicologia devidamente treinados. Após total, podemos concluir que a estrutura fatorial é seme-
a pesquisa, foi entregue aos pais um relatório com os re- lhante nos diversos grupos. O terceiro método que foi
sultados da criança. empregado na verificação da validade do construto do
SON-R 2½-7[a] foi a Análise Fatorial Confirmatória
Análise dos dados (AFC), utilizando o software LISREL 8.8 (Jöreskog &
Foram utilizados múltiplos métodos para verificar Sörbom, 2006). Nessa etapa foi testado o ajuste entre o
a estrutura fatorial do instrumento não-verbal de inteli- modelo de dois fatores e os dados empíricos. Também
gência. Antes de realizar as análises principais foram re- foram obtidas evidências sobre a invariância do modelo
alizadas análises exploratórias para verificar a ocorrência fatorial em quatro diferentes grupos de idade.
de erros na base de dados. Depois dessa fase exploratória
foi verificada a fidedignidade dos escores dos quatro sub- Resultados e Discussão
testes do SON-R 2½-7[a] e das três escalas do SON-R:
a Escala de Execução (SON-EE), a Escala de Raciocínio Estudo Piloto
(SON-ER) e a Escala Geral (SON-QI). Na verificação Embora o estudo de normatização do SON-R
da fidedignidade, usou-se o coeficiente Lambda 2 de 2½-7[a] não contemple crianças com problemas auditi-
Guttman, uma vez que foi comprovado que este esti- vos, o estudo piloto com as crianças surdas no Centro
ma melhor a fidedignidade do que o coeficiente Alfa de Educacional da Audição e Linguagem (CEAL) ser-
Cronbach (Sijtsma, 2012; Tellegen & Laros, 2004; Ten viu para verificar a adequação das instruções não-ver-
Berge & Zegers, 1978), principalmente quando os ins- bais de aplicação constantes no manual em português.
trumentos contêm poucos itens ou quando a amostra é Adicionalmente, buscou-se realizar uma análise inicial
pequena. Para calcular o coeficiente Lambda 2 foi utiliza- da qualidade psicométrica do teste SON-R 2½-7[a] nes-
do o SPSS na sua versão 16.0. se grupo específico de crianças. Os resultados indicaram
Depois de estimar a fidedignidade, procedeu-se a que as crianças surdas (N=38) entenderam as instruções
verificação da estrutura fatorial do SON-R 2½-7[a]. não-verbais do teste sem problemas. Os coeficientes de
O primeiro procedimento utilizado para isso foi o Full fidedignidade (Lambda 2 de Guttman) dos quatro sub-
Information Factor Analysis (FIFA), que faz parte do sof- testes encontrados nesse grupo foram satisfatórios, com
tware TESTFACT 4.0 (Wood e cols., 2003). O método valores variando entre 0,80 a 0,87.
FIFA é uma análise fatorial baseado na Teoria de Resposta O principal objetivo do estudo piloto com os alunos
ao Item. Um problema com o uso de correlações entre de creche (N=92) foi verificar a qualidade psicométrica
itens dicotômicos (os itens dos subtestes do SON-R do SON-R 2½-7[a] em um grupo de crianças sem pro-
2½-7[a] são desse tipo) é que são geralmente afetadas blemas auditivos. Nesse grupo, os coeficientes de fide-
tanto pelo conteúdo dos itens como pelas semelhan- dignidade para os quatro subtestes variaram entre 0,84 a
ças das distribuições estatísticas dos itens (Nunnally & 0,89. Observou-se que a porcentagem de acerto de itens,
Bernstein, 1994). Itens com distribuições semelhantes em geral, foi decrescente para todos os subtestes. Isso é
tendem a correlacionar mais fortemente entre eles em importante, uma vez que o SON-R 2½-7[a] é aplicado
comparação com itens que têm distribuições dissimi- seguindo um procedimento adaptativo.
lares. Itens fáceis e difíceis tendem a constituir fatores
distintos mesmo quando todos os itens estão medindo Estudo principal
a mesma variável latente unidimensional (Nunnally & Tendo como base a amostra da pesquisa principal,
Bernstein, 1994). O método FIFA não tem problema foi primeiramente realizada a análise da consistência in-
com a análise fatorial de instrumentos com itens dico- terna dos subtestes. De acordo com Cronbach (1996), o
tômicos, uma vez que ele não exige o cálculo de coefi- coeficiente de consistência interna tende a mudar con-
cientes de correlação. Outra vantagem da análise fato- sideravelmente em função da variância dos escores dos
rial FIFA é que ela acomoda os efeitos de acerto ao acaso grupos. Nesse contexto, Thompson (2005) enfatiza que
e de itens não apresentados. a fidedignidade tem que ser calculada para cada pesquisa
O segundo procedimento utilizado para investigar a e que não deve ser simplesmente copiada do manual do
estrutura fatorial do SON-R 2½-7[a] foi o Simultaneous teste. Ademais, deve-se considerar que existe uma rela-
Component Analysis (SCA), desenvolvido por Millsap e ção estreita entre a fidedignidade e a variância dos esco-
Meredith (1988). O SCA é uma generalização de análise res: quanto maior a variância, maior é o coeficiente de
de componentes principais para a análise simultânea de consistência interna. Nesse sentido, considerando que
diferentes variáveis observadas em várias populações. O as diferenças na variância dos escores entre os grupos de
procedimento SCA verifica se uma porcentagem maior idade ocorrem geralmente devido a particularidades da
da variância é explicada quando se considera grupos sepa- amostragem e que os grupos de idade não são compostos
rados ao invés de um grupo único (Millsap & Meridith, por um quantitativo muito alto de crianças, foi realizado
1988; Niesing, 1997). Quando a análise nos grupos sepa- um ajuste nos índices de fidedignidade tendo como base
rados não explica uma porcentagem maior da variância a variância em cada grupo.

Avaliação Psicológica, 2013, 12(2), pp. 233-242 237


Laros, J. A., Jesus, G. R., & Karino, C. A.

Na Tabela 2 são exibidos os coeficientes de fidedig- QI, foram feitas as análises de validade de construto que
nidade nos dez grupos de idade para os escores dos quatro serão apresentadas a seguir.
subtestes do SON-R 2½-7[a], para a Escala de Execução
(SON-EE), para a Escala de Raciocínio (SON-ER) e Análise Fatorial de Informação Plena – FIFA
para o escore total (SON-QI). Na inspeção da Tabela 2, A Análise Fatorial de Informação Plena (Full Information
nota-se que, para todos os grupos de idade, os coeficien- Factor Analysis – FIFA) foi utilizada para verificar a estrutura
tes de fidedignidade são superiores a 0,70 para os esco- fatorial do teste, considerando a escala de resposta dicotômi-
res dos subtestes; a 0,80 para as duas escalas (SON-EE e ca. Os resultados da FIFA realizada com os dados do SON-R
SON-ER) e a 0,90 para o SON-QI. Verificada a consis- 2½-7[a] podem ser vistos em duas estruturas: com um fator e
tência interna dos escores dos subtestes, escalas e SON- com dois fatores - Execução e Raciocínio (ver Tabela 3).

238 Avaliação Psicológica, 2013, 12(2), pp. 233-242


Validação do SON-R 2½-7[a]

Os valores entre parênteses representam as cargas A análise que foi efetuada com os dados brasileiros teve
fatoriais da estrutura de um fator. Como pode ser obser- como objetivo verificar se a estrutura interna do teste, no
vado, todos os 60 itens saturam no fator único com cargas Brasil, também é similar em três grupos diferenciados de
fatoriais iguais ou superiores a 0,32, que corresponde no idade, a saber: (1) 3;3 a 4;3; (2) 4;9 a 6;3 e (3) 6;9 a 7;9. A
mínimo cerca de 10% de variância comum com o fator. SCA se baseia nas três matrizes de correlação dos escores
De acordo com Tabachnick e Fidell (2007), esse valor é normatizados dos subtestes. Por meio dessa análise, foi
satisfatório. Tais resultados dão suporte à utilização de testado se uma solução uniforme com pesos otimizados
uma escala total do SON-R 2½-7[a]. Verifica-se também dos componentes nos três grupos explica significativa-
que a média das cargas fatoriais no fator único é mais alta mente menos da variância total do que os componen-
para os subtestes Categorias e Situações. tes que são otimizados nos grupos separados (Millsap &
A estrutura com dois fatores (Execução e Raciocínio) Meridith, 1988; Niesing, 1997). Os resultados indica-
foi obtida utilizando-se a rotação Promax. Como pode ram que, com a extração de dois componentes, a solução
ser observado, os dois fatores apresentam em geral cargas uniforme foi ligeiramente menos adequada (80,1% vs.
fatoriais satisfatórias, a maioria superior a 0,32. Entre os 80,2% da variância total explicada nos grupos separados).
itens com carga fatorial menor do que 0,32 estão os itens Assim, as características estruturais do SON-R 2½-7[a]
mais fáceis dos subtestes Mosaicos e Categorias e os mais demonstraram ser altamente independentes dos grupos
difíceis dos subtestes Mosaicos, Padrões e Situações. As de idade. Outro resultado da análise SCA é que o uso
cargas fatoriais baixas desses itens foram provavelmen- de pesos simples (1 e 0) é quase tão bom quanto pesos
te influenciadas pela pouca variabilidade de resposta. otimizados (79,92% vs. 80,05%).
É interessante notar também que, no fator execução, o Não obstante a boa consistência da estrutura interna
subteste Padrões apresenta cargas fatoriais mais altas. Por do SON-R 2½-7[a] nos diferentes grupos, pode-se ob-
fim, a correlação encontrada entre os dois fatores foi alta, servar que o segundo componente antes da rotação é re-
0,80. Frente aos resultados, considera-se que a estrutura lativamente menos importante: o autovalor do segundo
bifatorial também se mostra válida. componente foi cerca de 0,60. Entretanto, o autovalor do
segundo componente tende a aumentar com o aumento
Análise Simultânea dos Componentes Principais – SCA da idade, conforme a Tabela 4. É uma indicação de que
No processo de validação do SON-R 2½-7, na a solução com dois fatores ficou ligeiramente mais ade-
Holanda, foi efetuada uma análise fatorial com os escores quada para o grupo de idade mais velho. Provavelmente,
normatizados dos subtestes (M=10 e DP=3) utilizando a precisão da diferença entre o fator espacial e o de ra-
a Análise Simultânea dos Componentes Principais (SCA) ciocínio não é tão alta. Portanto, conclusões importantes
(Kiers & Ten Berge, 1989; Millsap & Meredith, 1988). Os não podem ser baseadas nessas diferenças. Mais detalhes
resultados da análise fatorial na Holanda indicaram que da análise com o programa SCA (Kiers, 1990) podem ser
a estrutura fatorial foi similar em três grupos de idade. vistos na Tabela 4.

Além do percentual de variância explicada dos dois suporte à utilização e interpretação do SON-R 2½-7[a]
fatores nos três grupos de idade, a Tabela 4 também apre- por meio de duas escalas em diferentes grupos de idade.
senta as cargas fatoriais dos dois fatores no grupo total de
idade. O resultado demonstra cargas expressivas em am- Análise Fatorial Confirmatória – CFA
bos os fatores. Dessa forma, os resultados apresentados dão A Análise Fatorial Confirmatória (CFA) é um

Avaliação Psicológica, 2013, 12(2), pp. 233-242 239


Laros, J. A., Jesus, G. R., & Karino, C. A.

procedimento estatístico viabilizado pelos Modelos de estrutura em quatro grupos diferentes de idade, a saber:
Equações Estruturais (Byrne, 2010; Kline, 2011; Pilati 3;3 a 7;9; 3;3 a 4;3; 4;9 a 6;3 e 6;9 a 7;9. A CFA realizada
& Laros, 2007). Inicialmente, foi verificado se a es- neste estudo foi executada por meio do pacote estatísti-
trutura fatorial do SON-R 2½-7[a] com dois fatores, co LISREL 8.8, tendo como método de estimação a má-
Escala de Execução e Escala de Raciocínio, se confir- xima verossimilhança. A Tabela 5 apresenta um resumo
mava. Também se buscou verificar a invariância dessa dos resultados.

Como pode ser observado na Tabela 5, todas as car- Considerações Finais


gas fatoriais são moderadas ou altas e o erro associado
é bastante pequeno. Os índices de correlação múltipla O presente estudo teve como objetivo principal
ao quadrado (SMC) também indicam resultados muito obter evidências de validade de construto do teste
satisfatórios. SON-R 2½-7[a]. Dessa forma, buscou-se contribuir
Além dos dados apresentados na Tabela 5, as estatís- para a área de avaliação psicológica infantil, uma vez
ticas de ajuste ao modelo foram verificadas. Conforme que a faixa etária abordada no teste é muito importan-
sugere Byrne (2010), os índices avaliados foram o GFI te, sobretudo, para a intervenção precoce (Campbell &
(Goodness of Fit Index) e o AGFI (Adjusted Goodness of Fit Ramey, 1995).
Index). A literatura aponta que valores desses índices Três técnicas de análises foram utilizadas neste estu-
entre 0,90 e 0,95 são indicadores de ajuste suficiente do para obter evidências de validade de construto do teste
e valores acima de 0,95 são considerados bons ajustes SON-R 2½-7[a]: Análise Fatorial de Informação Plena
(Kline, 2011). Ademais, faz parte das estatísticas de ajus- – FIFA, Análise Simultânea dos Componentes Principais
te o RMSEA (Root Mean Square Error of Approximation), – SCA e Análise Fatorial Confirmatória – CFA. De
descrito como a falta de ajuste dado um número parti- modo geral, os resultados das análises embasam o uso do
cular de parâmetros no modelo testado. Valores inferio- SON-R 2½-7[a] com uma escala geral e com duas esca-
res a 0,05 para RMSEA indicam um bom ajuste (Byrne, las específicas: Execução e Raciocínio. Ademais, tanto na
2010; Pilati & Laros, 2007). SCA quanto na CFA foi avaliada a robustez da estrutura
No modelo testado para os quatro grupos de ida- fatorial de duas escalas em três grupos distintos de idade:
de, verificou-se que tanto o GFI quanto o AGFI obti- (1) 3;3 a 4;3; (2) 4;9 a 6;3 e (3) 6;9 a 7;9 anos. Verificou-
veram valores superiores a 0,95, indicando um ajuste se que sua estrutura é invariante tanto no grupo total de
bom do modelo. Quanto ao RMSEA, com exceção do crianças, com idade entre 3;3 a 7;9 anos, quanto dividin-
grupo com idade entre 3 anos e 3 meses e 4 anos e 3 do-se a amostra em três grupos distintos de idade.
meses, que obteve um índice de 0,07, os demais gru- Assim, de maneira geral, os estudos de validade re-
pos apresentaram valores inferiores a 0,05. Esses re- alizados indicam que o SON-R 2½-7[a] é um teste vá-
sultados indicam que a estrutura do SON-R 2½-7[a] lido, fidedigno e robusto em sua estrutura interna. Esta
com dois fatores é robusta e foi confirmada nos quatro pesquisa aponta, ainda, que se trata de um teste com alta
grupos de idade. qualidade psicométrica e com índices de confiabilidade

240 Avaliação Psicológica, 2013, 12(2), pp. 233-242


Validação do SON-R 2½-7[a]

adequados para uso nas diferentes faixas etárias contem- em especial no desenvolvimento de testes que buscam
pladas pelo teste. mensurar a inteligência fluida.
Outros estudos ainda podem ser feitos na busca de evi- A aferição da inteligência geralmente é realizada
dência de validade de construto do teste SON-R 2½-7[a]. com o objetivo de avaliação diagnóstica e os seus resul-
Por exemplo, a análise da invariância da estrutura fatorial em tados têm consequências importantes tanto para a vida
amostras diferentes e a análise da adequabilidade do modelo escolar como para a formulação de recomendações para a
comparando-se os índices de ajuste dos dados em modelos criação de programas especiais de educação e tratamento
alternativos, conforme sugere Thompson (2005). das desordens (Hutz & Bandeira, 1993; International Test
Há décadas, pesquisadores e estudiosos da área de Commission, 2003). Considerando o impacto dos testes na
inteligência procuram evidências sobre a arquitetura vida de milhares de pessoas, espera-se que esta pesquisa
intelectual humana. Este estudo fornece mais uma con- tenha contribuído para área ao colaborar com o processo
tribuição para o avanço da compreensão da inteligência, de validação do teste SON-R 2½-7[a].

Referências

Alves, I. C. B. & Duarte, J. L. M. (2001). Escala de maturidade mental Colúmbia: Manual para aplicação e interpretação. São Paulo: Casa do
Psicólogo.
Angelini, A. L., Alves, I. C. B., Custódio, E. M., Duarte, W. F., & Duarte, J. L. M. (1999). Manual Matrizes Progressivas Coloridas de Raven: escala
especial. São Paulo: CETEPP - Centro Editor de Testes e Pesquisas em Psicologia.
Byrne, B. M. (2010). Structural Equation Modeling with AMOS: Basic Concepts, Applications, and Programming (2ª ed.). New York: Routledge
Academic.
Campbell, F. A. & Ramey, C. T. (1995). Cognitive and school outcomes for high-risk African-American students at middle adolescence:
positive effects of early intervention. American Educational Research Journal, 32(4), 743-772.
Carroll, J. B. (1993). Human cognitive abilities: A survey of factor analytic studies. New York: Cambridge University Press.
Carroll, J. B. (2012). The three-stratum theory of cognitive abilities. Em D. P. Flanagan & P. L. Harrison (Org.), Contemporary intellectual
assessment: Theories, tests, and issues, Third Edition (pp. 883-890). New York: The Guilford Press.
Cattell, R. B. (1963). Theory of fluid and crystallized intelligence: a critical experiment. Journal of Educational Psychology, 54, 1-22.
Cronbach, L. J. (1996). Fundamentos da testagem psicológica (5ª ed.). Porto Alegre: Artes Médicas.
Figueiredo, V. L. M. (2002). Padronização brasileira das Escalas Wechsler de Inteligência para Crianças, Terceira Edição - WISC-III. Em D.
Wechsler (Org.), WISC-III: Escala de Inteligência para Crianças: Manual. São Paulo: Casa do Psicólogo.
Hogan, T. P. (2006). Introdução à prática de testes psicológicos. Rio de Janeiro: LTC – Livros e Técnicos e Científicos Editores S. A.
Horn, J. L. (1965). Fluid and crystallized intelligence: A factor analytic and developmental study of the structure among primary mental abilities. Unpublished
doctoral dissertation, University of Illinois.
Horn, J. L. (1994). Theory of fluid and crystallized intelligence. Em R. J. Sternberg (Org.), Encyclopedia of human intelligence (pp. 443-451).
New York: MacMillan.
Horn, J. L. & Blankson, A. N. (2012). Foundations for better understanding of cognitive abilities. Em D. P. Flanagan & P. L. Harrison (Org.),
Contemporary intellectual assessment: Theories, tests, and issues (3ª ed., pp. 73-98). New York: The Guilford Press.
Horn, J. L. & Noll, J. (1997). Human cognitive capabilities: Gf-Gc theory. Em D. P. Flanagan, J. L. Genshaft, & P. L. Harrison (Org.),
Contemporary intellectual assessment: Theories, tests and issues (pp. 53-91). New York: The Guilford Press.
Hutz, C. & Bandeira, D. (1993). Tendências contemporâneas no uso de testes, uma análise da literatura brasileira e internacional. Psicologia:
Reflexão e Crítica, 6, 85-101.
International Test Commission (2003). Diretrizes para o uso de testes: International Test Commission (ITC). Versão em Português. Retirado no
World Wide Web: http://www.ibapnet.org.br/ diretrizesITC.pdf
Jöreskog, K. G. & Sörbom, D. (2006). LISREL for Windows [Computer software]. Lincolnwood, IL: Scientific Software International.
Kiers, H. A. L. (1990). SCA: a program for simultaneous component analysis. Groningen: IEC, ProGamma.
Kiers, H. A. L. & ten Berge, J. M. F. (1989). Alternating least squares algorithms for simultaneous component analysis with equal weight
matrices in two or more populations. Psychometrika, 54, 467-473.
Kline, R. B. (2011). Principles and practice of structural equation modeling (3ª ed.). New York: Guilford Press.
Laros, J. A., Tellegen, P. J., Jesus, G. R., & Karino, C. A. (no prelo). SON-R 2½-7[a], Teste não-verbal de inteligência. Manual com normatização
e validação brasileira. Porto Alegre: Casa do Psicólogo.
McGrew, K. S. (2009). CHC theory and the human cognitive abilities project: Standing on the shoulders of the giants of psychometrics.
Intelligence, 37, 1-10.
Millsap, R. E. & Meredith, W. M. (1988). Component analysis in cross-sectional and longitudinal data. Psychometrika, 53, 123-124.
Niesing, J. (1997). Simultaneous component and factor analysis methods for two or more groups: A comparative study. M & T Series, 30. Leiden: The
Netherlands, DSWO Press.
Nunnally, J. C. & Bernstein, I. H. (1994). Psychometric Theory (3ª ed.). New York: McGraw-Hill.
Oliveira, R., Rosa, H. R., & Alves I. C. B. (2000). R-2. Teste não verbal de inteligência para crianças: Manual. São Paulo: Vetor.
Pasquali, L. (2005). Manual técnico e de aplicação do teste não-verbal de raciocínio para crianças - TNVRI. São Paulo: Vetor Editora.
Pilati, R. & Laros, J. A. (2007). Modelos de equações estruturais em psicologia: conceitos e aplicações. Psicologia: Teoria e Pesquisa, 23(2),
205-216.
Primi, R. (2001). Complexity of geometric inductive reasoning tasks: Contribution to the understanding of fluid intelligence.
Intelligence, 30, 41-70.
Santos, A. A. A., Noronha, A. P. P., & Sisto, F. F. (2006). Teste Não-Verbal de Inteligência (TONI-3, Forma A). São Paulo: Vetor Editora.

Avaliação Psicológica, 2013, 12(2), pp. 233-242 241


Laros, J. A., Jesus, G. R., & Karino, C. A.

Schneider, W. J. & McGrew, K. S. (2012). The Cattell-Horn-Carroll model of intelligence. Em D. P. Flanagan & P. L. Harrison (Org.),
Contemporary intellectual assessment: Theories, tests, and issues, (3ª ed., pp. 99-144). New York: The Guilford Press.
Sijtsma, K. (2012). Future of psychometrics: Ask what psychometrics can do for psychology. Psychometrika, 77, 4-20.
Sisto, F. F., Rueda, F. J. M., Noronha, A. P. P., Santos, A. A. A., & Castro, N. R. (2012). Escala de Inteligência Wechsler para Crianças – WISC-IV.
São Paulo: Casa do Psicólogo.
Snijders-Oomen, N. (1943). Intelligentieonderzoek van doofstomme kinderen [The examination of intelligence with deaf-mute children].
Nijmegen: Berkhout.
Spearman, C. (1904). “General intelligence” objectively determined and measured. American Journal of Psychology, 15, 201-293.
Spearman, C. (1927). The abilities of man: Their nature and measurement. New York: Macmillan.
Tabachnick, B. G. & Fidell, L. S. (2007). Using multivariate statistics (3a ed.). Northridge, CA: Harper Collins College.
Tellegen, P. J. & Laros, J. A. (2004). Cultural bias in the SON-R test: comparative study of Brazilian and Dutch children. Psicologia: Teoria e
Pesquisa, 20(2), 103-111.
Tellegen, P. J. & Laros, J. A. (2005). Fair assessment of children from cultural minorities: a description of the SON-R non-verbal intelligence tests. Slovakia:
Paper presented at the UNESCO seminar.
Ten Berge, J. M. F. & Zegers, F. E. (1978). A series of lower bounds to the reliability. Psychometrika, 43(4), 575-579.
Thurstone, L. L. (1938). Primary mental abilities. Chicago: University of Chicago Press.
Thompson, B. (2005). Exploratory and confirmatory factor analysis: Understanding concepts and applications. Washington, DC: American Psychological
Association.
Wasserman, J. D. (2012). A history of intelligence assessment. Em D. P. Flanagan & P. L. Harrison (Org.), Contemporary intellectual assessment:
Theories, tests and issues (3ª ed., pp. 3-55). New York: The Guilford Press.
Wood, R., Wilson, D. T., Gibbons, R., Schilling, S. G., Muraki, E., & Bock, R. D, (2003). TESTFACT (Version 4.0). Mooresville, IN:
Scientific Software International.

Recebido em agosto de 2012


Reformulado em janeiro de 2013
Aprovado em fevereiro de 2013

Sobre os autores

Jacob Arie Laros é Doutor PhD em Personality and Educational Psychology pela University of Groningen e pós-doutor pela
University of Groningen. Atualmente é professor da pós-graduação em Psicologia Social, do Trabalho e das Organizações (PSTO) da
Universidade de Brasília (UnB) e bolsista de produtividade em pesquisa do CNPq. E-mail: jalaros@unb.br
Girlene Ribeiro de Jesus é graduada em Psicologia pela Universidade Federal da Paraíba. Mestre e Doutora em Psicologia pela
Universidade de Brasília.
Camila Akemi Karino é bacharel em psicologia e psicóloga pela Universidade de Brasília. Mestre pelo Programa de Pós-graduação
em Psicologia Social, do Trabalho e das Organizações da UnB. Atualmente, é coordenadora-geral de Instrumentos e Medidas do Instituto
Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP).

242 Avaliação Psicológica, 2013, 12(2), pp. 233-242

Você também pode gostar