INTRODUO
O problema da validade de constmto de grande relevncia na rea educacional, tendo em vista o fato de que a avaliao se vale, frequentemente, de constmtos, que, aps sua defmio operacional, so medidos por intermdio de testes. A validnde de contedo e a validade de airrtb (concorrente e preditiva), atributos exigidos dos bons testes de escolaridade, no se preocupam, entretanto, com a compreenso dos constmtos que os testes medem; conseqentemente, impe-se, conforme acentua Brown (1970), uma nova abordagem para anlise dos instrumentos de medida da aprendizagem escolar. A Widade de muitos instrumentos de medida e , s vezes, inferida, mas tal procedimento 6 adotado revelia da metodologia cientfica, no sendo, pois, um comportamento justificvel. S o necessrias prwasinsoiismveis de que um teste, construido para determinado fm, efetivamente vlido. Desse modo, se um teste visa a medir processos mentais complexos, como ocorre iniimeras vezes na rea educacional, inclusive nos exames de acesso s universidades, indispensvel que existam provas irrefutveis de que os instrumentos utilizados medem, efetivamente, o construto hipotetizado. A validade de constmto possibilita determinar qual a caracterstica educacional que explica a varincia do teste ou, ento, qual o significado do teste (Kerlinger, 1973). Um avaliador, desse
modo, poder fazer perguntas do tipo: - o teste mede, efetivamente, a capacidade de expresso escrita? O teste um reflexo do status scio-econhico dos estudantes avaliados? Aindagao, no caso, pretende esclarecer qual a proporo da varincia total do teste que decorre desses consirutos: expresso escrita e status scio-econmico. Ou, ainda, procura explicar as diferenas individuais nos escores desse instrumento de medida. O interesse, na validao de construtos, centraliza-se na caracterstica ou trao que est sendo medido, mais do que no prprio teste.
~
A verificao da validade de construto, sua lgica e metodologia foram amplamente estudadas por Cronbach e Meehl(1955), que produziram documento fundamental para a compreenso desse tipo de validade, que de particular importncia sempre que um instrumento deva ser interpretado como proporcionando medidas de um atributo ou qualidade que, presumivelmente, as pessoas possuem. Outro documento bsico para o estudo do problema o ensaio de Campbell e Fiske (1959) sobre validade convergente e discriminante. Ambos os trabalhos so amplamente utilizados na fundamentao do presente estudo.
36
A lgica da validade de construto, assim como o seu processo, so, essencialmente, os do mtodocientfico. Parte-se de uma teoria sobre a natureza do construto e fazem-se predies sobre as relaes entre os escores do teste e outras variveis. A seguir, essas predi&s so verificadas empiricamente e, dependendo dos resultados, a teoria aceita ou revista. O trabalho contnuo de fazer prediks, testar hipteses, atravs da experimentao, e rever a teoria so atividades que contribuem para aumentar a preciso da definio do construto.
As teorias que procuram explicar um determinado fenmeno compreendem um conjunto interrelacionado de conceitos, proposies e leis. A esse sistema interligado Cronbach e Meehl (1955) deram o nome de rede nomolgica*. As leis estabelecem relaes entre diferentes caractersticas, entre caractersticas e construtos, ou entre um construto e outro, conforme aqueles autores, os quais ressaltam ainda que as leis e os conceitos devem estar ligados a comportamentos observveis. As vezes, entretanto, isso no ocorre. Uma determinada lei ou conceito Mo se relaciona diretamente com as caracterkticas, mas c o outras ~ leis e conceitos, que, por sua vez, so diretamente ligados a caractersticas ohservveis. E condio necessria, na pesquisa da validade de construto, que a definio de conceitos ou formulao de leis estiamapoiados, direta ou indiretamente, em dados observveis. Cronhach e Meehi (1955) assinalam, ainda, que o significado de um conceito somente fica perfeitamente esclarecido quando se elabora uma rede de relaes que mostre, claramente, que essas relaks so especficas e definitivas. Dessa forma, ~ V a l i d a ~ de oum constmto, h i necessidade de um grande nmero de diferentes operaes, inclusive de ordem qualitativa, para a mensurao de um conceito e a fm de mostrar que esse mesmo conceito est ligado a outro conceito por intermdio de uma rede nomolgica. A partir desse posicionamento, preciso considerar as seguintes situaes: 1 - o processo de inferncia do significado de um construto exige que os dados sejam observveis; 2 - o processo de inferzncia do significado de um construto, a partir de dados observveis, deve ser explicitamente especificado, para que se possa verificar a preciso de uma inferncia; 3 - diferentes usurios de um construto devem servir-se, essencialmente, de uma mesma rede nomolgica, para que a concordncia entre os pesquisadores seja possvel, pois, freqentemente, o nome de um mesmo constmto usado com referncia a diferentes constmtos (ex: - inteligncia) ou diferentes nomes so empregados com reiao ao mesmo construto (ex: - pensamento divergente e criatividade), conforme assinalou Brown (1970).
VALIDAO DE TE~TESE VALIDAO DE TEORIAS A validao de construtos no se limita apenas a validar um teste, o seu alcance bem mais amplo, centrando-se o seu objetivo na validao da teoria em que se apoiou a construo do instrumento (Kerlinger, 1973); desse modo, o trabalho de validao de um construto uma pesquisa cientfica empirica, porque, defuiidos os construtos que seriam responsiveis pelo desempenho no teste. o avaliador passa a formular hipteses sobre a teoria dos construtos e, a seguir, testa empiricamente essas hipteses. A testagem de hipteses sobre construtos exige a verificao da convergncia e da discriminatividade. A convergncia mostra que as evidncias coletadas de diferentes fontes e de diferentes modos indicam um significado igual ou semelhante para o
2
Nomolgico, que 4 relativo a nomologia, estudo da\ leis que presidem aos fenmenosnaturais.,
37
CcmStNto. A discrimiminativi&de refere-se i possibilidade de diferenciar, empiricamente, um construto de outros constmtos semelhantes, assim como a de constatar o que no est coneiacionado aos construtos (Kerlinger, 1973). As idias de convergncia e de discriminatividade sero retomadas mais adiante, quando for discutida a metodologia de CampbeU e Fiske (1959) relativa h matriz do multitrao-multimtodo. A validao de construtos ultrapassa, assim, os limites de uina validao emprica, pois, alm de constatar a correlao com um critrio ou em que medida o instrumento separa indivduos que.possuem alto ou baixo grau de uma determinada caracterstica, explica, tambm, o porqu dessas ocorrncias.
A METODOLOGIA DA PESQUISA DA VALIDADE DE CONSTRUTO A validade de constmto pode ser pesquisada por diferentes mtodos, inclusive os que so empregados na validade de contedo e de critrio. Ao utilizar diferentes mtodos importante que se estude (Magnusson, 1967), entre outros aspectos: i a -as diferenas entre os grupos em funo do que a teoria estabelece relativamente ? varivel pesquisada; b - como os resultados dos testes so influenciados por mudanas nos indivduos ou no meio, as quais, segundo a teoria, devem, respectivamente, influenciar ou deixar de influenciar as vrias posies dos indivfduos no mntinuum; c -as correlaes entre diferentes testes que, supostamente, medem a mesma varivel. I? necessrio cautela a fin de que as correlaes entre as medidas no se elevem em virtude de similaridades nos mtodos utilizados (Cronbach e Meehl, 1955). Isso pode acontecer (Magnusson, 1967) se as respostas dos testes exigirem alguma aptido especial alm da que est sendo considerada. Uma possvel concordncia entre as medidas poderia, simplesmente, provocar um aumento da correlao do efeito de .diferenas individuais relativas a essa aptido especial;
38
d - as correlaes entre itens isolados ou diferentes partes do teste, a fim de verificar se possuem alta intercorrelao e o teste possa ser considerado como medindo umavarivel unitria. A validade em geral e, especialmente, a validade de construto so estimadas pela concordncia de medidas obtidas por mtodos to diferentes quanto possvel. As dissimilaridades dos mtodos, no estudo da validade de constnito, so importantes para que asintercorrelaes obtidas possam ser interpretadas como expressando realmente esse tipo de validade.
MTODOS USADOS NA VALIDAO DE CONSTRIJTOS Os mtodos usados no estudo da validade de constnito podem ser classificados, de acordo com B r o m (1970), em cinco categorias: mtodos intratestes, mtodos entretestes, estudos relacionados a critrios, estudos experimentais e estudos de generali~abilidade~. Mtodos intratestes - esses mtodos usam tcnicas que permitem o estudo da estrutura
O efeito de halo um efeito sistemtico do avaliador que deve ser levado em conta quando traos humanos esto sendo avaliados. Uma atitude positiva ou negativa do avaliador em relao ao avaliado afeta! geralmente, na dirco da atitude, as medidas de cada ao sujeito i avaliao. O efeito poder provocar um decrscimo nas diferenas individuais e um aumento na correlao entre as medidas de diferentes traos.
4.
39
interna do teste - seu contedo, as interrelaes entre os itens e os subtestes e os processos relacionados com as respostas aos itens. Essas tcnicas no consideram variveis externas, porque se preocupam, antes de mais nada, com a estrutura interna do teste. Assim, no se pode usar essa metodologia para obter amplas informaes sobre avalidade de constmto do teste, quando muito o seu emprego possibilitaria algum mnhecimento sobre a natureza do construto, mas no o relacionamento do construto com outras variveis. Adeterminao da validade de contedo fornece informaes sobre a validade de construto e um tipo de estudo que pode ser includo na categoria dos mtodos intratestes. As especifica b s do contedo e do domnio comportamental amostrado no teste, condio essencial no estudo da validade de contedo, tambm servem para definir a natureza do construto que o teste mede. A anlise da homogeneidade do teste, mtodo que tambm pode ser includo na categoria dos intratestes, por intermdio de medidas de consistncia interna (coeficientes de KuderRichardson), pela anlise fatorial dos itens, entre outros estudos de homogeneidade, auxiliam na definio do construto, especialmente ao indicar se o teste mede um nico trao ou se, ao contrrio, mede diversos traos. Ao analisar um teste, o interesse nem sempre se limita ao conhecimento do contedo dos itens, aprofunda-se e procura conhecer, tambim, o processo usado pelos examinandos M S suas respostas aos itens. Assim sendo, qualquer processo de anlise que identifique capacidade e habilidades pode, em princpio, esclarecer o significado do construto que o teste mede, ao indicar as variveis que esto sendo medidas pelos itens do instrumento. preciso, entretanto, usar de cautela quando for empregado o processo de anlise, pois, indiscutivelmente, diferentes pessoas podero utilizar processos diversos, mas igualmente vlidos, de resposta a um item, criando-se, desse modo, uma situao complexa que pode levar a falsas interpretaes. Mtodos entretestes - os mtodos includos nessa categoria consideram, simultaneamente, vrios testes, mas no levam em considerao variveis extratestes. Os mtodos entretestes pemitem indicar, geralmente, os aspectos comuns a vrios testes, mas no possibilitam a realizao de inferncias diretas sobre a relao entre escores do teste e variveis externas. O mtodo mais simples dessa categoria consiste em correlacionar um teste novo a um outro teste j amplamente estudado e conhecido nas suas diversas dimenses E a chamada validade congruene. Se existe uma alta correlao entre os dois testes pode-se dizer que ambos medem o mesmo construto. Essa abordagem apresenta um aspecto que merece reflexo, pois a menos que os dois testes sejam altamente correlacionados (Brown, 1970), isto , as correlaes e as fidedignidades sejam da mesma magnitude, os fatores que influenciam no abaixamento da correlao podem ser importantes para determinar a relao entre o teste e a varivel externa e, desse modo, invaiidar as inferncias realizadas com base na intercorrelao dos testes. Uma outra abordagem, ainda nessa categoria, consiste em promover a amse fatorkzl em um p p o de testes. A anlise fatorial , no momento, o mtodo mais promissor para estimativa da validade de construto (Kerlinger, 1970), pois objetiva reduzir um grande nmero de medidas a um nmero reduzido de fatores a fim de estabelecer quais os que medem as mesmas coisas e em que medida est, realmente, ocorrendo a mensurao que era esperada. A aniise fatoriai, ainda que seja um procedimento complexo, exigindo inclusive o emprego de computador, um caminho fecundo na pesquisa de construtos, pois mostrar quais os testes que compartilham da varincia comum e, assim, medem o mesmo construto. A pesquisa das cargas do mesmo fator (Brown, 1970), no contedo comum dos testes, possibilitainferir sobre a natureza do construto e at mesmo pode levar 2 identificao do fator. A anlise fatorial permitir verificar em que medida cada teste est saturado pela varincia comum e em que medida os seus escores dependem da varincia especfica. A proporo da varincia total dos escores do teste, que varincia comum, um ndice da validade de constmto. O presente mtodo visa a estabelecer a vai idade fato ri ai,^ denominao esta frequentemente usada como sinnimo de validade de construto. Outra abordagem possvel nessa categoria refere-se is concepes de Campbell e Fiske
(1959) para estabelecimento da validade convergente e da wiidade discriminante. A validao, segundo estes autores, processar-se-ia por meio de mtodos que visariam a estabelecer se duas tcnicas de medida (ou testes) diferentes estariam medindo, efetivamente, o mesmo construto; da serem esses mtodos chamados de convergentes. A vaiidnde congruente e a validade fatorial so exemplos tpicos do uso de mtodos convergentes. Um dos problemas centrais da anlise da validade de um constmto consiste em que os testes, alm de apresentarem uma alta correlao com outros testes que medem o mesmo construto, devem, tambm, demonstrar que no apresentam correlao com testes que medem claramente constmtos diferentes.. Sabese, por exemplo, que h uma associao entre inteligncia e criatividade; dessa forma, segundo o ponto de vista de Campbel e Fiske (1955), somente podemos aceitar um teste de criatividade se o mesmo no apresentar qualquer correlao com os resultados de testes de inteligncia, quando se ter certeza de que aquele construto est sendo medido e no se confunde com este outro. Esse , sem dvida, o ponto discriminante validao de construto, pois, conforme acentuou Brovm (1970), um teste somente viido para medir um determinado construto quando, sem sombra de dvida, independente de testes que medem outros constmtos perfeitamente defuiidos. Estudos relrcwnados a critrios - A natureza e o tipo de critriosque os escores de um teste predizem so indicativos do construto que o teste mede; isso posto, 6 perfeitamente possvel obter importantes informaks para o estabelecimento da validade de construto a partir dos dados de estudos sobre validade de critrio. Uma das maneiras de coletar evidncias sobre um construto 6 a partiir de escores de um teste que seja capia de separar grupos naturalmente existentes de gnipos organizados experimentalmente. Os escores para esse fim devem estabelecer a diferenciao entre p p o s . Suponhamos, a ttulo de exemplificao, que foi construdo um teste para identificar criatividade literria. Os itens desse teste devem ter sido elaborados de forma a identificar dois gNpos bent distintos: - os que so capazes de produzir textos de valor artstico nos vrios setores da literatura e aqueles que apenas possuem o domnio da lngua, como qualquer pessoa comum. O instrumento assim construdo teria validade de critrio (concorrente), o que representa importante informao para a caracterizao do construto. Uma outra abordagem, ainda segundo essa perspectiva, seria a formao de dois gnipos distintos com base nos escores do teste (quartil superior e inferior, por exemplo) e o estabelecimento das caractersticas de cada um aesses grupos, o que permitiria estabelecer uma defmio, to completa quanto possvel, sobre a natureza do construto. Destaca-se, nessa categoria, o mtodo baseado no emprego de coeficientes de validade, O qual consiste em verificar o xito de um instrumento na predio de um determinado comportamento. Um teste de aptido escolar deve ser um bom preditor do desempenho acadmico, pois h uma clara associao entre essas duas variveis. Ora, na medida em que isso ocorre, o teste critrio estaria medindo se o construto realmente aptido escolar. Estudos experimentais - Outros mtodos usados para determinao da validade de construto exigem a manipulao de algumas variveis e a observao dos efeitos conseqentes nos escores do teste. Tomemos o exemplo da ansiedade, conforme a colocao de Brown (1970). Os estudantes, em poca de exames, costumam demonstrar um aumento na sua ansiedade. A ansiedade durante a realizao de um teste refletiria medo de fracasso no exame e o comprometimento do auto-conceito da pessoa. A partir dessa definio de ansiedade, pode-se estabelecer a hiptese de que o desempenho no exame inversamente correlacionado i ansiedade durante a realizao de um teste, se o teste for de grande importncia para a pessoa Igualmente, pode-se hipotetiiar que ansiedade e exame no se correlacionam, se o teste for estruturado de forma a no constituir umn ameaa ao indivduo. Se, nesse contexto, os escores num teste de ansiedade no apresentarem relao de predio com os escores de um exame, ter-se-ia, ento, evidncia de que o teste mede realmente o construto ansiedade. Um conceito de grande importncia em psicometria - o de fidedignidade - pode ser usado
41
no estudo da validade de construto (Cronbach e Meehi, 1955) Se o construto estabelece que o trao a ser medido grandemente estvel ao longo do tempo e resiste a mudanas, o coeficiente de estabilidade do teste ser um indicador do construto que foi hipotetizado. Se o construto estabelece que os escores, em certas circunstncias, aumentam com a idade, na medida em que isso constatado, tem-se uma prova davalidade de construto de instrumento. Estudos de generalizabilidade: mtodo do rnultihnp-multimetodo - Os estudos de gene raiizabilidade so aqueles em que o teste, cujo construto se deseja validar, analisado sob diferentes condies, como, por exemplo, a aplicao do instrumento a diferentes amostras da populao, a utilizao de mtodos diversos na sua aplicao etc. A abordagem mais freqentemente utilizada para estudos desse tipo o da matriz do multitrao.multimtodo, conforme a proposta de Campbell e Fiske (1959). Esses autores estabeleceram algumas condies fundamentais para P sucesso de um processo de validao. Essas condies no se restrigem apenas i validade de construto, incluindo, tambm, a verificao da validade preditiia e concorrente. Um teste uma unidade trao-mtodo (Campbell e Fiske, 1959), ou seja, um teste mede determinado trao usando um nico mtodo. O interesse, portanto, no processo de validao, centra-se no conhecimento das contribuies relativas do trao e do mtodo para O escore do teste, o que obriga a estudar mais de um trao e mais de um mtodo. Isso significa que se deseja, na verdade, estabelecer a ialidade convergente e a validade dismminante. A validade convergente ser determinada por intermdio da correlao entre os m e m s trdps medidos por difrentes &todos, esperando-se que essa correlao seja significantemente alta. A validade discriminnnte, por sua vez, ser estabelecida comprovandese que diferentes traos, mesmo quando medidos pelo mesmo metodo, no possuem uma alta correlao. A Tabela 1.0 apresenta uma matriz relativa ao emprego do multimio-multimtodo, em que temos trs traos hipotticos (A, B, C) medidos por trs mtodos diferentes (1, 2, 3), que geram nove variveis separadas. Oumais claramente, a ttulo de exemplifica?+o,os traos seriam: - compreenso de textos, raciocnio abstrato e capacidade de identificar elementos secundrios numa informao, traos esses que seriam medidos por um teste de papela-lpis, um teste individual e uma escala de classificao. O mtodo pode ser usado para o estudo de n traos, usando m mtodos, no havendo necessidade de n = m. O nmero de traos igual ao nmero de mtodos, no exemplo citado, apenas por convenincia na discusso da metodologia. Os coeficientes de correlao apresentados na Tabela 1.0 representam o grau de associao entre trs variveis (A, B, C), medidas por trsmtodos diferentes (1,2,3). Os escores para cada uma das variveis so correlacionados com os escores de cada uma das outras variveis, independentemente do mtodo pelo qual os escores foram obtidos. Os valores na diagonal da matriz completa - 089; 0,89; 0,76; _._ . . .;O,W, 0,92; 0,85 -representam asfidedignidadesdas medidas, valores esses que representam os resultados da medida do mesmo trao pelo mesmo mtodo: portanto, so os valores monotrap-monomtodo. Os tringulos representados por linhas cheias, a o longo da diagonal da matriz compieta, contm coeficientes que do a relao entre as medidas de diferentes vmi<wis pelo mem mtodo, so, pois, valores heterohap-monomtodo. Considerandese que o mesmo mtodo foi usado para a medida de diferentes variveis, as propriedades do mtodo do origem a uma varincia comum para as diferentes variveis, na medida em que as propriedades do mtodo concorrem para a varincia sistemtica quando variveis individuais so mensuradas. Os tringulos em linhas interrompidas contm coefEientes de correlao entre medidas de diferentes variveis obtidas por mtodos diferentes; dessa forma, so valores heteromoheterorntodo. As diagonais entre esses tringulos apresentam os coeficientes &. correlao entre as medidas da mesma varivel por diferentes mtodos e so meficientes de validade (validade convergente). Esses valores em diagonal devem ser substanciais, porque refletem a correlao entre as mesmas variveis medidas diferentemente. A varincia comum que resulta, em virtude das semelhanas nos mtodos, afetar o tamanho desses cceficientes na medida em que os
42
mtodos tm propriedades iwais e ihes so oferecidas oportunidades de afetar as medidas de maneira sistemtica.
TABELA 1.0.
Matriz mdtitmo-muitimtodo, segundo CampbeU e Firdte (1959)
Mtodo 1 Trao
Mtodo 2
Mtodo 3
Ca
A3
B3
Ai
0,8Y
61
Ci
Ai
Ba
c 3
Ai
43
20 - as medidas de uma varivel devem apresentar uma correlao mais estreita com medidas do mesmo tipo, e que foram ,obtidas por um outro mtodo, do que com medidas de outro tipo que foram estabelecidas pelo mesmo mtodo. Os coeficientes de validade para unia certa varivel devem, assim, ser maiores do que os coeficientes para a mesma varivel nos tringulos delimitados por linhas contnuas; 3? - o coeficiente de validade para uma determinada varivel deve ser maior do que a correlao entre as medidas dessa varivel e as medidas de todas as outras variveis, obtidas por qualquer outro mtodo. Um coeficiente de validade, desse modo, ser maior do que os corres. pondentes coeficientes na mesma linha e coluna no interior do tringulo representado por linhas interrompidas; 40 - se os mesmos mtodos ou mtodos diferentes forem usados, as magnitudes dos coeficiemtes para as correlaes entre diferentes variveis devem ter a mesma configurao. Se a primeira condio for satisfeita, os mtodos possuem validade cvnvergente: - concordncia significativa entre medidas do m e m o tipo com diferentes mtodos. A concretizao dessa condiqo no suficiente para satisfazer o processo de validao. necessno que a segunda e a terceira condio tambm ocorram. Se ambas ocorrerem, dir-se- que as medidas tm ynlidade dism'rninante. preciso, no caso das condies estabelecidas por Campbell e Fiske (1959), considerar a fidedignidade dos mtodos, pois se ocorrer a falta desse atributo, a validade discriminante ser afetada. A fidedignidade, na presente abordagem, refere-se i concordncia entre duas medidas do mesmo trao usando o mesmo mtodo enquanto que a &lidade 6 defmida em temos da concordncia entre duas medidas do mesmo trap usando diferentes mtodos. Assim sendo, cumpre ressaltar que a diferena fundamental entre fidedignidade e vaiidade est na simiiaridade dos mtodos de medida. A quarta condio apresentada por Campbeii e Fiske (1959) irrealista (Magnusson, 1967) e impossvel de ser obedecida rigorosamente. Se fosse seguida, a validade discrimiiante dificilmente seria estabelecida, em face da dificuldade de julgar o efeito da falta de fidedignidade em matrizes complexas, com inmeras variveis, como exigemosestuaos de validao de construtos
REFERENCIAS BIBLIOGRAFICAS
BROWN, F.G. (1970) fiineiples of Edumtbnal and Psychobgical Testing. The Dryden Ress Inc. Hinsdale, Iliinois. CAMPBELL, D. T. e FISKE, D. W. (1959) Convergent and discriminant validation by the multitrait-multimethod matrix. k'sychologicd Bulletin, 59. CRONBACH, L. J. e MEEHL, P. E. (1955) Construct validity and psychological tests. pSVcho10gicd Bulletin, 52. KERLINGER, F.M (1973) Foundatwns of Behavwral Research. Second edition. Holt, Rinehart and Winston, Inc. Nova Iorque. MAGNUSSON, D. (1967) Test Theoiy - Addison-Wesley Publishing Company. Reading, Massachusetts. S A X , G . (1980) Pnnciples of educationatal and psychobgial mtnsurement and evaiuatim. 2 ed. Wadsworthl Publishing Company. Belmont. Caiifomia.
44