Você está na página 1de 9

Gráfico de dispersão – Índice de correlação

Correlação = duas coisas que tem interferência uma na outra, se correlacionam, tem influência
entre si. Quando você tem uma, você tem outra. Quando não tem uma, não tem outra.

Exemplo: - Cor de cabelo x QI = fenômenos que não se correlacionam.

- Consumo de sorvete x afogamentos = fenômenos que se correlacionam

No verão, há mais consumo de sorvete, e mais afogamentos. De forma que os dois


fenômenos se correlacionam. É diferente de causalidade!!!

Portanto, estarem correlacionadas, não significa dizer que uma coisa causou a outra. Apenas
indica que quando uma aumenta, a outra também, ou quando uma diminui, a outra
também.

Outro exemplo:

Consumo de queijo x número de divórcio. Estão correlacionadas em pesquisa recente, embora


não se saiba o motivo.

Outros exemplos:

Nota de prova x presença em aula.

Nota de prova x consumo de caneta.

Nota de prova x concentração na aula.

Nota da prova x horas de estudo.

Nota Horas de estudo


2 1
5 6
9 12

O gráfico é uma reta ascendente. Uma correlação positiva. O símbolo é uma letra R. Quanto
mais horas se estuda, maior a nota. Dois fenômenos que vão por mesmo lugar!!! Da mesma
forma, quem menos come, menos peso tem. O índice de correlação é próximo de +1.

Obs. Numa pesquisa desta (horas de estudo), tiram-se pessoas que têm algum prejuízo, como
um quadro de TDH, demência, etc.

Outro exemplo:

Nota Vezes que usou o celular na aula


9 2
5 7
2 15
O gráfico é uma reta decrescente. É uma correlação negativa. Significa que os fenômenos tem
correlação entre si, só que neste caso, ao contrário do anterior, não vão para o mesmo lugar,
mas para lugares opostos. O índice de correlação é próximo de -1.

Outros exemplos:

Quanto menor a temperatura x mais roupa eu uso.

Quanto menos dinheiro x mais dívidas eu tenho.

Quanto mais estudo x menos eu durmo.

CORRELAÇÃO PRÓXIMA A ZERO

Uma coisa não está relacionada a outra. É o exemplo de cor de cabelo x QI. Ou:

Altura x nota da prova. No gráfico, não há reta, crescente ou decrescente. Nesta correlação,
pode aparecer uma reta na horizontal  3 notas diferentes com pessoas na mesma altura. Ou
uma reta na vertical  3 alturas diferentes que tiraram a mesma nota.

Ou se tiver vários pontinhos espalhados, correlação próxima a ZERO!

NOS TRÊS CASOS (RETA NA HORIZONTAL, VERTICAL, PONTOS ESPALHADOS), os fenômenos


não estão relacionados, os dois fenômenos não têm correlação.

Os índices de correlação nos testes darão um número entre -1 e +1. Quanto mais perto ele
der do +1, significa que os fenômenos estão mais correlacionados, há uma forte correlação
positiva, caminham para o mesmo sentido.

Mais perto de -1, a correlação é negativa, decrescente. Um fenômeno vai para um lado, ou
outro vai para o outro.

Mais perto de ZERO, não há correlação.

A correlação é sempre entre dois fatores.

ANÁLISE FATORIAL

Fatores são partes, características, determinantes de um mesmo fenômeno.

Ex. 1: Quais fatores compõem a inteligência?

Raciocínio, memória, percepção, linguagem, raciocínio numérico, raciocínio espacial, etc.

Ex. 2: Qualidade de vida de crianças.

Fatores: sociabilidade, saúde, escola, família, etc.

No ex. 2, estabeleço 5 perguntas para cada fator. Total de 20 perguntas na pesquisa.

De um modo geral, se a criança está bem com sua família, ela responderá coisas parecidas
dentro das perguntas referentes à família. Exemplos: Quanto você se sente bem na presença
da família? O quanto você se diverte com sua família? Você pode conversar com as pessoas da
sua família? Assim, não faz sentido que ela responda que é horrível o tempo que ela passa com
a família, e para outras questões ela diga o contrário. Se a criança não está bem com a família,
faz sentido que as perguntas sejam respondidas todas no mesmo sentido, dentro de um dos
fatores determinados na pesquisa. O índice de correlação sempre utiliza dois fatores (duas
respostas à pesquisa).

Portando, a análise só pode ser feita de 2 em 2. Portanto, vai se avaliar, por ex., a pergunta
1x2, 1x3, 1x4...1x20. Depois 2x3, 2x4, 2x5...2x20. Depois 3x4, 3x5, 3x6....3x20, e por aí vai,
até se correlacionarem todos os fenômenos. Isso se chama MATRIZ DE CORRELAÇÃO.

Neste exemplo, só posso fazer a correlação de uma pergunta com outra pergunta.

Agora, tomando-se o exemplo dos fatores, faz sentido que todas as perguntas relacionadas à
família sejam correlacionadas, e tenham índice de correlação próximo a +1. Se ela está feliz
com a família, as respostas às perguntas serão semelhantes.

Quando relacionar as perguntas de um grupo com outro, faz sentido que também devam estar
correlacionados, pois, embora estejam em classificações diferentes, fazem parte de uma
categoria maior: qualidade de vida. No entanto, não será tão igual, pois na escola, por ex.,
pode ser que as coisas não estejam tão boas como na família. Portanto, não faz sentido que a
correlação seja próxima a zero, nem que seja negativa, pois nunca serão opostas. Pode dar 0,5,
ou 0,4... não faz sentido que seja 0,1. Como também não faria sentido que alguém tivesse um
excelente raciocínio e uma péssima memória. Não se raciocina sem resgatar informações de
sua memória.

TESTES PSICOLÓGICOS

Como se sabe, a Psicometria usa modelos matemáticos para avaliar processos psicológicos,
através de testes psicológicos.

O teste psicológico mede um fenômeno psicológico. Ex. teste de personalidade, inteligência,


atenção, índice de felicidade.

- Toda medida TEM ERRO!!! O erro é inevitável. O erro deve, no entanto, ser o menor
possível.

Não tendo como fugir do erro, o objetivo é chegar no menor erro possível. Eliminar o erro é
impossível. Deve-se saber o quanto de erro há em uma medida.

DECORAR:

- O TESTE PSICOLÓGICO é um procedimento SISTEMÁTICO usado para coletar amostras de


COMPORTAMENTOS RELEVANTES e COMPARAR ESSAS AMOSTRAS de acordo com NORMAS.

Se todo teste é usado para medir um fenômeno psicológico, a primeira pergunta que se faz é
se o teste mede aquilo a que se propõe medir. Ex. o teste para medir memória não pode medir
atenção.

1) Será que estou medindo o que eu disse que estou medindo?

- Estudos de validade

2) Quanto de erro? O resultado é confiável? O teste é preciso?

- Estudos de fidedignidade

3) Como eu aplico o teste? Como corrijo? Como interpreto?

- Normatização.
1) ESTUDOS DE VALIDADE (V=3C  CONTEÚDO, CRITÉRIO, CONSTRUTO)

Existem três tipos: conteúdo, critério e construto.

Esses três estudos de validade têm que ser feitos nessa ordem: conteúdo, critério e construto.
Isso vale para novos testes, ou testes importados de outros países, uma vez que as diferenças
culturais tornam obrigatórias as adaptações de testes trazidos de fora.

1.1) VALIDADE DE CONTEÚDO

É um estudo teórico, não prático. Nada na psicologia pode ser extraído da cabeça de alguém.
Não existe, em ciência alguma, “vozes na minha cabeça”. Ou melhor dizendo, tudo deve ser
extraído das teorias, dos textos.

Ex. criação de teste sobre a motivação sexual em pessoas acima de 60 anos. Pois bem,
primeiramente, deve ser pesquisado na literatura acadêmica e científica*, tudo sobre
motivação, motivação sexual, motivação sexual em idosos acima de 60 anos, fazendo uma
vasta busca bibliográfica dentro da literatura científica, elaborando a parte teórica do teste.
Neste caso, irá escrever, ex., 60/70 páginas DE TEORIA sobre aquele fenômeno – definição
conceitual – todo o referencial teórico do fenômeno. A isso se dá o nome DEFINIÇÃO
CONCEITUAL.

*sempre literatura recente, DOS ÚLTIMO 5 ANOS.

DEFINIÇÃO OPERACIONAL

Que perguntas vou fazer para o entrevistado para investigar a motivação sexual de alguém?

Frequência?

Parceiros?

Tipos de prática?

Portanto, a definição operacional diz respeito às perguntas necessárias à investigação do


fenômeno psicológico proposto no teste psicológico. Essas perguntas serão buscadas na
LITERATURA.

AVALIAÇÃO DE ESPECIALISTAS E JUÍZES

Juízes: pessoas que dominam o assunto que está sendo avaliado. Profissionais especialistas e
com grande experiencia na área que estou fazendo o teste. Ex. geriatras muito experientes,
psicólogos que trabalham com terceira idade, com livros publicados, psiquiatra que trabalham
com idosos, etc.

AVALIAÇÃO QUALITATIVA, e não quantitativa. Os juízes irão analisar a doutrina utilizada e as


perguntas elaboradas, dando seu parecer acerca das questões e parte teórica. Neste
momento, o pesquisador irá reavaliar o trabalho de acordo com os apontamentos dos
especialistas. É feita, assim, uma revisão das perguntas e teorias, baseada na opinião dos
juízes.

TESTE PILOTO

Saber se o teste é factível, executável, se na prática dá certo. Escolhe-se uma quantidade


pequena de pessoas para verificar, na prática, se o teste é viável.
Ex. será que é possível perguntar para uma senhora de 60 anos quantas vezes ela faz sexo por
semana? O teste piloto dirá.

No teste de qualidade de vida feito pela professora, uma das perguntas era: o quanto você
está satisfeito com tempo que você passa com os membros da sua família? Na prática, a
professora percebeu que as crianças não entendiam a pergunta, pois não sabiam o significado
de “membros”. Então, ela substituiu por “pessoas”. Neste momento, tem que voltar para os
juízes, dizendo que teve que mudar esse detalhe, e eles aprovam a alteração, voltando a fazer
novos testes com outras crianças com a nova palavra.

Assim, ENCERRADOS ESTÃO OS ESTUDOS DE VALIDADE DE CONTEÚDO.

1.2) VALIDADE DE CRITÉRIO

Estudo prático. Ao contrário do conteúdo, não há teoria, e sim a aplicação nas pessoas, para
saber se o teste é bom. Uma quantidade consideravelmente boa de pessoas. Calcula-se
quantas pessoas serão necessárias, dependendo do fenômeno. A estatística dirá a quantidade
ideal.

Há 5 tipos de validade de critério (o SATEPSI1 exige ao menos 2):

1 – Critério concorrente

Uma avaliação concorrente é uma comparação com outro teste que mede a mesma coisa. Por
vários motivos, pode ser criado um novo teste para medir a mesma coisa. O teste de
referência seria o padrão Ouro (o melhor). Sempre deve pegar o melhor teste para comparar.
O SAPESI diz quais são os melhores testes para se avaliar determinado fenômeno. Portanto,
são dois testes que medem o mesmo fenômeno.

Ex. teste padrão ouro de inteligência é o Wisc. Teste padrão ouro de personalidade é o
Rorschach.

Obs. Caso o teste seja completamente novo, não há como se usar esse critério.

Os testes tem que ser aplicados no mesmo momento, com as mesmas pessoas. Os resultados
devem ser estatisticamente iguais. Caso não tenham o mesmo resultado, significa que o teste
avaliado não é bom, pois ele foi comparado a um teste Ouro, ou seja, comprovadamente
eficaz.

O padrão Ouro é o melhor escolhido, o que não quer dizer que ele não possui erro. Todo teste
tem erro.

A correlação deve estar, portanto, perto de +1. Ou seja, estatisticamente iguais.

2 – Critério convergente

São fenômenos que caminham próximos. O teste analisado é comparado com outro teste que
avalia um fenômeno parecido. Ex. raciocínio, memória, inteligência.

Os resultados não têm que ser estatisticamente iguais, mas próximos.

O resultado seria algo em torno de 0,4; 0,5; 0,6 até 0,7. O resultado é intermediário. Não pode
ser perto de ZERO ou negativo, para o teste ser bom.

1
Sistema de Avaliação de Testes Psicológicos
3 – Critério divergente

Divergentes são fenômenos opostos. Exemplos: depressão x índice de felicidade. Depressão x


qualidade de vida. TEA x desenvolvimento típico.

O teste a ser avaliado deve ser contraposto a um teste de fenômeno oposto.

O resultado da comparação será próximo de -1.

4 – Critério discriminante

Diferencia dois fenômenos. Um não tem nada a ver com o outro, não existe correlação.

Ex. compulsão alimentar x teste de memória.

QI x qualidade de relacionamento familiar.

O resultado seria próximo a ZERO. Caso desse outro número, por ex., der +0,8, ou -0,8;
significa que o teste está errado.

Na PROVA, a professora irá perguntar: o que o resultado -0,8 diz sobre os fenômenos?

A resposta deve ser: que eles estão relacionados. Que enquanto um aumenta, o outro
diminui. NÃO RESPONDA QUE O TESTE ESTÁ ERRADO!!!

Do ponto de vista teórico, isso faz algum sentido? O que significa?

A resposta deve ser não, e significa que o teste está errado.

5 – Critério preditivo

Verificar se o teste tem a capacidade de prever um comportamento ou habilidade futura. A


intenção é prever algum quadro que precisa ser tratado, se é preciso encaminhar a pessoa
para algum tratamento futuro. Ex. uma possível depressão leve com previsão de um futuro
suicídio. Um teste de transtorno tem que prever se o futuro pode ser bom ou não, para
encaminhar.

Caso meu teste de depressão não fale nada sobre o futuro, não servirá para muita coisa. É
necessário verificar quem precisa ser tratado.

Em alguns testes isso será possível, outros não.

Ex. compulsão alimentar.

Imagine que alguns comportamentos na infância são considerados de risco, de forma a prever
uma compulsão alimentar no futuro. O teste precisaria ser preciso em prever um
comportamento de risco. Caso contrário o teste não serviria para prever a compulsão
alimentar.

Aplica-se o teste hoje e no futuro, irá verificar se o teste conseguiu prever o comportamento.

Ex. teste de rastreio de memória para prever um quadro de demência (esclerose múltipla,
Alzheimer). Acompanha-se os testados e verifica quantos desenvolveram demência. Caso
tenha previsto, o teste pode ser aplicado e resolveu um número grande problemas, evitando
possivelmente quadros de demência. A correlação seria positiva.
1.1)VALIDADE DE CONSTRUTO

É a junção da validade de conteúdo com a validade de critério e aplicação da análise fatorial.


No final, o objeto é levar o teste até a validade de construto.

REVISANDO...ESTUDOS DE VALIDADE

Validade de conteúdo = parte teórica

Validade de critério = parte empírica (prática, aplicação)

Validade de Construto...é a JUNÇÃO DAS DUAS COISAS

2) ESTUDOS DE FIDEDIGNIDADE

Medir o QUANTO DE ERRO que tem em um determinado teste. Saber se o resultado é


confiável, preciso, estável.

5 tipos de estudo de fidedignidade

2.1) TESTE RETESTE

Testa em 2 tempos ou 3 tempos. O resultado deve ser igual, no dia 1, no dia 2, ou no dia 3
(quando houver), num intervalo de tempo curto (cerca de 30 dias, dependendo dos
fenômenos) nas mesmas pessoas. Comparando os resultados, o teste de correlação de ser
bem próxima de +1. Se o teste der a mesma pontuação nos 3 dias testados, significa que o
teste é estável ao longo do tempo. Um teste que conclui pela compulsão alimentar num dia, e
em 10 dias conclui que não, é um teste não confiável, não estável, infiel.

Muito espaçamento é perigoso, pois pode ser que o fenômeno mude, como no caso de
depressão. Caso em 6 meses eu reavalie a pessoa e o teste der diferente, o teste é inválido ou
a pessoa curou a depressão?

2.2) TESTE DAS DUAS METADES

Divide-se o teste em duas partes, metades equivalentes.

No exemplo de qualidade de vida em crianças, supondo que o teste tem 16 perguntas:

4 perguntas de família 4 perguntas de escola


4 perguntas de socialização 4 perguntas de saúde

A fim de dividir esse teste em duas metades, ficaria:

1ª metade:

2 perguntas de família 2 perguntas de escola


2 perguntas de socialização 2 perguntas de saúde

2ª metade:

2 perguntas de família 2 perguntas de escola


2 perguntas de socialização 2 perguntas de saúde
APLICANDO NA MESMA PESSOA EM METADES EQUIVALENTES NO MESMO DIA! A MESMA
QUANTIDADE DE PERGUNTAS ACERCA DE TODOS OS FATORES.

O RESULTADO SERÁ IGUAL. O teste é coerente, está interligado. O teste possui pouco erro,
pois as duas partes, de forma equiparada, são equivalentes.

Nem todo teste é possível ser dividido de forma equivalente. Ex. teste de depressão com
vários fatores. Um dos aspectos da depressão é a perda de vontade. Uma das perguntas é
sobre a perda da vontade de sair com os amigos e a outra, a perda de vontade em levantar-se
da cama. As duas perguntas são sobre o mesmo fator (vontade), o que muda é a intensidade.
Não se levantar da cama é muito mais intenso, de forma que não é possível dividir o teste pela
metade, pois as duas metades não seriam equivalentes.

2.3) FORMAS PARALELAS/FORMAS ALTERNADAS

Teste psicológico com modelos diferentes. Professora fez um paralelo para explicar como
tendo seis turmas de Psicometria na faculdade, tendo que elaborar 6 modelos diferentes de
prova com a mesmo nível de dificuldade. Independente da prova que faria, o aluno tiraria nota
equivalentes.

Testes psicológicos com modelos diferentes. O teste é o mesmo, o que varia são as perguntas.
É muito comum em testes neuropsicológicos, testes de memória. O intuito é que, ao repetir o
teste, as perguntas sejam diferentes, já que o entrevistado se lembraria quais as perguntas
anteriormente feitas.

Então, aplica-se na mesma pessoa, o modelo A e o modelo B. A correlação tem que ser
próximo a +1. Formas paralelas, portanto, são como modelos de provas diferentes.

2.4) INTER JUÍZES / INTER AVALIADORES (INDICE KAPPA)

Imagine uma pessoa incapacitada de responder um teste. Neste caso, um profissional


responderia pela pessoa. Ex.: pessoas com demência, em surto psicótico, crianças pequenas,
TEA, etc.

Ex. criança com suspeita de TEA. O psiquiatra preenche o teste, o psicólogo preenche, o
pedagogo preenche. Todos os testes devem ter correlação e resultados iguais, positiva
próximo a +1.

Neste caso, há o problema dos próprios juízes. Os profissionais devem ter experiência no
fenômeno a ser avaliado. O psicólogo deve, no exemplo acima, entender de autismo.

Ou seja, o profissional deve ter conhecimento e experiencia no fenômeno analisado.

NA PROVA, lembrar que esse índice/coeficiente se chama Kappa!!! (não é Pearson nem
Spearman).

O índice Kappa pode ser utilizado em outros contextos. Geralmente, usa-se 3 ou 5 testes.
Quem for muito criterioso pode usar mais.

2.4) COEFICIENTE ALFA/ ALFA DE CRONBACH/ CONSISTENCIA INTERNA

Num único dia, na mesma pessoa, o mesmo teste é aplicado. O valor deve ser próximo a +1.
Ao contrário da análise fatorial, que analisa a correlação entre dois fatores, no coeficiente alfa
de Cronbach faz-se a correlação de todas as perguntas x todas as perguntas, gerando-se um
único resultado. A análise fatorial me dá uma matriz com múltiplos resultados.

Aqui, há um único número, que vai de 0 a 1. Tendo um alfa de Cronbach 0,8, o número é bom
para o teste, estando as perguntas estão altamente correlacionadas. Um bom número é acima
de 0,7.

Neste caso, não se avalia cada dupla de pergunta, mas o teste como um todo.

Importante salientar que a análise fatorial vem antes, de forma a quando chegar no alfa, já
tenham sido sanados os erros individualmente em cada dupla de perguntas.

3) NORMATIZAÇÃO

- Binet fez um teste de inteligência em ordem crescente de dificuldade, criou uma tabelinha.

Padronização

O teste tem padrão. É preciso aplicar, corrigir, interpretar, usar os equipamentos, tudo de
acordo com o manual.

Exceção: deficiências físicas, qualquer pessoa que tenha dificuldade auditiva, deficiência visual,
precisa estar de óculos, daltônicos, etc. Neste caso, deve ir atrás de estudos que fizeram uma
adaptação. Em alguns testes, a pessoa precisa escrever, se ela tem alguma deficiência motora,
o teste não poderá ser aplicado.

Normatização

Num teste de inteligência, uma criança acertou 20 de 30 questões, pode-se dizer se ela foi
bem ou mal? A resposta é depende. Uma criança de 6 anos e outra de 14 acertou também 20,
quem foi melhor? Novamente, a resposta é depende. Dependo do que é esperado para a
idade de cada um. Deve-se olhar as normas. No manual, há uma tabela com as normas, valores
de referência.

Os pontos brutos são a quantidade de respostas certas num determinado teste. Isso não diz
nada, não se pode interpretar o teste só com isso. Há que se saber o esperado. Quem aplica o
teste, vai consultar a tabela.

Pontos ponderados = percentil. A tabela vai pegar os pontos brutos e transformar em


ponderados. O resultado já é a interpretação do teste.

O percentil vai dizer quanto melhor está uma pessoa comparado com as outras da sua idade.
Dando percentil 90, quer dizer que a criança está melhor que 90% das crianças da sua idade. O
percentil 10 dita que a pessoa está melhor que 10% que as pessoas da sua idade. Logo, 90%
das crianças de sua idade estão melhor que ela.

Você também pode gostar