Escolar Documentos
Profissional Documentos
Cultura Documentos
para
Psicólogos
(que não gostam de números)
Copyright © desta edição:
ESETec Editores Associados, Santo André, 2007.
Todos os direitos reservados
Morais, P. R.
ISBN 85 88303 83 - 3
Estatística
para
Psicólogos
(que não gostam de números)
ESETec
2007
SUMÁRIO
Apresentação 7
arte
Par ara conhecer a Estatística 11
Para
te 1 – P
Capitulo 1 – Conceitos Básicos 13
– O que é Estatística 13
– População e amostra 15
– Tipos de variáveis 26
– Níveis de mensuração 28
– Fases do método estatístico 36
Capitulo 2 – Estatística Descritiva 42
– Descrevendo variáveis qualitativas 42
– Descrevendo variáveis quantitativas 45
– Descrevendo a simetria de um conjunto
– Descrevendo correlações 62
– Apresentação dos resultados: tabelas e gráficos 64
Capítulo 3 – Estatística Inferencial 67
– Teste de hipóteses 80
– Decisão e erro 84
– Nível de significância 87
– A escolha de um teste estatístico 89
– Testes de significância estatística 92
Par te 2 – P
arte ara empregar a Estatística 111
Para
Capítulo 4 – Psicologia, avaliação em psicologia e estatística: por
que esta união é fundamental? 113
Makilim Nunes Baptista
Capitulo 5 – Análise fatorial 123
Altemir José Gonçalves Barbosa
Capitulo 6 – Análise de dados com o computador: breve descrição
dos programas atualmente disponíveis 137
Marcos Aguiar de Souza e Israel Souza
APRESENTAÇÃO
fazer alguns dos cálculos, mas não sabia como usar (e interpretar) os
resultados de tais cálculos. A isso alguns dão o nome de “efeito papa-
gaio” – repete muito bem o que se ouve (ou “aprende”), mas não tem
qualquer critica sobre o que está repetindo.
Felizmente, mais tarde, tive a oportunidade de ter aulas de Esta-
tística não com um matemático ou estatístico, mas com um profissio-
nal ligado à área da saúde, na verdade um dentista. O Professor Neil F.
Novo, da UNIFESP, apresentou a mim e a muitos outros a Estatística
não como um amontoado de fórmulas, testes, jargões e conceitos pu-
ramente abstratos, mas como uma ferramenta bastante útil e também
fácil de ser utilizada.
No entanto, simplesmente dispor de uma ferramenta não é o
suficiente. Como qualquer ferramenta, a Estatística precisa ser
“manuseada”, da mesma forma que um martelo ou um alicate. Assim
como um marceneiro precisa saber utilizar suas ferramentas, quem vai
utilizar a Estatística também precisa conhecê-la. Imagine como ficaria
um armário se, no lugar onde deveriam ser fixados parafusos este
marceneiro martelasse alguns pregos. Lamentavelmente, quando o
assunto o é Estatística, parafusos são martelados e poucos se dão
conta disso. Quem não tem nenhum conhecimento da natureza da Es-
tatística ou dos parafusos não é capaz de notar qualquer diferença.
Atualmente, quem precisa utilizar a Estatística em sua vida pro-
fissional ou acadêmica não é mais obrigado a decorar fórmulas gigan-
tescas e saber aplicar tais fórmulas aos seus dados, embora este co-
nhecimento seja algo muito interessante e auxilia a compreensão dos
conceitos estatísticos. Com uma simples calculadora de bolso pode-se
aplicar, de maneira simples e rápida, fórmulas que permitem saber a
média e a dispersão de um conjunto de dados. Além disso, a
popularização dos recursos da informática associada à criação de di-
versos softwares estatísticos, tornou a utilização dos laboriosos recur-
sos da Estatística algo relativamente fácil. Testes estatísticos, com suas
fórmulas assustadoras, podem ser executados rapidamente com o au-
xílio do computador, bastando que os dados sejam introduzidos ade-
quadamente e que sejam dadas as instruções corretas.
Mas de nada adianta dispor de todos estes recursos quando
não se conhecem os conceitos básicos subjacentes. O computador
executa e apresenta os resultados, mas ainda cabe ao humano intro-
duzir os dados em um programa estatístico, dar as instruções a este
programa, entender e interpretar os resultados fornecidos pelo compu-
tador. Ou seja, o computador é somente um executor de cálculos e
nada mais. O mundo ainda precisa de pessoas que saibam interpretar
os resultados apresentados pelo computador.
-8-
Estatística para o curso de Psicologia
-9-
A segunda parte é composta por capítulos que abordam te-
mas mais específicos. O texto de Makilim N. Baptista aborda a uti-
lização da Estatística na Psicologia, mais exatamente na avaliação
psicológica. Na següência, o capítulo escrito por Altemir J. G. Bar-
bosa descreve um tipo de análise bastante utilizado em pesquisas
psicológicas e também na elaboração de instrumentos de avalia-
ção psicológica, a análise fatorial. E, para finalizar, Marcos A. de
Souza e Israel Souza apresentam e descrevem alguns dos muitos
programas de computador que podem ser empregados para o tra-
tamento estatístico de conjuntos de dados.
Espero que o conteúdo deste livro sirva tanto para mostrar
que a Estatística não é necessariamente só matemática, como tam-
bém auxiliar o leitor a compreender e aplicar melhor os conceitos
estatísticos necessários ao seu exercício profissional ou acadêmico.
Paulo R. Morais
Prof. titular do curso de Psicologia
da UNESC – União das Escolas Superiores de Cacoal
Parte 1
Para conhecer
a Estatística
I. Conceitos básicos
1. O QUE É ESTATÍSTICA?
- 14 -
Estatística para o curso de Psicologia
2. POPULAÇÃO E AMOSTRA
- 15 -
Paulo Rogério Morais
2.2 – Amostra
Independentemente de se pretender estudar características
de populações finitas ou infinitas, geralmente as pesquisas possuem
vários elementos que limitam, ou mesmo, impedem que seja
estudada toda a população. Limitações relacionadas ao tempo,
recursos econômicos e humanos, entre outras, fazem com que os
pesquisadores estudem apenas uma parte da população.
Esta parcela da população que é estudada recebe o nome
de amostra. Conceitualmente, uma amostra é um subconjunto
composto por um número limitado e conhecido de elementos
extraídos da população (o tamanho da amostra, isto é, o número de
elementos ou observações que a compõe, é representado por n –
minúsculo). Na grande maioria das vezes, tal subconjunto é estudado
com o objetivo de tirar conclusões que possam ser generalizadas
para toda a população que o originou.
Para que se possam generalizar as conclusões tiradas de
um pequeno grupo para toda a população, a amostra deve ser
representativa da população que a originou. Para tanto alguns
preceitos devem ser obedecidos:
1. Com base no conhecimento que o pesquisador possui acerca
das características tanto quantitativas quanto qualitativas da
população a proporção de tais características deve ser respeitadas
na constituição da amostra. Como exemplo, imagine a distribuição
por gênero entre os estudantes de Psicologia brasileiros. Vários
levantamentos têm demonstrado que nas universidades brasileiras,
algo em torno de 90% dos estudantes de Psicologia são do sexo
feminino e os cerca de 10% restantes são do sexo masculino. Uma
amostra com n=20, para ser representativa da população de
estudantes de Psicologia brasileiros, precisaria ser constituída por
algo em torno de 18 garotas e 2 rapazes.
- 16 -
Estatística para o curso de Psicologia
- 17 -
Paulo Rogério Morais
- 18 -
Estatística para o curso de Psicologia
- 19 -
Paulo Rogério Morais
- 20 -
Estatística para o curso de Psicologia
Amostra sistemática
Esta técnica de amostragem apresenta uma grande vantagem
sobre a técnica casual simples: não é necessário ter a identificação
de cada elemento da população para posterior sorteio. Mesmo assim,
o princípio da imparcialidade é mantido, pois o pesquisador não tem o
poder de “escolher” qual elemento irá compor ou não sua amostra.
Para se obter este tipo de amostra o pesquisador estabelece
uma regra, geralmente numérica, que ira obedecer para realizar a
seleção dos elementos que irão compor a sua amostra. O pesquisador
pode, por exemplo, estabelecer que ira coletar os dados de um a cada
cinco elementos. Desta forma, todo quinto elemento contado terá seus
dados coletados. Imagine um pesquisador que pretende fazer o
levantamento do tempo médio de espera de pacientes para serem
atendidos em uma clínica escola usando uma amostra composta por
25% dos pacientes que estão na lista de espera. Com os prontuários
de tais pacientes em mãos, o pesquisador pode coletar os dados de
um a cada 4 prontuários contados. A figura 1.1 ilustra este sistema:
Prontuário
23
Prontuário
22
Prontuário Prontuário
21 20
Prontuário
19
Prontuário
18 Prontuário
Prontuário
17 16
Prontuário
15
Prontuário
14
ProntuárioProntuário
13 12
Prontuário
11
Prontuário
10
Prontuário
Prontuário
9 8
Prontuário
7
Prontuário
6
ProntuárioProntuário
5 4
Prontuário
3
Prontuário
2
Prontuário
1
- 21 -
Paulo Rogério Morais
- 22 -
Estatística para o curso de Psicologia
Amostra de conveniência
Este tipo de amostra é composto por elementos que estão
facilmente disponíveis ao pesquisador. As amostras de conveniência
são tidas por muitos estatísticos como o exemplo clássico da
amostragem não-casual e fonte de amostras tendenciosas ou
enviesadas, por este motivo é alvo de sérias restrições.
No entanto, a utilização deste tipo de amostra é bastante
comum na área de saúde. Muitas pesquisas são feitas com pacientes
atendidos em um só hospital ou clínica e, não raro, estudantes são
usados como sujeitos controle. Além disso, algumas pesquisas na
área de saúde só são possíveis de serem realizadas quando são
utilizadas amostras que, a rigor, são de conveniência. Se um
pesquisador pretende avaliar aspectos familiares das famílias de
indivíduos esquizofrênicos, ele certamente não terá como listar todos
os elementos que compõem esta população para fazer um sorteio ou
estabelecer um sistema para selecionar os elementos de sua amostra.
Neste caso, o pesquisador poupara tempo, dinheiro e energia
buscando seus sujeitos em algum centro especializado em tratar esta
patologia ou em algum ambulatório de saúde mental. Mesmo dispondo
de todos os recursos necessários, o pesquisador jamais teria contato,
por exemplo, com indivíduos que possuem a doença, mas são
considerados excêntricos ou têm seus sintomas interpretados como
sinal de possessão demoníaca, encosto ou coisas do gênero.
Mas, mesmo trabalhando com amostras que são por definição
de conveniência, o pesquisador pode, e deve, empregar alguma técnica
- 23 -
Paulo Rogério Morais
- 24 -
Estatística para o curso de Psicologia
- 25 -
Paulo Rogério Morais
3. TIPOS DE VARIÁVEIS
- 26 -
Estatística para o curso de Psicologia
- 27 -
Paulo Rogério Morais
4. NÍVEIS DE MENSURAÇÃO
4.1 Quantificação
Dados arqueológicos indicam que a medição e a quantificação
há muito tempo fazem parte da vida do ser humano. Desde épocas
muito remotas, o ser humano já utilizava sistemas numéricos para
representar as características quantificáveis de informações relevantes
do seu dia-a-dia. Antes mesmo de existirem os símbolos numéricos,
outros recursos (coleções de conchas ou pedras, por exemplo) já eram
empregados com a finalidade de quantificar aspectos importantes para
a nossa espécie.
Conhecer e descrever a natureza somente em seus aspectos
puramente qualitativos é bastante útil, mas a informação que temos, a
partir de tal conhecimento, é bastante limitada e, muitas vezes,
controverso. Eu posso qualificar uma cidade como violenta só por que
presenciei ou fui vítima de algum ato violento nesta cidade, mas a minha
impressão pessoal pode não ser uma informação que deva ser
generalizada para toda a cidade. Saber que uma cidade é violenta é
uma informação bastante proveitosa, mas se tivermos dados
quantitativos que substanciem o porquê de tal rótulo para esta cidade,
certamente teremos maior conhecimento e poderemos fazer afirmações
menos vagas ou puramente emocionais acerca da realidade.
O conhecimento qualitativo de algo é melhor do que
conhecimento nenhum. Mas, se a esse conhecimento pudermos
acrescentar alguma forma de quantificação, teremos um
conhecimento mais refinado. Da mesma forma que para nossos
antepassados não deveria ser muito funcional saber somente que
possuía “muito” gado ou que dispunha de “pouca” comida. Assim
como nós, eles necessitavam de informações quantitativas acerca
de suas vidas. A quantificação de muitos aspectos da nossa vida foi
útil no passado e é uma condição necessária para os dias atuais.
Como afirmou o astrônomo Carl Sagan: “Ter medo da quantificação
equivale a renunciar aos nossos direitos civis (...)”.
Para as ciências, a quantificação oferece duas grandes
vantagens: a) índices numéricos possibilitam que os resultados de
uma pesquisa sejam apresentados com fineza de detalhes que não
seria possível de outra forma; além disso, b) a quantificação também
permite o uso de diferentes técnicas matemáticas, que são essenciais
para o desenvolvimento de teorias e na análise de dados de pesquisa.
A mensuração nada mais é do que regras empregadas para
atribuir números ou categorias aos elementos da natureza de forma
a representar numericamente seus atributos. Estas regras podem
- 28 -
Estatística para o curso de Psicologia
- 29 -
Paulo Rogério Morais
Nível Nominal
É a escala de mensuração mais simples e rudimentar, permitindo
somente a classificação dos elementos de acordo com algum de seus
atributos. Os valores numéricos ou outros símbolos só são utilizados
para classificar o elemento em diferentes categorias. Pode-se, por
exemplo, usar o número 1 para representar o diagnóstico de depressão
e o número 2 para representar o diagnóstico de ansiedade, como é
mostrado na tabela 1.1:
Tabela 1.1: Diagnósticos de pacientes atendidos em uma clínica-escola.
Sujeito Diagnóstico
João 1
Claudia 1
Pedro 2
Olavo 1
Ana 1
Marcos 2
Mara 2
- 30 -
Estatística para o curso de Psicologia
Nível Ordinal
Esta escala fornece um pouco mais de informação do que
a escala nominal, pois, além de informar que os elementos são iguais
ou diferentes entre si, também existe uma ordem de grandeza entre
os valores atribuídos à variável. Os elementos podem ser ordenados
em termos de “maior”, ou “melhor que”, e “menor”, ou “pior que”.
Desta forma, se atribuímos os seguintes códigos numéricos ao nível
de sintomatologia depressiva:
1 – sintomatologia leve
2 – sintomatologia moderada
3 – sintomatologia severa
E temos a seguinte situação:
- 31 -
Paulo Rogério Morais
Escala Intervalar
Nesta escala, são atribuídos valores numéricos para as
observações feitas e tais valores têm representação real e podem
ser submetidos à algumas operações matemáticas. A escala
intervalar tem como principais características:
• a existência de unidades constantes e intervalos fixos e
conhecidos entre as unidades;
• o ponto zero (ponto de início da mensuração) e a unidade de
medida são arbitrários.
Como exemplo, podemos citar duas escalas muito utilizadas
para a avaliação da sintomatologia de depressão, as escalas de
1
A comparação destas duas escalas foi utilizada somente para o exemplo, pois ambas possuem
diferenças relacionadas tanto ao conteúdo, objetivo e à forma de aplicação.
- 32 -
Estatística para o curso de Psicologia
Escala
Classificação Beck Hamilton
Não sintomático 0 -12 0-6
Sintomatologia leve 13 -20 7 - 17
Sintomatologia moderada 21 -25 18 -24
Sintomatologia severa 26 – 36 > 25
Tabela 1.4: Pontuação obtida por dois pacientes nas escalas de Hamilton e de
Beck para depressão
- 33 -
Paulo Rogério Morais
- 34 -
Estatística para o curso de Psicologia
Intervalar = 23 pontos
Nominal = deprimido
- 35 -
Paulo Rogério Morais
- 36 -
Estatística para o curso de Psicologia
- 37 -
Paulo Rogério Morais
- 38 -
Estatística para o curso de Psicologia
- 39 -
Paulo Rogério Morais
dos dados são feitas quase totalmente com a utilização deste recurso,
não exigindo do pesquisador conhecimentos acerca das fórmulas e
cálculos, muitas vezes complexos, que tanto assustam muitos
estudantes e até profissionais da Psicologia que necessitam utilizar
a estatística em seu trabalho.
- 40 -
Estatística para o curso de Psicologia
- 41 -
Paulo Rogério Morais
II - Estatística descritiva
- 42 -
Estatística para o curso de Psicologia
Quadro 2.1.
Número do prontuário Classificação
0001 Esquizofrenia
0002 Depressão maior
0003 Esquizofrenia
0004 Transtorno alimentar
0005 Esquizofrenia
(...) (...)
1.398 Depressão maior
1.399 Transtorno bipolar
1.400 Dependência química
Diagnósticos Freqüência %
Dependência química 397 28,4
Transtornos de ansiedade 280 20,0
Transtornos de humor 170 12,1
Esquizofrenia 141 10,0
Outros diagnósticos 253 18,1
Sem diagnóstico 159 11,4
Total 1.400 100
- 43 -
Paulo Rogério Morais
- 44 -
Estatística para o curso de Psicologia
Média aritmética
A média pode ser definida como o resultado da soma de todos
os valores de um conjunto, dividido pelo número de valores somados.
Ela representa o valor da variável que cada elemento do conjunto teria
se não houvesse variação, ou seja, se todas as observações da variável
tivessem o mesmo valor este valor seria igual à média.
O cálculo da média é bastante conhecido e simples, embora
a fórmula possa assustar quem não gosta de matemática.
- 45 -
Paulo Rogério Morais
Onde:
Σ = somatório
xi = valores individuais
n = número de valores somados (tamanho da amostra)
_
x = Σ xi
Símbolos: n
µ (letra grega mu) = média da população
–
x (xis barra) = média da amostra
Exemplo: Dados os seguintes valores dos tempos (em segundos)
que 10 indivíduos gastaram para executar uma tarefa manual:
- 46 -
Estatística para o curso de Psicologia
Mediana
n impar:
PMd= n + 1
2
n par:
P1 + P2
P1= n . P2= n + 2 PMd= ________
2 2 2
- 47 -
Paulo Rogério Morais
Onde:
P1 = primeiro posto
P2 = segundo posto
n = número de elementos ordenados
PMd = posto mediano
- 48 -
Estatística para o curso de Psicologia
Moda
Conceitualmente, a moda (Mo) é o valor da variável que
apresenta a maior freqüência, isto é, é o valor mais observado em um
conjunto. Pode-se fazer analogia da moda estatística com o que é
chamado de moda no dia-a-dia: diz-se que um corte de cabelo está
na moda por que a freqüência de observação deste tipo de corte é
alta em comparação com as outras possibilidades de cortes de cabelo.
Em alguns conjuntos de valores pode não haver moda
alguma ou mesmo existirem vários valores modais, como é mostrado
nos conjuntos a seguir:
Estaturas (em cm) de um grupo de estudantes:
Amostra A: 160, 160, 164, 165, 165, 165, 168, 172.
- 49 -
Paulo Rogério Morais
- 50 -
Estatística para o curso de Psicologia
2
Em situações de risco potencial e na impossibilidade de escapar, o rato tende a apresentar um
comportamento bastante peculiar, ficando completamente imóvel, com os olhos abertos, com tre-
mor da mandíbula, ranger dos dentes e sua respiração se torna irregular. Freqüentemente, faz-se
referência a este comportamento como freezing ou congelamento.
- 51 -
Paulo Rogério Morais
AMPLITUDE TOTAL
Está é a mais simples das medidas de variabilidade, e
também a mais fácil de ser calculada. É uma medida que vai informar
qual a diferença existente entre o maior e o menor valor do conjunto,
isto é, trata-se de uma medida que representa a maior variação
observada nos valores de um conjunto.
Sua fórmula é bem simples:
AT = V max – V m
Onde:
AT = amplitude total
Vmax = maior valor observado no conjunto
Vmin= menor valor observado no conjunto
Aplicando esta fórmula aos dados dos grupos controle e
experimental do exemplo acima, têm-se os seguintes resultados:
- 52 -
Estatística para o curso de Psicologia
DESVIO-PADRÃO
O desvio-padrão é a medida de variabilidade mais empregada
em trabalhos de pesquisa. É uma medida que possui diversas
propriedades que a torna uma medida muito útil para demonstrar a
dispersão dos valores de um conjunto.
Para entender melhor as propriedades que tornam o desvio-
padrão tão útil e interessante, bem como seu cálculo (uma fórmula
que, embora simples, assusta quase a totalidade dos estudantes e
também muitos profissionais de Psicologia), é interessante conhecer
outras medidas de variabilidade relacionadas ao desvio-padrão. Na
verdade, pode-se dizer que tais medidas são passos para se chegar
ao desvio-padrão.
Desvio médio
Se um dos inconvenientes da amplitude total é só considerar
os valores extremos, o desvio médio contorna este problema, pois
seu calculo envolve cada elemento que compõe o conjunto.
- 53 -
Paulo Rogério Morais
_
Σ__________
|xi - x |
DM =
n
Onde:
Σ = somatório
|xi – | = o valor absoluto da diferença de cada valor individual
x
em relação à média.
n = número de valores somados
Por exemplo, o desvio médio do grupo controle é
apresentado a seguir:
xi xi – x |xi- x |
125 125 – 120 = 5 5
113 113 – 120 = -7 7
105 105 – 120 = -15 15
137 137 – 120 = 17 17
Σ 0 44
44
DM Grupo controle = = 11 segundos
4
Como já foi abordado, uma das características da média é
que a soma dos desvios de cada elemento é sempre igual a zero.
Por isso, o cálculo do desvio médio vai utilizar o valor absoluto dos
afastamentos (| |), isto é, o sinal negativo dos desvios é desprezado.
O desvio médio vai expressar a média dos afastamentos de
todos os elementos em relação à média do conjunto. Se todos os
sujeitos que compõe o grupo controle estivessem afastados
igualmente da média, ou teriam ficado em freezing 11 segundos a
mais ou 11 segundos menos do que a média. Mas na verdade não é
isso que se observa, um dos sujeitos ficou em freezing 7 segundos a
menos do que a média do grupo, outro ficou 17 segundos a mais em
freezing, e assim por diante.
Este é uma desvantagem do desvio médio: ele iguala os
desvios de todos os elementos, não diferenciando desvios pequenos
de desvios grandes.
VARIÂNCIA
A variância é uma medida de variabilidade que utiliza todos
os elementos do conjunto em seu cálculo, com uma grande vantagem
sobre o desvio médio: é uma medida que considera o tamanho de
cada afastamento.
- 54 -
Estatística para o curso de Psicologia
_
Σ (xi -
_________x)
2
s2 =
n
Onde:
Σ = somatório
(xi – x )2 = o valor da diferença de cada valor individual em
relação à média elevado ao quadrado.
n = número de valores somados
xi xi - x (xi- )2
125 125 – 120 = 5 52= 25
113 113 – 120 = -7 -72=x49
105 105 – 120 = -15 -152= 225
137 137 – 120 = 17 172= 289
Σ 0 588
2 2
s Grupo controle = 588 = 53 segundos
4
Sua fórmula é muito parecida com a do desvio médio, a
diferença é que para se chegar à variância deve-se elevar cada
afastamento ao quadrado, ao invés de considerar seu valor absoluto.
Com isto, elimina-se o problema do resultado nulo da soma dos
desvios e atribuem-se valores pequenos para desvios pequenos e
valores maiores para os desvios grandes. No entanto, o resultado é
expresso em unidades ao quadrado que, na maioria das vezes, não
tem uma tradução real. O que significa dizer que o afastamento dos
elementos em relação à média é de 53 segundos ao quadrado? Por
causa desta característica, a variância tem pouca utilidade para a
descrição da dispersão de conjuntos de valores.
Mas, com o valor da variância em mãos, podemos finalmente
chegar ao desvio-padrão. Para tanto basta calcular a raiz quadrada
positiva da variância, como mostra a fórmula abaixo:
__________
√
_
Σ (xi - x )2
_________
s=
n
Σ = somatório
(xi – x )2 = o valor da diferença de cada valor individual em
relação à média elevado ao quadrado.
n = número de valores somados
- 55 -
Paulo Rogério Morais
68 %
95 %
99,7 %
_
-3 DP -2 DP -1 DP X +1 DP +2 DP +3 DP
Valores de xi
- 56 -
Estatística para o curso de Psicologia
COEFICIENTE DE VARIAÇÃO
Como foi citado anteriormente, o valor do desvio-padrão
indica a homogeneidade dos valores de um conjunto, sendo que um
3
Dada a fórmula do erro padrão (DP dividido pela raiz quadrada de n), DPzões são apresentados
como se fossem DPzinhos.
- 57 -
Paulo Rogério Morais
Tabela 2.4 – Médias de dois grupos para a idade e a pontuação obtida na escala
WAIS
Grupo Idade (média±DP) WAIS (média±DP)
Controle 31± 7 103 ± 15
Pacientes 46 ± 9 99 ± 8
- 58 -
Estatística para o curso de Psicologia
Intervalo interquartil
Como foi citado, o desvio-padrão só representa adequadamente
a dispersão de conjuntos de dados com distribuição simétrica. Para
descrever a variação de um conjunto de valores com distribuição que
não se comporta sob uma curva de Gauss, o intervalo interquartil é
uma medida bastante útil.
O intervalo interquartil compreende a distância entre o primeiro
e o terceiro quartil. Para compreender o que é um quartil, é necessário
conhecer as separatrizes, que nada mais são do que valores que dividem
um conjunto ordenado de valores em n partes de igual tamanho.
As principais separatrizes são:
Quartil (Q) à divide uma distribuição em quatro partes iguais,
cada uma com ¼ dos valores do conjunto.
Decil (D) à divide a distribuição em dez partes iguais, cada uma
com 1/10 dos valores do conjunto.
Centil ou percentil (P) à divide uma distribuição em cem partes
iguais, cada uma com 1/100 dos valores do conjunto.
- 59 -
Paulo Rogério Morais
Valores 02 03 05 06 08 10 10 11 12 14 16 21 26 28 29
Postos 1o 2o 3o 4o 5o 6o 7o 8o 9o 10o 11o 12o 13o 14 o 15o
Para localizar o primeiro (Q1) e o terceiro (Q3) quartis basta
aplicar as seguintes fórmulas:
- 60 -
Estatística para o curso de Psicologia
- 61 -
Paulo Rogério Morais
Conjunto A: 1, 2, 2, 3, 3, 3, 4, 4, 5
Conjunto B: 1, 1, 1, 1, 1, 2, 4, 6, 9
4
A
3
FREQÜÊNCIA
0
0 1 2 3 4 5 6
VALORES OBSERVADOS
- 62 -
Estatística para o curso de Psicologia
B
4
FREQÜÊNCIA 3
0
0 1 2 3 4 5 6 7 8 9 1 1
VALORES OBSERVADOS
- 63 -
Paulo Rogério Morais
4. DESCREVENDO CORRELAÇÕES
- 64 -
Estatística para o curso de Psicologia
Coeficiente de Interpretação
correlação
-1,00 Correlação negativa perfeita
-0,75 Correlação negativa forte
-0,50 Correlação negativa moderada
-0,25 Correlação negativa fraca
0,00 Ausência de correlação
+0,25 Correlação positiva fraca
+0,50 Correlação positiva moderada
+0,75 Correlação positiva forte
+1,00 Correlação positiva perfeita
- 65 -
Paulo Rogério Morais
onde:
r = coeficiente de correlação de Pearson
n = número de pares de medidas
x = total da soma dos valores da variável x
y = total da soma dos valores da variável y
ou
Coeficiente de correlação de postos de Spearman
6ΣD2
__________
rs = 1 -
n(n2 – 1)
onde:
rs= coeficiente de correlação de postos de Spearman
D = diferença entre os postos de cada elemento amostral nas
duas variáveis
n = número de pares de medidas (tamanho da amostra válida4)
4
Nas amostras de estudos correlacionais são considerados somente os elementos amostrais que
têm avalições na variável x e na variável y. Elementos com avaliação em somente uma das variá-
veis são descartados.
- 66 -
Estatística para o curso de Psicologia
TABELAS
As tabelas são quadros, compostos por linhas e colunas,
que apresentam o resumo organizado dos resultados obtidos a partir
dos dados brutos. A finalidade maior das tabelas é fornecer o máximo
de informações em um mínimo de espaço.
Uma tabela é composta pelos seguintes elementos
essenciais:
• Titulo: frase curta que fornece informações acerca do
conteúdo da tabela. Deve ser colocado acima da tabela
• Corpo: é o conjunto de linhas e colunas que contém os
dados da tabela
• Cabeçalho: é a primeira linha do corpo da tabela e indica
o conteúdo das colunas;
• Coluna indicadora: é a primeira coluna da tabela e
especifica o conteúdo de cada linha. Tabelas de dupla
entrada podem apresentar mais de uma coluna
indicadora;
- 67 -
Paulo Rogério Morais
- 68 -
Estatística para o curso de Psicologia
GRÁFICOS
Os gráficos são figuras que tem como função representar
de forma geométrica ou pictográfica as principais informações de
um ou mais conjuntos de dados. Certamente, são os instrumentos
estatísticos mais conhecidos. A maior parte das pessoas tem contato
com alguma informação estatística por meio de algum tipo de gráfico.
Dadas as suas características, que serão abordadas a seguir,
diferentes meios de comunicação empregam diferentes tipos de
gráficos para fazer a apresentação de informações estatísticas.
Representar uma determinada informação por meio de
gráficos exige rigor e ética por parte de quem os confecciona.
Experimente comparar as informações contidas em um croqui
ilustrativo de algum anúncio de imóvel (desses que geralmente são
entregues nos semáforos das grandes cidades) com o mapa de um
guia de ruas que represente a mesma área. Embora as duas figuras
se prestem a representar basicamente a mesma informação,
freqüentemente os anúncios de imóveis apresenta a informação de
- 69 -
Paulo Rogério Morais
- 70 -
Estatística para o curso de Psicologia
- 71 -
Paulo Rogério Morais
600
500
*
400
*
mediana (Q1– Q3)
latência (seg.)
300
200
100
0
Gsal PLsal PEsal PEatro PEpilo
GRUPOS
*= p<0,05 comparado com grupos Gsal e PEpilo
Neste gráfico, o autor apresentou a medida de tendência central
(mediana) e também a dispersão (Q1 e Q3) de seus dados. Além disso,
também indica com os asteriscos quais diferenças foram, a partir da
análise inferencial, consideradas estatisticamente significante.
Quando o objetivo é representar valores proporcionais de
uma ou mais variáveis, uma variação do gráfico de colunas (e de
barras também) pode ser utilizada. No gráfico de colunas (ou barras)
compostas, o tamanho total dos retângulos representa 100% e os
mesmos são divididos em partes de tamanho proporcional ao da
grandeza a ser representada, como mostra o exemplo a seguir:
Figura 2.6 – Distribuição segundo o tipo de droga
utilizada pelos pacientes
100
80
Porcentagem
só outras drogas
60
álcool + outras drogas
40
só álcool
20
0
ambulatório hospital
Local de Atendimento
- 72 -
Estatística para o curso de Psicologia
35
30
Porcentagem
25
20 masculino
15 feminino
10
5
0
1987 1989 1993 1997
Ano do levantamento
* uso na vida (exceto álcool e tabaco).
Gráficos lineares
- 73 -
Paulo Rogério Morais
15
% de canhotos 10
0
10 20 30 40 50 60 70 80 90
idade em anos
Figura 2.8 - Porcentagem de indivíduos canhotos na população segundo idade
450
Total de Respostas acumuladas
400
350
300 CRF
250 VR
200 FI
150
VI
100
50
0
1 4 7 10 13 16 19 22
Tempo (minutos)
Figura 2.9 - Freqüência de respostas de à barra em diferentes esquemas de reforçamento
Gráfico setorial
Este tipo de gráfico também é conhecido como gráfico pizza
ou torta (pie), pois a base para a sua confecção é um circulo que é
dividido em setores (fatias) correspondentes à grandezas observadas
para diferentes categorias de uma variável qualitativa.
O total de observações é representado pelo circulo (360o ou
100%) que é dividido em setores com tamanhos proporcionais aos
valores observados para cada uma das categorias em questão. O
tamanho de cada setor é determinado por regra de três simples.
- 74 -
Estatística para o curso de Psicologia
médicos
especialistas em saúde mental
outros (padres,terapeutas holísticos, etc)
Figura 2.10 - A quem as pessoas recorrem quando necessitam de ajuda para dificuldades
psicológicas
Gráficos polares
Este tipo de gráfico, embora pouco utilizado, é bastante útil
para representar variações cíclicas de uma variável ao longo de
determinado período.
O gráfico polar também é confeccionado sobre um circulo,
mas a coordenada angular (tamanho dos setores) é constante e o
que varia são as coordenadas lineares (raio) de acordo com os valores
em cada intervalo da variável.
jan
dez fev
nov mar
out abr
set mai
ago jun
jul
Figura 2.11 - Incidência do diagnóstico de transtornos de humor ao longo do ano de 2003
em um ambulatório.
- 75 -
Paulo Rogério Morais
Pictograma
O pictograma é um tipo de gráfico bastante atraente e
sugestivo, pois emprega figuras semanticamente relacionadas ao
fenômeno em questão para representar os valores numéricos da
variável. Este tipo de gráfico é bastante comum em revistas e jornais,
mas pouco usado em publicações cientificas.
28
24
20
porcentage
16
12
0
1983 1984 1986 1988 1990 1992
1984 1985 1987 1989 1991
Figura 2.12 - Proporção de usuários de drogas injetáveis entre os pacientes com AIDS.
- 76 -
III - Estatística inferencial
1
Entende-se por “acaso” a variável, ou o conjunto de variáveis, que não foi controlada, seja por não
ser conhecida, seja por conveniência. Às vezes, os possíveis efeitos de uma variável são tão pe-
quenos, que tentar controlá-la poderia inviabilizar a pesquisa.
- 78 -
Estatística para o curso de Psicologia
7 caras
3 coroas
- 79 -
Paulo Rogério Morais
1. TESTE DE HIPÓTESES
2
O cálculo de probabilidades envolve outras questões, como a dependência entre eventos, isto é, a
ocorrência de um evento estar vinculada a ocorrência de outro evento. Devido a característica introdutória
do presente texto, este tema não será abordado em detalhes. Os leitores que desejarem conhecer um
pouco mais sobre probabilidade poderão consultar os textos de Downing e Clark (2000), Costa (1998) e
Levin (1987).
- 80 -
Estatística para o curso de Psicologia
- 81 -
Paulo Rogério Morais
- 82 -
Estatística para o curso de Psicologia
- 83 -
Paulo Rogério Morais
2 – DECISÃO E ERRO
3
Note que não rejeitar é diferente de aceitar. Quando se aceita uma hipótese, se fecha a questão.
Mas, quando “não rejeitamos” isso mantém a questão em aberto, indicando que os dados disponí-
veis não são suficientes para rejeitar uma hipótese, mas mantém a questão aberta para que novas
evidências que eventualmente rejeitem tal hipótese sejam apresentadas.
4
A probabilidade b também esta relacionada ao calculo do tamanho da amostra. À medida que o n
aumenta, diminui a chance de se cometer o erro do tipo II e também aumenta o poder do teste
estatístico. Devido o caráter introdutório deste livro, sugere-se a leitura de Levin (1987) e Jekel,
Elmore e Katz (1999) para os leitores interessados neste tópico.
- 84 -
Estatística para o curso de Psicologia
FIGURA 3.1 –
- 85 -
Paulo Rogério Morais
- 86 -
Estatística para o curso de Psicologia
3 – NÍVEL DE SIGNIFICÂNCIA
- 87 -
Paulo Rogério Morais
- 88 -
Estatística para o curso de Psicologia
5
Embora seja comum, não é adequado afirmar que um p= 0,0001 refere-se a um resultado mais
significativo do que um p= 0,048. O correto é afirmar que a rejeição de H 0 é mais consistente no
primeiro caso do que no segundo.
- 89 -
Paulo Rogério Morais
Statistic
Sumamarize 4
Custon tables 4
General Linear Model 4
Correlate 4
Regression 4
Loglinear 4
Classify 4
Data reduction 4
Nonparametric Tests 4 Chi-Square...
Time Series 4 Binomial...
Survival 4 Runs...
Multiple Response 4 1 – Sample K-S...
Missing Value Analysis 4 2 Independent Samples...
K independent Samples...
2 Related Samples...
K Related Samples...
- 90 -
Estatística para o curso de Psicologia
6
Para fins de análise, dados intervalares e proporcionais são tratados da mesma forma e são
chamados de contínuos.
- 91 -
Paulo Rogério Morais
- 92 -
Estatística para o curso de Psicologia
- 93 -
Paulo Rogério Morais
7
O leitor interessado em conhecer as fórmulas poderão consultar Levin (1987) e Siegel (1975),
entre outros.
- 94 -
Estatística para o curso de Psicologia
Teste Binomial
Este teste é aplicável quando se pretende analisar uma
amostra que teve seus dados coletados em nível nominal dicotômico,
isto é, a variável assume somente dois valores como, por exemplo:
“masculino” ou “feminino”, “sim” ou “não”, “saudável” ou “doente”,
entre outras.
Exemplo: um pesquisador pretende saber se existe diferença
significativa um grupo de pacientes atendidos em um ambulatório
quanto a variável sexo, isto é, quer saber se entre os pacientes deste
ambulatório existem mais homens ou mulheres, ou se o número de
homens e de mulheres é estatisticamente o mesmo.
Algumas variáveis ordinais ou contínuas podem ser
arbitrariamente dicotomizadas (por exemplo, a idade mensurada em
anos pode ser reduzida a classes dicotômicas de “jovens” e “adultos”).
Nestes casos, pode-se empregar o teste binomial, mas tal
procedimento resulta em desperdício de informações contidas nos
dados originais.
Para descrever os resultados deste teste devemos citar que
para a análise dos dados foi utilizado o teste binomial e a
probabilidade α dada pelo teste (valor de p).
- 95 -
Paulo Rogério Morais
8
Os graus de liberdade (gl ou df – do inglês degrees of freedom) indicam o quanto os valores
observados em um conjunto poderiam variar quanto a sua localização no conjunto, isto é, onde um
dado valor poderia estar se não estivesse onde esta. Por exemplo, se vou colocar meus sapatos
antes de colocar o primeiro sapato, posso escolher calçar tanto o direito quanto o esquerdo. Mas,
depois de calçar o sapato esquerdo, não tenho mais liberdade para escolher qual colocar. Neste
caso, meu grau de liberdade é 1 (n-1). Um ferreiro teria 3 graus de liberdade ao colocar ferraduras
em um cavalo e quem inventar de calçar sapatilhas em uma centopéia terá 99 graus de liberdade.
O cálculo do o número de graus de liberdade não é o mesmo para todas as situações:
Uma única amostra: gl= n – 1
Amostras relacionadas: gl = número de pares – 1
Amostras independentes: gl = somatória dos graus de liberdade de cada amostra [(n1 – 1) + (n2
– 1) + (...) + (nx – 1)]
Tabelas de contingência: gl = (número de linhas – 1) X (número de colunas – 1)
- 96 -
Estatística para o curso de Psicologia
- 97 -
Paulo Rogério Morais
- 98 -
Estatística para o curso de Psicologia
Teste de McNemar
Teste de Wilcoxon
Quando trabalhamos com duas amostras relacionadas ou
emparelhadas, e a variável a ser analisada possui mensuração no
mínimo ordinal, este teste pode ser empregado para se determinar
a probabilidade das diferenças observadas terem ocorrido por mera
obra do acaso. Este teste é uma alternativa ao teste t pareado quando
trabalhamos com conjuntos de valores com mensuração contínua
e distribuição assimétrica.
O teste de Wilcoxon irá comparar as diferenças observadas
entre os pares de dados, atribuindo-lhes postos que consideram o
tamanho da diferença e também o sentido da diferença (positivo ou
negativo).
- 99 -
Paulo Rogério Morais
- 100 -
Estatística para o curso de Psicologia
Teste de Fisher
Este teste é uma alternativa para a comparação de uma
variável nominal dicotômica em dois grupos com n inferior a 30
observações. O teste de Fisher pode ser empregado em situações
em que os dados podem ser dispostos em uma tabela de
contingência do tipo 2 X 2 (duas linhas por duas colunas).
- 101 -
Paulo Rogério Morais
Teste U de Mann-Whitney
A aplicação deste teste é adequada para a comparação de
dois grupos em variáveis com mensuração ordinal ou contínua com
distribuição assimétrica. Este teste pode não ser tão poderoso para
rejeitar a hipótese de nulidade, uma vez que não trabalha com os
valores absolutos observados, mas sim com postos que são atribuídos
a cada um dos valores dos dois grupos. No entanto, o teste U de
Mann-Whitney é a alternativa não-paramétrica mais freqüentemente
utilizada para conjuntos de valores que não possuem os requisitos
exigidos para o emprego do teste t para amostras independentes.
- 102 -
Estatística para o curso de Psicologia
- 103 -
Paulo Rogério Morais
Teste Q de Cochran
Este teste é uma extensão do teste de McNemar e como tal
pode ser empregado em situações em que uma variável nominal
dicotômica de um mesmo indivíduo é avaliada em três ou mais
situações diferentes
- 104 -
Estatística para o curso de Psicologia
Teste de Friedman
O teste de Friedman presta-se à análise de variáveis com
mensuração ordinal ou contínua de três ou mais amostras
relacionadas. Trata-se de uma generalização do teste de Wilcoxon.
- 105 -
Paulo Rogério Morais
- 106 -
Estatística para o curso de Psicologia
- 107 -
Gabarito para a escolha do este estatístico
Alguns testes para análise inferencial
Distribuição
simétrica assimétrica Teste “t” de Teste “t” de Teste “t” ANOVA de ANOVA de
Contínuo Média e Mediana e Student (*) Student (*) pareado (*) uma via (*) duas vias (*)
- 109 -
Paulo Rogério Morais
- 110 -
Parte 2
Para empregar
a Estatística
Paulo Rogério Morais
- 112 -
IV – Psicologia, avaliação
em Psicologia e Estatística:
por que essa união é
fundamental?
Prof. Dr. Makilim Nunes Baptista1
1
Programa de Estudos Pós-Graduados em Psicologia da Universidade São Francisco – Itatiba/
SP.
Paulo Rogério Morais
aos professores e, estes por sua vez não se sentem motivados (ou
poderiam estar muito mais) para ensinar matemática para as
pessoas, constituindo-se em uma relação de pura subtração, ou seja
todos perdem.
Sabe-se também que, se as pessoas fossem mais hábeis
em matemática, não haveriam tantas manipulações e falcatruas dos
bancos, governo (e seus cálculos para diversos impostos), comércio,
crediário ou outras instituições financeiras. Quantas pessoas não
acabam se endividando por não saber matemática?
O fato é que uma das matérias mais odiadas no ensino superior
também acaba sendo a estatística, que pode-se denominar como um
conjunto de métodos utilizados na avaliação de dados, como por
exemplo a exploração de dados epidemiológicos (ex. número de óbitos
ou nascimentos em uma determinada região ou época do ano).
Me lembro de várias ocasiões em que os alunos de
Psicologia me perguntavam para que teriam que estudar estatística,
já que a opção era para uma ciência considerada como humana. E
é claro que este tipo de pergunta não é tão fácil de ser respondida
para alguém que está entrando em um curso novo e geralmente
não possui conhecimentos técnicos suficientes para conseguir
equacionar os motivos do porque a estatística faz parte da grade de
um curso de Psicologia. Provavelmente alguns alunos até podem
chegar a acreditar que é um erro da coordenação ter colocado
matéria tão ingrata no curso, ou mesmo que a grade curricular está
desatualizada ou ultrapassada.
Em seu artigo sobre atitudes em relação à estatística e à
matemática, Silva e cols. (2002) comentam que o aluno que parte do
pressuposto de que a estatística é uma área importante e estimulante,
tenderá relacionar tais crenças com o comportamento, ou seja, estará
mais disposto para aprender e aplicar seus princípios. Do contrário, o
aluno que crê que estatística é matemática e, as experiências anteriores
relacionadas à matemática tenham sido aversivas, associará este
aprendizado com o estímulo atual, ou seja, a estatística se torna um
conceito também aversivo, o que acabará dificultando a sua
aprendizagem, motivação, atenção seletiva, memória, raciocínio,
dentre outros fenômenos e processos básicos psicológicos.
As autoras anteriormente citadas encontraram como
resultados principais de sua pesquisa uma relação entre escolha de
área correlacionada com relação afetiva que o aluno possui com a
matemática e com a estatística. Dessa forma, os alunos pertencentes
á área de exatas apresentaram atitudes mais positivas em relação à
- 114 -
Estatística para o curso de Psicologia
- 115 -
Paulo Rogério Morais
- 116 -
Estatística para o curso de Psicologia
- 117 -
Paulo Rogério Morais
- 118 -
Estatística para o curso de Psicologia
- 119 -
Paulo Rogério Morais
- 120 -
Estatística para o curso de Psicologia
- 121 -
Paulo Rogério Morais
Referências
- 122 -
V - Análise fatorial
1
Mestre em Psicologia Escolar; Doutor em Psicologia como Profissão e Ciência; Coordenador
de Núcleos de Pesquisa da USJT; professor e supervisor de estágio em Psicologia na USJT e
UBC.
Paulo Rogério Morais
- 124 -
Estatística para o curso de Psicologia
- 125 -
Paulo Rogério Morais
Pré-requisitos
Para efetuar uma AF utilizando o SPSS, alguns pré-requisitos
são fundamentais:
1. Possuir dados com nível de mensuração de razão fixa,
intervalar ou, no mínimo, ordinal;
2. Ter, no mínimo, 50 participantes ou, preferencialmente,
100 ou mais sujeitos;
3. Ter uma amostra com quatro ou cinco vezes o número
de variáveis (itens) analisadas;
4. Ter os dados tabulados corretamente na planilha do
software; e
5. Efetuar o teste de normalidade.
Quanto ao primeiro pré-requisito, o próprio SPSS recomenda
somente os níveis de mensuração intervalar ou razão fixa (SPSS,
2003). Contudo, como demonstram Latif (1994) e o exemplo que foi
adotado neste capítulo, é possível obter resultados confiáveis na AF
com nível de mensuração ordinal.
“As observações devem ser, no mínimo, de 50 casos e
preferencialmente de 100 ou mais” (Hair, 1995 apud Almeida, 2004:
Internet). No estudo de Alvarenga (2003), 172 professores
responderam a escala que aqui é analisada. É necessário, também,
que o número de observações seja igual a 4 ou 5 vezes o número
de variáveis (Hair, 1995 apud Almeida, 2004). Como 11 necessidades
educacionais especiais foram analisadas (itens), houve
aproximadamente 15 observações para cada variável.
No que diz respeito ao teste de normalidade, existe um con-
junto de técnicas que permite verificar se um determinado conjunto
de dados está normalmente distribuído, ou seja, avaliar se os dados
têm distribuição normal na amostra pesquisada. Para tanto, é possí-
vel utilizar exames rigorosos de distribuição normal ou, simplesmen-
te, examinar curvas de distribuição em, por exemplo, um gráfico de
dispersão (scatterplot)2 (Figura 1).
- 126 -
Estatística para o curso de Psicologia
- 127 -
Paulo Rogério Morais
- 128 -
Estatística para o curso de Psicologia
- 129 -
- 130 -
Estatística para o curso de Psicologia
Interpretando os resultados da AF
Dentre as múltiplas informações disponíveis, a primeira a
ser considerada abrange os resultados da KMO e da BTS (Approx.
Chi-Square - χ2o). No caso da pesquisa de Alvarenga (2003), foram
obtidos KMO igual a 0,872 e χ2o igual a 1249,281, com 55 graus de
liberdade (df) e p valor (Sig.) de 0,000. Reitera-se que tratam-se
dois testes fundamentais para avaliar se as premissas quanto à
natureza dos dados para AF são atendidas.
O resultado do χ 2 o do BTS deve ser interpretado
considerando o nível de significância de 0,05 e o de KMO adota os
valores críticos a seguir (Pereira, 1999: 124):
• Valores na casa dos 0,90: adequação ótima dos dados
à AF.
• Valores na casa dos 0,80: adequação boa dos dados
à AF.
• Valores na casa dos 0,70: adequação razoável dos
dados à AF.
• Valores na casa dos 0,60: adequação medíocre dos
dados à AF.
• Valores na casa dos 0,50 ou menores: adequação
imprópria dos dados à AF.
Em ambos os casos os resultados obtidos indicam que as
premissas da AF estão sendo atendidas no estudo em questão.
Scree Plot
6,00
5,34
5,00
4,00
Eigenvalue
3,00
2,00 2,33
1,00
,73
,59
0,00 ,46 ,43
1 2 3 4 5 6 7 8 9 10 11
Component Number
- 131 -
Paulo Rogério Morais
- 132 -
Estatística para o curso de Psicologia
Tabela 1: Total de variância explicada pelos fatores extraídos.
Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Component Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
1 5,341 48,558 48,558 5,341 48,558 48,558 4,454 40,490 40,490
2 2,330 21,179 69,737 2,330 21,179 69,737 3,217 29,247 69,737
3 ,726 6,602 76,339
- 133 -
Component
1 2
Autismo ,867
Deficiência mental ,854
Síndrome de Down ,836
Paralisia cerebral ,805
Deficiência auditiva ,781
Deficiência visual ,766
Superdotação ,577 ,369
Câncer ,908
Problemas renais crônicos ,883
Deficiência física ,865
Infecção por HIV ,744
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 3 iterations.
,5
superdotação
deficiência
síndrome
deficiência visual
de mental
deficiência down
auditiva
auti smo
paralisia cerebral
0,0
-,5
-1,0
-1,0 -,5 0,0 ,5 1,0
Component 1
Figura 4: Relações entre fatores e variáveis num espaço de Factor Loadings.
- 134 -
Estatística para o curso de Psicologia
Referências
- 135 -
Paulo Rogério Morais
- 136 -
VI - Análise de dados com o
computador: breve
descrição dos programas
atualmente disponíveis
Marcos Aguiar de Souza
Universidade Federal Rural do Rio de Janeiro
Israel Souza
Escola Nacional de Ciências Estatísticas
- 138 -
Estatística para o curso de Psicologia
- 139 -
Paulo Rogério Morais
AMOS
O AMOS é um programa desenvolvido especificamente para
modelagem de equações estruturais (SEM), permitindo a construção
de modelos que refletem melhor as relações complexas entre as
variáveis.
O AMOS vem sendo utilizado em diversas áreas do
conhecimento humano como nas ciências sociais e do comportamento
(como psicologia, sociologia, psiquiatria, ciência criminal, família,
ciência política, pesquisa, antropologia, ou trabalho social); Pesquisa
médica (alimentação, farmácia, epidemiologia, gerontologia,
cinesiologia, ciência desportiva, e outros campos); Educação (em
administração, política, análise de testes); Pesquisa empresarial
(comércio, administração, economia, organização); Ciência ambiental
(inclusive administração de recursos e pesquisa longitudinal).
Já na sua versão 6.0, o AMOS é produzido pela mesma
empresa que comercializa o SPSS, o que para muitos significa que
trata-se de um programa é uma forma de complementar o SPPS.
- 140 -
Estatística para o curso de Psicologia
BIOESTAT
O pacote estatístico BIOESTAT foi desenvolvido
originalmente para estudantes de graduação e pós-graduação das
áreas médica e biológica por Manuel Ayres, Manoel Ayres Jr, Daniel
Lima Ayres e Alex de Assis Santos dos Santos, sendo distribuído
pela Sociedade Civil Mamirauá (Belém – Pará).
Sua distribuição é gratuita, porém a versão mais recente, a
3.0 (2005) já está esgotada. A previsão é de que a versão 4.0 já
esteja disponível em breve para downloads na página da Sociedade
Civil Mamirauá (www.mamiraua.org.br). Maiores informações podem
ser obtidas através do e-mail: loja@mamiraua.org.br.
Embora tenha sido desenvolvido para as áreas médica e
biológica os testes estatísticos presentes no BIOESTAT podem ser
empregados nas mais diversas áreas da ciência, podendo ser
executado em sistema operacional Windows 95 ou superior, e em
computadores pessoais 486 ou superior com no mínimo 8 mb de
memória RAM.
Uma dos fatores mais interessantes do BIOESTAT é que, além
de ser totalmente em português por ser um programa brasileiro, possui
um sistema de sugestões, no qual o usuário é auxiliado na escolha do
teste estatístico apropriado após informar o número de amostras, o
número de variáveis e o nível de medida dos dados a serem analisados.
Sua interface gráfica é semelhante às planilhas do tipo Excel.
Dentre as estatísticas realizadas pelo BIOESTAT 3.0
destacamos a amostragem (simples, sistemáticas, estratificadas, por
conglomerados e aleatória dos escores); análise multivariada
(componentes principais, distância multivariada, teste de Hotelling,
teste de Bartlett); análise de sobrevivência; análise da variância
(anova, teste de Friedman, Kruskal-Wallis, Q de Cochran); bootstrap;
correlação (Pearson, parcial, Kendall, phi, Spearman, coeficiente de
contingência, coeficiente de concordância); distribuição de
probalidades; teste t; teste Z; Kolmogorov-Smirnov; qui-quadrado;
teste de Poisson; odds ratio; teste Kappa; meta-análise; testes de
normalidade e regressão múltipla entre outros (Ayres e
colaboradores, 2003).
Com todas essas utilidades apenas dois detalhes diminuem
o brilho deste pacote: (1) os dados só podem ser analisados em
colunas. Assim, a planilha com o banco de dados original deve ser
alterada a cada procedimento estatístico realizado; e (2) os resultados
e os gráficos devem ser salvos em outro aplicativo (Word, por
exemplo) antes de uma nova análise.
- 141 -
Paulo Rogério Morais
EPI INFO
Desenvolvido para utilização por profissionais de saúde pública
o EPI INFO, é de domínio do Centro para Controle e Prevenção de
Doenças (CDC – Atlanta, Geórgia, EUA). O EPI INFO, na verdade é
composto por uma série de programas voltados para análise de dados
epidemiológicos e para a administração de bancos de dados de vigilância
de saúde pública, sendo, entretanto, útil para realização de uma série
de análises estatísticas com aplicações em diversas outras áreas.
O programa foi desenvolvido inicialmente para ser executado
em ambiente DOS, com a primeira versão lançada em 1985 e já em
1997 estimava-se haver mais de 145.000 cópias em 117 países
(Decano e colaboradores, 2000).
Sua versão mais recente (EPI INFO 2000) foi totalmente
remodelada, sendo executado diretamente no sistema operacional
Windows (95, 98, NT e 2000).
Seu diferencial inclui um Sistema de Informação Geográfico
(SIG), chamado Epi Map 2000. O programa mantém as vantagens
do EPI INFO para DOS, além de oferecer vantagens como a interface
gráfica amigável do Windows com a facilidade de apontar-e-clicar,
gráficos, fontes e impressão fácil (Decano e colaboradores, 2000).
O grande atrativo do EPI INFO consiste em ser um pacote
estatístico de domínio público, assim como a documentação e os
materiais pedagógicos, podendo ser copiados, distribuídos ou
traduzidos livremente.
O pacote estatístico EPI INFO 2000 encontra-se disponível
para download na página http://www.cives.ufrj.br/cdc/epi2000/
arq2000.html. Já as versões do EPI INFO em DOS podem ser
encontradas na página: http://www.lampada.uerj.br/epiinfo/
download.htm. Uma outra opção é acessar diretamente a página do
Centro para Controle e Prevenção de Doenças (CDC): http://
www.cdc.gov/epiinfo/downloads.htm
O EPI INFO 2000 requer as seguintes configurações para
sua instalação:
- Microsoft Windows 95, 98, NT ou 2000
- 32 mb RAM - mais é recomendado para o Windows NT
- 50 mb de espaço de disco rígido livre
- processador de pelo menos 200 MHz
Dentre os recursos do EPI INFO 2000 podem ser destacadas
as funções: listar, freqüências, tabelas, parear, médias, sumariar,
gráficos, mapa, regressão linear, regressão logística, análise de
- 142 -
Estatística para o curso de Psicologia
EQS
EXCEL
O Microsoft EXCEL fornece um conjunto de ferramentas
para análise de dados que pode ser usado para pular etapas no
desenvolvimento de análises estatísticas ou de engenharia
complexas.
Após serem fornecidos os dados e os parâmetros para cada
análise, o EXCEL exibe os resultados em uma tabela de saída.
Algumas ferramentas geram gráficos além das tabelas de saída.
O EXCEL disponibiliza uma série de procedimentos
estatísticos, sendo possível ao usuário fazer uso de fórmulas para
realização de outras análises. Dentre os testes já disponíveis,
podemos destacar coeficiente de correlação linear de Pearson,
tabela, distribuição de Poisson, teste qui-quadrado, teste f, teste z,
teste t de Student para amostras independentes e para amostrar
pareadas, entre outros.
No entanto o EXCEL possui algumas limitações como, por
exemplo, o cálculo do nível de significância. Para resolver esses
problemas diversos pacotes ou extensões foram desenvolvidos com
o objetivo de suprir as deficiências na análise de dados do EXCEL,
nos diferentes procedimentos estatísticos.
- 143 -
Paulo Rogério Morais
LISREL
O LISREL é um pacote estatístico específico, oferecendo
principalmente recursos para modelagem de equações estruturais.
Com o LISREL é possível realizar análise fatorial exploratória e
confirmatória, análise de componentes principais e análise
multivariada. Na página www.ssicentral.com é possível adquirir uma
versão demo válida por 15 dias.
Atualmente é um dos programas mais utilizados para análise
fatorial confirmatória (Byrne, 1998), no entanto os programas AMOS
(da SPSS) e o EQS, vêm ganhando uma parte importante do
mercado.
As ferramentas do LISREL possuem aplicações de
grande uso nas ciências sociais e humanas.
MINITAB
O programa MINITAB foi criado em 1972 por professores de
estatística da Pennsylvania State University, para auxiliar professores
e alunos no ensino da Estatística. O Software era utilizado nas aulas
de análise de dados em estatística, facilitando a compreensão das
informações por parte dos alunos (MinitabBrasil, 2005).
O seu sucesso permitiu que, atualmente, o MINITAB seja
utilizado na aprendizagem de estatística em nível superior em mais de
4.000 universidades de mais de 80 países.
O sistema MINITAB, atualmente na versão 14, é semelhante
ao SPSS, permitindo que se nomeie variáveis (colunas) com palavras
de mais de oito caracteres e que texto sejam utilizados nas variáveis
categóricas (PROMMEPE, 2005). Os resultados gráficos podem ser
salvos nos formatos TIFF, PNG e JPEG.
Trata-se de um pacote comercial (pago). No entanto uma versão
demo é disponibilizada na página: http://www.minitabbrasil.com.br/
minitab/demo.asp. Entretanto é preciso fazer um cadastro. Após
instalada, a versão demo do MINITAB 14 poderá ser utilizada durante
30 dias.
- 144 -
Estatística para o curso de Psicologia
OPEN STAT
O OPENSTAT é um software gratuito construído com base
no SPSS, criado para uso de estudantes, professores e
pesquisadores de diferentes áreas. O programa está disponível para
download no endereço http://www.statpages.org/miller/openstat/. O
criador do programa no entanto não dá garantias sobre a precisão,
perfeição, confiabilidade ou outras características desejáveis em
pacotes estatísticos.
O OPENSTAT vem sofrendo uma evolução desde a primeira
versão que recebia o nome de Freestat criada por William G. Miller,
professor de psicologia educacional na universidade de Iowa.
Atualmente o OPENSTAT está disponível tanto para o Windows como
para o Linux.
Os recursos disponíveis no OPENSTAT são: estatísticas
descritivas que incluem medidas de tendência central e de dispersão,
distribuições de freqüência, coeficiente de correlação linear de Pearson,
correlação parcial, correlação canônica, coeficiente de correlação por
postos de Sperman, regressão linear simples e múltipla, regressão
logística; análise da variância e teste t de Student, entre outros.
R
O Programa R trata-se de uma linguagem e ambiente para
computação estatística e gráficos, que fornece uma variedade de
técnicas estatísticas como modelagem linear e não linear, testes
estatísticos clássicos, análise de séries temporais, classificação,
agrupamento, entre outros, gráficos, e que pode ser facilmente
ampliada (Beasley, 2004).
- 145 -
Paulo Rogério Morais
SAEG
A versão atual do SAEG é a 9.0 que usa recursos de memória
virtual, possuindo, portanto, maior capacidade de processamento.
Produz dezenas de tipos de gráficos de duas e três dimensões,
acessíveis por produtos que trabalham em ambiente WINDOWS,
sendo composto por aproximadamente 70 procedimentos
responsáveis pela manipulação dos arquivos de dados e capaz de
gerar vários tipos de gráficos de alta qualidade (Ribeiro Jr, 2001).
O SAEG vem sendo bastante difundido e atualmente, mais
de 5000 cópias do SAEG estão instaladas em empresas públicas,
privadas e universidades brasileiras e sul-americanas. Uma versão
demo pode ser adquirida em www.ufv.br/saeg/SAEGD9.00.exe.
O SAEG permite uma série de ferramentas para análise
estatística, embora sua interface não seja tão amigável quanto o
- 146 -
Estatística para o curso de Psicologia
SAS/STAT
O SAS/STAT é considerado, juntamente com o SPSS, um
dos mais utilizados e melhores pacotes de estatística do mundo.
(CENAPAD, 2004).
Na verdade trata-se de um programa que possui diversos
módulos (mais de 20) em torno de um módulo base (SAS/Base).
Sendo o SAS/STAT o módulo responsável por análises estatísticas.
O SAS é um sistema integrado de aplicações para a análise
de dados, que consiste de: Recuperação de dados, Gerenciamento
de arquivos, Análise estatística, Acesso a Banco de Dados, Geração
de gráficos, Geração de relatórios. Trabalha com quatro ações
básicas sobre o dado: Acessar, Manipular, Analisar e Apresentar
(CENAPAD, 2004).
O módulo SAS/STAT possui diversas técnicas de estatísticas
avançadas, incluindo: análise de variância; análise de dados
categóricos; análise de sobrevivência; análise psicométrica; análise
de conglomerados; análise não-paramétrica; análise de componentes
principais; análise discriminante; correlação canônica; modelos de
redução multidimensional; modelagem por equações estruturais;
análise de fatores; análise de correspondência simples e múltipla, e
redução multidimensional, entre outras.
O SAS é um pacote comercial (pago), e possui suporte em
português que pode ser conferido na página http://www.sas.com/
offices/latinamerica/brazil/.
SISVAR
- 147 -
Paulo Rogério Morais
SPAD
O SPAD é um software francês que está na sua Versão 6.0.
O seu diferencial está na análise de correspondência múltipla, embora
ele forneça diversas ferramentas de análise estatística.
Seus gráficos são de fácil interpretação e de qualidade
excelente para publicação, exemplos podem ser obtidos na página
http://www.decisia.com ou http://www.decisia.fr
Na verdade são quatro programas em ordem crescente de
complexidade de análise de dados, sendo que os programas mais
avançados englobam as análises presentes dos anteriores: SPAD
Profiling; SPAD Scoring; SPAD Data Mining; SPAD CRM.
A amplitude desse software permite realizar análises
descritivas, gráficos para o estudo de distribuições de variáveis,
separadamente, através de pares (2D) e por trios (3D), caracterização
automática de variáveis designadas (contínua ou nominal) pelo resto
da informação, análises de fatorial (análise de componente principal –
PCA, análise de correspondência simples – SCA, análise de
correspondência múltipla – MCA, análise de correspondência múltipla
condicional – MCA e ajuda para a interpretação dos fatores .
O SPAD permite tratar diversos tipos de informação, inclusive
a informação textual, graças a técnicas de análise de texto utilizadas
na conduta de pesquisas.
A única dificuldade que o usuário iniciante poderá ter é a língua
do software (Francês). O SPAD é um pacote comercial e pode ser
comprado através da página www.decisia.fr.
- 148 -
Estatística para o curso de Psicologia
SPHINX
O SPHINX funciona como, todo sistema de base Windows,
com menus, cliques em botões e respostas a diálogos. As convenções
habituais do Windows são respeitadas, e avisos de proteções contra
operações ilícitas provenientes de falsas manipulações e instruções
são dadas, se necessário.
Existem 3 versões: o SPHINX Primo, o SPHINX Plus2 e o
SPHINX Léxica, os quais correspondem, respectivamente, aos níveis
de necessidades mínimo, intermediário e máximo.
Com o SPHINX Primo, é possível: conceber, digitar e tabular
enquetes, detalhar os dados de enquetes. Pode-se ainda facilmente
navegar nos dados, verificando resultados e corrigindo os dados,
preparando e editar listas, e procurar as especificidades ou
características de certos indivíduos (SphinxBrasil, 2005)..
O SPHINX Plus2, além dos recursos disponíveis no SPHINX
Primo, permite aprofundar análises graças às técnicas estatísticas
avançadas de análise multidimensional: análise fatorial, classificação,
tipologia, análise de variância; enriquecer sua base de dados iniciais
com a geração de novas variáveis; e abrir e analisar diversos arquivos
contendo valores ou textos.
Com o SPHINX Léxica possui os recursos de análise de
conteúdo e de análise léxica já presentes no Primo ou no Plus2. Com
os recursos nesta última versão do SPHINX é possível realizar análise
de conteúdo a partir de dados obtidos de questões abertas; gerar listas
de palavras e expressões; realizar análises temáticas; produzir extratos
de textos e restituir frases características; e calcular estatísticas léxicas
que permitam quantificar textos (SphinxBrasil, 2005).
S-PLUS
Considerado por alguns autores como um dos mais completos
pacotes estatísticos disponíveis comercialmente (Ripley, 1997), o S-
PLUS apresenta um ambiente de desenvolvimento para muitas
pesquisas quantitativas, incorporando resultados de pesquisas recentes
em visualização de dados.
O S-PLUS é um programa comercial, disponibilizado pela
empresa Insightful (http://www.insightful.com/), estando disponível para
sistemas UNIX, LINUX e Windows. Em sua versão S-PLUS 7.0, estão
disponíveis 2 edições: O S-PLUS 7.0 Professional Developer (que
atualiza o S-PLUS 6.2 Professional) e o novo membro da família S-
PLUS, o S-PLUS 7.0 Enterprise Developer.
- 149 -
Paulo Rogério Morais
SPSS
O SPSS (Statistical Package for the Social Sciences) ou
Pacote Estatístico para Ciências Sociais, é um do pacote estatístico
que teve a sua primeira versão em 1968. É um dos programas de
análise estatística mais usados nas ciências sociais, sendo também
utilizado na pesquisa de mercado, na pesquisa relacionada com a
saúde, por governos, na educação e outros setores (Bisquerra,
Sarriera & Martinez, 2004; PROMMEPE, 2005).
Atualmente na sua versão 14.0, é possível obter uma versão
demo mediante cadastro na página http://www.spss.com.br/. É
interessante ressaltar que o SPSS conta com uma empresa ocupada
de um contínuo processo de evolução do programa.
O programa permite realizar cálculos estatísticos complexos,
visualizar resultados, de forma rápida permitindo assim aos seus
utilizadores uma apresentação e uma interpretação sucinta dos
resultados obtidos. Possui ainda uma grande variedade de gráficos e
seus resultados podem ser salvos num único arquivo (output) facilitando
muito as consultas posteriores.
O SPSS é considerado por muitos como um dos programas
mais completos, principalmente pelos recursos que disponibiliza para
a livre manipulação dos dados, permitindo a reorganização dos dados
sem a alteração da planilha original, combinar e criar novas variáveis
a partir dos dados.
Dentre os diversos recursos que possui destacam-se os
testes paramétricos e não paramétricos mais comumente utilizados
em pesquisa como o teste t, teste z, análise da variância, testes
post hoc, teste do qui-quadrado, teste de Wilcoxon, teste de Mann-
Whitney, correlação parcial, correlação linear de Pearson, correlação
por postos de Spearman, regressão linear simples e múltipla,
- 150 -
Estatística para o curso de Psicologia
STATISTICA
O STATISTICA é um pacote produzido pela empresa StatSoft,
fundada em 1984 por um grupo de professores universitários e
cientistas. Em 1990 foi iniciado um projeto mais ambicioso e avançado,
no qual o programa passa oferecer novos níveis de funcionalidade
ainda não disponíveis nos softwares então no mercado.
A sua Versão mais recente é a 6.1 e na página http://
www.statsoft.com.br/index.php é disponibilizada uma versão demo.
O programa conta com um sistema abrangente, envolvendo
análise de dados integrada, gráficos, gerenciamento de base de dados
e o desenvolvimento de aplicações customizadas, com o objetivo de
atender diretamente a usuários das áreas de Engenharia, Ciências e
Negócios. Além de procedimentos estatísticos e gráficos de propósito
geral, o sistema apresenta um conjunto de módulos especializados
para cientistas sociais, pesquisadores biomédicos e engenheiros.
Dispõe de processos apropriados para recolher, organizar,
classificar, apresentar e interpretar conjuntos de dados e oferece
estatísticas essenciais de forma amigável, com poder de análise e
facilidade de benefícios de uso, tais como: estatística/tabelas básicas,
regressão linear múltipla, ANOVA, estatística não paramétrica e
ajuste de distribuição.
O STATISTICA Base possui todas as técnicas para análise
descritiva de dados, intervalos de confiança, testes t para uma e
duas amostras e teste t pareado.
Disponibiliza também outras análises como kurtose, análise
de variância, desvio-padrão, erro-padrão, média harmônica, com a
mesma simplicidade e também com diversas estatísticas descritivas
específicas e de diagnósticos. Em todos os módulos do STATISTICA
estão disponíveis uma ampla variedade de gráficos, o que facilita a
exploração dos dados e visualização dos resultados.
- 151 -
Paulo Rogério Morais
STATA
O STATA (Statistical Software for Professionals) é um pacote
estatístico voltado para análise de dados, administração de dados,
e gráficos. Atualmente o programa encontra-se em sua nona versão.
O STATA dispõe de diversas ferramentas estatísticas e de
técnicas avançadas, como modelos de sobrevivência, dados
dinâmicos, regressões, cálculo de equações generalizadas,
estimação com amostras de pesquisa complexas; modelos lineares,
ANOVA/MANOVA, análise de agrupamento, padronização de taxas
e tabulações básicas, teste t de Student, teste Wilcoxon, Mann-
Whitney, análise fatorial, entre outros.
O programa pode ser adquirido comercialmente na página
da internet http://www.stata.com/products/overview.html. A empresa
não oferece versão demo.
SYSTAT
O SYSTAT foi desenvolvido no início da década de 70 pelo
Professor de estatística da Universidade de Illinois (Chicago-EUA) Leland
Wilkinson. A primeira versão era executada em DOS e foi produzida
em 1984. A meta de Wilkinson era oferecer para os pesquisadores um
programa no ambiente DOS para o desenvolvimento de estatísticas
descritivas e outros modelos estatísticos mais usados. Na ocasião havia
poucos pacotes estatísticos em DOS; os pacotes como SAS e SPSS
ainda eram voltados para mainframe.
O SYSTAT originalmente possui uma interface semelhante ao
SAS, tanto no seu uso como no seu funcionamento.
Trata-se de um pacote estatístico comercial que apresenta
quatro janelas: a principal onde as análises são realizadas e onde os
resultados são colocados; a janela gráfica, em que os gráficos são
colocados um após o outro com barras deslizantes para a movimentação
entre eles; uma janela de dados, que é uma planilha onde os dados
podem ser digitados ou carregados; e finalmente, uma janela para a
edição de comandos, que pode ser utilizada para a digitação de
comandos que não acessíveis através de menus. Estas janelas são
abertas de forma separada, ao invés de derivadas de uma janela mãe,
como costuma acontecer com outros programas, dando ao SYSTAT
uma aparência um pouco diferente dos demais programas de base
Windows.
- 152 -
Estatística para o curso de Psicologia
Considerações finais
- 153 -
Paulo Rogério Morais
Referências
- 154 -
Estatística para o curso de Psicologia
- 155 -
Paulo Rogério Morais
- 156 -