Escolar Documentos
Profissional Documentos
Cultura Documentos
Manual MA Todos Quantitativos Tomo 1 PDF
Manual MA Todos Quantitativos Tomo 1 PDF
Projecto
CONSOLIDAÇÃO DAS CAPACIDADES DA ADMINISTRAÇÃO
PÚBLICA
CO-FINANCIAMENTO
Ficha Técnica
Autor:
Rui Brites
Resumo biográfico:
Rui Brites
Mestre em Sociologia, Área de Comunicação, doutorando em Sociologia (ISCTE).
Professor Auxiliar Convidado do Departamento de Métodos Quantitativos do ISCTE.
Investigador do CIES/ISCTE-Centro de Investigação e Estudos de Sociologia e membro do GIESTA/ISCTE-Grupo
de Investigação Estatística e Análise de Dados.
Foi coordenador do Centro de Informação sobre a Droga e a Toxicodependência do IPDT-Instituto Português da
Droga e Toxicodependência (Agosto 2000-Julho 2002).
Participa e tem participado em diversos projectos de investigação e investigação-acção, como coordenador das áreas
metodológicas e de análise de dados.
Título do manual:
Manual_Métodos Quantitativos_Tomo_1.doc
Coordenação do projecto:
Cabo Verde – Unidade de Gestão do Projecto
Coordenadora – Josefa Lopes
ISBN:
(número internacional integrante do sistema ISBN (International Standard Book Number), a solicitar pela entidade
responsável pela edição do documento, se possível).
Índice
Pág.
Estruturação dos capítulos 5
Introdução 6
Capítulo 1 – Amostragem 7
Objectivos 7
Palavras-chave 7
Conteúdo temático
1.1. Noções de amostragem 8
1.2. Métodos de amostragem 10
1.3. Selecção das unidades amostrais 11
1.4. Margens de erro e intervalos de confiança 12
Avaliação 15
Bibliografia 15
Capítulo 2 – Introdução ao SPSS 16
Objectivos 16
Palavras-chave 16
Conteúdo temático
2.1. Editor de dados do SPSS 17
2.2. Output do SPSS 18
2.3. Menus SPSS 19
2.4. Criação de bases de dados 22
2.5. Tratamento Preliminar de dados 22
2.5.1. Transformação algébrica de variáveis 23
2.5.2. Transformação lógica de variáveis 28
2.5.3. Inversão da escala de uma variável 29
2.5.4. Variáveis de contagem de ocorrências 30
2.6. Selecção de casos 31
Avaliação 35
Referências 36
Pág.
Capítulo 3 – Estatística aplicada com SPSS 37
Objectivos 37
Palavras-chave 37
Conteúdo temático
3.1. Análise de dados univariada 38
3.1.1. Frequências 38
3.1.2. Estatísticas descritivas e gráficos de perfil 41
3.1.3. Testes de aderência (para 1 amostra) 44
3.1.3.1. χ (Qui-quadrado)
2
44
3.1.3.2. Kolmogorov-Smirnov 45
3.1.3.3 Teste t de Student 46
3.2. Análise de dados bivariada 47
2
3.2.1. Cruzamentos e teste de independência χ (Qui-quadrado) 47
3.2.2. Testes não paramétricos – procedimento Non Parametric Tests 50
3.2.2.1. Duas amostras independentes (Mann-Whitney e Kolmogorov-Smirnov) 50
3.2.2.2. K amostras independentes (Kruskal-Wallis) 52
3.2.3. Testes não paramétricos – procedimento Compare Means 54
3.2.3.1. Duas amostras emparelhadas (t de Student amostras emparelhadas) 54
3.2.3.2. Duas amostras independentes (t de Student de independência) 55
3.2.3.3. k amostras independentes (Análise de Variância Simples Paramétrica -
ANOVA) 56
3.2.4. Correlação linear simples 59
3.3. Modelos de previsão 61
3.3.1. Análise de Regressão Simples 61
3.3.2. Análise de Regressão Múltipla 63
3.4. Análise de dados multivariada 66
3.4.1. Análise das Componentes Principais 66
3.4.2. Análise de Clusters 71
3.4.2.1. Análise hierárquica de Clusters 72
3.4.2.2. Análise não hierárquica de Clusters – método de optimização (K-Means) 76
3.4.3. Articulação entre a Análise das Componentes Principais r a Análise de
Clusters 76
Avaliação 79
Bibliografia 79
Anexo 1: Testes de inferência estatística mais utilizados em Análise bivariada 80
Anexo 2: European Social Survey (round 1 - 2002) - Questionário adaptado 83
Em cada capítulo ou conteúdo temático, o participante visualizará uma estrutura que apresentará
as seguintes subdivisões, a saber:
de aprendizagem a ser alcançada no final dessa mesma (sub)temática e que
servirá de referência para a auto-avaliação;
Objectivos
Palavras-chave, que pela sua relevância para a temática e como realce da
atenção do participante para determinada designação ou conceito, que terá a
Palavras
sua definição e explicitação, no final do capítulo, no espaço reservado em
Glossário.
objectivo e com rigor técnico, a (sub)temática em apreço, referenciando-se
os elementos de substância, julgados mais significativos e de interesse para
a aprendizagem do(a) participante(a).
Conteúdo
Avaliação. Neste espaço será indicada a forma de avaliação do capítulo e
incluída a respectiva ficha de exercício.
Avaliação
Referências. Nesta subdivisão poder-se-á encontrar uma lista de elementos
bibliográficos referentes: às citações efectuadas ao longo do texto; às obras
Referências
consultadas pelo(s) autor(es), i. é, livros, artigos, monografias, trabalhos
académicos, endereços electrónicos, etc., que poderão ajudar no trabalho
de pesquisa ou de aprofundamento de saberes de cada participante(a).
Introdução
O Manual de Técnicas e Métodos Quantitativos (Tomo 1) tem como objectivo principal orientar
os formandos na utilização do SPSS, constituindo-se simultaneamente como um guião da
matéria leccionada e de uma ficha técnica para realização dos exercícios propostos no âmbito do
Programa PIR PALOP II e do Projecto “Consolidação das Capacidades da Administração
Pública”.
Pretende-se, deste modo, disponibilizar aos formandos um guião que lhes permita acompanhar a
sequência dos pontos do programa e as respectivas aulas. Nesse sentido, este manual não
dispensa a necessidade de se tirar apontamentos nas aulas, nem a leitura e consulta de outra
bibliografia, que permitirá o aprofundamento dos temas, na medida em que aqui se situam
apenas os principais tópicos e as balizas das matérias abordadas.
A sua utilidade para os formandos, para além da já referida, assenta ainda no facto de poder
servir de apoio à elaboração de novo guião para futuras acções de formação que venham a
coordenar, já como formadores.
Procurou-se por isso apresentar o conteúdo dos vários pontos de uma forma clara, simples e
sintética, de maneira a que o essencial seja captado neste manual, podendo ser aprofundado a
partir das referências indicadas.
De acordo com o programa, este manual divide-se em três capítulos, que estão obviamente
relacionados intimamente:
- O primeiro pretende fornecer aos formandos elementos que lhes permitam construir uma
amostra representativa e proceder à selecção aleatória das unidades amostrais.
1
Capítulo 1 – Amostragem
Objectivos
No final deste capítulo os formandos deverão ser capazes de:
1. seleccionar os tipos de amostra mais adequados a cada contexto;
2. calcular a dimensão da amostra e a margem de erro;
3. seleccionar as unidades amostrais.
Palavras
-
-
-
Amostra
Erro amostral
Unidades amostrais
- A população é infinita, ou considerada como tal, não podendo portanto ser analisada
na íntegra;
- Custo excessivo do processo de recolha e tratamento dos dados, como resultado da
grande dimensão da população ou da complexidade do processo de caracterização de
todos os elementos da população;
- Tempo excessivo do processo de recolha e tratamento dos dados, conduzindo à
obtenção de informação desactualizada;
- As populações são dinâmicas, de onde resulta que os elementos ou objectos da
população estão em constante renovação, de onde resulta a impossibilidade de
analisar todos os elementos desta população;
1
Amostra (estatística) . In Infopédia [Em linha]. Porto: Porto Editora, 2003-2008. [Consult. 2008-01-15]. Disponível na www:
<URL: http://www.infopedia.pt/$amostra-(estatistica)>.
Questões pré
prévias ao processo de amostragem
de natureza quantitativa
*Designa-se por população alvo a totalidade dos elementos sobre os quais se deseja obter determinado tipo
de informação
7
Representaç
Representação de uma Amostra*
Universo Hipotético
(praticamente infinito)
Universo ou População, N
(finito)
Amostra, n
(unidades de observação)
8
* in: Bravo, Sierra: Técnicas de Investigación Social, Madrid, Editorial Paraninfo, 1989
População alvo
População a inquirir
Amostra final
9
* in: Reis, Melo, Andrade e Calapez: Estatística aplicada, vol. 2, Lisboa, Sílabo, 1999
Métodos de selecç
selecção da amostra*
•Amostragem aleatória simples
•Amostragem sistemática
Métodos probabilísticos •Amostragem estratificada
(amostragem casual)
•Amostragem por clusters
•Amostragem multi-etapas
•Amostragem multifásica
10
* in: Reis, Melo, Andrade e Calapez: Estatística aplicada, vol. 2, Lisboa, Sílabo, 1999
Métodos de selecç
selecção da amostra (cont)
cont)*
Amostra estratificada*
Área
Norte Centro Sul Outros
(Coimbra, (Lisboa, Total
(Braga e Aveiro e Setúbal e (Restantes
Porto) Leiria) Santarém) distritos)
Sector
Universo
Área
Norte Centro Sul Outros
(Coimbra, (Lisboa, Total
(Braga e Aveiro e Setúbal e (Restantes
Porto) Leiria) Santarém) distritos)
Sector
Produto A 18 16 31 20 85
Produto B 15 7 23 5 50
Produto C 126 55 70 19 270
Produto D 107 61 60 17 245
Total 266 139 184 61 650
* Adaptado de: Reis, Melo, Andrade e Calapez: Estatística aplicada, vol. 2, Lisboa, Sílabo, 1999 12
Métodos de selecç
selecção da amostra (cont)
cont)*
Métodos não probabilísticos - amostragem dirigida
Amostragem por A amostra é seleccionada em função da disponibilidade e
conveniência acessibilidade dos elementos que constituem a população alvo
A escolha dos elementos a incluir na amostra baseia-se na opinião
Amostragem de uma ou mais pessoas que conhecem muito bem as
intencional características específicas da população em estudo, que se
pretende analisar
Determinaç
Determinação da margem de erro em funç
função do nº
nº de elementos*
in: Bravo, Sierra: Técnicas de Investigación Social, Madrid, Editorial Paraninfo, 1989 14
Determinaç
Determinação nº
nº de elementos em funç
função da margem de erro *
in: Bravo, Sierra: Técnicas de Investigación Social, Madrid, Editorial Paraninfo, 1989 15
in: Bravo, Sierra: Técnicas de Investigación Social, Madrid, Editorial Paraninfo, 1989 16
A avaliação deste capítulo consiste num exercício escrito, de resposta às
seguintes questões
Avaliação
Exercício de avaliação:
Comente a frase e diga quais os procedimentos para seleccionar as unidades amostrais (sujeitos)
numa amostra estratificada.
Referências
-
-
corrigida y ampliada, Madrid, Paraninfo (Secção 1).
Reis, E., P. Melo; R. Andrade e T. Calapez (1999) Estatística
Aplicada – volume 2, Lisboa, Sílabo, 3ª edição revista.
Vicente, P.; E. Reis; F. Ferrão (2002), Sondagens-A amostragem
como factor decisivo de qualidade, Lisboa, Edições Sílabo.
2
Reis, E., P. Melo; R. Andrade e T. Calapez (1999) Estatística Aplicada – volume 2, Lisboa, Sílabo, 3ª edição revista.
3
Idem.
2
Capítulo 2 – Introdução ao SPSS
Objectivos
O objectivo geral deste capítulo é o de familiarizar os formandos com o SPSS,
nomeadamente no que se refere:
-
-
Janelas e menus;
Criação e manipulação de bases de dados;
- Tratamento preliminar dos dados.
Palavras
-
-
Variável
Nível de medida
2.1. Editor de dados do SPSS
O editor de dados do SPSS (Data Editor) é composto por duas janelas sobrepostas: Data View e
Variable View. A função da primeira – Data View – é a de introduzir os dados e da segunda -
Variable View – é criar a estrutura da base de dados.
O Data Editor do SPSS é um programa do tipo de folha de cálculo que permite facilmente criar ou
editar ficheiros de dados. Abre automaticamente quando se entra no SPSS.
O seu aspecto é o seguinte:
É nesta janela que são apresentados todos os resultados estatísticos. Abre automaticamente sempre
que um determinado procedimento gera resultados. É possível editar as tabelas e gráficos
produzidos, clicando duas vezes com a tecla esquerda do rato e modificar a sua aparência.
Os menus das janelas principais – Data Editor e Outpur Viewer - são idênticos e têm o seguinte
aspecto visual:
Configuração/parametrização do SPSS
Edit
(Options), inserir novas variáveis e novos casos.
Ajuda em linha;
Help
Tutorial.
As bases de dados são criadas na janela Variable View, devendo a estrutura das variáveis obedecer
às seguintes regras:
A introdução dos dados processa-se na janela Variable View após ter sido criada a estrutura da
base.
Nota: A base de dados que vamos utilizar é um extracto da base de dados do European Social
Survey (round 1)4 com os resultados da aplicação do questionário em Portugal (ficheiro
ESS-Portugal 2002 (base1).sav).
4
A base de dados original está disponível em http://www.europeansocialsurvey.org/.
Pretende-se criar duas novas variáveis: a variável idade a partir da variável f3 (data de
nascimento) e recodificá-la, criando uma nova variável - idade2 - com 4 escalões: até 30 anos; 31
– 50 anos; 50 – 65 anos e > 65 anos.
A variável idade acrescentou-se à base de dados. Vamos agora proceder à sua recodificação,
criando uma nova variável – idade2 – com 4 escalões5:
A variável idade2 acrescentar-se-á à base e deverá ser completada com a alteração do nível de
medida (scale para ordinal) e a definição dos respectivos value labels.
Idade
Cumulative
Frequency Percent Valid Percent Percent
Valid Até 30 anos 341 22.6 22.6 22.6
31 - 50 anos 505 33.4 33.4 56.0
51 - 65 anos 315 20.8 20.8 76.8
> 65 anos 350 23.2 23.2 100.0
Total 1511 100.0 100.0
5
Nota: na recodificação de variáveis é recomendável manter as variáveis originais e criar novas variáveis recodificadas,
escolhendo para o efeito a opção Into diferent variable.
Pretende-se recodificar a variável “escolaridade” (f7) criando uma nova variável (escol) com 3
escalões: até 9 anos; 10 – 12 anos e > 12 anos.
A variável escol acrescentar-se-á à base e deverá ser completada com a alteração do nível de
medida (scale para ordinal) e a definição dos respectivos value labels.
Escolaridade
Cumulative
Frequency Percent Valid Percent Percent
Valid Até 9 anos 1046 69.2 69.2 69.2
10 - 12 anos 251 16.6 16.6 85.8
> 12 anos 212 14.0 14.0 99.9
NR 2 .1 .1 100.0
Total 1511 100.0 100.0
Pretende-se recodificar a variável “autoposicionamento político” (b28) criando uma nova variável
(b28r) com 3 escalões: esquerda; centro e direita.
A variável b28r acrescentar-se-á à base e deverá ser completada com a alteração do nível de
medida (scale para ordinal) e a definição dos respectivos value labels.
Autoposicionamento político
Cumulative
Frequency Percent Valid Percent Percent
Valid Esquerda 296 19.6 24.5 24.5
Centro 620 41.0 51.2 75.7
Direita 294 19.4 24.3 100.0
Total 1211 79.9 100.0
Missing System 304 20.1
Total 1515 100.0
Pretende-se criar dois índices sintéticos: Confiança social (variáveis a8, a9 e a10) e Confiança
institucional (variáveis b7, b8, b9 e b10).
Descriptive Statistics
6
Nota: tratando-se de variáveis rácio, deverão ter casas decimais (1 ou 2).
Exemplo: pretende-se criar uma variável - sexid - através da transformação lógica das variáveis f2
e idade2, com 4 categorias: “homens até 30 anos”, “homens com mais de 30 anos”,
“mulheres até 30 anos” e “mulheres com mais de 30 anos”.
Nota: repetir o comando para as restantes categorias, cujas expressões numéricas são as seguintes:
Categoria 2: f2 = 1 & idade2 > 2
Categoria 3: f2 = 2 & idade2 = 3
Categoria 4: f2 = 2 & idade2 > 4
A variável sexid acrescentar-se-á à base e deverá ser completada com a alteração do nível de
medida (scale para ordinal) e a definição dos respectivos label e value labels.
O resultado é o seguinte:
Sexo e Idade
Cumulative
Frequency Percent Valid Percent Percent
Valid Homens até 30 anos 158 10.5 10.5 10.5
Homens com mais de 30 anos 472 31.2 31.2 41.7
Mulheres até 30 anos 183 12.1 12.1 53.8
Mulheres com mais de 30 anos 698 46.2 46.2 100.0
Total 1511 100.0 100.0
Exemplo: pretende-se criar uma nova variável (ib1) com a inversão da escala da variável interesse
pela política (b1) de modo a que 1 corresponda a “nenhum interesse” e 4 a “muito
interesse”:
O resultado é o seguinte:
b1
Qual o seu interesse pela política
Cumulative
Frequency Percent Valid Percent Percent
Valid Muito interesse 117 7.7 7.8 7.8
Algum interesse 456 30.2 30.3 38.1
Pouco interesse 441 29.2 29.3 67.5
Nenhum interesse 489 32.4 32.5 100.0
Total 1503 99.5 100.0
Missing Recusa 6 .4
Não sabe 2 .1
Total 8 .5
Total 1511 100.0
ib1
Qual o seu interesse pela política
Cumulative
Frequency Percent Valid Percent Percent
Valid Nenhum interesse 489 32.4 32.5 32.5
Pouco interesse 441 29.2 29.3 61.9
Algum interesse 456 30.2 30.3 92.2
Muito interesse 117 7.7 7.8 100.0
Total 1503 99.5 100.0
Missing Não sabe 2 .1
Recusa 6 .4
Total 8 .5
Total 1511 100.0
Exemplo: pretende-se criar uma variável – partciv – que traduza o Índice de participação cívica,
que integre (conte) apenas os inquiridos que responderam sim (1) às questões b15 a
b24.
O resultado é o seguinte:
Cumulative
Frequency Percent Valid Percent Percent
Valid 0 1174 77.7 77.7 77.7
1 145 9.6 9.6 87.3
2 85 5.6 5.6 92.9
3 39 2.6 2.6 95.5
4 30 2.0 2.0 97.5
5 16 1.1 1.1 98.5
6 9 .6 .6 99.1
7 11 .7 .7 99.9
9 1 .1 .1 99.9
10 1 .1 .1 100.0
Total 1511 100.0 100.0
A interpretação é a seguinte: 77,7% (1174) inquiridos não assinalaram nenhum indicador, 9,6%
(145) assinalaram apenas 1, 5,6% (85) assinalaram 2, etc.
Na base de dados (Data View) os registos não seleccionados (filtrados) aparecem tracejados,
mantendo-se assim até que se anule a selecção (filtro). A barra de status informa que a base está
filtrada:
Nota muito importante: não esquecer de desactivar o filtro quando não for necessário:
Na base de dados (Data View) os registos não seleccionados (filtrados) aparecem tracejados,
mantendo-se assim até que se anule a selecção (filtro). A barra de status informa que a base está
filtrada:
Nota muito importante: não esquecer de desactivar o filtro quando não for necessário:
Pretende-se separar a análise pelas 4 categorias (sub-amostras) da variável sexid (sexo e idade).
É possível obter os resultados na mesma tabela, seleccionando a opção Compare groups ou em
tabelas diferentes, com a opção Output by groups:
Descriptive Statistics
No segundo caso seriam produzidas 4 tabelas, uma por cada categoria da variável colocada em
split:
Descriptive Statisticsa
Descriptive Statisticsa
Descriptive Statisticsa
Descriptive Statisticsa
Avaliação deste módulo consiste em criar uma base de dados para o excerto do
seguinte questionário:
Avaliação
Referências
-
Pereira, A. (1999), SPSS-Guia Prático de Utilização, Análise de
Dados para Ciências Sociais e Psicologia, Lisboa, Edições Sílabo, 6ª
edição revista e corrigida.
- Vinacua, B. V. (2002), Análisis Estadístico con SPSS para Windows. Volumen I.
Estadística básica, Madrid, McGraw-Hill, 2ª edición.
Capítulo
3
Capítulo 3 – Estatística aplicada com SPSS
Objectivos O objectivo geral deste capítulo é o de proceder à análise estatística de dados,
nomeadamente:
o Análise univariada – frequências e distribuições;
o Análise bivariada – Cruzamentos, testes de hipóteses e inferência
estatística;
o Análise multivariada:
Previsão - Regressão linear simples e múltipla;
Detectar dimensões latentes - Análise das componentes
principais;
Segmentação: Análise de Clusters
– Frequências
Palavras
–
–
–
–
–
Cruzamentos
Testes de hipóteses
Inferência estatística
Margem de erro
Intervalo de confiança
– Significância estatística
3.1. 1. Frequências
Sexo
Cumulative
Frequency Percent Valid Percent Percent
Valid Masculino 630 41.7 41.7 41.7
Feminino 881 58.3 58.3 100.0
Total 1511 100.0 100.0
Idade
Cumulative
Frequency Percent Valid Percent Percent
Valid Até 30 anos 341 22.6 22.6 22.6
31 - 50 anos 505 33.4 33.4 56.0
51 - 65 anos 315 20.8 20.8 76.8
> 65 anos 350 23.2 23.2 100.0
Total 1511 100.0 100.0
Cumulative
Frequency Percent Valid Percent Percent
Valid Até 9 anos 1046 69.2 69.3 69.3
10 - 12 anos 251 16.6 16.6 86.0
> 12 anos 212 14.0 14.0 100.0
Total 1509 99.9 100.0
Missing NR 2 .1
Total 1511 100.0
7
Nota: as tabelas geradas pelo procedimento Frequencies são em formato “rascunho” destinando-se apenas ao
controlo e validação da base de dados, com o objectivo de eliminar erros de introdução de dados.
N %
Masculino 630 41.7
Sexo Feminino 881 58.3
Total 1511 100.0
Até 30 anos 341 22.6
31 - 50 anos 505 33.4
Idade 51 - 65 anos 315 20.8
> 65 anos 350 23.2
Total 1511 100.0
Até 9 anos 1046 69.2
Anos de 10 - 12 anos 251 16.6
escolaridade > 12 anos 212 14.0
concluídos NR 2 .1
Total 1511 100.0
8
Nota: o quadro foi modificado no respectivo editor, a que se acede “clicando” duas vezes sobre o mesmo.
O resultado é o seguinte:
Descriptive Statistics
9
Nota: as tabelas geradas pelo procedimento Descriptives são em formato “rascunho” destinando-se apenas ao
controlo e validação da base de dados, com o objectivo de eliminar erros de introdução de dados.
Média Desvio-padrão
Ter boas qualificações académicas 6.1 2.5
Ter familiares próximos a viver cá 6.5 2.4
Saber falar a língua oficial do país 6.1 2.6
Ter formação cristã 3.8 3.0
Ser branco 2.8 2.9
Ser rico 6.8 2.8
Ter qualificações profissionais de que o país precisa 7.5 2.2
Querer adaptar-se ao mesmo modo de vida do país 7.1 2.4
c) Gráfico de perfil10:
7.1
Querer adaptar-se ao mesmo modo de vida do país
7.5
Ter qualificações profissionais de que o país precisa
6.8
Ser rico
2.8
Ser branco
3.8
Ter formação cristã
6.1
Saber falar a língua oficial do país
6.5
Ter familiares próximos a viver cá
6.1
Ter boas qualificações académicas
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
Nenhuma importância Muita importância
10
Para obter um gráfico interactivo de linhas, o procedimento é o seguinte: Graph/Interactive/Line, seleccionam-se
todas as variáveis em simultâneo pressionando a tecla “Ctrl” e arrastam-se para “horizontal”.
O gráfico do exemplo foi editado e transformado, tendo-se alterado a escala para o formato real e a cor da linha e
acrescentado as etiquetas (valores e mínimo e máximo), a grelha e a linha de referência.
Exemplo 1: Pretende-se testar se a classe social (classe2) tem uma distribuição uniforme11 no
universo.
O resultado é o seguinte:
Interpretação: A variável classe social não segue uma distribuição uniforme no universo
(χ2(4)=366,123; p=0,000).
11
Testando se as frequências observadas são iguais às frequências esperadas.
3.1.3.2. Kolmogorov-Smirnov
Exemplo: Pretende-se testar se o interesse pela política (ib1) segue uma distribuição normal ou
uniforme no universo.
O resultado é o seguinte:
Interpretação: A variável interesse pela política não segue uma distribuição normal
(K-S=8,001; p=0,000) nem uniforme (K-S=12,613; p=0,000) no universo.
Exemplo: Pretende-se testar se a confiança social adere à média que corresponde ao centro da
escala (5)12 dos indicadores que compõem a variável (confsoc).
O resultado é o seguinte:
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
Índice sintético de
1480 4.316 1.7469 .0454
Confiança social
One-Sample Test
Test Value = 5
95% Confidence
Mean Interval of the Difference
t df Sig. (2-tailed) Difference Lower Upper
Índice sintético de
-15.073 1479 .000 -.684 -.774 -.595
Confiança social
12
A escala de medida dos indicadores de confiança social varia entre 0=nenhuma e 10=toda.
Exemplo 1: Pretende-se saber se há relação entre o sexo e o facto de ter comprado produtos por
razões de ordem política, ética ou ambiental.
O resultado é o seguinte:
% within Sexo
Comprou produtos por
razões de ordem
política, ética ou
ambiental
Sim Não Total
Sexo Masculino 7.2% 92.8% 100.0%
Feminino 7.7% 92.3% 100.0%
Total 7.5% 92.5% 100.0%
Chi-Square Tests
*
Para a selecção dos testes estatísticos, ver o Anexo 1.
Interpretação: As mulheres compram ligeiramente mais que os homens mas as diferenças não
são estatisticamente significativas (χ2 (1)=0,121; p>0,05).
O resultado é o seguinte:
Comprou
produtos por
razões de
ordem
política, ética
ou ambiental
Sexo Chi-square .121
df 1
Sig. .728
Results are based on nonempty rows and
columns in each innermost subtable.
Exemplo 1: Pretende-se testar se há relação entre o sexo (f2) e o interesse pela política (ib1).
O resultado é o seguinte:
Test Statisticsa
Qual o seu
Ranks interesse
Sexo N Mean Rank Sum of Ranks pela política
Qual o seu interesse Masculino 628 815.82 512336.00 Mann-Whitney U 234670.000
pela política Feminino 875 706.19 617920.00 Wilcoxon W 617920.000
Total 1503 Z -5.058
Asymp. Sig. (2-tailed) .000
a. Grouping Variable: Sexo
Interpretação: a média das ordenações (Mean Rank) é superior nos homens. Ou seja, os homens
referem que têm mais interesse pela política do que as mulheres. As diferenças são
estatisticamente significativas (M-W=234670; p=0,000).
13
Consultar o Anexo 1.
Exemplo 2: Pretende-se testar se há relação entre o sexo (f2) e o grau de escolaridade (escol).
14
Consultar o Anexo 1.
O resultado é o seguinte:
Test Statisticsa
Escolaridade
Most Extreme Absolute .025
Differences Positive .025
Negative -.014
Kolmogorov-Smirnov Z .476
Asymp. Sig. (2-tailed) .977
a. Grouping Variable: Sexo
Exemplo: Pretende-se testar se há relação entre a idade (idade2) e o interesse pela política (ib1).
15
Consultar o Anexo 1.
O resultado é o seguinte:
Test Statisticsa,b
Ranks
Qual o seu
Idade N Mean Rank interesse
Qual o seu interesse Até 30 anos 339 777.35 pela política
pela política Chi-Square 36.088
31 - 50 anos 504 803.46
df 3
51 - 65 anos 313 768.74
Asymp. Sig. .000
> 65 anos 347 637.38
a. Kruskal Wallis Test
Total 1503
b. Grouping Variable: Idade
Interpretação: A média das ordenações (Mean Rank) é mais elevada nos que têm entre 31 e 50 anos,
sendo este escalão, por conseguinte, que refere ter mais interesse pela política, enquanto os mais
velhos são os que revelam menos interesse. As diferenças são estatisticamente significativas (K-W
(3)=36,088; p=0,000).
Exemplo: Pretende-se testar se a média da confiança social (confsoc) é idêntica, ou não, à média
da confiança institucional (confinst).
O resultado é o seguinte:
Std. Error
Mean N Std. Deviation Mean
Pair 1 Índice sintético de
4.313 1319 1.7165 .0473
Confiança social
Índice sintético de
4.087 1319 1.7606 .0485
Confiança institucional
N Correlation Sig.
Pair 1 Índice sintético de
Confiança social &
1319 .310 .000
Índice sintético de
Confiança institucional
Paired Differences
95%
Confidence
Interval of the
Std. Error Difference
Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)
Pair 1 Índice sintético de
Confiança social -
.225 2.0428 .0562 .115 .336 4.009 1318 .000
Índice sintético de
Confiança institucional
16
Consultar o Anexo 1.
Exemplo: Pretende-se testar se há relação entre o sexo (f2) e a confiança social (confsoc).
O resultado é o seguinte:
Group Statistics
Std. Error
Sexo N Mean Std. Deviation Mean
Índice sintético de Masculino 612 4.412 1.7476 .0706
Confiança social Feminino 868 4.248 1.7442 .0592
Levene's Test
for Equality of
Variances t-test for Equality of Means
95%
Confidence
Interval of the
Mean Std. Error Difference
F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper
Índice sintético de Equal variances assumed .182 .669 1.781 1478 .075 .164 .0921 -.0167 .3448
Confiança social Equal variances not
1.780 1313.926 .075 .164 .0922 -.0167 .3449
assumed
17
Consultar o Anexo 1.
Interpretação: Os homens (4,412) revelam mais confiança social que as mulheres (4,248) 18 ,
embora a diferença não seja estatisticamente significativa, (t (1480)=1,808; p> 0,05).
Exemplo: Pretende-se testar se há relação entre a idade (idade2) e a confiança social (confsoc).
O resultado é o seguinte:
Descriptives
18
O índice de confiança social varia entre 0=nenhuma confiança e 10=toda a confiança.
19
Consultar o Anexo 1.
ANOVA
Interpretação: São os mais novos (4,722), seguidos dos mais velhos (4,519) que mais confiam.
Os escalões intermédios 31-50 anos (4,058) e 51-65 anos ( (4,068) confiam um pouco menos. As
diferenças são estatisticamente significativas (F (3)=13,787; p=0,000).
Nota: sendo as diferenças estatisticamente significativas, importa saber quais os grupos que
diferem uns dos outros. Para o efeito realiza-se um teste à posteriori (Post Hoc). O SPSS
disponibiliza vários testes para este fim, sendo os mais utilizados, o teste de Scheffe20, no caso de
as variâncias serem iguais, e o teste Games-Howell no caso de serem diferentes.
Neste caso, uma vez que se rejeita a hipótese de as variâncias serem iguais (p=0,007), vamos
solicitar o teste Games-Howell:
20
Que é também o mais conservador,
O resultado é o seguinte:
Multiple Comparisons
A correlação linear simples permite obter uma medida (coeficiente de correlação – r de Pearson)
através da qual se determina a força ou intensidade de uma associação linear entre duas ou mais
variáveis quantitativas ou tratadas como tal (escalas tipo Likert).
O coeficiente de correlação varia entre –1 e 121 e deve ser interpretado da seguinte forma:
0: ausência de correlação;
+/- ]0 – 0,25]: correlação muito fraca;
+/- ]0,25 – 0,40] correlação fraca;
+/- ]0,40 – 0,60] correlação média;
+/- ]0,60 – 0,75] correlação média forte;
+/- ]0,75 – 0,90] correlação forte;
+/- ]0,90 – 1[ correlação muito forte;
+/- 1 correlação perfeita
Exemplo: Correlação entre as variáveis satisfação com a vida (b29), com a economia (b30), com o
Governo (b31), com a democracia (b32), com a educação (b33) e com os serviços de
saúde (b34):
21
O sinal – significa uma correlação negativa e a ausência de sinal uma correlação positiva.
O resultado é o seguinte:
Correlations
Satisfação
com a vida Serviços
em geral Economia Governo Democracia Educação de Saúde
Satisfação com a Pearson Correlation
vida em geral Sig. (2-tailed)
N
Economia Pearson Correlation .339**
Sig. (2-tailed) .000
N 1441
Governo Pearson Correlation .280** .578**
Sig. (2-tailed) .000 .000
N 1413 1392
Democracia Pearson Correlation .348** .403** .507**
Sig. (2-tailed) .000 .000 .000
N 1371 1353 1339
Educação Pearson Correlation .205** .361** .289** .300**
Sig. (2-tailed) .000 .000 .000 .000
N 1429 1389 1367 1338
Serviços de Saúde Pearson Correlation .195** .396** .340** .294** .537**
Sig. (2-tailed) .000 .000 .000 .000 .000
N 1489 1440 1412 1370 1433
**. Correlation is significant at the 0.01 level (2-tailed).
A regressão linear, como referem Bryman e Cramer, “é um poderoso instrumento para resumir a
natureza da associação entre variáveis e para fazer previsões acerca dos valores da variável
dependente”.22
Exemplo: pretende-se saber em que medida é que a confiança social (confsoc) – variável
independente – explica a confiança institucional (confinst) – variável dependente.
22
Alan Bryman e Duncan Cramer, op.cit.: 212
O resultado é o seguinte:
Model Summary
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 392.354 1 392.354 139.912 .000a
Residual 3693.263 1317 2.804
Total 4085.617 1318
a. Predictors: (Constant), Índice sintético de Confiança social
b. Dependent Variable: Índice sintético de Confiança institucional
Coefficients a
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2.716 .125 21.778 .000
Índice sintético de
.318 .027 .310 11.828 .000
Confiança social
a. Dependent Variable: Índice sintético de Confiança institucional
Os testes t (no quadro dos Coefficients), testam a nulidade dos coeficientes. No primeiro caso
(t=115,605; p=0,000) testa a probabilidade de a constante (recta de regressão na origem) ser 0, e
no segundo caso testa a probabilidade do coeficiente de regressão ser 0.
A recta da regressão24, neste caso, é a seguinte: Confiança institucional = 2,716 + 0,318 confiança
social.
23
O coeficiente de determinação quantifica a percentagem de variação da variável dependentes que é explicada pela
variação da variável independente.
24
A equação simplificada da recta da regressão é a seguinte: Yi = β0 + β1 Xi, em que Yi é a variável dependente, β0 é a
ordenada na origem, β 1 é o coeficiente de regressão e Xi é a variável independente.
No nosso exemplo vamos usar a análise de regressão múltipla – em concreto a linear – para
modelar a relação entre as variáveis independentes e a variável dependente26.
Exemplo: com base nos dados do ESS, pretende-se saber se os níveis de satisfação com o estado
da Economia portuguesa (b30), com a forma como o Governo tem governado (b31),
com a qualidade da Democracia (b32), com o estado da Educação (b33) e com os
Serviços de Saúde (b33) são, ou não, predictores da satisfação com a vida em geral
(b29):
Variável dependente
Variáveis independentes
(b30, b31, b32, b33 e b34)
Método: Stepwise
(Neste método entram no modelo
apenas as variáveis independentes
com significância estatística, por
ordem de importância.)
Nota: é habitual usar-se o método
ENTER quando se pretende
testar um modelo e o método
Stepwise em contextos
exploratórios, como é o caso.
25
Bryman, A. e D. Cramer, Análise de Dados em Ciencias Sociais, Oeiras, Celta, 2003.
26
Quando se associa às variáveis o estatuto de independentes e dependente pretende-se analisar mais do que a
associação entre elas (entenda-se variação conjunta), descrever e explicar uma relação de dependencia que deverá
ser teóricamente fundamentada.
Procedimentos seleccionados:
Resultado:
Variables Entered/Removed a
Variables Variables
Model Entered Removed Method • Variáveis que
1 Stepwise (Criteria: Probability-of-F-to-enter
Democracia .
<= .050, Probability-of-F-to-remove >= .100).
entraram nos
2
Economia .
Stepwise (Criteria: Probability-of-F-to-enter modelos
<= .050, Probability-of-F-to-remove >= .100).
a. Dependent Variable: Satisfação com a vida em geral
Model Summary
Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .346a .119 .119 2.086 .119 174.812 1 1289 .000
2 .406b .165 .164 2.032 .046 70.245 1 1288 .000
a. Predictors: (Constant), Democracia
b. Predictors: (Constant), Democracia, Economia
Coefficientsa
A Análise das Componentes Principais é um dos métodos de redução de dados mais comum no
marketing e em pesquisas de mercado. É “uma técnica de análise exploratória multivariada que
transforma um conjunto de variáveis correlacionadas entre si num conjunto menor de variáveis
independentes, combinações lineares das variáveis originais, designadas por componentes
principais”27. No essencial, o seu objectivo “é identificar novas variáveis, em número menor que o
conjunto inicial, mas sem perda significativa da informação contida neste conjunto”28.
Vamos começar por solicitar uma ACP com a extracção das componentes por defeito (critério de
Kaiser: valor próprio das componentes ≥ a 1).
• Selecção das
variáveis;
27
Moroco, J. Análise Estatística com utilização do SPSS, Lisboa, Sílabo, 2003: 231.
28
Reis, E., Análise factorial das componentes principais: um método de reduzir sem perder informação, Lisboa
Giesta/Iscte, 1990.
• Kaiser-Meyer-Olkin: quantifica
o nível de intercorrelações entre
as variáveis;
• Testa a hipótese de a matriz de
correlações na população ser a
matriz identidade.
• Critério de Kaiser de
extracção das componentes
que o SPSS usa por defeito.
São extraídas as
componentes com valores
próprias superiores a 1.
Cada componente deve
contribuir para a variância,
como se de uma variável de
input se tratasse.
Adequabilidade da ACP:
Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Component Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
1 3.518 43.975 43.975 3.518 43.975 43.975 3.007 37.587 37.587
2 1.283 16.043 60.018 1.283 16.043 60.018 1.795 22.432 60.018
3 .978 12.230 72.248
4 .539 6.739 78.987
5 .493 6.165 85.153
6 .419 5.244 90.396
7 .391 4.885 95.282
8 .377 4.718 100.000
Extraction Method: Principal Component Analysis.
Como podemos observar, por defeito foram extraídas duas componentes, que explicam cerca de
60% da variância total.
Verificando-se que a terceira componente tem uma valor próprio próximo de 1 (0,984) e que
aumenta a variância explicada em 12,3%, vamos forçar a sua extracção e gravar as três
componentes extraídas como novas variáveis:
Descriptive Statistics
Std. Analysis
Mean Deviation N KMO and Bartlett's Test
Ter boas qualificações académicas 6.11 2.527 1330 Kaiser-Meyer-Olkin Measure of Sampling
Ter familiares próximos a viver cá 6.44 2.407 1330 Adequacy. .812
Saber falar a língua oficial do país 6.01 2.615 1330
Ter formação cristã 3.77 2.906 1330 Bartlett's Test of Approx. Chi-Square 3474.721
Ser branco 2.82 2.825 1330 Sphericity df 28
Ser rico 6.77 2.812 1330 Sig. .000
Ter qualificações profissionais de que o país precisa 7.45 2.247 1330
Querer adaptar-se ao mesmo modo de vida do país 7.07 2.448 1330
Communalities
As Comunalidades representam a
Initial Extraction
Ter boas qualificações académicas 1.000 .590
proporção de variância da variável
Ter familiares próximos a viver cá 1.000 .788 explicada pelas componentes.
Saber falar a língua oficial do país 1.000 .719 Variáveis com comunalidades
Ter formação cristã 1.000 .756
Ser branco 1.000 .786
reduzidas (0,3 ou inferior) são
Ser rico 1.000 .722 pouco explicadas pelas
Ter qualificações profissionais de que o país precisa 1.000 .749 componentes e contribuem pouco
Querer adaptar-se ao mesmo modo de vida do país 1.000 .669
Extraction Method: Principal Component Analysis.
para a sua definição.
Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Component Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
1 3.518 43.975 43.975 3.518 43.975 43.975 2.152 26.898 26.898
2 1.283 16.043 60.018 1.283 16.043 60.018 1.951 24.389 51.287
3 .978 12.230 72.248 .978 12.230 72.248 1.677 20.961 72.248
4 .539 6.739 78.987
5 .493 6.165 85.153
6 .419 5.244 90.396
7 .391 4.885 95.282
8 .377 4.718 100.000
Extraction Method: Principal Component Analysis.
Component
1 2 3
Ter qualificações profissionais de que o país precisa .785 .361 -.053
Querer adaptar-se ao mesmo modo de vida do país .775 .244 .089
Ser rico .771 -.014 .358
Ter familiares próximos a viver cá .110 .880 .047
Saber falar a língua oficial do país .260 .741 .319
Ter boas qualificações académicas .487 .587 .090
Ser branco .124 .011 .878
Ter formação cristã .094 .305 .809
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 4 iterations.
0,05
0,20
média
0,00
média
0,00
-0,05
-0,20
29
O SPSS utiliza várias formas de rotação, sendo a mais usada a rotação Varimax, de modo a permitir uma mais fácil
interpretação dos factores, pois torna os loadings elevados ainda mais elevados e os loadings baixos ainda mais
baixos. Para a interpretação das componentes consideram-se os loadings mais correlacionados com as mesmas.
Em geral, consideram-se bons os loadings maiores ou iguais a 0,5, por serem pelo menos responsáveis por 25% da
variância. (cfr. Pestana e Gageiro, Análise de Dados para as Ciências Sociais – A complementaridade do SPSS,
Lisboa, Sílabo, 3ª edição, 2003: 504.
0,10
0,10
média
0,00
-0,10
média
0,00
-0,20
-0,30
-0,10
-0,40
De acordo com Moroco, 30 “a análise de Clusters é uma técnica multivariada que não possui
sólidos fundamentos teóricos e que procura agrupar objectos mais ou menos homogéneos segundo
critérios mais ou menos heurísticos”.
A classificação dos sujeitos em cada um dos clusters é, regra geral, mais rigorosa nos métodos
não-hierárquicos do que nos hierárquicos, podendo a validade das soluções obtidas com os
métodos hierárquicos – segundo Elizabeth Reis – tornar-se bastante limitada. Alguns autores
propõem, por isso, a utilização de métodos não-hierárquicos de optimização que permitam a
partição dos indivíduos num número pré definido de grupos.
30
Cfr. Reis, Elizabeth, A Análise de Clusters e as Aplicações às Cíências Empresariais: Uma Visão Crítica da Teoria
dos Grupos Estratégicos, in Elizabeth Reis e Manuel Alberto M. Ferreira (eds.) Temas em Métodos Quantitativos
1, Lisboa, Sílabo, 2000: 206-238 e Moroco, João, Análise Estatística com utilização do SPSS, Lisboa, Sílabo,
2003
31
Estes coeficientes são o valor numérico para o qual vários indivíduos ou grupos se unem para formarem um novo
grupo e são disponibilizados pelo SPSS no método hierárquico (Aglomeration Schedule).
por conseguinte, maiores distâncias, “onde a escolha óptima do número de grupos coincidirá com
uma marcada horizontalidade da curva”32.
Exemplo: pretende-se seleccionar e criar clusters com base nos 8 indicadores relativos às atitudes
face à imigração (d10 + d11 + d12 + d13 + d14 + d15 + d16 + d17)
Escolha do Método
Betwen-groups linkage (Distância média entre grupos): a
distância do 1º cluster aos restantes objectos é a média das
distâncias de cada um dos elementos que constituem o
cluster a cada um dos restantes objectos.
• Melhor performance com dados com grande dispersão;
• Influenciado por outliers;
• Tendência para produzir clusters com variâncias
homogéneas.
Within-groups linkage: Este método é semelhante à
“Distância média entre grupos” mas os clusters são unidos
de modo a que a variabilidade dentro dos grupos seja
mínima.
Nearest Neighbor (Vizinho mais próximo): a distância do
1º cluster aos restantes objectos, é a menor das distâncias
de cada um dos elementos que constituem o cluster a cada
um dos restantes objectos.
• Tendência para formar clusters alongados;
• Menos influenciado por outliers;
Furthest Neighbor (Vizinho mais distante): a distância do
1º cluster aos restantes objectos, é a maior das distâncias
de cada um dos elementos que constituem o cluster a cada
um dos restantes objectos.
• Menos influenciado por outliers;
Centroid clustering: a distância entre dois grupos é a
diferença entre as suas médias para todas as variáveis.
• Pior performance com dados com grande dispersão
• Menos influenciado por outliers;
Median clustering (Distância mediana): A distância entre
Escolhemos o Ward’s method, pois, sendo um dois objectos é a mediana das distâncias de cada um dos
elementos que constituem o cluster a cada um dos restantes
dos métodos mais usado, tem tendência para objectos.
32
Reis, op.cit.
constituir grupos com dimensões idênticas. Ward’s method: optimiza a variância mínima dentro dos
grupos, agrupando os objectos que provoquem um
aumento mínimo da soma dos quadrados dos erros.
• Boa performance com dados com grande dispersão;
• Influenciado por outliers
• Tendência para produzir clusters com dimensão
semelhante.
A variável CLU4-1 (primeira solução com 4 clusters) acrescentou-se à base de dados, tendo sido
completada com os respectivos label.
Cumulative
Frequency Percent Valid Percent Percent
Valid Cluster 1 498 33.0 37.4 37.4
Cluster 2 299 19.8 22.5 59.9
Cluster 3 423 28.0 31.8 91.7
Cluster 4 110 7.3 8.3 100.0
Total 1330 88.0 100.0
Missing System 181 12.0
Total 1511 100.0
33
Pois são os que apresentam maior distância entre si. No entanto, seria sempre possível ensaiar soluções com mais
clusters. No essencial, mais clusters significam mais homogeneidade entre os seus elementos e menos clusters
menos homogeneidade.
34
Uma vez que já não necessitamos dos coeficientes de aglomeração.
Exemplo: pretende-se seleccionar e criar clusters com base nos 8 indicadores relativos às atitudes
face à imigração (d10 + d11 + d12 + d13 + d14 + d15 + d16 + d17)
1. Selecção das
variáveis;
2. Indicação do nº de
Clusters
pretendidos (vamos
indicar 4, de acordo
com o processo
anterior)
3. Criação de uma
nova variável que
regista a pertença
de cada observação
ao cluster
respectivo
A variável QCL_1 (primeira solução com 4 clusters) acrescentou-se à base de dados, tendo sido
completada com os respectivos label.
O resultado é o seguinte:
Cumulative
Frequency Percent Valid Percent Percent
Valid Cluster 1 334 22.1 25.1 25.1
Cluster 2 459 30.4 34.5 59.6
Cluster 3 324 21.4 24.4 84.0
Cluster 4 213 14.1 16.0 100.0
Total 1330 88.0 100.0
Missing System 181 12.0
Total 1511 100.0
Para este exemplo interessa saber, no entanto, que “a análise de clusters é uma técnica
multivariada que não possui sólidos fundamentos teóricos e que procura agrupar objectos mais ou
menos homogéneos segundo critérios mais ou menos heurísticos” 35.
Exemplo: Pretende-se criar três clusters (grupos homogéneos) com base nas três componentes
principais obtidas no exercício anterior.
Trata-se de um método de classificação (classifica indivíduos), cujo procedimento, que vai ser
descrito detalhadamente no capítulo 5, é o seguinte:
Acrescentou-se à base de dados uma nova variável com 3 categorias, que designámos de Cluster 1,
Cluster 2 e Cluster 3, que agrupa os indivíduos com valores semelhantes nas três Componentes36
35
Moroco, J. Análise Estatística com utilização do SPSS, Lisboa, Sílabo, 2003.
36
Nota: como se torna evidente, os valores são mais ou menos semelhantes quantos mais ou menos clusters criarmos.
Ou seja, mais clusters significa mais homogeneidade entre os clusters.
Cumulative
Frequency Percent Valid Percent Percent
Valid Cluster 1 480 31.8 36.1 36.1
Cluster 2 624 41.3 46.9 83.0
Cluster 3 226 15.0 17.0 100.0
Total 1330 88.0 100.0
Missing System 181 12.0
Total 1511 100.0
1.00
0.50
(Médias)
0.00
-0.50
-1.00
Cluster 1
Cluster 2
Cluster 3
-1.50
Recursos profissionais e económicos
Facilidades de integração
Características raciais e religiosas
Interpretação:
– A avaliação deste capítulo consiste na avaliação da participação
nas aulas e da realização dos exercícios que compõem o seu
conteúdo.
Avaliação
Referências
– Aranaz, M. F. (2001), SPSS para Windows. Análise Estadístico,
Madrid, McGraw-Hill.
– Bryman, A. e D. Cramer (2003), Análise de Dados em Ciências
Sociais – Introdução às Técnicas Utilizando o SPSS para
Windows, Lisboa, Celta (3ª edição).
– Moroco, J. (2003) Análise Estatística com utilização do SPSS,
Lisboa, Edições Sílabo, 3ª edição.
– Pereira, A. (1999), SPSS-Guia Prático de Utilização, Análise de Dados para Ciências
Sociais e Psicologia, Lisboa, Edições Sílabo, 6ª edição revista e corrigida.
– Pestana, M. H. e J. N. Gageiro (2000), Análise de Dados para as Ciências Sociais – A
Complementaridade do SPSS, Lisboa, Sílabo, 2ª edição revista e aumentada.
– Rada, Vidal Díaz (2002), Técnicas de Análise Multivariante para Investigación Social
e Comercial, Madrid, RA-MA.
– Reis, E., Análise factorial das componentes principais: um método de reduzir sem
perder informação, Lisboa Giesta/Iscte, 1990.
– Vaus, D (2004), Analysing Social Science Data, London, Sage Publications.
– Vinacua, B. V. (2002), Análisis Estadístico con SPSS para Windows. Volumen I.
Estadística básica, Madrid, McGraw-Hill, 2ª edición.
– Vinacua, B. V. e J. C. M Canas (2002), Análisis Estadístico con SPSS para Windows.
Volumen II. Estadística multivariante, Madrid, McGraw-Hill, 2ª edición.
ANEXO 1
em
Questionário adaptado
http://www.europeansocialsurvey.org/