P. 1
SPSS - MANUAL DE UTILIZAÇÃO

SPSS - MANUAL DE UTILIZAÇÃO

4.84

|Views: 123.275|Likes:
Publicado portermoplana
Versão do programa estatístico SPSS em português.
Versão do programa estatístico SPSS em português.

More info:

Published by: termoplana on Aug 20, 2008
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

08/20/2013

pdf

text

original

Sections

ESCOLA SUPERIOR AGRÁRIA

INSTITUTO POLITÉCNICO DE CASTELO BRANCO

SPSS - MANUAL DE UTILIZAÇÃO

ARMANDO MATEUS FERREIRA

Escola Superior Agrária de Castelo Branco, 1999

SPSS

Índice

ESACB

i

ÍNDICE

1 - INTRODUÇÃO..........................................................................................1

2 - EDITOR DE DADOS..............................................................................3

2.1 -

CRIAR UM FICHEIRO DE DADOS..................................................5

2.1.1 - DEFINIÇÃO DE VARIÁVEIS .................................................................... 5
2.1.2 - INTRODUÇÃO DOS VALORES ................................................................ 9
2.1.3 - GRAVAR O FICHEIRO DE DADOS........................................................ 11
2.1.4 - ABRIR UM FICHEIRO DE DADOS EXISTENTE.................................... 12
2.1.5 - ACESCENTAR NOVOS CASOS A UM FICHEIRO DE DADOS............... 13
2.1.6 - ACRESCENTAR NOVAS VARIÁVEIS...................................................... 14
2.1.7 - DEFINIR UMA VARIÁVEL EM FUNÇÃO DE OUTRAS ......................... 15
2.1.8 - ELIMINAR LINHAS E VARIÁVEIS.......................................................... 16

2.2 -

IMPORTAÇÃO DE FICHEIROS EXTERNOS..............................17

2.2.1 - IMPORTAÇÃO DE FICHEIROS LOTUS E EXCEL 4.0........................... 17
2.2.2 - IMPORTAÇÃO DE FICHEIROS DE DBASE........................................... 18
2.2.3 - IMPORTAÇÃO DE FICHEIROS EXCEL................................................. 19
2.2.4 - IMPORTAÇÃO DE FICHEIROS ACCESS............................................... 22
2.2.5 - RECODIFICAÇÃO DE VALORES........................................................... 22
2.2.6 - SELECÇÃO DE CASOS........................................................................... 25

3 - ANÁLISE DE DADOS.........................................................................29

3.1 -

OBTER ESTATÍSTICAS DESCRITIVAS.......................................29

3.1.1 - PROCEDIMENTO DESCRIPTIVES........................................................ 29
3.1.2 - PROCEDIMENTO EXPLORE................................................................. 32
3.1.3 - PROCEDIMENTO EXPLORE COM FACTORES.................................... 36
3.1.4 - PROCEDIMENTO FREQUENCIES........................................................ 39

4 - GRÁFICOS.................................................................................................44

4.1 -

GRÁFICOS STANDARDIZADOS....................................................44

4.1.1 - GRÁFICO DE BARRAS........................................................................... 45
4.1.2 - HISTOGRAMA........................................................................................ 50
4.1.3 - GRÁFICO DE EXTREMOS-E-QUARTIS................................................. 52
4.1.4 - GRÁFICO DE BARRA DE ERROS.......................................................... 54
4.1.5 - GRÁFICOS DE PROBABILIDADES........................................................ 56
4.1.6 - GRÁFICO DE DISPERSÃO..................................................................... 59

4.2 -

EDIÇÃO DOS GRÁFICOS STANDARDIZADOS........................62

4.3 -

GRÁFICOS INTERACTIVOS............................................................65

4.3.1 - GRÁFICO DE BARRAS........................................................................... 66
4.3.2 - GRÁFICO DE DISPERSÃO..................................................................... 70

4.4 -

EDIÇÃO DE GRÁFICOS INTERACTIVOS...................................75

SPSS

Índice

ESACB

ii

5 -

TESTES T.........................................................................................................79

5.1 - TESTE T PARA A MÉDIA DE UMA AMOSTRA......................................82
5.2 - TESTE T PARA DUAS AMOSTRAS INDEPENDENTES.........................83
5.3 - TESTE T PARA DUAS AMOSTRAS EMPARELHADAS.........................86

6 -

ANÁLISE DE VARIÂNCIA...........................................................................90

6.1 - ENSAIOS UNI-FACTORIAIS......................................................................90

6.1.1 - PROCEDIMENTO ONE-WAY ANOVA................................................. 91
6.1.2 - PROCEDIMENTO MEANS.................................................................... 96

6.2 - ENSAIOS MULTI-FACTORIAIS.................................................................99

7 -

REGRESSÃO LINEAR.................................................................................111

7.1 - INTRODUÇÃO............................................................................................111
7.2 - REGRESSÃO LINEAR SIMPLES..............................................................115
7.3 - REGRESSÃO LINEAR MÚLTIPLA..........................................................121
7.4 - AJUSTAMENTO DE MODELOS PRÉ-DEFINIDOS................................131

8 -

MANUSEAR OS RESULTADOS.................................................................136

ANEXOS.....................................................................................................................143

SPSS

1 - Introdução

ESACB

1

1 - INTRODUÇÃO

O pakage estatístico SPSS para Windows é um poderoso sistema de análises estatísticas e
manuseamento de dados, num ambiente gráfico, em que a utilização mais frequente, para a
maioria das análises a efectuar, se resume à selecção das respectivas opções em menus e
caixas de diálogo. Contudo, o sistema dispõe de um editor de comandos, a que o utilizador
mais avançado poderá recorrer a fim de realizar determinado tipo de análises mais
complexas e elaboradas.

De um modo muito sucinto, o sistema SPSS dispõe de:

Data Editor: Editor de Dados: uma versátil folha de cálculo, que permite definir,
introduzir, modificar, corrigir e visualizar a informação. O Data Editor abre
automaticamente quando se entra no SPSS.

Viewer:

Janela de Resultados: Todos os resultados estatísticos, tabelas, gráficos, são
visualizados numa janela designada por Viewer. Uma janela Viewer abre
automaticamente na primeira vez que o utilizador executar uma tarefa que
gera output.
Na figura seguinte apresenta-se o aspecto da janela de resultados referentes
ao cálculo das estatísticas elementares um conjunto de dados (variável com
o nome fosfo). O Viewer é composto por duas janelas: à esquerda está um
organigrama do output; à direita estão os resultados propriamente ditos.
Neste exemplo, os resultados incluem as instruções necessárias à execução

SPSS

1 - Introdução

ESACB

2

da tarefa: é o que se designa por Log1

, e que é composto pelas seguintes

linhas de instruções:

DESCRIPTIVES
VARIABLES=fosfo
/STATISTICS=MEAN SUM STDDEV VARIANCE RANGE MIN MAX SEMEAN KURTOSIS SKEWNESS .

Estas instruções foram geradas, no caso, pela selecção de opções nos menus
do programa; contudo, podem ser digitadas, como se de uma linguagem de
programação se tratasse2
.

Pivot Tables: Tabelas Dinâmicas: O programa dispõe de uma potente rotina de geração de
tabelas dinâmicas (ou pivot tables), que permitem que o utilizador explore
os dados, com o re-arranjo de colunas e linhas.

Gráficos:

O SPSS permite realizar todos os tipos de gráficos usuais em estatística, a
fim de realçar as análises efectuadas.

Acesso a Bases de Dados: O SPSS permite o acesso às bases de dados mais usuais, em
formato SQL e ODBC, tais como ficheiros de dados criados em dBase,
Access, Excel, Lotus, etc. A importação de ficheiros de texto, Access,
Excel, é feita através de um assistente de importação (wizard).

1

O Log pode não estar visível; só aparece na janela Viewer se se tiver configurado o programa para
mostrar este item.

2

O utilizador pode escrever as suas próprias rotinas de análise; para tal, deve abrir o SPSS Syntax
Editor, janela de edição de comandos do SPSS.

SPSS

2 - Edição de Dados

ESACB

3

2 - EDITOR DE DADOS

O Data Editor do SPSS é um programa do tipo de folha de cálculo que permite facilmente
criar ou editar ficheiros de dados. O Data Editor abre automaticamente quando se entra no
SPSS.

O aspecto inicial do editor é o seguinte:

Muitas das características do data editor do SPSS são similares ás de qualquer folha de
cálculo em ambiente Windows, tal como o Excel.

As colunas correspondem às variáveis. Inicialmente, todas as colunas, ou variáveis, tem o
mesmo nome genérico, var, tal como é mostrado na imagem. O utilizador irá dar os nomes
às variáveis que definir.

As linhas correspondem aos casos, ou indivíduos.

Cada célula contém um valor ou observação de um indivíduo, em relação a uma
determinada característica ou variável. As células podem apenas conter valores (numéricos
ou alfanuméricos); não é possível, tal como se faz nas folhas de cálculo, definir fórmulas
em células. O SPSS permite definir fórmulas, mas que afectam integralmente toda uma
variável ou coluna.

O ficheiro de dados é rigorosamente rectangular, sendo o seu tamanho definido pelo
número de casos e de variáveis. O utilizador pode introduzir valores em células fora das

SPSS

2 - Edição de Dados

ESACB

4

fronteiras actuais da folha de cálculo; contudo, o SPSS automaticamente acrescenta linhas
e/colunas de modo a que essa nova observação fique incluída dentro da estrutura
rectangular. A fim de ilustrar este aspecto, considere a seguinte imagem referente a um
folha de dados do SPSS, em que existem duas variáveis (com os nomes x e y), com 6 casos
ou observações. Repare na posição da célula activa.

Se se introduzir um valor (por exemplo, 25) para esta célula, fora dos limites do ficheiro
rectangular, o SPSS cria duas novas variáveis numéricas atribuindo-lhes automaticamente
os nomes var00002 e var00003, e introduz valores em branco para as células, de modo a
ficar um ficheiro rectangular, com 4 variáveis e 7 casos (repare que estas células têm o
ponto decimal):

Estas células, aparentemente vazias, são assumidas pelo SPSS como “missing values”, isto
é, observações em falta para algumas variáveis. Contudo, e para já, estas células não
afectam os cálculos estatísticos, caso se se trate de variáveis numéricas. Por exemplo,
calculando a média da variável x obter-se-á o valor de 15, como é lógico, para os valores
apresentados.

SPSS

2 - Edição de Dados

ESACB

5

2.1 - CRIAR UM FICHEIRO DE DADOS

Vamos usar os seguintes dados a fim de ilustrar como se cria um ficheiro com o Data Editor
do SPSS. Trata-se dos resultados de um ensaio, em que se registaram as produções (kg/ha)
de arroz, em função da variedade (V1: IR8; V2: IR5; V3: C4-63) e de 5 níveis de adubação
azotada (N0: 0 kg/ha; N1: 60 kg/ha; N2: 90 kg/ha; N3: 120 kg/ha; N4: 150 kg/ha). Para
cada tratamento fizeram-se 4 repetições.

Na imagem seguinte, capturada do Excel, estes dados estão perceptíveis para o leitor, e
estão estruturados para algumas possíveis análises a executar na folha de cálculo; contudo,
ao serem introduzidos para um ficheiro SPSS, dever-se-ão respeitar as normas deste
programa, de modo a que os dados possam ser analisados.

VariedadeAzoto

1

2

3

4

N0

3852

2606

3144

2894

N1

4788

4936

4562

4608

V1

N2

4576

4454

4884

3924

N3

6034

5276

5906

5652

N4

5874

5916

5984

5518

N0

2846

3794

4108

3444

N1

4956

5128

4150

4990

V2

N2

5928

5698

5810

4308

N3

5664

5362

6458

5474

N4

5458

5546

5786

5932

N0

4192

3754

3738

3428

N1

5250

4582

4896

4286

V3

N2

5822

4848

5678

4932

N3

5888

5524

6042

4756

N4

5864

6264

6056

5362

Repetição

Como se referiu atrás, os dados deverão ser introduzidos para uma matriz rectangular, em
que as colunas são as variáveis e as linhas os casos. Neste caso, as variáveis são a
Variedade, o Azoto, a Repetição e a Produção.

2.1.1 - DEFINIÇÃO DE VARIÁVEIS

Vamos começar por definir estas variáveis no SPSS dando-lhes nomes válidos; as regras
para os nomes das variáveis são:

• nome da variável tem no máximo, 8 caracteres;
• nome da variável deve começar por uma letra; os restantes caracteres podem ser
letras (maiúsculas ou minúsculas são iguais), algarismos, ou os símbolos @, #, _, $.
Não se podem usar espaços em branco, nem os seguintes caracteres: !, ?, ‘, “, *, +, -,
%, vírgula, ponto e vírgula, \, /, >, <
• Os nomes não podem terminar com ponto;
• Evitar terminar o nome com o caracter _ (underscore);
• Evitar usar caracteres acentuados ou com til.

SPSS

2 - Edição de Dados

ESACB

6

No exemplo, vamos definir as seguintes variáveis:

variedad

Variável numérica inteira, cujos valores são 1, 2, 3, com as seguintes
correspondências, a fim de facilitar a sua introdução:
1 : IR8; 2 : IR5; 3 : C4-64;

azoto

Variável inteira: 0: 0 kg/ha; 1: 60 kg/ha; ... ; 4: 150 kg/ha;

repete

Variável inteira, com os valores 1, 2, 3, 4

producao

Variável real, com duas casas decimais (por defeito).

A fim de definir cada uma das variáveis, fazer o seguinte procedimento:

Duplo click na célula do nome da variável (var) no topo da coluna, ou click em qualquer
sítio da coluna para a variável e seleccionar no menu a opção Data, seleccionando depois a
opção Define Variable...

Igualmente pode fazer click com o botão direito na célula do nome da variável (var) no
topo da coluna; aparece o menu:

onde se selecciona a opção Define Variable...

Na sequência de qualquer dos procedimentos anteriores aparece a seguinte caixa de diálogo
de definição da variável:

SPSS

2 - Edição de Dados

ESACB

7

No campo Variable Name escrever o nome da variável; no caso, variedad

Seleccionar a opção

No campo Decimal Places alterar o valor para 0 (casas decimais); e fazer

.

Seleccionar a opção

No campo Value escrever o valor 1; no campo Value Label: escever IR8; fazer

:

SPSS

2 - Edição de Dados

ESACB

8

Repetir o processo de definição de Value e Value Label para os valores 2 (IR5) e 3 (C4-

63); para cada valor, fazer

:

No final, fazer

.

A caixa

serve para entrar uma breve descrição

da variável, mais elucidativa que apenas o nome; é de preenchimento facultativo.

Para aceitar estas alterações, e terminar a definição da variável variedad, na caixa de
diálogo fazer OK:

SPSS

2 - Edição de Dados

ESACB

9

De modo idêntico, definir as restantes variáveis; note-se que a opção Labels serve para
fazer as correspondências, de modo que neste exemplo só é usada para as variáveis
variedad e azoto; na definição da variável producao, não é necessário ir à opção Type
porque, por defeito, as variáveis são numéricas reais (com duas casa decimais).

Terminada a definição de variáveis, o Data Editor terá o seguinte aspecto:

2.1.2 - INTRODUÇÃO DOS VALORES

Definidas as variáveis, introduzem-se os dados; o utilizador deve optar pela estratégia de
introduzir os valores coluna a coluna, ou linha a linha, que lhe for mais favorável e menos
propensa a erros.

Para apagar um valor, colocar o cursor na célula respectiva e carregar a tecla DEL. Para
alterar ou corrigir um valor errado numa das células, activa-se essa célula (levando o cursor
para lá, ou simplesmente fazendo click) e digita-se o valor correcto, fazendo-o entrar com
Enter ou deslocando para outra célula.

O ficheiro ficará com o seguinte aspecto:

SPSS

2 - Edição de Dados

ESACB

10

Usou-se a codificação dos valores das variáveis variedad e azoto, por um lado para facilitar
a introdução dos valores, e por outro lado para ser menos propenso a erros. Contudo, podem
visualizar-se o nome da variedade e o valor da adubação; para tal, no menu principal

seleccionar a opção

, e depois seleccionar a opção Value Labels:

O ficheiro de dados toma agora o aspecto mais elucidativo acerca dos dados a analisar:

SPSS

2 - Edição de Dados

ESACB

11

2.1.3 - GRAVAR O FICHEIRO DE DADOS

Tendo introduzido e corrigido os dados, grava-se o ficheiro com um nome válido (aplicam-
se as regras de nomes de ficheiros de MS-DOS). Para gravar, faz-se:

Na caixa escreve-se o nome a dar ao ficheiro, por exemplo arroz; automaticamente é
atribuída a extensão .sav típica dos ficheiros de dados do SPSS:

Caso se pretenda guardar o ficheiro num disco ou directório que não do directório activo,

abrir a caixa

e seleccionar o disco/directório

pretendido:

SPSS

2 - Edição de Dados

ESACB

12

2.1.4 - ABRIR UM FICHEIRO DE DADOS EXISTENTE

Se se pretende abrir um ficheiro de dados, para introduzir mais dados, para alterar ou
corrigir valores, ou para efectuar a análise desses dados, tem de se abrir o ficheiro. Para tal,
efectua-se o seguinte procedimento:

Se o ficheiro pretendido aparece na listagem, faz-se click sobre o nome do ficheiro, ou

escreve-se na caixa

, e de seguida faz-

se

.

Caso o nome do ficheiro não conste na listagem, é porque está guardado noutro directório
que não o especificado na janela. Nesta situação, ter-se-á de encaminhar para a
drive/directório onde se encontra.

Para tal, abre-se a o caixa

, e selecciona-se a o

disco ou o directório pretendido:

Como o SPSS apenas admite um ficheiro de dados aberto, ao abrir um ficheiro o programa
encerra o ficheiro actual. Caso este não esteja gravado, após quaisquer alterações, o
programa apresenta uma mensagem de aviso:

SPSS

2 - Edição de Dados

ESACB

13

O utilizador deverá responder Sim ou Não, consoante queira guardar ou não as alterações
efectuadas no ficheiro aberto (no caso da imagem, tinha-se aberto o ficheiro lambs.sav, em
que se tinham efectuado alterações).

2.1.5 - ACESCENTAR NOVOS CASOS A UM FICHEIRO DE DADOS

Para acrescentar um novo caso, após os dados já introduzidos, basta digitar o valor
pretendido para a variável a acrescentar; automaticamente é acrescentado um caso a todas
as variáveis.

Se interessa introduzir um caso, não no final dos dados, mas entre duas observações, então
ter-se-á de introduzir uma linha (caso) entre essas duas observações.

Admitamos que foi esquecido um caso referente a hora=Manhã; este caso deveria ser
introduzido imediatamente antes da primeira observação da Tarde; para tal, faz-se duplo
click sobre o indicador da linha 5, ou um click em qualquer parte da linha 5 e de seguida

selecciona-se a opção

no menu. Aparece a janela:

Pode igualmente fazer click com o botão direito do rato sobre o indicador da linha,
aparecendo o menu:

SPSS

2 - Edição de Dados

ESACB

14

No menu anterior deve seleccionar

. Automaticamente é aberta uma

linha, onde se introduzem os valores respectivos das variáveis:

2.1.6 - ACRESCENTAR NOVAS VARIÁVEIS

Para acrescentar uma nova variável ao ficheiro, basta colocar o cursor numa célula da
primeira coluna não usada, e executar o procedimento de definição de variáveis atrás
descrito. O programa cria a nova variável com tantas células (em branco ou missing values)
quantos os casos das restantes variáveis. Após isto, só há que proceder à introdução dos
valores.

Se, por algum motivo, há que introduzir uma nova variável, não no final do ficheiro, mas
entre duas variáveis já definidas, colocar o cursor na variável à direita da qual se pretende a

nova variável, seleccionar a opção

e de seguida

. Pode igualmente

fazer click com o botão direito do rato, aparecendo o menu:

e seleccionar a opção

.

De seguida, definir esta variável, tal como descrito atrás.

SPSS

2 - Edição de Dados

ESACB

15

2.1.7 - DEFINIR UMA VARIÁVEL EM FUNÇÃO DE OUTRAS

O programa SPSS permite criar novas variáveis como resultado de funções ou operações
envolvendo as variáveis já existentes.

Por exemplo, determinadas metodologias estatísticas (análise de variância, regressão, etc)
baseiam-se no pressuposto de que os dados a analisar seguem a função de distribuição
normal; ora, tal pressuposto, é muitas vezes violado (e, infelizmente para a validade das
conclusões, não é testado). Nas situações em que se verificou a não normalidade, é
frequente proceder a determinadas transformações dos dados (logaritmo, raíz quadrada,
arc-seno são transformações usuais).

Vamos ilustrar a criação de uma nova variável no ficheiro arroz.sav, com o nome ln_prod,
definida como sendo o logaritmo neperiano dos valores da variável producao.

Para tal, coloca-se o cursor na primeira célula da primeira coluna não ocupada, e faz-se:

Aparece a seguinte caixa de diálogo:

Na caixa Target Variable escreve-se o nome da variável a criar, ln_prod; transfere-se o
cursor para a caixa Numeric Expression e na caixa das funções selecciona-se a função
LN(numexpr); de seguida, fazer click sobre a variável argumento (producao). A janela fica
com o seguinte aspecto:

SPSS

2 - Edição de Dados

ESACB

16

Para calcular, basta fazer

.

O ficheiro fica com o seguinte aspecto:

A variável ln_prod é visualizada com 2 casas decimais (por defeito), muito embora seja
guardada com maior precisão. Caso haja interesse em visualizar mais casa decimais,
proceder como descrito na definição de variáveis.

As transformações de variáveis podem ser mais complexas que uma simples função; repare-
se que a caixa de definição das transformações apresenta o que se parece a uma máquina de
calcular científica, que permite definir transformações várias, incluindo selecção
condicional de casos (if), funções lógicas (e &; ou |; negação ~) comparações (<, <=, >, >=,
=, ~=), etc.

2.1.8 - ELIMINAR LINHAS E VARIÁVEIS

Para eliminar linhas de valores (casos) ou colunas (variáveis), fazer click sobre o número da
linha, à esquerda do ecran, ou sobre o nome da variável; a linha ou coluna, consoante o

caso, ficam seleccionadas (sombreadas). Para a eliminar, seleccionar

e de seguida

(ou carregar na tecla DEL).

SPSS

2 - Edição de Dados

ESACB

17

Pode também fazer click com o botão direito do rato sobre a identificação da linha ou
coluna a eliminar, e fazer Cut ou Clear.

2.2 - IMPORTAÇÃO DE FICHEIROS EXTERNOS

O programa SPSS dispõe de uma rotina de importação de ficheiros criados noutras
aplicações, nomeadamente folhas de cálculo (Lotus 123, Excel), bases de dados (dBase,
Access), ficheiros ASCII (separados por tabulações, vírgula, espaços), etc.

Vamos abordar a importação de ficheiros Excel e Access, por serem duas das aplicações
actualmente mais usadas na constituição de bases de dados, e ficheiros ASCII, pois não
havendo outra forma de transferir informação entre aplicações, todos os programas
permitem exportar e importar ficheiros ASCII, sendo esta forma uma ponte comum entre as
aplicações.

É pressuposto que, qualquer que tenha sido a aplicação utilizada para criar os ficheiros,
estes devem estar organizados de acordo com a estrutura dos ficheiros SPSS.

2.2.1 - IMPORTAÇÃO DE FICHEIROS LOTUS E EXCEL 4.0

Se o ficheiro tiver sigo gravado em Excel 4, Lotus 123 (ou Quattro), o SPSS abre-o
automaticamente. Para tal, executar o seguinte procedimento:

File

Open...

Nesta janela deve especificar-se que o ficheiro é do tipo Excel (*.xls) [se se tratar de um
ficheiro Lotus, selecciona-se a opção Lotus(*.w*)]; para tal, abrir a caixa Ficheiro do tipo e
especificar Excel (*.xls):

SPSS

2 - Edição de Dados

ESACB

18

Na caixa Procurar em deve especificar-se o directório onde se encontra o ficheiro:

No campo Nome do ficheiro, especificar o nome do ficheiro a importar e fazer OK:

Aparece de seguida a seguinte caixa de diálogo, onde se especifica se as primeiras células

contêm os nomes das variáveis (se sim activar

) e o intervalo

(rectangular) de células (no exemplo, A1:B11):

O SPSS cria um ficheiro, com tantas variáveis quantas as colunas e tantos casos quantas as
linhas do bloco especificado.

2.2.2 - IMPORTAÇÃO DE FICHEIROS DE DBASE

Dada a relevância da utilização do gestor de bases de dados dBase III, é natural que alguns
utilizadores disponham de bases de dados organizadas neste programa, e que pretendam
importá-las para o SPSS a fim de executar algumas análises estatísticas.

Os ficheiros gerados pelo dBase III (*.dbf) obedecem tipicamente à estrutura dos ficheiros
SPSS, de modo que a sua importação é extremamente fácil. Para tal, faz-se o seguinte
procedimento:

File

Open...

Na caixa de diálogo, deve definir-se o tipo de ficheiro [dBase (*.dbf)], o directório onde
está guardado e o nome do ficheiro a importar, tal como se mostra na figura:

SPSS

2 - Edição de Dados

ESACB

19

Ao fazer

a importação processa-se automaticamente.

2.2.3 - IMPORTAÇÃO DE FICHEIROS EXCEL

Os ficheiros Excel 5.0 e Excel 97 são constituídos por diversas folhas de cálculo; a rotina de
importação é ligeiramente diferente, e é assegurada pelo protocolo Open Database
Connectivity (ODBC), que é um método padrão de partilha de dados entre bases de dados e
outros programas. Os controladores ODBC utilizam a linguagem SQL (Structured Query
Language) padrão para aceder a dados de origens exteriores.

Pretende-se importar a seguinte folha de cálculo, criada em Excel 97:

SPSS

2 - Edição de Dados

ESACB

20

Para tal, executar o seguinte procedimento:

File

Database Capture

New Query...

Aparece o seguinte assistente de importação de ficheiros:

Especificar qual a origem do ficheiro (no caso

) e fazer

. Na

caixa de diálogo que se segue, especificar o disco, directório e o ficheiro a abrir:

Aparece a seguinte janela:

SPSS

2 - Edição de Dados

ESACB

21

Caso o ficheiro tenha diversas folhas de cálculo, será conveniente confirmar qual é que se
pretende importar; para visualizar as variáveis de cada folha, click sobre o sinal + à
esquerda da identificação:

Tendo confirmado qual a folha a importar (neste caso, Folha1$), click sobre o nome da
folha e arraste-o para campo Retrieve Fields :

SPSS

2 - Edição de Dados

ESACB

22

Para executar a importação, click em Terminar.

2.2.4 - IMPORTAÇÃO DE FICHEIROS ACCESS

Os ficheiros de bases de dados criados em Microsoft Access são constituídos por diversas
folhas ou tabelas (base de dados, consultas, formulários); a rotina de pelo protocolo Open
Database Connectivity (ODBC), que é um método padrão de partilha de dados entre bases
de dados e outros programas. Os controladores ODBC utilizam a linguagem SQL
(Structured Query Language) padrão para aceder a dados de origens exteriores, e processa-
se em tudo de modo semelhante à importação de ficheiros Excel, sendo guiada pelo mesmo
assistente (wizard):

File

Database Capture

New Query...

Aparece o seguinte assistente de importação de ficheiros:

Especificar qual a origem do ficheiro (no caso

) e fazer

Seguinte. Depois, é prosseguir tal como descrito para o Excel.

2.2.5 - RECODIFICAÇÃO DE VALORES

SPSS

2 - Edição de Dados

ESACB

23

Ao fazer a importação de ficheiros externos, acontece que variáveis alfanuméricas são
importadas como tal, causando posteriormente problemas em determinadas análises. Isto
acontece, por exemplo, quando se importam variáveis de agrupamento ou definição de
classes, ou variáveis nominais, do género de variável sexo, que agrupa os casos em
masculino e feminino. Em situações deste género, é natural que posteriormente haja
necessidade de agrupar os casos por sexo (genericamente por classes), nomeadamente para
comparar médias de sub-amostras.

Para contornar esta questão, a fazer a importação destas variáveis, há que recodificá-las em
variáveis nominais, com códigos numéricos, por exemplo masculino=1, feminino=2, à
semelhança do que se fez na introdução das variáveis variedad e azoto.

Vamos ilustrar usando o ficheiro pulso.sav, que se criou pela importação do ficheiro
pulso.dbf do dBase. Neste ficheiro, as variáveis sexo (Homem, Mulher) e fuma (Fuma,
Não Fuma) são alfanuméricas, mas nitidamente com uma conotação de agrupamento em
classes.

Vamos recodificar a variável sexo (Homem=1, Mulher=2) e fuma (Fuma=1, Não Fuma=2).

Para tal, executar o seguinte procedimento (por variável a recodificar):

Transform

Recode

Into Same Variable

Na caixa de diálogo seguinte, seleccionar a variável a recodificar (sexo):

Seleccionar

. Na caixa de diálogo seguinte definir as recodificações,

identificando em

o valor antigo a recodificar, e em

o novo valor a atribuir; fazer

.

SPSS

2 - Edição de Dados

ESACB

24

Repetir para o outro valor da variável (Mulher=2). No final, a caixa de diálogo mostra as
recodificações a efectuar:

No final, fazer

e OK. As alterações são executadas.

Seguidamente, deve alterar-se o tipo de variável para numérica, e definir as “labels”:
1=Homem; 2=Mulher, tal como já anteriormente explicado:

SPSS

2 - Edição de Dados

ESACB

25

Fazer o mesmo procedimento para a outra variável a recodificar.

No final, aparentemente não houve alterações: a variável sexo contém os valor Homem e
Mulher, como anteriormente; só que, após esta transformação, estas variáveis têm a
conotação de agrupamento de casos, coisa que não acontecia tal como resultaram da
importação do ficheiro de dados externo ao SPSS.

2.2.6 - SELECÇÃO DE CASOS

Por vezes, há necessidade de proceder a análises sem a inclusão de todos os casos contidos
nas variáveis em jogo. Uma situação típica é ter-se verificado que há valores “outliers”, isto
é, valores extremos muito elevados ou muito baixos, que provavelmente são registos mal
efectuados, ou eventualmente observações anómalas que, incluídas nas análises estatísticas,
vão distorcer a validade das conclusões. Desta forma, poderá ser preferível excluí-las das
análises, mas sem as eliminar do ficheiro de dados.

A detecção de “outliers” será efectuada no procedimento EXPLORE (cap. 3).

Vamos ilustrar com a exclusão do caso nº 6 do ficheiro pulso.sav, em que a observação
correspondente à variável ritmod é 265, valor impossível para a característica em análise,
sendo provável que tenha acontecido um lapso no acto de registo dos valores. Pretende-se
excluir todo este caso das análises subsequentes, sem contudo o eliminar do ficheiro, pois
poderá haver necessidade de posteriormente efectuar análises sobre as outras variáveis (por
exemplo, ritmoa), cujo valor (96) é perfeitamente normal.

Para tal, fazer:

Data

Select Cases...

SPSS

2 - Edição de Dados

ESACB

26

Pretende-se excluir o caso nº 6 da análise, isto é, incluir na análise todos os casos com

excepção do caso nº 6. Para tal, na caixa de diálogo seleccionar

, e

definir que se seleccionam para análise todos os cados diferenntes do caso nº 6:

A indicação caso ~= 6 significa todos os casos excepto o caso 6.

O Data Editor do SPSS criou automaticamente uma variável designada filter_$, em que
indica quais os casos seleccionados e os não incluídos. Repare-se que a linha 6 está traçada,
indicando que este caso está excluído de futuras análises:

SPSS

2 - Edição de Dados

ESACB

27

A variável filter_$ é uma variável numérica, cujos valores são 0=”Not Selected” e
1=”Selected”. No ecran, aparecem visualizados as labels dos valores, caso se tenha optado
por este modo de visualização.

A fim de incluir novamente o caso 6 nas análises, fazer:

Data

Select Cases...

ou digitar o valor 1 na célula 6 da variável filter_$.

Por exemplo, querendo seleccionar os casos referentes aos homens (sexo=1) que fumam
(fuma=1), dever-se-á fazer o seguinte procedimento:

Data

Select Cases...

SPSS

2 - Edição de Dados

ESACB

28

Para definir a condição atrás referida, seleccionar a variável sexo, defini-la como sendo
igual a 1; o operador lógico e (AND) é simbolizado pelo caracter &; seleccionar a variável
fuma e defini-la igual a 1:

Fazer

para avançar.

SPSS

3 - Análise de Dados

ESACB

29

3 - ANÁLISE DE DADOS

Vamos iniciar a utilização do SPSS a fim de efectuar diversas análises estatísticas. Antes de
iniciar um processo de análise, os dados a analisar devem estar carregados na memória do
computador.

Vamos ilustrar utilizando o ficheiro arroz.sav que deverá estar carregado na memória do
computador.

3.1 - OBTER ESTATÍSTICAS DESCRITIVAS

Esta rotina calcula as estatísticas elementares (média, moda, mediana, variância, etc) de
uma variável numérica. No exemplo, a única variável susceptível de ser analisada é a
variável producao.

3.1.1 - PROCEDIMENTO DESCRIPTIVES

Para obter as estatísticas elementares de uma variável numérica, fazer:

Aparece a seguinte caixa de diálogo, onde se definem as variáveis a analisar; no presente
caso, será apenas a variável producao:

SPSS

3 - Análise de Dados

ESACB

30

Para seleccionar as variáveis a analisar, click sobre o nome da variável na listagem que

aparece na caixa esquerda, e de seguida click no botão

. Ficará com o seguinte aspecto:

A fim de definir quais os parâmetros estatísticos a estimar, seleccionar

, obtendo-

se a seguinte caixa de diálogo:

Inicialmente, estariam seleccionadas apenas a Mean (média), Std. deviation (desvio
padrão), Minimum (mínimo) e Maximum (máximo); vamos seleccionar também a Sum

SPSS

3 - Análise de Dados

ESACB

31

(soma de todas as observações), Variance (variância), Range (intervalo de variação),

S.E.mean (erro padrão da média:

N

s

sx=

), Kurtosis (curtose ou achatamento), Skewness

(enviesamento ou assimetria). As opções Display Order só têm significado nos casos em
que se procede ao cálculo de parâmetros de mais do que uma variável.

No final, fazer

e depois

.

O programa abre o Viewer (janela de resultados), com o aspecto:

Na janela direita estão os resultados; como se pediu o cálculo de muitos parâmetros, o
quadro de resultados demasiado largo para caber no ecran; use a barra de scroll para ler o
quadro de resultados

Caso tenha interesse em imprimir os resultados, o SPSS resolve o problema da largura,
fraccionando o quadro em vários.

Repare que ficou no SPSS Viewer; para voltar ao Data Editor do SPSS, onde está aberto o

ficheiro arroz.sav, restaure a janela

na barra Iniciar do Windows:

O SPSS permite capturar os resultados visualizados no Viewer e colá-los por exemplo, no
relatório que está a ser escrito no editor de texto Word; no processador de texto, pode
seleccionar-se a tabela e fazer o ajuste automático, de modo a que o quadro, demasiado
largo, caiba na largura do texto. Contudo, resulta mais elegante se não for necessário reduzir

SPSS

3 - Análise de Dados

ESACB

32

muito a largura do quadro original. Para tal, a solução é obter menos parâmetros estatísticos,
de modo que o quadro de resultados seja menos largo.

3.1.2 - PROCEDIMENTO EXPLORE

Em caso de necessidade de apresentar todos os parâmetros estatísticos, estes podem ser
obtidos noutra rotina do SPSS, cujo quadro de resultados se desenvolve na vertical, sendo
mais fácil inclui-los no relatório em Word. Vamos ilustrar esta opção.

A opção EXPLORE calcula os parâmetros estatísticos, e elabora o gráfico caule-e-folhas
(esquema de histograma) e o gráfico de extremos-e-quartis, muito útil para analisar a
amostra em termos de concentração ou dispersão dos valores por intervalos quartílicos, bem
como a sua simetria; além disso, é uma boa ferramenta de verificar se há observações
“outliers”, isto é, observações extremas que se afastam muito da gama média dos valores da
amostra. Opcionalmente, podem obter-se outras análises, como veremos.

Na caixa de diálogo que se segue, selecciona-se a variável a analisar (producao) tal como

descrito atrás. De seguida, seleccionar o botão

SPSS

3 - Análise de Dados

ESACB

33

Seleccionando o botão

, verifica-se que o cálculo das estatísticas descritivas está
activado; pode-se optar por verificar analiticamente a existência de “outliers”, bem como
calcular os percentis. A opção M-estimators destina-se ao cálculo de parâmetros estatísticos
(média e variância) ponderados; geralmente esta opção só interessa em utilizações muito

específicas. No final, fazer

.

Voltando à caixa de diálogo Explore, seleccionar a opção

; seleccionar a opção

e fazer

.

Na janela Explore seleccionar a opção fazer

para obter os resultados.

SPSS

3 - Análise de Dados

ESACB

34

Note-se que os resultados vêm na sequência dos resultados obtidos anteriormente, de modo
que durante a sessão de trabalho, os resultados vão-se acumulando, podendo o utilizador em
qualquer momento seleccionar os que lhe interessam.

Utilize a barra se scroll vertical para visualizar os resultados, ou na caixa do organigrama
dos resultados, à esquerda, seleccione os que lhe interessa visualizar. Por exemplo, para ver

os parâmetros estatísticos, click sobre

:

Esta opção, além dos parâmetros estatísticos obtidos no procedimento DESCRIPTIVES,
calcula o intervalo de confiança para a média, e a média após eliminar as 5% observações
inferiores e as 5% observações superiores (5% Trimmed Mean).

De seguida apresentam-se o histograma, diagrama de caule-e-folhas (steam-and-leaf) e
diagrama de extremos-e-quartis (Boxplot) referentes a esta análise.

SPSS

3 - Análise de Dados

ESACB

35

Producao

6
500.0

6
250.0

6
000.0

5
750.0

5
500.0

5
250.0

5
000.0

4
750.0

4
500.0

4
250.0

4
000.0

3
750.0

3
500.0

3
250.0

3
000.0

2
750.0

2
500.0

Histogram

Frequency

10

8

6

4

2

0

Std. Dev = 952.52

Mean = 4956.5

N = 60.00

Producao Stem-and-Leaf Plot

Frequency Stem & Leaf

3.00 2 . 688
3.00 3 . 144
5.00 3 . 77789
6.00 4 . 111234
13.00 4 . 5556778889999
7.00 5 . 1223344
18.00 5 . 555666678888899999
5.00 6 . 00024

Stem width: 1000.00
Each leaf: 1 case(s)

SPSS

3 - Análise de Dados

ESACB

36

60

N =

Producao

7000

6000

5000

4000

3000

2000

3.1.3 - PROCEDIMENTO EXPLORE COM FACTORES

Os resultados anteriores referem-se à globalidade das produções, e têm o interesse que o
utilizador pretender retirar deles.

Numa situação como a que estamos a analisar, teria igualmente interesse executar estas
análises, não para a globalidade das observações, mas sim repartidas por um ou mais dos
factores.

Vamos executar o procedimento EXPLORE, obtendo os resultados para cada uma das três
variedades (poderia ser para os cinco níveis de azoto, ou para os dois factores em
simultâneo).

SPSS

3 - Análise de Dados

ESACB

37

Na caixa de diálogo que se segue, selecciona-se a variável a analisar (producao) tal como
descrito atrás. Seleccionar a variável variedad para o campo Factor List:

A partir deste ponto, o procedimento é análogo ao atrás descrito. Os resultados têm o
seguinte aspecto:

A seguir apresenta-se a listagem completa dos resultados do procedimento:

SPSS

3 - Análise de Dados

ESACB

38

Descriptives

Variedade

Statistic

Std. Error

Producao IR8

Mean

4769.4000

235.8637

95% Confidence Interval for Mean Lower Bound 4275.7316
Upper Bound 5263.0684

5% Trimmed Mean

4819.3333

Median

4836.0000

Variance

1112633.726

Std. Deviation

1054.8145

Minimum

2606.00

Maximum

6034.00

Range

3428.00

Interquartile Range

1762.0000

Skewness

-.651

.512

Kurtosis

-.441

.992

IR5

Mean

5042.0000

214.0869

95% Confidence Interval for Mean Lower Bound 4593.9109
Upper Bound 5490.0891

5% Trimmed Mean

5085.3333

Median

5410.0000

Variance

916664.421

Std. Deviation

957.4259

Minimum

2846.00

Maximum

6458.00

Range

3612.00

Interquartile Range

1574.5000

Skewness

-.839

.512

Kurtosis

-.076

.992

C4-63

Mean

5058.1000

191.4035

95% Confidence Interval for Mean Lower Bound 4657.4878
Upper Bound 5458.7122

5% Trimmed Mean

5081.6667

Median

5091.0000

Variance

732706.305

Std. Deviation

855.9827

Minimum

3428.00

Maximum

6264.00

Range

2836.00

Interquartile Range

1493.5000

Skewness

-.419

.512

Kurtosis

-.921

.992

O diagrama de extremos-e-quartis é apresentado agora para cada uma das três variedades:

SPSS

3 - Análise de Dados

ESACB

39

20

20

20

N =

Variedade

C4-63

IR5

IR8

Producao

7000

6000

5000

4000

3000

2000

Estes resultados podem começar a fornecer pistas para a análise dos dados, do género de
que a variedade C4-63 apresenta uma produção mais homogénea.

3.1.4 - PROCEDIMENTO FREQUENCIES

O procedimento FREQUENCIES permite gerar tabelas de frequências (contagem de casos
quer de variáveis alfanuméricas, quer de variáveis numéricas. Adicionalmente, pode
calcular os parâmetros estatísticos calculados pelos procedimentos DESCRIPTIVES e
EXPLORE, anteriormente vistos; pode igualmente gerar histogramas, com o ajustamento a
uma função de distribuição de probabilidades.

No caso de variáveis numéricas, em que se admite que seguem uma lei de distribuição
normal (pressuposto quase obrigatório para a maioria das metodologias estatísticas usuais
em ciências agrárias), a visualização do ajustamento do respectivo histograma à função de
distribuição normal pode ser uma valiosa ferramenta para análises subsequentes.

A fim de ilustrar, vamos executar dois procedimentos FREQUENCIES: gerar as tabelas de
frequência das variáveis nominais azoto e variedad, e gerar a tabela de frequências da
variável producao, neste caso com o respectivo histograma ajustado à fdp normal.

Seleccionar:

Statistics

Summarize

Frequencies...

Na caixa de diálogo, seleccionar as variáveis variedad e azoto:

SPSS

3 - Análise de Dados

ESACB

40

A opção

permite seleccionar, facultativamente, quais os parâmetros estatísticos a
calcular. No caso de variáveis nominais e alfanuméricas não têm significado.

Os resultados obtidos, que são acrescentados ao Viewer, têm o seguinte aspecto:

Repita-se o procedimento para a variável numérica producao:

Statistics

Summarize

Frequencies...

SPSS

3 - Análise de Dados

ESACB

41

Vá à opção

seleccionar para calcular os decis (com a selecção da opção

), a média, mediana e variância. No final, fazer

:

De seguida, vá-se á opção

para seleccionar o histograma com ajustamento à

função de distribuição normal:

SPSS

3 - Análise de Dados

ESACB

42

Fazer

para avançar, e OK para calcular.

Veja no Viewer os resultados.

O histograma com o ajustamento à f.d.p. normal tem o seguinte aspecto, onde sobressai o
enviezamento da amostra para a direita em relação à distribuição teórica, bem como um
achatamento um pouco maior que o que seria de esperar (isto é, cerca de 75% da amostra
está abaixo da curva, nomeadamente na zona central da distribuição):

Producao

6
500.0

6
250.0

6
000.0

5
750.0

5
500.0

5
250.0

5
000.0

4
750.0

4
500.0

4
250.0

4
000.0

3
750.0

3
500.0

3
250.0

3
000.0

2
750.0

2
500.0

Producao

Frequency

10

8

6

4

2

0

Std. Dev = 952.52

Mean = 4956.5

N = 60.00

SPSS

4 - Gráficos

ESACB

44

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->