Você está na página 1de 19

Explotacin de Datos con Programacin en SPSS

Elaborado por: Ing. Romy E. Rodrguez Ravines Julio del 2,000

EL SPSS
El SPSS es un paquete estadstico de Anlisis de datos con ms de 20 aos de aplicacin en la investigacin de las ciencias sociales y econmicas. Contiene programas capaces de realizar desde un simple anlisis descriptivo hasta diferentes tipos de anlisis multivariante de datos, como pueden ser: anlisis discriminante, anlisis de regresin, cluster, anlisis de varianza, etc... Tambin permite analizar series temporales, obtener tablas de frecuencias, realizar grficos, ...

POR QUE USAR Syntax?


1.

2. 3. 4.

Ms opciones: Uso de una variable ms de una vez Presentacin de los totales Varias tablas en un solo comando Menor tiempo Orden y precisin Conservar y Repetir el trabajo

CASO ILUSTRATIVO
Encuesta a 678 hogares y 3189 personas del pas

Los datos se encuentran en 03 archivos: 1. Data01.sav: Caractersticas Generales del hogar (Ubicacin, Miembros, Ingreso, Gasto) 2. Data02.sav: Caractersticas de los miembros (Edad, Estado Civil, Nivel de Educacin) 3. Data03.sav: Otras Caractersticas del hogar (Tipo de vivienda, Pared, Piso, Artefactos)

PARTES DEL PROGRAMA


o

LEER DATOS
Qu tipo de archivo de datos? Dnde est? Qu contiene? Datos etiquetados?

SELECCIONAR Y/O MODIFICAR DATOS


Todos o algunos datos? Nuevas variables? Nuevas categoras de variables? Valores perdidos?

PROCEDIMIENTO ESTADISTICO
Qu procedimiento? Qu opciones?

GUARDAR DATOS
Conservar los cambios en la data?

EJEMPLO DE PROGRAMA
* Este es un ejemplo de Programa Spss. Get file 'C:\Curso\Data01.sav' Var lab Ubigeo Cdigo de Dpto, Prov y Dist Area Area de Residencia. Val lab area '1' Urbana '2' Rural. String dpto(a2). Compute Dpto=substr(ubigeo,1,2). Execute. Var lab Dpto Departamento. Table /Gbase=Cases /Ptotal t1 'Total' t2 'Total' /Table=t1 + Dpto By t2 + area /Statistics cpct( area( f5.1 ) '':area ) /Title 'EJEMPLO 01:' /Caption ')Date'. Save Outfile 'C:\Curso\Ejemplo01.sav' /comp.

REGLAS GENERALES

Se inicia con un comando (p.e.TABLES)

Los subcomandos se separan por /


Todo comando termina en un punto. Los nombres de las variables se escriben completos Se pueden usar varias lneas Los signos igual son opcionales El punto se utiliza como separador de decimales Los comentarios comienzan con un asterisco (*) En muchos casos es necesario EXECUTE.

USO FRECUENTE

VARIABLE LABEL
Nombre completo a las variables
(120 caracteres)

VAR LAB MIEPERHO INGHOG1D DOMINI01

Nmero de Miembros Ingreso Trimestral Dominio

VALUE LABEL
Nombre a los valores de las variables
(60 caracteres)

VAL LAB ESTRAT01 1 Ciudades capitales 2 Grandes ciudades 3 Resto urbano 4 Rural 5 Resto rural

USO FRECUENTE

RECODE
Recodifica una variable. HAY DOS OPCIONES: 1. Reemplazar valores RECODE domini01 (1,2,3=1) (4,5,6=2)(7=3)(8=4). RECODE hnbi (sysmis =0). EXECUTE. 2. Crear una nueva variable RECODE estrat01 (1 thru 3=1) (4,5 =2) INTO area. RECODE nbicount (1 thru higest=1) (0=2) into nbi. EXECUTE.

USO FRECUENTE
COMPUTE

Calcula variables nuevas Operaciones y funciones

COMPUTE gasmali=(gru11hd+gru12hd+gru13hd/3). COMPUTE gasmpc=(gashog2d/(mieperho*3). COMPUTE Lningm=Ln((inghog1d/3)). Execute.


Casos seleccionados

IF(area=1) urbana=1. IF(percepho>=2) percep=1. EXE.


Se debe escribir dos veces

IF(mieperho >= 1 & mieperho <= 4) miemb=1. IF(mieperho > 4) miemb =2. EXE.

USO FRECUENTE

SELECT IF
Seleccin permanente de casos USE ALL. FILTER OFF. SELECT IF (p203=1). EXE.

FILTER BY
Seleccin temporal de casos USE ALL. COMPUTE filtro = (p203=1). FILTER BY filtro. EXE.

USO FRECUENTE
o

SPLIT FILES
Divide el archivo de datos en subgrupos que pueden ser analizados simultneamente.

SORT CASES
Reordena los casos en el archivo de datos basado en una o ms variables.

AGGREGATE
Crea un nuevo archivo con variables calculadas. Puede ser un archivo de hogares a partir de un archivo de personas

o o

MERGE FILES
Sirve para juntar dos archivos

RANK CASES
Se usa para la formacin de deciles, quintiles, etc.

SPSS Tables
Creacin de tablas sofisticadas, de fina presentacin. Con ms de 35 estadsticos capaces de ser incluidos en estas tablas. Que permite hacer? Utilizar ms de 35 estadsticos para celdas y resmenes. Presentar datos de respuestas mltiples efectivamente: calcula porcentajes sobre respondentes o respuestas para interpretacin y anlisis mas sencillo Manejar los valores perdidos (missing values) y cambiar sus etiquetas y formatos

Ejemplo de SPSS Tables Syntax


TABLES /GBASE=CASES /FTOTAL= t2 "Total" t1 "Total" /TABLE=estrat01 + t2 BY nbicount + t1. TABLES /GBASE=CASES /pTOTAL= t2 "Total" t1 "Total" /TABLE= t2 + estrat01 BY t2 + nbicount /STATISTICS cpct(nbicount(f5.1) '':estrat01) /TITLE 'Ejemplo 01 ' + ' )DATE'.
Ejemplo 01 09 Jul 00
Nmero de NBI del hogar Total Total Estrato Ciudades capitales Grandes ciudades Resto urbano Rural Resto rural 100.0 100.0 100.0 100.0 100.0 100.0 .00 59.1 77.6 79.8 70.6 52.0 28.8 1.00 26.5 13.8 17.3 22.9 42.0 40.6 2.00 10.8 5.1 1.9 5.5 6.0 23.7 6.4 .5 3.00 3.2 3.1 1.0 .9 4.00 .3 .5

TIPOS DE SUBCOMANDOS
Subcomandos GLOBALES
Subcomando AUTOLABEL BASE FTOTAL, PTOTAL GBASE MDGROUP, MRGROUP MISSING OBSERVATION Descripcin Crea etiquetas para todas las tablas Determina la base de los porcentajes para las variable categricas Crea variables para los totales de una tabla Determina la base de los porcentajes para las variables de respuesta mltiple Crea variables de respuesta mltiple Determina el tratamiento de los valores perdidos Declara las variables que sern resumidas al interior de la tabla

Subcomandos LOCALES
Subcomando CAPTION CORNER SORT STATISTICS TABLE TITLE Descripcin Crea notas al pie del cuadro Crea etiquetas para la tabla Ordena las celdas de las tablas Indica las estadsticas que sern calculadas al interior de las tablas Determina la estructura de las tablas Crea el ttulo de la tabla

TIPOS DE VARIABLES
Categoras

CATEGORY, default
Los valores de esta variable se usan para clasificar la data
Observacin

OBSERVATION
Los valores de esta variable se presentan en el contenido de la tabla a travs de estadsticas (media, varianza, etc.)
Respuesta

Mltiple MRGROUP: Multiple response


Son variables que se crean a partir de variables individuales en la data.

Total

al final FTOTAL: Following Total


En esta variable se calculan las estadsticas para el total de la fila o columna. Se presenta luego de la variable en estudio.

Total

al comienzo PTOTAL: Preceding Total


Es similar al anterior, pero se presenta antes de la variable en estudio.

RELACION ENTRE VARIABLES

Dimensiones: BY Se usa para separar las variables o combinaciones de variables segn sern asignadas a las dimensiones de la tabla (filas, columnas, capas) Filas BY Columnas BY Capas

Apilar: + Se usa para presentar dos variables en la misma dimensin de la tabla (una a continuacin de la otra) Var1 + Var2 BY Var3 Anidar: > Se usa para presentar todos los valores de una variable (variable anidada) respecto a cada uno de los valores de otra variable (variable de control) Var1 > Var2 BY Var3 Combinar Apilar y Anidar: ( ) Se usa para tablas deonde se desea Apilar y Anidar a la vez. (Var1 + Var2) > Var3 BY Var4

CONTENIDO DE LA TABLA

CONTENIDO DE LA TABLA

Você também pode gostar