Você está na página 1de 25

BREVE MANUAL DE INDUCCION AL SAS

USO DE LA PARTE INTERACTIVA: ANALYST

El SAS (Statistical Analysis System) es un sistema de software integrado que proporciona un control total sobre
acceso, manejo, análisis y presentación de bases de datos. La versión de SAS de la que nos ocuparemos es la 8.0.

Al ingresar al programa por medio de un ícono o a través de un item de programas aparece la siguiente ventana:

y luego la ventana:
Como se puede observar, en la parte izquierda aparece una especie de explorador de SAS, donde se puede indagar
acerca de librerías, conjuntos de datos previamente creados en SAS o recientemente creados por el usuario,
resultados generados con algún procedimiento.
En la parte derecha aparecen dos ventanas claramente distinguibles con los nombres Editor y Log.
En la parte inferior aparecen los nombres de dichas ventanas a las cuales se puede tener acceso (aparecen tres
nombres: Output, Log y Editor) con solo hacer click en el respectivo nombre. Si es de su comodidad y quiere mayor
espacio puede cerrar la ventana de explorer.

En la ventana del PROGRAM EDITOR se deben digitar todos los comandos correspondientes a un programa en SAS.
Permite además la entrada de bases de datos (se recomienda que estas bases sean pequeñas; si son grandes es
aconsejable introducirlas al sistema de otra forma.
En la ventana del LOG aparece un reporte detallado de la ejecución del programa. Si se cometieron errores estos
aparecen reportados en color rojo en esta ventana; además el programa indica el tipo de error que se cometió y la
línea donde está. Algunas veces puede aparecer un mensaje en color verde que dice WARNING; esto no debe ser
motivo de alarma ya que no interrumpe la correcta ejecución del programa; no obstante, debe ser leído con
detenimiento. Se recomienda revisar siempre esta ventana después de ejecutar el programa.
En la ventana del OUTPUT aparecen todos los resultados solicitados en el programa. Si se solicitan gráficos, el
sistema genera automáticamente una ventana con el nombre Graph1.

En la parte superior aparece un menú de opciones, entre las cuales figuran: File, Edit, View, Tools, Run, Solutions,
Windows y Help.

Debajo una barra de herramientas. Dicha barra de herramientas permite, entre otras cosas, abrir nuevo documento,
guardar, imprimir, abrir archivos, impresión previa de alguna ventana, herramientas de copiar, pegar, cortar, deshacer,
crear nueva librería, abrir ventana explorer en SAS, , ejecutar comandos SAS, borrar todo el contenido de una
ventana, pausa y ayuda. Para saber que hace cada botón basta situar el mouse en dicho ícono y aparece su
respectiva descripción.
Por ejemplo:

El primer botón también sirve para borrar las ventanas LOG y Output.

Un programa típico en SAS consta básicamente de dos pasos que son: El paso DATA y el paso PROC.
El paso DATA se relaciona con aspectos tales como lectura de datos, creación de nuevas variables, operaciones
lógicas y aritméticas y ejecución de ciclos.

El paso PROC se relaciona con la ejecución de los distintos procedimientos de análisis los cuales están incorporados
dentro de cada producto del SAS; por ejemplo, el SAS/GRAPH. Estos procedimientos se invocan al sistema con sus
respectivos nombres y cada uno de ellos posee una amplia gama de opciones.

NOTAS IMPORTANTES

En la elaboración de un programa en SAS se debe ser muy cuidadoso con la sintaxis y se debe guardar
periódicamente usando la siguiente convención: Si se quiere guardar el contenido del PROGRAM EDITOR se debe
usar la extensión.sas; por ejemplo miprimer.sas. Si se quiere guardar el contenido del OUTPUT se debe usar la
extensión.lst; por ejemplo miprimer.lst.
Toda línea de comandos se debe finalizar con punto y coma. La omisión de esta importante regla de sintaxis genera
errores muy difíciles de detectar y es uno de los errores más comunes. Los nombres asignados a las variables no
deben exceder ocho caracteres. Se recomienda que tales nombres den idea de la variable; por ejemplo, PRESANG
puede representar una variable llamada presión sanguínea.

Para invocar los distintos procedimientos se pueden usar letras mayúsculas, minúsculas o la combinación de ambas;
por ejemplo PROC MEANS=proc means=Proc Means.

Se recomienda documentar todos los programas. Esto permite identificar cada programa y da una idea de lo que cada
uno de ellos hace. Los comentarios en SAS tienen la siguiente sintaxis /* COMENTARIO */; por ejemplo,

Lectura de datos en formatos especiales ( ASCII, separado por comas, punto y comas, tabuladores, Excel)

- Ejemplo de un programa en SAS entrando los datos directamente al PROGRAM EDITOR.

Suponga que se recopiló información a un grupo de personas. Específicamente se les registró el sexo, la edad, la
estatura y el peso. Se quiere obtener un resumen detallado por medio de tablas de este grupo de personas. Este
programa se debe digitar en la ventana del PROGRAM EDITOR. Un programa en SAS típico puede ser:

/****************************************************************************/
/* Este programa permite obtener tablas de resúmenes estadísticos básicos */
/* */
/* Proc’s Usados: FREQ, MEANS y UNIVARIATE */
/* */
/****************************************************************************/
DATA uno; /* CREACION DATA */
INPUT sexo $ edad estatura peso; /* NOMBRAMIENTO VARIABLES */
CARDS;
H 25 1.72 70
M 20 1.64 54
M 19 1.65 52
M 27 1.63 50
M 22 1.65 47
H 16 1.65 62
H 25 1.69 64
H 26 1.73 72
M 25 1.72 71
H 23 1.80 74
H 22 1.70 69
H 25 1.72 71
;
RUN;
PROC MEANS DATA=uno; / *ESTADISTICAS BASICAS */
Var estatura peso;
Run;

PROC FREQ DATA=uno; /* TABLA DE FRECUENCIAS */


TABLES sexo;
Run;

PROC UNIVARIATE DATA=uno; /* MAS ESTADISTICOS BASICOS */


Var edad;
Run;

Si lo desea puede utilizar solo las ventanas EDITOR, OUTPUT y LOG y cerrar la ventana explorer. Puede organizar
las ventanas como desee al estilo Windows. El signo $ es empleado para indicar una variable alfa-numérica.

Para ejecutar el programa anterior basta hacer click en el ícono con forma de muñeco caminando. Los resultados de
los procedimientos empleados aparecerán en la pantalla OUTPUT y los tiempos empleados y errores en la pantalla
LOG.
! " # " #
! $% $&'($''') *&*+(,),' $&'-***** $&,******
. ! $% '-&******* (&)+%$%() +)&******* )+&******* / ) 0,&-- ) 0,&--
0 +$&') $% $**&**

1 2 2 3 ! ! ! !
4
5 #
!
%%&($'') -&%'*$,
$% 6 7 ! $% %+&***** $*&'%,)(
%%&($'''') 8 ! ! %)0 %0&***** 7 $$&*****
-&%'*$,%$, $*&'%,),)( 2 " 7 +&*****
9 : !! ;*&,(--+', < ! ! *&%*($*+$
1 '+$( $$'&($''')
== $+&%%'%+(0 *&(+$$--0-

! ! = 5 4 *>* ! ? = 0@ 1 2 2
4
! ; ! ; ;;;;;. ;;;;;; !
8 ! !
A! %+&-0**) B C&***$ $**D %)
7 ' B> *&***0 ((D %) ;;;;5 : ! ;;;; ;;;;/ 7 ! ;;;
7 9 -( B> *&***0 (0D %)
(*D %' 8 ! 8 !
)0D - %0
0*D %+ $' ' %0 )
%0D $ %$ $( - %0 (
$*D $( %* % %0 $%
0D $' %% $$ %' ,
$D $' %% 0 %) +
*D $'
- Ejemplo de un programa en SAS leyendo los datos de un archivo externo

Suponga que la información anterior fue previamente


guardada en un archivo de texto, digamos una archivo
de nombre datos.txt guardado en un disquete. Al abrir
el archivo se observa lo siguiente:

Aunque este es un archivo pequeño, la herramienta


de lectura de datos desde archivos externos se hace
útil cuando se tienen grandes base de datos.

Para leer los datos desde SAS se usa el siguiente


programa:

/****************************************************************************/
/* Este programa permite leer datos de un archivo externo en formato ASCII */
/* separado por espacios. */
/* */
/* Proc’s Usados: DATA, PRINT */
/* */
/****************************************************************************/

DATA uno; /* CREACION DATA */


INFILE “ A:\datos.txt”; /* LECTURA DE DATOS EXTERNOS */
INPUT sexo $ respu edad ingreso; /* NOMBRAMIENTO VARIABLES */
RUN;

PROC PRINT DATA=uno; /* IMPRIME DATOS */


Run;

Al correr el programa se obtiene

El conjunto de datos Uno se ha creado satisfactoriamente y contiene la información guardada en el archivo: datos.txt .
El procedimiento PRINT permite imprimir el contenido de cualquier DATA creado previamente en SAS.

Ahora suponga que se quiere crear una nueva variable; en particular suponga que se quiere pasar la variable ingreso
a miles de pesos; para esto modifique el anterior programa así:
DATA uno;
INFILE “a:\datos.txt”; /* RUTA DONDE ESTAN LOS DATOS */
INPUT sexo$ respu edad ingreso;
ingreso1=ingreso*1000;
Run;

PROC PRINT DATA=uno;


Run;

Las instrucciones en negrilla son las que se agregaron.


El resultado de estas modificaciones se muestra a
continuación.

Ahora suponga que se quiere recodificar la variable


RESPU; en particular se quiere especificar que el 0=No
y el 1=Si.

Para hacer esto modifique el anterior programa


agregando unas dos nuevas líneas al programa.

El programa en SAS y los respectivos resultados se


muestran en el siguiente gráfico.

DATA uno;
INFILE "a:\datos.txt
INPUT sexo$ respu edad ingreso;
ingreso1=ingreso*1000;
IF respu=1 THEN respu1="SI";
ELSE respu1="NO";
RUN;

PROC PRINT DATA=uno;


Run;

Las instrucciones en negrilla corresponden a las


agregadas. Similares instrucciones pueden ser
usadas para crear más variables o modificar las
existentes.

Ahora bien, si se quiere saber la distribución de frecuencias de la variable RESPU1 según el SEXO, se debe modificar
el programa así,

DATA uno;
INFILE “A:\datos.txt”;
INPUT sexo$ respu edad ingreso;
ingreso1=ingreso*1000;
IF respu=1 THEN respu1=”SI”;
ELSE respu1=”NO”;
Run;
PROC PRINT DATA=uno;
Run;

PROC FREQ DATA=uno;


Tables respu1*sexo;
Run;

Las líneas que se agregaron aparecen en negrilla. La ejecución de este programa genera el siguiente resultado,
Si se quiere obtener un GRÁFICO DE FRECUENCIAS por EDAD, modifique el programa así,

DATA uno;
INFILE “A:\datos.txt”;
INPUT sexo$ respu edad ingreso;
ingreso1=ingreso*1000;
IF respu=1 THEN respu1=”SI”;
ELSE respu1=”NO”;
Run;
PROC PRINT DATA=uno;
Run;
PROC FREQ DATA=uno;
Tables respu1*sexo;
Run;

PROC GCHART DATA=uno;


VBAR edad / DISCRETE;
Run;

La ejecución de este último conjunto de opciones genera


el gráfico:

Otra manera de mostrar esta información es colocando estas barras de manera horizontal. Las siguientes
instrucciones en SAS permiten hacer esto y adicional ala gráfico aparece adjunta una tabla de frecuencias.

DATA uno;
INFILE “A:\datos.txt”;
INPUT sexo$ respu edad ingreso;
ingreso1=ingreso*1000;
IF respu=1 THEN respu1=”SI”;
ELSE respu1=”NO”;
Run;
PROC PRINT DATA=uno;
Run;
PROC FREQ DATA=uno;
Tables respu1*sexo;
Run;

PROC GCHART DATA=uno;


HBAR edad / DISCRETE;
Run;
- Ejemplo de Lectura de datos desde un archivo externo, con una estructura especial

Suponga que se tiene una base de datos con la siguiente apariencia:

Un programa usual para leer estos datos será:

DATA dos;
INFILE "a:\datos2.txt" FIRSTOBS=2;
INPUT nombre $ carnet direcc est resp matri sexo $;
Run;

La opción FIRSTOBS=2 le indica al programa que la información empieza en la segunda fila. Al ejecutar las
instrucciones anteriores resulta:

La razón es porque para el SAS cada espacio en blanco separa un valor para cada una de las variables especificadas
en la instrucción INPUT. Para resolver este problema es necesario establecer un formato fijo para cada variable. Por
ejemplo, el NOMBRE mas largo va desde la columna 1 hasta la columna 23, el CARNET de la columna 26 a la 34, la
DIRECCIÓN mas larga de la columna 38 a la 61 y los valores de las demás variables están separados por espacios.
El programa en SAS para leer esta base de datos es:

DATA dos;
INFILE "a:\datos2.txt" FIRSTOBS=2;
INPUT nombre $ 1-23 carnet 26-34 direcc $ 38-61 est resp matri sexo $;
Run;
El resultado al correr estas instrucciones es:

Para generar una tabla de frecuencia de SEXO contra RESP, se procede así:

DATA dos;
INFILE "a:\datos2.txt" FIRSTOBS=2;
INPUT nombre $ 1-23 carnet 26-34 direcc $ 38-61 est resp matri sexo $;
Run;
PROC FREQ DATA=dos;
TABLES sexo*est/norow nocol nopercent;
Run;

= ! # !

! !

" #E %E -E +E 0E 'E
F F F F F F
E - E $ E $ E $ E * E '
F F F F F F
E * E % E % E * E % E '
F F F F F F
- - - $ % $%

El SAS permite la creación de gráficos


tridimensionales y gráficos que permiten
visualizar el comportamiento de varias variables
simultáneamente.
El siguiente programa crea una tabla de doble
entrada de las variables sexo y resp

DATA dos;
INFILE "a:\datos2.txt" FIRSTOBS=2;
INPUT nombre $ 1-23 carnet 26-34
direcc $ 38-61 est resp matri sexo $;
Run;
PROC FREQ DATA=dos;
TABLES sexo*resp/norow nocol
nopercent;
Run;

PROC GCHART DATA=dos;


BLOCK est/DISCRETE GROUP=sexo;
Run;
Creación de Librerías en SAS

Una herramienta muy útil cuando se manejan muchos conjuntos de datos es tener a disposición todos los conjuntos
de datos y no tener que de nuevo escribir un programa para leerlos o inclusive volver a digitarlos en la ventana del
PROGRAM EDITOR. Una manera de resolver este problema es usando el concepto de Librería. Una librería se
asemeja a un archivador el cual contiene en su interior información sobre diferentes conjuntos de datos.

En SAS el manejo de las librerías es muy similar a los archivadores que se manejan en algunas empresas (por
ejemplo, un archivador donde las carpetas son información de diferentes clientes, o sobre proveedores de productos o
información sobre estudiantes, etc).

En SAS se tienen dos tipos de librerías: Temporales y Permanentes.

Librerías Temporales. En las librerías temporales los conjuntos de datos allí guardados solo están activos mientras
no se termine la sesión de SAS, es decir al salir de SAS los conjuntos de datos desaparecen; son como conjuntos de
datos temporales. En SAS, la librería que guarda los conjuntos de datos temporales es la librería WORK.
En cualquier caso, sea que los datos se escriban directamente en el programa o se lean de un archivo externo, Al
ejecutarse el programa los datos quedan guardados en la librería WORK y el nombre asignado es: WORK.nombre.
Por defecto el SAS solo usa el nombre del conjunto de datos sin usar la palabra WORK. Para ilustrar, observe el
siguiente ejemplo:
Librerías Permanentes. Para crear una librería permanente que permanezca dentro de SAS aún después de
terminar la sesión de SAS e iniciar de nuevo, se puede hacer de dos maneras: Con comandos en SAS o usando el
menú explicado antes.

Para crear una librería con comandos usamos la instrucción LIBNAME (nombre) ‘ruta’. En nombre asignamos un
nombre que no pase de 8 caracteres y el cual determinara la librería. Todos los archivos que se generen en adelante
quedarán dentro de la librería previamente creada. Por ejemplo:

Libname curso “a:\”;

DATA curso.dos;
INFILE "a:\datos2.txt" FIRSTOBS=2;
INPUT nombre $ 1-23 carnet 26-34
direcc $ 38-61 est resp matri sexo $;
Run;

Proc print data=curso.dos;


Run;

El archivo de datos se llama ahora curso.dos.

La ejecución de estas instrucciones arroja los


siguientes resultados:

Otra manera fácil de crear librearías, no requiere el colocar le nombre de la librería antes del nombre del archivo de
datos. Suponga que se leen los siguientes datos:

DATA dos;
INFILE "a:\datos2.txt" FIRSTOBS=2;
INPUT nombre $ 1-23 carnet 26-34 direcc $ 38-61 est resp matri sexo $;
Run;

Internamente se ha creado el archivo de datos dos


dentro de la librería WORK. En el menú principal
seleccionamos el ícono correspondiente a una
nueva librería:

El archivo de datos previamente creado quedan automáticamente guardados en esta nueva librería. Por ejemplo si la
librería va a estar físicamente en el drive A y su nombre es Curso, la ruta a escribir o path será: “ A:\ “.

La ilustración de este proceso se muestra a continuación:


En la ventana explorer quedan registrados no solo las librerías existentes y recién creadas, sino también los archivos
de datos dentro de cada librería. Como su nombre lo indica usted puede realizar todas las tareas que haría un
explorador usual: Copiar, Cortar, Mover, borrar, etc.

En el drive A, se puede ver el archivo de datos de nombre dos y con formato de archivo de datos en SAS. Un solo clic
en el archivo basta para que el programa abra su contenido en una ventana aparte. Lo anterior se muestra en los
siguientes dos gráficos:

Lectura de Datos usando la opción Import Data

Suponga que se dispone de la información contenida en el archivo datos.txt el cual contiene información acerca de
Sexo, Resp, Edad e Ingreso y está físicamente en el drive A.
Al seleccionar la opción indicada y presionar Next aparece una ventana donde se pide la ruta del archivo que se
desea leer y luego Next. Después de seleccionar el archivo y presionar Next, aparece otra ventana donde se indica
en que librería se desea guardar la información y con que nombre el archivo de datos y luego las opciones Next y
Finish. Se ilustran los dos pasos anteriores.

Al presionar Finish aparece la siguiente pantalla:

Seleccionamos cada una de las columnas del archivo haciendo click, nombramos la respectiva columna con un
nombre y determinamos el tipo de escala de medición. En el botón Options , aparece entre otras cosas, el tipo de
separador entre variables. Por defecto es un espacio en blanco, pero podemos tener bases de datos donde los
valores de las variables están separados por comas, por tabuladores o otros símbolos. La opción Add, permite
adicionar la columna seleccionada
El resultado de adicionar las variables y sus respectivos nombres es:

al cerrar la ventana aparece y luego salvar los datos aparecen las siguientes ventanas:

Suponga ahora que los datos antes leídos están disponibles en formato Excel. Suponga que dicha información está
registrada en el archivo datos.xls:

Para leer estos datos usamos la misma opción Import Data. En este caso el formato de los datos ya está previamente
establecido

Al presionar Next, aparece una nueva ventana donde se pide la ubicación de los datos. Estos están en el drive
A:\datos.xls, al presionar el ícono Options aparece una nueva ventana donde se especifica si los nombres de las
variables aparecen en la primera fila, se selecciona la opción y OK, luego presione Next. La ventana que aparece
permite especificar la librería y el nombre para el archivo de datos. Seleccionamos librería Curso y archivo de datos
Tres. Por último presione Finish. Estos resultados se muestran a continuación:
En la ventana del Log aparece un mensaje diciendo
que el archivo fue exitosamente creado. Si desea ver el
archivo basta usar el Procedimiento PRINT.

Proc Print data=curso.tres;


Run;

Manejo de Datos Usando SAS Interactivo

Para acceder a la parte interactiva del programa SAS,


es necesario tener previamente creado en SAS uno o
varios archivos de datos a ser utilizados. En SAS
tenemos dos modos interactivos de análisis básicos:
Interactive Data Análisis y Analyst. El resto de este
documento se dedicará a mostrar algunas de las
opciones del Analyst.Este módulo interactivo tiene la particularidad de trabajar en forma de proyectos: cada
procedimiento realizado, cada gráfica, cada resultado y el código utilizado aparecen registrados y en cualquier
momento están disponibles. Permite guardar más ágilmente gráficos y otros resultados.

Para ingresar al modo Analyst, se usa el menú Solutions

Al hacer esto aparece la siguiente ventana :


Algunas opciones del menú superior son:

Un menú inferior también contiene algunos procesos resumidos de gráficos, tablas, resúmenes estadísticos, etc.
Abrimos un archivo de datos existente en alguna librería sea de SAS o creada por el usuario. Tenemos la librería
CURSO. Usando la Opción File – Open by SAS Name, aparece una ventana donde se especifican las librerías y
dentro de ellas los respectivos archivos de datos contenidos en cada una de ellas (basta hacer doble clic en la librería
de interés y al lado derecho aparecen los archivos de datos. Seleccionamos la Librería CURSO y el conjunto de datos
Tres y luego OK. Aparece el Nombre dado al archivo de Datos y a la izquierda la ventana con las observaciones.

Exploremos los menú Graphs y Statistics

Al seleccionar la opción Graphs aparece el siguiente submenú:

Exploremos brevemente cada una de estas opciones sin entrar en mucho detalle. Esta exploración adicional se deja
para el usuario.

Usaremos los datos correspondientes a una muestra de estudiantes de la Universidad Nacional Medellín. Por medio
de una encuesta de cada estudiante se recopiló información acerca de: Estrato, Horas dedicadas a estudiar
semanalmente, Edad, Si Trabaja o No ( 1 corresponde a Trabaja y 2 a No-trabaja) y Promedio en el semestre anterior.
Los datos aparecen en la Librería CURSO con el nombre ESTUD.

Gráficos de Barras (Bar Chart)

En el menú seleccionamos Bar Chart y luego barras horizontales o verticales. Si seleccionamos Horizontal, aparece
una ventana donde las variables están al lado izquierdo. Se selecciona la o las variables que desea haciendo clic
sobre el nombre y haciendo click en Chart y Luego OK. Observe que al lado izquierdo aparece el nombre del
procedimiento usado, el nombre del gráfico y el código en SAS usado por el programa. El resultado para la variable
Estrato es el siguiente:
El gráfico resultante está mal elaborado, pues las barras no corresponden a valores reales de la variable. La razón es
que no se le especificó al SAS que la variable era discreta. Si la variable es continua lo que hace es definir categorías
con los valores de esta. Para resolver esto en la ventana Bar Chart hacemos clic en Options. Aparece una ventana
donde se tiene la opción de elegir el número de barras que se desee, una barra para cada nivel discreto o un conjunto
de valores particulares (para lo cual se debe especificar los puntos medios respectivos) usando la opción Specify. Se
ilustra lo antes dicho.

Al seleccionar la opción de barras para cada nivel de la variable estrato, resulta el diagrama:
Si desea barras para estrato discriminado para los que trabajan y los que no trabajan, basta especificar en la opción
Group By la variable deseada ( en este caso Trabaja), el resultado es el siguiente

Para las Barras Verticales se procede Igual.

Diagramas de Pastel (Pie Chart).

Las opciones son similares a Bar Chart

Histogramas (Histogram...)

Los histogramas son elaborados para variables continuas o variables discretas con muchos valores. Al seleccionar
esta opción aparece una ventana similar a las otras consideradas.

Por ejemplo, un histograma de porcentajes para la variable Edad se obtiene al seleccionar Edad y hacer click en
Análisis y luego OK.
El SAS por defecto maneja ciertos colores y elabora el histograma de porcentajes. Usted puede cambiar estas
opciones si así lo desea. También puede elaborar histograma para la variable Edad discriminado por la variable
Trabaja. Para esto dicha variable es especificada en Class.
Se muestran ambos procedimientos. (Observe que siempre al lado izquierdo se va registrando todo lo que se hace y
en cualquier momento basta hacer doble clic para tener acceso a dichos resultados).
Diagrama de Cajas y Bigotes (Box Plot)

Las opciones que aparecen al seleccionar esta opción son muy similares a las anteriores. En la opción Display puede
controlar el color y los símbolos para datos atípicos. Un Box Plot para la variable Promedio es:

El mismo Box Plot para promedio pero clasificado por estrato Resulta:
Diagrama de Dispersión (Scater Plot)

En esta opción hay dos posibilidades Bidimensional y Tridimensional. Explicamos el bidimensional. Al seleccionar la
opción de interés se debe especificar la variable en el eje X y la Variable en el eje Y. Si lo desea puede elaborar este
gráfico discriminado por cualesquiera de las otras dos variables discretas. Graficamos Horasest contra Promedio.
Recuerde que el Display permite modificar colores y símbolo usado para el gráfico. Veamos el gráfico respectivo:

El mismo gráfico pero discriminado por la variable Trabaja:

Un gráfico de dispersión Tridimensional (con el Promedio


en el eje Z, Edad en el eje X y Horasest en el eje Y)

Las líneas de referencia así como el símbolo utilizado en


el gráfico son seleccionadas al hacer clic en la opción
Display, al igual que el color de los puntos en el gráfico.

Si se desea un gráfico similar pero discriminado por la


variable Trabaja, basta seleccionar dicha variable en la
opción Variables. Aparecerá un gráfico para cada valor de
la variable Trabaja.
Gráfico de Contornos (Contour Plot)

Imagínese una montaña que es cortada en rodajas pero paralelas al piso de la montaña, o recorrer la montaña por
caminos paralelos a la base de la montaña. Los recorridos o cortes son en esencia Contornos. Los contornos
identifican observaciones tridimensionales a una misma altura. LA estructura es muy similar al diagrama de dispersión
tridimensional. Puede elegir el número de contornos, el tipo de representación, si los contornos tienen o no etiqueta,
etc. Un ejemplo de un gráfico de Contorno con 10 niveles es:

Gráfico de Superficies (Surface Plot)

La estructura es muy similar al Gráfico de contornos, se seleccionan las variables en los respectivos ejes y en la
opción Display se puede escoger los colores de dicho gráfico (color encima y debajo), numero de divisiones a utilizar
en los ejes X, Y y el eje Z, escoger líneas de referencia, ángulo de rotación del gráfico, etc. Para las mismas tres
variables se tiene:

En el submenú de íconos podemos seleccionar el correspondiente a Tablas y seleccionar entre diferentes opciones.
Una tabla de Estrato vs Trabaja es (1 corresponde a No trabaja y 2 a Trabaja):
Exploremos ahora el menú Statistics.

Veamos el submenú Descriptive.

Estadísticas Básicas (Summary Statisitics)

Este tipo de análisis tiene sentido para variables continuas o discretas con muchos valores. Produce estadísticos
básicos, Histogramas, cajas y bigotes, discriminados o no por otra variable. En los diferentes menús que aparecen
usted puede seleccionar la medidas de su interés así como los gráficos. Los siguientes gráficos ilustran lo que s e
quiere explicar.

Puede seleccionar uno o los dos. En la opción Class puede


especificar una variable discreta si desea análisis
discriminados por una tercera variable. Los resultados
obtenidos son:
Las mismas estadísticas y gráficos pero discriminados
por Trabaja se obtienen al seleccionar la variable
Trabaja en la opción Class.

Estos resultados son:

En este caso son 134 los que no trabajan con una edad
promedio alrededor de los 23 años y los que trabajan
tienen una edad promedio entre los 27 y 28 años.

Se muestran los histogramas para la variable Edad tanto


par los que No trabajan como para los que trabajan.

Distribuciones (Distrtibutions).

Este submenú permite obtener estadísticas básicas de


variables, pero calculando medidas básicas (Momentos),
medidas de variabilidad, percentiles, gráficos de Caja y
Bigotes, Histogramas, Gráficos de Probabilidad normal y
un gráfico Cuantil-Cuantil, además de ajustar curvas de
algunas distribuciones al histograma.

La opción Plots, permite generar los gráficos antes


mencionados, la opción Fit, permite indicar el tipo de
distribución que se quiere ajustar al histograma.

En el recuadro con la opción Class, se puede especificar


alguna variable discriminatoria para realizar análisis
comparativos.

Seleccionando el gráfico Cuantil-Cuantil se muestran los


resultados para la variable Edad.
1 2 2 3 ! ! ! !
4
5 #
!
%+&',%(- 0&$**$)
%*0 6 7 ! %*0 %+&***** %'&*$$)%
%+&',%(%', 8 ! ! 0*'* %$&***** 7 -%&*****
0&$**$',-% %'&*$$)$'( 2 " 7 '&*****
9 : !! $&+,+'()0+ < ! ! -&*()%-(-(
1 $-*%*% 0-*'&-(*%+
== %*&''%)-)- *&-0'%$$%$

! 8 ! ! ! ! = 5 4 *>*

$**D +( ;;;;5 : ! ;;;; ;;;;/ 7 ! ;; ! ; ! ; ;;;;;. ;;;;;;


((D +%
(0D -0 8 ! 8 ! A! '(&%(%(0 B C&***$
(*D -% 7 $*%&0 B> C&***$
)0D - %) $) $+) -, -0 7 9 $*00)&0 B> C&***$
0*D %+ $) (% +* %,
%0D $ %$ $, $+' +% $0-
$*D %* $, ($ +% $,+
0D $( $( $(0 +( (+
$D $,
*D $)

Correlaciones (Correlations...)

Esta opción permite calcular medidas de dependencia entre las variables de interés ( variables continuas). En la
respectiva ventana se especifican las variables de interés. Dejamos a consideración del usuario explorar las opciones
con las que cuenta el submenú.

Conteos y Frecuencias (Frequency Counts)

Similar a la opción de generación de tablas. Permite además de crear tablas de frecuencias, generar gráficos de
barras para las variables implicadas. El usuario puede explorar sin problemas las opciones del submenú.

Você também pode gostar