Escolar Documentos
Profissional Documentos
Cultura Documentos
Estudiantes Auxiliares:
Ahumada Avendao Fredy Esteban
Alvarado Castillo Paola Alejandra
Alzate Gaitn Paola Andrea
Andrade Martnez David Ricardo
Caldern Espitia Walter Helberth
Cano Daz Alberto
vila Ibez Diego Fernando
Enciso Castao Julin David
Gonzlez Mayorga Cesar Felipe
Gisa Daz Carlos Eduardo
Hernndez Carvajal Miguel ngel
Hurtado Casas Andrs Felipe
Leyva Daz Daniel Felipe
Lugo Rozo Cindy Carolina
Malangn Carvajal Laura Juliana
Martnez Cortes Nicols
Miranda Hernndez Ncolas
Montes Parra Mayerli Andrea
Moreno Urin Germn Yesid
Oquendo Patio Viviana Mara
Patio Oquendo Luis Felipe
Pineda Estupian Andrs Javier
Rojas Martn Daniel Francisco
Rubiano Rojas Mario Andrs
Vargas Castro Jessica Paola
1.
2.
Contenido
Introduccin............................................................................................................... 6
2.1.
2.2.1.
2.2.2. Uso del software segn la pgina oficial de SAS(Official Page, Statistical
Analysis Software, 2013) ........................................................................................... 8
2.3.
2.3.1.
2.3.2.
2.3.3.
2.3.4.
2.3.5.
2.3.6.
2.3.7.
2.3.8.
2.3.9.
2.3.10.
2.3.11.
2.3.12.
2.3.13.
2.3.14.
Crear grficos......................................................................................... 28
2.3.15.
2.3.17.
ARIMA ................................................................................................... 36
2.3.18.
2.3.19.
2.4.
Clases ............................................................................................................... 71
2.4.1.
Primera Clase............................................................................................ 71
2.4.2.
2.4.3.
2.4.3.1.
Lgica condicional.................................................................................. 77
2.4.3.2.
2.4.3.3.
2.4.3.6.
2.4.4.
2.4.5.
2.4.6.
2.4.7.
2.4.8.
3.
4.
Introduccin
La empresa SAS crea el Statistical Analysis Software (SAS) principalmente como un mtodo
para la organizacin y control de grandes bases de datos. SAS fue diseado de manera tal que
respondiera a una recoleccin, transformacin, anlisis y reporte de datos; de manera adecuada
y eficiente para la organizacin que disponga del software. Sin embargo, pronto el software
comenz a formarse como uno de los paquetes economtricos ms poderosos del mercado.
Adems, el software puede generar muchas soluciones de negocio que permiten soluciones de
software a gran escala para reas como administracin, gestin de recursos humanos, gestin
financiera, inteligencia de negocios y ms. La ltima versin de SAS fue SAS 9.3 y sali al
mercado en diciembre de 2011.
2.2.2. Uso del software segn la pgina oficial de SAS(Official Page, Statistical
Analysis Software, 2013)
Como mtodo de autoexploracin del software SAS se estableci que a partir del
software y su respectivo manual, se iran encontrando las diferentes funciones del
programa y con base en estas se realizara la estructura del curso de acuerdo a los
diferentes tems encontrados y a la experiencia en la unidad sobre estos tipos de
software y el mejor procedimiento para dictar un curso libre. A continuacin se
presenta la primera parte del manual de SAS con los siguientes tems:
o
o
o
o
libref.filename
En el nombre de dos niveles, libref es el nombre de la biblioteca SAS que contiene
el archivo y nombre_de_archivo es el nombre del mismo archivo. Un perodo separa
la libref y el nombre de archivo. En el nombre de dos niveles, libref es el nombre de
la biblioteca SAS que contiene el archivo y filename es el nombre del mismo
archivo. Un perodo separa la libref y el filename.
10
EJEMPLO 1
Asignacin de un libref a archivos de referencia SAS
Suponga que usted quiere definir una librera SAS para referenciar una carpeta en el
entorno operativo de Windows que contiene algunos SAS data sets. Luego usted
quiere crear un nuevo data set, imprimirlo e imprimir un data set existente en la
misma librera. El siguiente programa define la librera Sales y referencia los
archivos SAS con esta librera.
Usted puede copiar y enviar este programa en SAS. Sin embargo, es necesario
editar el directorio en el estado LIBNAME (est en rojo) para referenciar un directorio
existente en su entorno operativo.
/*************************************/
/* define SAS library
*/
/*************************************/
libname sales 'c:\salesdata\sas\2002';
/*************************************/
/* create new data set from raw data */
/*************************************/
data sales.quarter1;
length Department $ 7 Site $ 8;
input Department Site Quarter Sales;
datalines;
Parts Sydney 1 4043.97
Parts Atlanta 1 6225.26
Parts Paris 1 3543.97
Repairs Sydney 1 5592.82
Repairs Atlanta 1 9210.21
Repairs Paris 1 8591.98
Tools Sydney 1 1775.74
Tools Atlanta 1 2424.19
Tools Paris 1 5914.25
;
run;
/*************************************/
/* print new data set
*/
/*************************************/
proc print data=sales.quarter1;
run;
/*************************************/
/* print existing data set
*/
/*************************************/
proc print data=mylib.productsales;
run;
11
EJEMPLO 2
Ahora suponga que usted quiere imprimir tambin una tabla Oracle y una tabla DB2.
El siguiente programa muestra cmo puede especificar declaraciones LIBNAME con
los motores de SAS/ACESS y opciones apropiadas. Despus de asignar un libref a
DBMS, es posible referenciar estas tablas y vistas como SAS data sets, usando los
nombres estndar two-level SAS.
Mientras usted pueda definir cualquier nmero de librefs in SAS, usted puede
procesar datos desde mltiples recursos DBMS en el mismo programa de SAS.
Debido a que esta es una gua rpida para principiantes, no es posible copiar y correr
este programa como se muestra. Sin embargo es posible modificarlo para trabajar con
tablas DBMS que usted pueda acceder.
/*************************************/
/* define SAS library for Oracle */
/*************************************/
libname myorlib oracle user=scott password=tiger
path="blunzer:v7" schema=hrdept;
/*************************************/
/* define SAS library for DB2
*/
/*************************************/
libname mydblib db2
noprompt="user=testuser;
password=testpass;database=testdb";
/*************************************/
/* print Oracle table
*/
/*************************************/
proc print data=myorlib.all_employees;
where state='CA';
run;
/*************************************/
/* print DB2 table
*/
/*************************************/
proc print data=mydblib.customers;
where state='CA';
run;
/*************************************/
/* clear librefs
*/
/*************************************/
libname myorlib clear;
libname mydblib clear;
12
REFERENCIAS
Ac puede encontrar ms informacin acerca de crear libreras.
Documentacin en Help SAS:
1. En SAS, click Help SAS Help and Documentation.
2. Expanda SAS Products Base SAS.
3. Expanda SAS Language Concepts SAS Files Concepts SAS Data
Libraries y mire los tpicos de inters
4. Expand SAS Language Dictionary Dictionary of Language Elements
Statements y click LIBNAME statement y LIBNAME Statement,
SAS/ACCESS.
5. Expanda Using SAS Software in Your Operating Environment, luego en la
seccin de su entorno operativo. Expanda Using SAS Files y vea los tpicos
relacionados con las libreras de SAS
Preguntas en el soporte tcnico Frequently Asked Questions
Programas in SAS help:
1.
2.
3.
2.3.2.
Tal vez quiera crear un nuevo data set desde un data set existente. En Create an run
SAS programas, haya visto ejemplos de DATA step que lee existiendo data sets usando
una declaracin SET. Leyendo un data set en un DATA step es ms simple que leyendo
los datos en bruto debido a que el trabajo de describir y convertir los datos ya se han
hecho.
Ahora, cuando usted usa un data sets existente o subsets creados desde SAS data sets,
usted puede hacer ms eficiente el uso de los recursos del computador que si usara los
datos en bruto (raw data) o si est trabajando con data sets largos. Leer menos
variables significa que SAS crea un program data vector ms pequeo, y leyendo menos
observaciones significa que existen menos iteraciones para el DATA step que se crean.
Usted puede leer desde uno o ms data set, combinar y modificar datos en diferentes
maneras, por ejemplo usted puede:
Combinar 2 o ms input data sets para crear un output data ser
Fusionar datos desde 2 o ms data sets para crear un output data set
Actualizar un archivo master basado en las grabaciones de transaccin.
En el caso ms simple usted lee datos desde un solo SAS data set:
13
Como las principales herramientas para leer, combinar y modificar data sets, usted
puede usar cuatro declaraciones: SET, MERGE, MODIFICY y UPDATE. Para procesar
los datos y crear un data set de salida, puede usar una programacin adicional de
declaraciones SAS en el paso DATA.
Esta tarea se centra en la lectura de un nico conjunto de datos SAS utilizando la
sentencia SET.
EJEMPLO
Cuando usted lee data sets de SAS, el gran poder del paso de programacin DATA est
disponible para usted. Los siguientes ejemplos muestran algunos caminos fciles para
usar la declaracin SET para leer una existente data set.
Usted puede copiar y enviar estos programas en SAS. En los datos de
Mylib.ProductSales fue creado por Work with SAS data sets . Si no se cre, vuelva
a la tarea definir la librera y crear un data set antes de cargar estos
programas que aparecen a continuacin
/*************************************/
/* read a data set and subset
*/
/*************************************/
data canada;
set mylib.productsales;
if country='CANADA';
run;
/*************************************/
/* read a data set, subset, and */
/* create new variables
*/
/*************************************/
14
REFERENCIAS
Documentation, publications, and FAQs
Ejemplos de programas
2.3.3.
15
Usted puede ver y salvar el cdigo PROC IMPORT que el Import Wizard genera
EJEMPLO
Suponga que usted quiere importar 2 archivos, a ua hoja de clculo de Microsoft Excel y
a una tabla de Access. El siguiente programa le muestra cmo leer datos usando
opciones especficas para el archivo dado, crea data sets e imprime el nuevo data sets.
Debido a que esta es una gua rpida para principiantes, no es posible copiar y correr
este programa como se muestra. Sin embargo usted puede modificarlo para trabajar con
bases de datos de PC a las que pueda acceder.
/*************************************/
/* import the Excel file
*/
/*************************************/
proc import datafile="c:\myfiles\Accounts.xls"
out=sasuser.accounts sheet="Prices";
getnames=no;
run;
/*************************************/
16
REFERENCIAS
Mire estos recursos online para aprender ms a cerca de como leer bases de datos de
PC.
Documentacin, publicaciones y FAQs
Ejemplos de programas
17
2.3.4.
18
EJEMPLO
Suponga que usted quiere llevar a cabo algn tipo de procesamiento en un host remoto,
descargue lo resultante del data set, cree un data set permanente en el host local, e
imprima un reporte sobre el host local. El siguiente ejemplo ilustra cmo poner todas
estas caractersticas en un solo programa.
Debido a que esta es una gua rpida para principiantes, no es posible copiar y correr
este programa como se muestra. Sin embargo usted puede modificarlo para trabajar con
archivos remotos a los cuales pueda acceder
/*************************************/
/* prepare to sign on
*/
/*************************************/
options comamid=netbios remote=netpc;
libname lhost 'c:\sales\reg1';
/*************************************/
/* sign on and download data set */
/*************************************/
signon;
rsubmit;
libname rhost 'd:\dept12';
proc sort data=rhost.master
out=rhost.sales;
where gross > 5000;
by lastname dept;
run;
proc download data=rhost.sales
out=lhost.sales;
run;
endrsubmit;
/*************************************/
/* print data set in local session */
/*************************************/
proc print data=lhost.sales;
run;
REFERENCIAS
Vea estor recursos online para aprender ms acerca de cmo presentar programas
remotos de SAS
Documentacin, publicaciones y FAQs
19
Ejemplos de programas
20
Usted puede crear variables en un paso DATA mediante las siguientes maneras:
Cuando usted crea variables usando declaraciones asignada, usted puede tomar
ventaja de SAS functions y SAS expressions.
21
22
EN los pasos PROC, las declaraciones WHERE son la herramienta ms comn para
seleccionar observaciones que cumplan una condicin especfica.
sta tarea se enfoca en la escritura de los pasos DATA usando subconjuntos de
declaraciones IF, las opciones DROP= y KEEP= de data set y las declaraciones DROP
y KEEP.
2.3.8.
SAS almacena las fechas y horas como nmeros nicos, exclusivos para que pueda
utilizarlas en programas como cualquier otra variable numrica:
Un SAS date value es un valor que representa el nmero de das entre enero 1 de
1960 y una fecha especificada. SAS puede realizar clculos con fechas que van desde
el ao 1582 a 19.900 AD. Fechas antes de Enero 1 de 1960, son nmeros negativos,
despus de las fechas son nmeros positivos.
Un SAS datetime value es un valor que representa el nmero de segundos entre enero
1 de 1960 y una hora / minuto / segundo dentro de un plazo determinado.
23
Formats presenta un valor reconocido por SAS, tal como un valor time o date,
como un dato del calendario o un tiempo de reloj de varias longitudes.
2.3.9.
Impresin de Datos
Para listar la informacin en un data set, usted puede crear un reporte usando el
procedimiento PRINT. Luego, usted puede mejorar el reporte con declaraciones
adicionales y opciones para crear reportes como se muestra ms abajo. Usted puede
crear una variedad de reportes que van desde una simple lista a un gran reporte de
datos completamente personalizado adems de clculos totales y subtotales de una
variable numrica.
Metodo Point-and-Click
Si usted tiene licensia de SAS/STAT, usted puede crear listas de reportes usando una
interfaz point-and-click.
Usted puede ver y guardar el cdigo PROC PRINT que genera Analyst.
2.3.10.
Conteo de datos
Cuando usted analiza sus datos, es posible que usted necesite determinar qu valores
de una variable estn distribuidos a travs de los datos. Para ello, usted puede crear
tablas de frecuencia, la cual muestra la distribucin de los valores de la variable,
tanto con los porcentajes de un total como el conteo de data.
24
Esta tarea estar enfocada en usar PROC FREQ para realizar anlisis bsicos de
datos.
Mtodo de Point-and-Click
Si usted tiene licencia de SAS/STAT, usted puede crear tablas de frecuencias usando
una interfaz point-and-click.
1. En SAS, click Solutions< Analysis< Analyst.
2. Cuando Analyst se abra, click File< Open by SAS Name para agregar al
proyecto
3. Luego click Statistics< Descriptive< Frequency Counts para crear tablas de
frecuencias.
Usted puede ver y salvar el cdigo PROC FREQ que genera Analyst.
2.3.11.
Tabular datos
25
PROC TABULATE calcula muchas de las mismas estadsticas que son calculadas por
otros procedimientos estadsticos descriptivos tales como MEANS, FREQ, y REPORT
Mtodo de Click-and-Point
Si usted tiene licencia de SAS/STAT, usted puede crear reportes tabulares usando una
interfaz point-and-click.
1. En SAS, click Solutions< Analysis< Analyst.
2. Cuando Analyst se abre, click File< Open by SAS Name para agregar datos al
proyecto.
3. Luego click Reports< Tables para crear un reporte tabular
Usted puede ver y salvar el cdigo PROC TABULATE que genera Analyst.
2.3.12.
Consulta de datos
26
Usted puede usar elementos del lenguaje SAS como declaraciones globales, opciones
del data set, funciones, y formatos con PROC SQL slo si usted puede con otros
procedimientos SAS. De todas maneras, ya que PROC AQL implementa Lenguaje de
consulta estructurado, funciona de forma diferente a otros procedimientos BASE SAS.
Esta tarea se enfoca en recuperar datos desde una sola tabla (data set).
Mtodo de Point-and-Click
Usted puede unir tablas usando una interfaz point-and-click.
1. En SAS, click Tools< Query.
2. Use la ventana SQL Query para realizar uniones.
Usted puede ver y salvar el cdigo PROC SQL que la ventana de Consulta SQL
genera
Mtodo Point-and-Click
Usted puede crear consultas SQL usando una interfaz point-and-click
1. En SAS, click Tools< Query.
2. Use la ventana SQL Query para crear consultas.
Usted puede ver y salvar el cdigo PROC SQL que la ventana SQL Query genera
2.3.13.
Unir tablas
Si usted ley CONSULTA DE DATOS, usted observ maneras para consultar una
sola tabla usando PROC SQL. Sin embargo, usted necesita datos a menudo desde
tablas separadas. Cuando usted especifica mltiples tablas, vistas, o expresiones de
consulta en la clausula FROM, PROC SQL, las procesa para formar una tabla. La
tabla resultante contiene datos de cada una de las tablas contribuyentes. Estas
consultas se les llaman como JOINS.
Conceptualmente, cuando usted especifica dos tablas, PROC SQL compara cada fila
de la tabla A con todas las filas de la tabla B para producir una tabla interna o
intermedia conocida como el CARTESIAN PRODUCT. El producto cartesiano
(CARTESIAN PRODUCT) de tablas largas puede ser enrome, por lo que usted quiere
enviar datos declarando el tipo de unin. A continuacin se muestran dos tipos de
uniones.
27
Inner joins retorna una tabla resultante por todas las filas en una tabla que
tiene una o mas filas que coincidan en la otra tabla o las otras tablas.
Outer Joins son inner joins que son aumentadas con filas que no
2.3.14.
Crear grficos
Una manera efectiva para examinar las relaciones entre variables es graficando sus
valores. Para producir grficos nicos o superpuestos, usted puede usar:
En adicin, usted puede crear una salida PROC GPLOT usando el SAS/GRAPH
Control for ActiveX, el cual que le permite incrustar grficos interactivos en pginas
web y documentos OLE.
La sintaxis para los dos procedimientos es muy similar, aunque PROC GPLOT ofrece
un nmero adicional de funciones de formato. Esta tarea le muestra ambos caminos
para crear varios tipos de grficos.
Usted debe tener la licencia de SAS/GRAPH para crear grficos usando PROC
GPLOT.
28
Mtodo de Point-and-Click
a) Si usted tiene licenciado SAS/GRAPH, puede crear grficos con calidad de
presentacin usando una interfaz point-and-click
1. En SAS, click Solutions< Reporting< Graph-N-Go.
2. Click en el icono New SAS Data Set y seleccione datos para el grfico
3. Haga clic en el cono para escoger el grfico que desee y colquelo en el rea de
trabajo. Luego haga docle clic en el objeto del grfico, seleccione los datos y
especifique las variables y las opciones del grfico.
Usted puede ver y salvar el cdigo de PROC GPLOT que genera Graph-N-Go
b) Si usted tiene licenciado SAS/GRAPH y SAS/GRAPH, tambin puede crear
grficos usando Analyst Application
1. En SAS, click Solutions< Analysis< Analyst.
2. Cuando Analyst se abra, click File< Open by SAS Name para agregar los
datos al proyecto.
3. Luego haga clic en Graphs y escoja el tipo de grfico que quiere crear
Usted puede ver y salvar el cdigo PROC GPLOT que Analyst genera
2.3.15.
Estos tipos de graficos muestran valores de una variable estadstica asociada con
sus valores. La variable graficada puede ser numerada o caracterizada.
29
Usted debe tener la licencia de SAS/GRAPH para crear grficos usando PROC
GCHART.
Mtodo de Click-and-Point
Si usted tiene licenciado SAS/GRAPH, usted puede crear grficos de presentacin con
calidad usando una interfaz point-and-click.
1. En SAS, click Solutions< Reporting< Graph-N-Go.
2. Click en el cono New SAS Data Set o en New MDDB y seleccione los datos
para el grfico.
3. Haga clic en el cono del grfico que desee y colquelo en el rea de trabajo.
Luego haga clic en el objeto del grfico, seleccione los datos y especifique las
variables y las opciones del grfico..
Usted puede ver y salvar el cdigo PROC GCHART que genera Graph-N-Gos.
30
2.3.16.
Considere una variable respuesta Y que puede ser predicha por una funcin polinomial
de una variable regresiva X. Usted puede estimarB0, el intercepto B1, la pendiente
debida a X y X2, la pendiente debida a X2 en:
31
32
33
34
35
2.3.17.
ARIMA
Introduccin
ARIMA es referenciado normalmente como modelos BOX and Jenkins
La declaracin ARIMA provee un set de herramientas para la identificacin de modelos
de series de tiempo univariadas, estimacin de variables, pronsticos, por ultimo ofrece
una gran flexibilidad en los tipos de modelos ARIMA y ARIMAX que pueden ser
analizados.
El diseo de PROC ARIMA sigue muy de cerca la estrategia de Box-Jenkins para el
modelamiento de series de tiempo con caractersticas para la identificacin, estimacin
y chequeo de diagnsticos, y pasos de pronosticacin del mtodo Box-Jenkins
36
37
Estadstica Descriptiva
La declaracin IDENTIFY primero imprime estadsticas descriptivas para las series
SALES. Esta parte de la declaracin IDENTIFY muestra lo siguiente:
The ARIMA Procedure
Name of Variable = sales
Mean of Working Series 137.3662
Standard Deviation 17.36385
Number of Observations 100
38
inversa
de
correlacin:
Para examinar estos grficos, usted puede determinar si las series son estacionarias o
no estacionarias. En este caso una inspeccin visual del grfico de la funcin de autocorrelacin indica que las series SALES no es estacionaria, desde que ACF decae muy
despacio. Para un test ms formal, use la opcin STATIONARITY= (pgina 207).
39
40
41
42
43
Datos Panel
44
45
46
47
48
49
50
Donde son los efectos transversales puros y son los efectos de tiempo. El modelo
actual especulado no es lineal en las variables originales. Se podra ver como la
siguiente forma:
51
data airline;
input Obs I T C Q PF LF;
label obs = "Observation number";
label I = "Firm Number (CSID)";
label T = "Time period (TSID)";
label Q = "Output in revenue passenger miles (index)";
label C = "Total cost, in thousands";
label PF = "Fuel price";
label LF = "Load Factor (utilization index)";
datalines;
1 1 1 1140640
.952757 106650
.534487
2 1 2 1215690
.986757 110307
.532328
3 1 3 1309570
1.091980 110574
.547736
4 1 4 1511530
1.175780 121974
.540846
5 1 5 1676730
1.160170 196606
.591167
6 1 6 1823740
1.173760 265609
.575417
7 1 7 2022890
1.290510 263451
.594495
8 1 8 2314760
1.390670 316411
.597409
9 1 9 2639160
1.612730 384110
.638522
10 1 10 3247620
1.825440 569251
.676287
11 1 11 3787750
1.546040 871636
.605735
12 1 12 3867750
1.527900 997239
.614360
13 1 13 3996020
1.660200 938002
.633366
14 1 14 4282880
1.822310 859572
.650117
15 1 15 4748320
1.936460 823411
.625603
16 2 1
569292
.520635 103795
.490851
17 2 2
640614
.534627 111477
.473449
18 2 3
777655
.655192 118664
.503013
19 2 4
999294
.791575 114797
.512501
20 2 5 1203970
.842945 215322
.566782
21 2 6 1358100
.852892 281704
.558133
22 2 7 1501350
.922843 304818
.558799
23 2 8 1709270
1.000000 348609
.572070
24 2 9 2025400
1.198450 374579
.624763
25 2 10 2548370
1.340670 544109
.628706
26 2 11 3137740
1.326240 853356
.589150
27 2 12 3557700
1.248520 1003200
.532612
28 2 13 3717740
1.254320 941977
.526652
29 2 14 3962370
1.371770 856533
.540163
30 2 15 4209390
1.389740 821361
.528775
31 3 1
286298
.262424 118788
.524334
32 3 2
309290
.266433 123798
.537185
33 3 3
342056
.306043 122882
.582119
34 3 4
374595
.325586 131274
.579489
35 3 5
450037
.345706 222037
.606592
36 3 6
510412
.367517 278721
.607270
37 3 7
575347
.409937 306564
.582425
38 3 8
669331
.448023 356073
.573972
39 3 9
783799
.539595 378311
.654256
52
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
913883
1041520
1125800
1096070
1198930
1170470
145167
170192
247506
309391
354338
373941
420915
474017
532590
676771
880438
1052020
1193680
1303390
1436970
91361
95428
98187
115967
138382
156228
183169
210212
274024
356915
432344
524294
530924
581447
610257
68978
74904
83829
98148
118449
133161
145062
170711
199775
276797
381478
506969
633388
804388
1009500
.539382 555267
.467967 850322
.450544 1015610
.468793 954508
.494397 886999
.493317 844079
.086393 114987
.096740 120501
.141500 121908
.169715 127220
.173805 209405
.164272 263148
.170906 316724
.177840 363598
.192248 389436
.242469 547376
.256505 850418
.249657 1011170
.273923 951934
.371131 881323
.421411 831374
.051028 118222
.052646 116223
.056348 115853
.066953 129372
.070308 243266
.073961 277930
.084946 317273
.095474 358794
.119814 397667
.150046 566672
.144014 848393
.169300 1005740
.172761 958231
.186670 872924
.213279 844622
.037682 117112
.039784 119420
.044331 116087
.050245 122997
.055046 194309
.052462 307923
.056977 323595
.061490 363081
.069027 386422
.092749 564867
.112640 874818
.154154 1013170
.186461 930477
.246847 851676
.304013 819476
53
.631055
.569240
.589682
.587953
.565388
.577078
.432066
.439669
.488932
.484181
.529925
.532723
.549067
.557140
.611377
.645319
.611734
.580884
.572047
.594570
.585525
.442875
.462473
.519118
.529331
.557797
.556181
.569327
.583465
.631818
.604723
.587921
.616159
.605868
.594688
.635545
.448539
.475889
.500562
.500344
.528897
.495361
.510342
.518296
.546723
.554276
.517766
.580049
.556024
.537791
.525775
54
55
56
Panel 2 de diagnstico
57
58
EJEMPLO 3.
Usando la misma base de datos que el ejemplo anterior, se puede adems investigar el
efecto real de los precios de combustible. Se puede especificar las siguientes
declaraciones en PROC PANEL para correr este modelo:
proc panel data=airline;
id i t;
model lC = lQ lPF LF / fixone;
run;
Estas declaraciones dan como resultado la siguiente salida. El ajuste parece tener un
deterioramiento preocupante. El SSE aumenta desde 0.1768 a 0.2926
59
Los parmetros cambian de una manera algo drstica como se muestra en la siguiente
salida. Los efectos de los costos del combustible se vuelven muy fuertes y significantes.
El Coeficiente del factor de carga crece, aunque no es drstico. Esto siguiere que el
efecto de tiempo ajustado puede ser dominado por la crisis de petrleo y la
desregulacin.
Parmetros Estimados.
60
61
En el modelo de efectos Random, Los trminos constantes individuales son vistos como
distribuidos al azar en todas las unidades de corte transversal y no como cambios
paramtricos de la funcin de regresin, como en los modelos de efectos mixtos. Esta es
apropiada cuando las unidades de secciones transversales de la muestra son estiradas
por una poblacin grande. Claramente, en este ejemplo, seis Aerolneas son una
muestra de todas las aerolneas en la industria y no una exhaustiva lista.
Hay 4 maneras de calcular los componentes de varianza en el modelo de efectos random
de one-way. El mtodo de Fuller y Battese (1974), usa un mtodo de constantes
ajustadaspara estimar los componentes. El mtodo de Wansbeek y Kapteyn (1989)
62
63
64
2.3.19.
65
Como se puede ver la interfaz est divida en dos partes: EL grfico los Elementos.
Existe una parte adicional que se llama Cdigo que genera el grfico, sin embargo esta
no es tan importante como las dems. A continuacin se muestra un ejemplo de un
grfico con su cdigo.
66
Editar: Al igual que fichero, esta pestaa contiene las funciones bsicas de edicin de
cualquier software: Deshacer, Rehacer, Seleccionar todo
67
Ver: permite las opciones de ver o no la galera de grficos, los elementos y el cdigo
Insertar: Permite insertar en un grfico un ttulo, una nota a pie, una leyenda. Adems
de insertar filas y columnas
Formato: En esta pestaa se permite editar cualquier propiedad de cada elemento del
grfico. Tambin se permite cambiar el estilo del grfico
68
Por ltimo se indicaran en el orden que aparecen en la barra de los botones del
diseador de grficos ODS:
69
Abrir
Guardar
Guardar como
Imprimir
Vista preliminar
Deshacer y Rehacer
Copiar en portapapeles: copia lo seleccionado del programa al
portapapeles de Windows
Ttulo: inserta un ttulo nuevo al grfico
Nota a pie: Inserta una nota al pie del grfico
Leyenda global: inserta una leyenda global:
70
2.4. Clases
A continuacin se muestran los documentos escritos relacionados con cada clase preparada
para el curso libre de SAS.
Se explican adems los requerimientos para el uso del software en Linux y Windows
Se fomenta el uso del software libre como poltica de la UIFCE
71
72
Ejemplo: Suponga usted que desea comenzar a trabajar con una base de datos
de 10 observaciones que contempla el sexo de la persona, el ingreso que recibe
mensualmente en miles de pesos, la edad, y el estrato.
Programacin:
/*INSERCION DE VARIABLES*/
DATA variables;
/*NOMBRE DE LA NUEVA BASE DE DATOS SAS*/
INPUT sexo $ ingreso edad estrato;
/*VARIABLES*/
CARDS;
/*COMANDO PARA INSERTAR DATOS*/
H
1500
20 3
H
3000
40 4
M
2000
30 4
H
800
25 2
M
500
18 3
H
9000
45 6
M
4000
30 3
M
5000
32 4
H
700
18 3
H
1000
23 3
;
RUN;
/*CORRER PROCEDIMIENTO*/
En cuanto a la programacin se hace la claridad que los comentarios estn en rojo y
separados por /* () */ como se haba explicado en la clase anterior, y que el comando
INPUT es el que nos permite insertar el nombre de las variables y en ese orden
debemos insertar los datos. As, la primera columna pertenece a sexo, la segunda a
ingreso, etc.
Tambin se aclara que el smbolo $ define cuando una variable es cualitativa (en este
caso es sexo).
4Hacer
73
El segundo ejemplo consiste en aadir un archivo externo, para ello SAS admite:
-
El conferencista apoyado por las diapositivas del repositorio (si as lo desea) sigue el
procedimiento ah descrito y crea una nueva librera con un archivo (en el manual de
SAS y el ejemplo de Power Point se usa un archivo llamado Libro2 ubicado en el
repositorio).
Estadstica descriptiva
Ahora se enfoca la clase en dos procedimientos que generan estadstica descriptiva
MEAN y FREQ:
Programacin:
74
75
76
Lgica condicional
Es importante resaltar que los procedimientos sobre los que se programa la lgica
condicional en SAS, son los mismos usados cuando comnmente se impone una
condicin (si esto ocurre y adems esto ocurre entonces pasar esto) es importante
inculcar en los estudiantes que SAS aunque tenga lenguaje de programacin, no es ms
que un software con un mtodo de redaccin.
Condicionales:
77
Luego de ello se pasa al ejemplo, es importante aclarar que ste ser el ltimo ejercicio
realizado con importacin directa de datos pues los prximos ejercicios deben contener una base
de datos amplia, si el conferencista lo desea en la evaluacin de los estudiantes puede incluir
ms ejercicios de importacin directa de datos.
Ejemplo:
Suponga usted que cuenta con una base de datos de 10 observaciones que contempla
una nmina de trabajadores del Aeropuerto Internacional ElDorado. La base contiene
la identificacin del trabajador, el sexo, el cargo, el nombre, el salario (en miles de
pesos) y la fecha de nacimiento.
Sin embargo se desea clasificar los trabajadores segn el cargo en grupos, as que segn
el cdigo del cargo que maneja el Aeropuerto, los trabajadores pueden clasificarse en
Mecnicos, Pilotos, Tcnicos de aviacin, Tecnlogos de aviacin y Contadores.
Ahora haciendo uso de SAS se crearn estos grupos.
Programacin6:
data nomina;
input Identificacion $ 1-4 Sexo $ 6 Cargo $ 8-10 Nombre $ 12-20 Salario 22-26
7
@28 Cumple date7. ;
if cargo='ME2'then
Grupo='Mecanicos';
elseif cargo='PT1'then
Grupo='Pilotos';
elseif cargo='TA1'then
Grupo='Tecnicos de aviacin';
elseif cargo='TA3'then
Grupo='Tecnlogos de aviacin';
elseif cargo='CON'then
Grupo='Contadores';
format cumple mmddyy8.;
CARDS;
1009 F TA1 AndreaVar 01000 12JUL59
1017 F TA3 DanielaMu 00800 23JAN57
1036 F TA3 Alejandra 05000 27MAY65
1037 M TA1 Jhonathan 07000 27AUG64
1038 M TA1 DavidAndr 08000 28DEC69
1050 M ME2 RicardoCa 01000 20FEB63
Debe mencionar que todas las condiciones deben importarse antes de importar los datos para
as los resultados sean efectivos.
7 Si resultan dudas respecto a estos formatos anuncie que durante la clase se solucionar la
duda, ya que este formato corresponde a la seccin fecha/hora SAS.
6
78
F
M
M
F
ME2
PT1
PT1
CON
CamilaFra
CarlosDa
OrlandoNu
JohannaGa
04000
15000
00900
01300
29JAN44
14OCT55
02APR70
05MAR60
Identificacion $ 1-4 por ejemplo, tiene despus del signo $ (que identifica a la variable
como una caracterstica) la indicacin 1-4, esto se puede interpretar como una especie
de organizacin de la tabla que se pretende introducir con los datos, la primera variable
es Identificacin que es un nmero de 4 dgitos para cada trabajador, es decir cada
carcter ocupa desde la columna 1 hasta la columna 4 de la tabla que formaremos con
los datos. Asimismo, por ejemplo, Sexo $ 6 ocupa solo la columna 6 de la futura tabla (el
5 no se cuenta porque es el espacio que divide la tabla).8
Algunos nombres tienen caracteres adicionales, y ahora hay ceros a la izquierda de los
salarios. Esto tiene que ver con el tem anterior para la organizacin de los datos, como
todos los espacios que se establezcan deben ser ocupados, para que los salarios se ajusten se
colocan uno o dos ceros a la izquierda, y los nombres simplemente se complementan con los
caracteres del apellido, hasta que se ajusten al nombre ms largo de la base de datos (en este caso
Alejandra o Jhonathan que tienen 8 caracteres)
@28 Cumple date7. es un comando de indicacin nuevo, el @ indica que es la ltima variable de la
base de datos y el 28 indica la columna en la que inician, Cumple es el nombre de la variable (no se
puede poner cumpleaos ya que la letra no es leda por SAS) y date7. es el formato que se desea
para la fecha, ste comando debe ser completado con el comandoformat cumple mmddyy8. al final de
las indicaciones de los condicionales, de lo contrario la fecha no ser leda.
Se muestra entonces la confirmacin de la ventana LOG que muestra que los datos han sido subidos
correctamente:
79
Contina el ejemplo:
el Aeropuerto desea analizar si sus trabajadores ganan un sueldo Alto, Medio o Bajo, para ello
establecen unos rangos de salario: Si el empleado gana igual o ms de 6000.000 de pesos mensuales
entonces tiene un salario alto, si gana entre 1500.000 pesos y 5999.999 pesos entonces tiene un
salario Medio y si gana menos o igual de 1.499.999 pesos, entonces el empleado tiene un salario
Bajo usando los condicionales para las variables numricas programamos adicionalmente:
Programacin:
data salarios;
set nomina (drop=Identificacion Sexo Cargo Cumple);
if salario>=06000then
Categoria="Alto";
elseif salario<=05999&salario>=01500then
Categoria="Medio";
elseif salario<=01499then
Categoria="Bajo";
run;
Nuevamente se explican los elementos nuevos:
DROP: Es un comando usado para suprimir filas de una nueva base de datos a partir de una base de
datos anterior. En este caso deseamos quitar las filas identificacin, sexo, cargo y cumple para
as crear una nueva database llamada salarios a partir de la base de datos nomina.
SET: Comando usado para crear una nueva base de datos a partir de otra ya existente, el comando set
recoge la base de datos ya creada.
Y se muestran la confirmacin de la ventana LOG y los resultados, sta vez buscando en WORK.salarios:
80
2.4.3.2.
Subconjuntos de datos
Esta seccin se inicia explicando un poco ms el uso de subconjuntos de datos, sobre todo cuando se
desea trabajar con solo una parte de una gran base de datos. Recuerde adems que los subconjuntos
de datos se crearn con base en lo anteriormente explicado de lgica condicional as que es prioritario
que los estudiantes hayan entendido bien la primera parte.
Ejemplo:
Suponga usted que tiene una lista de pases con su respectivo PIB y tasa de inters, sin
embargo como usted desea solo realizar un modelo con pases que tengan una tasa de inters
y un PIB por encima de la tasa de inters de Colombia para el primer trimestre del 2013
(3,75%) y el PIB del ao 2011 (333.371937.902,966), entonces desea separar estos datos de
la lista completa.
Siguiendo el procedimiento de la importacion de datos tenemos en WORK.interes:
81
Contina el ejemplo:
Suponga ahora que no desea ser tan estricto y solo quiere separar de la lista los pases con una
tasa de inters estrictamente mayor a Colombia (3,75%), adems, ya no le interesa observar el
cdigo del pas.
82
Luego de esto es importante otorgarle una interpretacin econmica al ejercicio, ya que el objetivo del
curso es encaminar el uso de SAS a las ciencias econmicas. Este es un ejemplo de un rpido anlisis
econmico dispuesto en el Manual de SAS:
por ejemplo la ausencia de los pases europeos y de Estados Unidos debido a la crisis
financiera de 2008, pues los pases que se muestran son de Amrica Latina y frica, tambin
se puede observar la notoria diferencia del PIB de Brasil respecto a los otros pases,
posicionando a ste pas como uno de los pases emergentes del siglo XXI.
2.4.3.3.
Fechar los documentos que se trabajen con SAS puede llegar a ser sumamente importante en toda
base de datos. Recuerde mencionar en primera medida que SAS inicia su fecha y hora en enero 1 de
1960 a las 00:00:00 a.m. lo cual numricamente corresponde al nmero cero; esto no quiere decir que
no se puedan programar fechas anteriores, si desea hacerlo solo debe insertar nmeros negativos. Esto
se puede explicar ms profundamente mencionando los tres tipos de procedimientos con datos de
fecha:
2.4.3.4.
83
2.4.3.5.
2.4.3.6.
Se mencionan adems las herramientas que tiene SAS en sus formatos de fecha y hora. Formatos
como mmddyy8. date9. y otros que se han presentado a menudo en las programaciones anteriores,
sirven para mostrar la fecha como se desee, si se muestran ciertos dgitos del ao, en que orden se
muestra la fecha, etctera.
Informats lee un valor, tal como un reloj de tiempo o un calendario, el cual puede ser de
varias longitudes, y luego convierte los datos o un valor data, time datetime.
Formats presenta un valor reconocido por SAS, tal como un valor time o date, como un dato
del calendario o un tiempo de reloj de varias longitudes.
Functions realize operaciones sobre valores date, time, y datetime de SAS.
Suponga primero que usted quiere probar los formatos de fecha en SAS y elige una serie de
nmeros aleatorios para distintos formatos de SAS, as que programa lo siguiente en la
ventana Editor:
Programacin:
84
Date1
Time2
Date1Month
01JAN60:22:13:29
20JUL96
12:25:00 AM
Suponemos que tenemos una serie de pases que de acuerdo a la fecha en que enviaron unos
documentos, se les enviar la respuesta. Tenemos entonces en la base de datos, el cdigo del
pas, la fecha del envo y la que sera la fecha de respuesta (que por polticas de la
organizacin ser 30 das despus de la fecha del envo del correo.
Programacin:
/*************************************/
/* Opciones de reporte
*/
/*************************************/
85
fecha
24NOV2010
28DEC2011
03DEC2012
04OCT2012
respuesta
24DEC2010
27JAN2012
02JAN2013
03NOV2012
86
Ejemplo
Suponga usted que desea crear un modelo de regresin simple en el cual que explica el
Producto Interno Bruto (PIB) de Colombia a travs del cambio en su Gasto Pblico en
el perodo de 1970-2009. Ante el aumento de una unidad en el Gasto Pblico como
cambian las unidades del PIB?
Luego de importar los datos 10 por medio de importacin externa, se incluye la
programacin solicitada:
PROC PRINT DATA=regresion;
TITLE1 ' RECTA DE REGRESION ENTRE LAS VARIABLES:';
TITLE2 ' PIB y GASTO PUBLICO;
RUN;
PROC REG DATA=regresion;
MODEL PIB=Gasto;
RUN;
Los resultados arrojados por la ventana output son:
87
88
El modelo nos indica entonces que ante un cambio de una unidad en el Gasto Pblico
de la nacin, habr un aumento de 6,21409 unidades en el PIB , interpretaciones de
este tipo sugieren que aumentar el gasto pblico a largo plazo implica una mayor
acumulacin de riqueza para la nacin lo cual es bastante positivo.
Hay que resaltar tambin que si se ha puesto desde el principio una relacin positiva
del gasto pblico con el PIB en el modelo, es porque para plantear un modelo es
necesario tener un soporte terico. En el caso del ejemplo, la ecuacin keynesiana del
ingreso a nivel macroeconmico es un soporte para plantear una forma funcional para
el modelo en el que el aumento del gasto pblico evidentemente aumentar el PIB.
89
Ejemplo:
Suponga usted que desea predecir el comportamiento del PIB de Brasil por medio del
consumo, las exportaciones, la Inversin Extranjera Directa (IED) neta, importaciones
e impuestos de bienes y servicios. Los datos se han tomado con periodicidad anual de
1975 al 2011.
Primero, establecemos la estructura del modelo y se explica que dado que el gasto y el
PIB estn expresados en pesos, es decir unidades monetarias, por eso los cambios que
los parmetros reflejarn sern interpretados en pesos tambin.
90
91
12
Es bueno que el conferencista aclare que estos grficos sirven para el anlisis visual. Por
ejemplo que los residuales por variable nos permiten observar sobre qu valores oscila ms una
variable.
12
92
El F-value con un p-value menor a 0.0001 nos permite afirmar que las variables
exgenas en su conjunto logran explicar el comportamiento de la variable endgena,
adems el R-cuadrado es bastante alto, por lo que podramos decir que es un buen
modelo.
93
94
Dado que al retirar las importaciones del modelo, ste no sigui respondiendo como
nosotros deseamos, retiraremos esta vez los impuestos que era la otra variable no
significativa, sin antes incorporar de nuevo Mpor, ya que puede que solo sean los
impuestos los causantes del problema:
model PIB = Consumo XporIEDMpor;
run;
Los resultados que arroja el procedimiento son:
95
El F-value con un p-value menor a 0.0001 nos permite afirmar que las variables
exgenas en su conjunto logran explicar el comportamiento de la variable endgena,
adems el R-cuadrado es bastante alto, por lo que podramos decir que es un buen
modelo.
En cuanto a la estimacin por parmetros SAS nos muestra que las importaciones y las
exportaciones no son significativas para el modelo. Grficamente de nuevo se muestra
el comportamiento de los residuales que esta vez son ms cercanos a la media, segn el
grfico de distribucin.
96
97
Ya que al eliminar las variables por separado no se lleg a ninguna solucin del modelo,
se retirarn las importaciones y los impuestos, acto seguido se correr la regresin
nuevamente:
model PIB = Consumo XporIED;
run;
Los resultados que arroja el programa son:
98
Luego de eliminar las dos variables, encontramos que la significancia individual de los
parmetros ha sido corregida, aunque el intercepto tiene un p-value de 0,0496 no
seremos tan estrictos y aceptaremos este parmetro.
Econmicamente esto implica que:
99
100
Adems de los estadsticos que ya hemos visto con anterioridad, aparecen otros nuevo que sirven para
la comparacin de modelos, pero dado que en esta clase se trabaja con un solo modelo, no se usarn.
Estos estadsticos tienen el mismo criterio. S al comparar el estadstico que se arroja en un modelo
con el que se arroja en otro existe una diferencia menor a uno, no hay gran diferencia entre los
modelos, caso contrario hay que evaluar cual de los dos modelos es el mejor. Los estadsticos son:
Por otro lado, las siglas MAE y MAPE corresponden a media absoluta de los errores y porcentaje
de la media absoluta de los errores que son dos criterios que igualmente nos permiten evaluar que
tanto los errores se alejan de la media, es decir, tienen una mayor varianza.
Puede notar que aqu aparece ya el coeficiente del estadstico Durbin Watson, sin embargo se ejecut
el comando de dicha prueba en la programacin para tener informacin ms detallada al respecto.
101
Aparecen nuevos grficos tambin, por ejemplo los grficos ACF y PACF que corresponden a los
grficos de correlacin simple y parcial de los rdenes MA y AR respectivamente, estos grficon
surgen en el caso que estemos trabajando con series de tiempo, tema que se ver ms adelante; pero
como no es el caso no sern tomados en cuenta.
102
103
Se puede observar que la poblacin a lo largo del tiempo ha aumentado de forma lineal
del 2001 al 2008 y no hay mayor variacin.
Despus de esto se inserta la programacin correspondiente para calcular el modelo
ARIMA de la serie:
proc arima data=pob ;
identify var=poblacion nlag=24;
run;
Se obtendr la siguiente informacin:
104
105
106
107
108
109
Sin embargo puede notarse que los residuos siguen una distribucin normal y los
residuales oscilan alrededor de la media.
110
En cambio AR muestra bajas correlaciones al aplicar estos rezagos, lo cual quiere decir
que se est solucionando el problema.
111
112
En cuanto a los residuales, se observa que estos tienden ms a la media igual a cero, sin
embargo se desvan ms de la media de los datos.
En cuanto al procedimiento FORECAST que se observa en la programacin que se
insert, encontramos que se encarga de realizar el pronstico de los datos hasta 112
pasos adelante (es decir, ms de 11 aos de pronstico para la periodicidad que se est
manejando. Primero se visualiza la tabla de datos del pronstico.
El grfico del pronstico en cambio muestra grandes intervalos de confianza lo que
muestra que el modelo no es confiable para la prediccin, ste es un grave error ya que
el principal objetivo de una serie de tiempo es la prediccin:
113
114
Observe que las correlaciones han bajado un poco, aunque se siguen manteniendo altas,
en comparacin, por ejemplo, con las correlaciones que muestra la parte autorregresiva
del modelo.
115
Como se puede ver, grficos nos sugieren por ejemplo agregar el orden 2 a MA, cuando
ste ya est agregado, as que este tipo de avisos del modelo no son tenidos en cuenta.
116
Vease que el grado de autocorrelacin ha disminudo en una gran cantidad frente a los
rezagos.
117
En cuanto a los residuales, observe que siguen una distribucin normal y que el 75% de
los datos oscila alrededor de la media.
118
Definicin:
Los Datos Panel son un mtodo de estimacin economtrica que recopilan las series de
tiempo con una combinacin de datos de corte transversal, es decir, permite analizar el
comportamiento de diferentes variables exgenas en diferentes perodos de tiempo.
Ejemplo
Se tienen datos de diferentes indicadores para los aos 1990-1997 en periodicidad
anual. Los datos son: PIB per cpita en pesos colombianos, nmero de habitantes en
millones, porcentaje de inflacin e ndice de alfabetizacin (ndice que va de cero a uno,
donde cero es poblacin analfabeta y uno poblacin completamente alfabetizada). El
estudio se realiz para los siguientes pases: Colombia, Brasil, Ecuador, Venezuela,
Argentina, Bolivia, Per, Uruguay, Paraguay y Chile. Se desea simplemente realizar
una visin conjunta de estos indicadores en estos pases de Latinoamrica para as
mismo observar factores comunes a lo largo del tiempo, teniendo en cuenta que se
supone que el PIB pr capita es explicado por el nmero de habitantes, la inflacin y el
ndice de alfabetizacin.13
Programacin
Proc panel data=datos;
Id c y;
Model PIBper= NumHab Infl Alfab / fixonefixtworanonerantwo pooled;
Run;
Estos datos, a diferencia de las dems clases, son datos aleatorios creados por los
desarrolladores de sta investigacin, y no corresponden a los datos reales de los pases.
13
119
120
121
122
Teniendo en cuenta las descripciones de los cuadros anteriores se observa que el R cuadrado es
apenas de 5,26%, lo cual nos dice que las variables no logran explicar el comportamiento de la
variable endgena.
Aparecen dos cuadros adicionales para el mtodo de efectos aleatorios, uno que nos indica la
varianza de las variables cruzadas, temporales (es decir las dummys que representan cada pas
y cada ao) y la varianza de los errores de estas variables; y otro que nos arroja el Test de
Hausman. Contrastado con una prueba , el Test de Hausman arroja un nivel de significancia
de 0.0138 lo cual rechaza la hiptesis nula, es decir, existe correlacin entre los efectos
aleatorios y las variables regresoras, luego no es recomendable hacer uso del mtodo de
efectos aleatorios para estimar el modelo.
En cuanto a la significancia individual de los parmetros ahora todas las variables resultan
insignificantes, a un nivel de significancia del 10% el nmero de habitantes resultara
significativo.
123
En cuanto a los grficos de la variable endgena encontramos que los valores predichos
rondan el valor real de la variable y esta vez s se not el punto de quiebre en 1994.
124
125
En los grficos se observa nuevamente una gran variabilidad de los errores, esta vez un
poco menos que en el mtodo de estimacin aleatoria con dos diferencias.
En cuanto a los grficos de la variable endgena se observa que se logr captar el punto
de quiebre de 1994 y el aumento a partir de 1996.
126
En ste mtodo observamos por ejemplo que el R cuadrado nos indica que las variables
exgenas logran explicar en un 93% el comportamiento de la variable endgena, esto se
complementa con el resultado de la prueba F que nos indica que el modelo es
globalmente significativo. Sin embargo en la estimacin de parmetros individual
encontramos que si bien casi todas las dummys que corresponden a las series cruzadas
y temporales son significativas, nuevamente los parmetros del modelo no lo son, en
este caso solo el intercepto es significativo.
127
128
Mtodo Pooled:
El mtodo Pooled nos muestra una desviacin de la media menos a los anteriores
mtodos utilizados, un R cuadrado de 0.42 que implica que las variables endgenas
explican en un 42% el comportamiento de la variable exgena. En cuanto a la
estimacin individual de los parmetros encontramos que sta vez es solo el intercepto
la variable poco significativa en el modelo.
129
La grfica nos permite observar que los errores tienen una gran variabilidad y aunque
siguen una distribucin normal, superan los lineamientos de la misma.
130
Sin el intercepto observamos entonces que segn el R cuadrado las variables exgenas
explican en un 87% el comportamiento de la endgena y se corrobora con la
significancia de la prueba F. Sin embargo esta vez las dummys que los efectos fijos
agregan para las series cruzadas y las series temporales no resultan significativas en
su mayora, as mismo solo el ndice de alfabetizacin resulta significativo en este caso.
131
En cuanto a los grficos de los errores, se muestra una distribucin normal de los
errores que rondan alrededor de la media.
En cuanto a los grficos del PIB per cpita si bien se acerca ms el crecimiento predicho
al real, no se muestra el punto de quiebre de 1994.
132
Al usar el mtodo de efectos fijos, observamos que segn el R cuadrado las variables
exgenas explican en un 53,86% el comportamiento de la variable endgena, el Test de
Hausman, a un nivel de significancia del 5% nos arroja un p-valor de 0.30 con lo que
podemos asumir que elegir entre efectos fijos y aleatorios no representa una mayor
diferencia. En cuanto a la significancia individual de los parmetros encontramos que
aunque ahora son un poco ms significativos no se encuentran dentro del nivel de
aceptacin, salvo nuevamente por el ndice de alfabetizacin.
133
Respecto a los grficos de los errores, observamos que los errores tienen una gran
variabilidad respecto a la observacin de la variable, y aunque sobrepasan un poco los
lmites de la distribucin, sta es normal.
134
Al realizar el mtodo de efectos fijos con dos diferencias se tiene que el modelo explica
en un 93% el comportamiento de la variable endgena, adicional a ello para
corroborarlo se observa con la prueba F que el modelo es globalmente significativo. En
cuanto a la estimacin de parmetros individual observamos que todas las series
cruzadas y casi todas las series temporales son significativas, aun as las variables no
resultan ser significativas.
135
Observando los grficos de los errores se tiene que estos no se desvan mucho de lo
observado con el PIB per cpita y aunque sobrepasan un poco los lmites de la
distribucin que siguen, estos se comportan de forma normal.
136
Bajo este mtodo, se observa que las variables endgenas del modelo logran explicar en
un 40% el comportamiento de la variable endgena segn el R cuadrado, adems de ello
el Test de Hausman arroja un p-valor de 0,03 al 5% de significancia con lo que no se
rechaza la hiptesis nula y se tiene que estimar el modelo por efectos fijos o por efectos
aleatorios de dos diferencias no afecta mucho la estimacin como tal. En la significancia
individual se observa que el ndice de alfabetizacin es la nica variable significativa,
ya que el nmero de habitantes apenas alcanza un nivel de aceptacin.
137
Respecto a los grficos del PIB per cpita s se observa que los residuales siguen el
comportamiento de la variable, aunque no se logr percatar completamente el punto de
quiebre que hay en el modelo.
138
139
En cuanto a los grficos que le corresponden al PIB per cpita, se observa que los
residuales logran seguir el mismo patrn que los datos observados, en el valor predicho
de la variable se tiene que se reconoce el punto del 94, pero no se reconoce el
crecimiento que en realidad presentan los pases.
A modo de conclusin, el mejor mtodo para estimar este modelo es el mtodo Pooled
sin intercepto, pues el modelo logr reunir todas las caractersticas para estimar datos
panel como la base de datos del ejemplo, aunque segn lo visto en la ltima grfica, el
modelo no es muy adecuado para la prediccin; sin embargo, si se fuera un poco ms
flexible con el nivel de aceptacin, al 10% de significancia puede escogerse adems de
los Datos Pooled, el mtodo de efectos aleatorios en dos diferencias.
140
En el panel izquierdo del programa, se busca la librera WORK y el nombre de los datos
que en este caso es grafico1, haciendo doble clic sobre l se desplegar una ventana
aparte que permitir observar los datos del archivo de Excel, es recomendable hacer
esto para saber qu tipo de grfico usar.
Luego de ver los datos, se hace clic en Herramientas y vamos a ODS Graphics
Designer:
141
Luego de ello aparece la ventana que permite asignar los datos y las variables para
graficar:
142
Se selecciona la librera de los datos (en este caso WORK), el conjunto de datos a
utilizar (GRAFICO1) y las variables a utilizar, en este caso como los ttulos de cada
conjunto de datos son X y Y, las seleccionaremos as. Los dems parmetros ya estn
seleccionados por defecto para el propsito de este primer ejercicio sencillo, as que
finalmente se hace clic en Aceptar.
143
144
Si se desea cambiar el estilo del grfico, se hace clic en Formato > Estilo > Ms estilos...
Con esto aparecer la ventana que se observa en el grfico de abajo, existen diferentes
estilos personalizados, en este caso se elegir Science para este primer grfico.
Si se desea editar los estilos predeterminados del paquete, se hace clic en Herramientas
> Editor de Estilos, as al hacer clic sobre el grfico que se encuentra en la parte
derecha del editor se mostrarn las opciones para cada componente de los grficos:
145
Luego de hacer los ajustes que el conferencista desee en la clase, en este caso no se
realizaron cambios en los colores, as que el grfico finalmente queda:
Ejemplo 2:
Se tienen datos de una regresin mltiple, donde el empleo (Emp) busca ser
explicado por el PIB (GNP), el PIB per cpita (GNPdf), el ndice de desempleo
(Unemp), cantidad de fuerzas armadas disponibles (ArmFor) y Poblacin en
miles (Pop).
146
147
Luego de ello fcilmente puede arrastrarse del panel izquierdo el grfico que
necesitemos para comenzar a trabajar, en este caso se dividir el panel de grficos en 4
con los botones Aadir Fila y Aadir columna, sealados en el siguiente recuadro con
los crculos rojo y azul.
En el primer grfico, se us el grfico de barras y el grfico de series para contrastar el
Empleo contra el PIB per cpita, para combinar grficos simplemente se arrastra un
grfico sobre otro, o al hacer clic derecho se selecciona Aadir un elemento...,
asimismo para agregar un grfico sobre un recuadro que no tenga un cuadro previo se
puede usar sta opcin.
148
149
150
151
152
Como aparece tambin en esta imagen, al pasar el mouse sobre la lnea nos
encontraremos con que esta se resalta un poco y arroja el valor de los ejes en el punto
sobre el que est el mouse. Se observa que esto pasa con las dos lneas:
153
Al hacer clic derecho sobre uno de los grficos, seleccionamos Asignar datos para
modificar en cualquier momento nuestro grfico, se observa por ejemplo que para el
grfico de arriba que tiene aplicado el grfico de regresin 2 regression2 se retirarn
las bandas para poder apreciar mejor este grfico combinado.
154
3.
Conclusiones
155
14
PIB
Gasto
1970
1,3277E+11
1,2E+10
1971
1,5589E+11
1,7E+10
1972
1,8961E+11
1,8E+10
1973
2,4316E+11
2,3E+10
1974
3,2238E+11
2,8E+10
1975
4,0511E+11
3,6E+10
1976
5,3227E+11
4,4E+10
1977
7,1603E+11
5,5E+10
1978
9,0949E+11
7,8E+10
1979
1,1888E+12
1,11E+11
1980
1,5791E+12
1,59E+11
1981
1,9828E+12
2,07E+11
1982
2,4973E+12
2,73E+11
1983
3,0541E+12
3,35E+11
1984
3,8566E+12
4,26E+11
1985
4,9659E+12
5,31E+11
1986
6,788E+12
6,6581E+11
1987
8,8244E+12
7,68E+11
1988
1,1731E+13
1,013E+12
1989
1,5127E+13
1,396E+12
1990
2,0228E+13
1,9E+12
156
14
4.
1991
2,6107E+13
2,414E+12
1992
3,3515E+13
3,2E+12
1993
4,3898E+13
4,424E+12
1994
6,7533E+13
9,9379E+12
1995
8,4439E+13
1,2866E+13
1996
1,0071E+14
1,8596E+13
1997
1,2171E+14
2,4842E+13
1998
1,4048E+14
2,9271E+13
1999
1,5157E+14
3,4457E+13
2000
2,095E+14
3,5E+13
2001
2,2709E+14
3,7791E+13
2002
2,4635E+14
3,9701E+13
2003
2,7312E+14
4,305E+13
2004
3,0776E+14
4,8478E+13
2005
3,4016E+14
5,4427E+13
2006
3,839E+14
6,0145E+13
2007
4,3107E+14
6,6983E+13
2008
4,8104E+14
7,3459E+13
2009
5,0853E+14
8,0486E+13
Referencias
N/A.
(19
de
Febrero
de
2013).
Wikipedia,
enciclopedia
libre.
http://es.wikipedia.org/wiki/SAS_%28lenguaje_de_programaci%C3%B3n%29
Obtenido
de
N/A.
Obtenido
de
Official
Analysis
libre.
Software.
Obtenido
de
Official Page, S. (18 de Febrero de 2013). Statistical Analysis Software SAS. Obtenido de
http://support.sas.com/documentation/installcenter/92/sasinstall/9.2/unx/lnx/sreq.pdf
Official Page, S. (18 de Febrero de 2013). Statistical Analysis Software SAS. Obtenido de
http://www.sas.com/offices/latinamerica/mexico/technologies/analytics/forecasting/ets/index.html
Universidad Complutense de Madrid. (19 de Febrero de 2013). Servicios Informtico de Apoyo a Docencia e
Investigacin.
Obtenido
de
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/Categor/CursoSAS9.pdf
Universidad Nacional de Colombia, sede Medelln (28 de Febrero de 2013). Breve Manual de Induccin al
SAS,
uso
de
la
parte
interactiva
ANALYST.
Obtenido
de
http://www.unalmed.edu.co/~estadist/INDUCCION%20SAS.pdf
157
(3
de
Marzo
de
2013).
Obtenido
de
index.php?page=Desviaci%C3%B3n+est%C3%A1ndar+(tipo)
U.
C.
Vitutor.
(3
de
Marzo
de
2013).
Vitutor
http://www.vitutor.com/estadistica/descriptiva/a_3.html
de
http://www.eduteka.org/glosario/tiki-
Obtenido
estadstica.
de
Obtenido
158
http://e-
de