Escolar Documentos
Profissional Documentos
Cultura Documentos
NDICE
1. Introduccin..................................................................................................2
2. Caractersticas.............................................................................................2
3. Ventajas........................................................................................................3
4.
5. Entorno de trabajo........................................................................................4
5
5.1.
Subventanas.................................................................................................5
5.2.
Barra de opciones........................................................................................5
5.3.
7.2.
15
Stata 11
1. Introduccin
Stata es un potente y eficiente software de anlisis estadstico, el cual fue creado
por una corporacin llamada StatCorp en los aos 80s, pero su xito ha
sido tal que a pesar de haber hecho su primer acto de aparicin en 1985; este
software se ha mantenido vigente a las necesidades de un sin nmero de
instituciones acadmicas y negocios alrededor del mundo. Es sin lugar a dudas
que un alto estndar de calidad precede a esta utilsima herramienta, no es de
sorprenderse que este software se haya convertido en una necesidad de primer
nivel para muchos investigadores y estudiantes de diferentes rubros que hacen
uso de la estadstica, tales como: Economa, Sociologa, Biologa, Ciencia
Poltica, Epidemiologia, Biomedicina, entre otras ms.
Esta herramienta se ha convertido en una necesidad de primer nivel para el
estudio y anlisis estadstico en estos diferentes rubros, el cual ha hecho posible
que el trabajo de muchos investigadores alrededor del mundo se haya llevado a
cabo con xito y de forma ms breve.
15
analizar los datos de seccin cruzada. Sin embargo, en los ltimos aos ha
alcanzado notoriedad y potencialidad abarcando campos de la micro y macro
econometra.
Entre las potencialidades del stata se destaca la facilidad para manipular y
describir con grandes bases de datos, donde la principal restriccin es el tamao
de la memoria de la computadora. Posee diversas aplicaciones predefinidas:
paneles, logit, probit, etc. Asimismo, posee una excelente herramientas para
realizar grficos.
3. Ventajas
Es un paquete que cuenta con varias ventajas que podran resumirse en lo
siguiente:
Contiene muchas de las tcnicas estadsticas ms recientes.
Se actualiza frecuentemente.
Mtodos grficos muy poderosos.
Buena interfase con procesadores de texto e impresoras.
Requiere de poco espacio en el disco duro.
Requiere de poca memoria. Precio accesible.
Lenguaje de programacin amigable y sencillo.
Aunque Stata tambin tiene ciertas desventajas :
No puede leer directamente de manejadores de bases de datos, para esto
necesita de un programa de interfase: DBMSCOPY o Stattransfer
El DBMSCOPY y el Stattransfer son programas de traduccin de archivos, de
todo a todo, DBASE a Foxpro SPSS a STATA, de STATA a SAS, de SAS a Epi
Info, etc.
15
4. Presentaciones de STATA.
Las diferentes presentaciones de STATA se caracterizan segn el tipo de usuraio
y recursos del computador. Las versiones Stata/SE, Intercooled Stata y Small
Stata varan segn el tamao de la base de datos de anlisis:
5. Entorno de trabajo
REVIEW
COMMAND
VARIABLES
Resultados
5.1.
Subventanas
15
Review
Aqu aparecen los comandos que han sido utilizados durante la sesin. Solo los
resultados ms recientes son visibles en esta pantalla.
Command
Sirve para utilizar Stata de forma interactiva, es decir se emplea para crear las
lneas de comandos y llevar a cabo las aplicaciones disponibles en el software.
Variables
Nos informa sobre las variables que estn disponibles en nuestra base de datos
para realizar las diversas aplicaciones.
Results
Esta nos permite visualizar los resultados (outputs) de los estadsticos que
pedimos calcular o de los modelos que solicitamos estimar.
5.2.
Barra de opciones
15
Edit: Copiar/Guardar
Data: Permite un mayor control en las variables utilizadas, esto es: reconocer su
etiqueta, cambiar nombres, crear matrices de variables, etc. Graphics: Creacin
de grficos.
15
Statistics:
Opciones
para
anlisis
de
datos,
estadsticos
descriptivos,
15
5.3.
Descripcin
Sirve para abrir una base de datos de Stata.
Sirve para guardar en el disco la base de datos que est siendo usada.
Imprime los grficos o el contenido de la ventana de Stata Viewer
Empieza una nueva bitcora, abre una existente, cierra o suspende la que
se est usando.
15
Abrir una base de datos es igual a abrir cualquier archivo en Word, o Excel. Solo
se presiona en la carpetita sealada por la flecha y se busca en sus documentos
el archivo de la base de datos deseado.
*Las bases de datos sern proporcionadas en el Blog de la clase o enviadas a un
correo del Aula en formato SPSS, para pasarlo a archivo .dta que es el tipo de
archivo que reconoce el STATA se har uso del Stat-Transfer.
15
6.1.
Un Do-File es una opcin que el Stata nos presenta en el cual se permite guardar
toda la secuencia que se ha trabajado, es un registro de los comandos usados al
momento de modificar o analizar la base de datos.
Comando help
help if
help summarize
help regression
help tabulate
15
El sistema de ayuda para los comandos de Stata es una de las herramientas que
ms rpidamente puede familiarizar al usuario con el manejo de Stata.
Alternativamente al sistema de ventanas, el usuario puede digitar en el cuadro de
comandos help seguido del comando del cual desea informacin.
La ayuda de Stata ofrece informacin sobre:
-
15
7.2.
Comando findit ;
15
15
9. Tipos de archivos
Antes de iniciar una sesin de trabajo es importante tener en cuenta que Stata
opera a travs de diferentes tipos de archivos.
Tipo de Archivo
Archivos de datos
Archivos grficos
Bitcoras de salida
Archivos de comandos
Archivos de programacin
Extensin
*.dta
*.gph
*.smcl
*.do
*.ado
10. Funcionalidades
15
Imputacin multivariada
Panel de control para MI.Permite unificar las funcionalidades del comando MI y gua al usuario desde que
inicia hasta el trmino del anlisis, es decir desde la etapa de examinar los
valores faltantes hasta realiza estimaciones e inferencia sobre imputaciones
mltiples.
15
15
Describe
El comando describe nos proporciona informacin sobre la(s) variable(s)
especificadas, como el tipo de variable, el formato en el que est guardada, su
nombre y etiqueta. Es til para resumir un conjunto de variables de nuestra base
de datos.
Inspect
Inspect es un comando que produce mini-histogramas de las variables, til para
ver rpidamente su distribucin
Codebook
Codebook es un comando ms completo que describe aunque precisamente por
ese motivo, los resultados que genera son menos compactos. Produce abundante
informacin sobre la variable, los valores que toma, el rango, los casos perdidos,
etc.
List
list es un comando de inspeccin de casos, que nos muestra los valores de las
variables especificadas para los casos que escojamos. Si no especificamos que
variables queremos, por defecto nos mostrar los valores de todas las variables,
igual que para los casos. Si trabajamos con encuestas no es un comando muy til
porque no tenemos inters en los casos particulares pero si nuestra base de
datos fuese, por ejemplo, de pases o de municipios, entonces s nos interesara.
Lookfor
15
15
15
teclear el comando correspondiente, use, seguido del nombre del fichero, sin
necesidad de indicar su extensin.
use datos.dta ( use datos)
- Descargar el fichero y dejar libre la memoria: clear
Mediante la instruccin
use datos, clear
cargamos en memoria el fichero datos.dta, descargando previamente cualquier
fichero que estuviera en uso en ese momento.
- Grabar el fichero:
save datos.dta
Si el fichero ya existe y queremos reemplazarlo:
save datos.dta, replace
- Descripcin del contenido del fichero de datos cargado en memoria:
describe
Este comando proporciona informacin sobre el nmero de observaciones y el
nmero, nombre, tipo y formato de las variables del fichero de datos.
- Ordenacin de datos:
El comando para ordenar los datos es sort. As,
15
sort year
ordena los datos en orden ascendente segn los valores de la variable year.
sort year iden
Los ordena segn la variable year en primer lugar y despus segn la variable
iden.
Algunos comandos de Stata, como egen (lo veremos ms adelante) desordenan
los datos, de forma que es preciso asegurarse siempre de cmo los tenemos
ordenados y ordenarlos de la forma ms conveniente.
15. Creacin de variables
Comando generate
El comando para generar variables es generate, que puede abreviarse como gen
Ejemplos:
generate var4 =var1 +var2
generate var5 = var1 /var2 if dum==1
En la segunda de estas rdenes, Stata asignar un missing value,., a aquellas
observaciones que no cumplen la condicin sealada despus de if.
Tambin podemos generar una variable considerando cada valor de una variable
de referencia. Para ello es necesario que los datos estn ordenados segn dicha
variable.
16. Creacin de grficos
15
Ejemplos:
graph var1
graph var1 in 2/10, box
graph var1 var2 if dum==1
by iden: graph var1
Para grabar un grfico cuando lo creamos, debemos incluir la opcin saving, y un
nombre para el fichero que contendr el grfico. La extensin que Stata asigna a
este fichero es .gph. Ejemplo:
graph var1 var2 , saving(grafi1,replace)
Genera un grfico de la variable var1 sobre la variable var2 y lo guarda en un
fichero llamado grafi1.gph. La opcin replace reemplaza este fichero en caso de
que ya exista.
Si queremos recuperar por pantalla un grfico ya creado, lo haremos llamando al
fichero en el que lo hemos guardado. Por ejemplo:
15
15
clear
display
cd
exit
Salir de la aplicacin
help
cd
save
use
Grficos
hbar
Histogramas
scatter
diagramas de dispersin
Estadsticos descriptivos
codebook
Resumen de variables
hist
Histograma
tabulate
encode
Recodificacin automtica
describe
destring
drop
by varlist
encode
15
format
Definir un formato
generate
infile
input
label
list
Listar casos
merge
Combinar ficheros
move
log using
Resultados a fichero
log close
order
recode
Recodificar variable
rename
Renombrar variable
replace
set
sort /gsort
Ordenar el dataset
Anlisis de varianza
correlate
Correlacin
oneway
Anlisis de varianza
ranksum
Test de Wilcoxon
tabulate
table
ttest
Contraste de medias
Modelos de regresin
clogit
logit
Regresin logstica
logistic
Regresin logstica
15
Poisson
Regresin de Poisson
predict
regress
Regresin lineal
15
FUENTES DE CONSULTA
Curso de Extensin Stata 11 para Economistas. Universidad Catlica del Per.
Curso de Introduccin al paquete Stata. Jos Manuel Rojo Abun. 2008.
Una gua para primeros pasos en Stata:
www.gwilympryce.co.uk/teach/Stata_for_dummies_v1m.doc
15