Escolar Documentos
Profissional Documentos
Cultura Documentos
Bioestadstica
Bioestadstica
la opcion Help y siga las instrucciones en pantalla. Para terminar la sesin, cierre el programa
clickeando en el botn superior derecho (como cualquier otro programa Windows).
El programa Stata 8 nos presenta una variedad de iconos, que pueden agilizar el manejo y anlisis
de una base de datos.
Para abrir un archivo, use.
Para guardar archivo que se encuentra en memoria, save
Para poder imprimir un archivo, print
Para crear un archivo que guarde bitcoras del Stata Results, log
Para crear un archivo que guarde programas de ventana Review, do
Para abrir ventana de edicin de base de datos, edit
Para visualizar base de datos en uso, browse
COMANDO
DESCRIPCION
help
log
use
edit
codebook
describe
save
list
... if ...
drop
keep
label variable
label define
label values
Bioestadstica
comando lista de variables [if expression] [in expression], [opciones]
help. Para obtener ayuda de parte del programa stata 8
Para opciones generales del comando
. help
edit
Para ingresar los datos por medio de una ventana tipo hoja de calculo utilizamos el comando edit,
el cual apertura una ventana de ingreso de datos
edit
Al terminar de ingresar
datos haga click en el icono
preserve para no perder el
ingreso de datos realizado
Bioestadstica
codebook
Este comando muestra una lista de las variables sealando el tipo de variable, su rango,
frecuencias en caso de una variable cualitativa (codificada) media, desviacin estandar y
percentiles en caso fuera una variable continua.
Use C:\Stata8\auto.dta, clear
codebook
use "C:\Stata8\auto.dta", clear
mpg
Mileage (mpg)
--------------------------------------------------------------------------------------type: numeric (int)
range: [12,41]
units: 1
unique values: 21
missing .: 0/74
mean: 21.2973
std. dev: 5.7855
percentiles:
10%
25%
50%
75%
90%
14
18
20
25
29
rep78
units: 1
missing .: 5/74
describe
Este comando muestra una lista de las variables de la base de datos en uso.
. describe
Contains data from miarchi.dta
obs:
3
vars:
3
Bioestadstica
size:
102 (99.9% of memory free)
------------------------------------------------------------------------------storage display
value
variable name
type
format
label
variable label
------------------------------------------------------------------------------name
str20 %20s
age
float %9.0g
sex
str6
%9s
------------------------------------------------------------------------------Sorted by:
save
Para guardar datos que se han ingresado
save miarchi
Bioestadstica
Si no se muestra el directorio donde estara el archivo, por defecto se guarda el archivo en el
directorio C:\Data. Si el archivo ya habia sido creado anteriormente y se han ingresado datos
nuevamente se utiliza la opcion replace
save miarchi, replace
list. Presenta los valores de las variables. Si no presenta variables con el comando list, se
presentaran los valores de todas las variables
use "C:\Stata\auto.dta", clear
list drug age
1.
2.
3.
4.
5.
6.
7.
drug
1
1
1
1
...
...
...
age
39
66
70
44
...
...
...
if al final de un orden significa usar slo los datos especificados. if es permitido con la mayora
de los comandos de Stata.
list drug age if age > 45
2.
3.
9.
11.
14.
drug
1
1
1
1
1
age
66
70
48
63
64
Bioestadstica
label variable age "edad del paciente"
describe age
storage display value
variable name
type
format
label
variable label
------------------------------------------------------------------------------age
int
%8.0g
edad del paciente
label define. Es utilizado como un primer paso para el etiquetar valores de variables seleccionada
label define drogas 1 Megacilina 2 Tetracicilna 3 Oxacilina 4 Penicilina
label values. Es utilizado como segundo paso para el etiquetar valores de variables seleccionada
label values drug drogas
Bioestadstica
Exploracin y presentacin de datos.
generate
replace
merge
collapse
summarize
tabulate
table
graph
scatter
boxplots
bar
lines
stacked bar
mean
Genera variable
Reemplaza valores de variable bajo alguna condicin
Ingresa variables o casos de una base patrn a otra
Calculo de estadsticos descriptivos para variables cuantitativas
Anlisis para variable cuantitativa, media, mediana, etc
Tabla de frecuencias para variables cualitativas
Tabla de frecuencias simples para variables cualitativas
Crea un grafico de cualquier variable
Genera grafico de dispersin entre 2 variables
Grafico de cajas
Grafico de barras
Grafico de lineas
Grafico de barras apiladas
Grabar y editar review.
Uso del editor de programas (archivo .do)
Variables:
Variables Cuantitativas
o Variable Discretas
o Variable continuas
Variables Cualitativas
o Variable nominal
o Variable ordinal
Demostracin y explicacin
Definicin de tipos de datos, presentacin de datos en tablas de contingencia y resumen,
presentaciones grficas diversas. Estadstica descriptiva simple: medidas de tendencia central y
dispersin. Uso de archivos de bitcora (log),
1. Para el analisis de las variables numericas tenemos el comando summarize, el cual calcula
estadisticos de tendencia central, asi como de distribucion.
Entonces trabajando con el archivo de c:\stata\cancer.dta, tenemos
generate. Genera una variable que va a ser recodificada, por ejemplo si tenemos en uso el
archivo cancer (c:\stata\cancer.dta) y queremos recodificar la variable age en una nueva variable
age1 que contenga los intervalos de edad 45-50 51-55 56-60 61a+. Entonces seguimos los pasos
correspondientes para el ejemplo
Bioestadstica
Para abrir el archivo cancer
use c:\stata\cancer.dta, clear
Generando la variable age1 con valores iguales a age
generate age1 = age
Para reemplazar valores en la nueva variable age1, utilizamos el comando replace, if y
operadores logicos y de relacion
replace age1 = 0 if age <=50
replace age1 = 1 if age > 50 & age <= 55
replace age1 = 2 if age > 55 & age <= 60
replace age1 = 3 if age > 60
. replace age1 = 0 if age <=50
(12 real changes made)
. replace age1 = 1 if age > 50 & age <= 55
(11 real changes made)
. replace age1 = 2 if age > 55 & age <= 60
(14 real changes made)
. replace age1 = 3 if age > 60
(11 real changes made)
summarize. El presente comando es una opcin para obtener estadsticos
descriptivos para variables cuantitativas.
. summarize age
Variable | Obs
Mean Std. Dev.
Min
Max
-------------+----------------------------------------------------age | 48 55.875 5.659205
47
67
. summarize studytime age
Variable | Obs
Mean Std. Dev.
Min
Max
-------------+----------------------------------------------------studytime | 48
15.5 10.25629
1
39
age | 48
55.875 5.659205
47
67
Bioestadstica
10%
25%
49
50.5
50%
56
75%
90%
95%
99%
60
65
67
67
48
49
Largest
65
67
67
67
Obs
Sum of Wgt.
48
48
Mean
Std. Dev.
55.875
5.659205
Variance
Skewness
Kurtosis
32.0266
.3161066
2.125197
Para generar estadsticos para una determinada variable cuantitativa, necesitamos colocar los
estadisticos sobre un parentecis
merge. El comando nos ayuda a unir informacin entre bases de datos relacionadas.
Ejemplo: uno a uno merge
. use ds1
. merge using ds2
collapse. Reporta estadsticas sobre tendencia central.
El siguiente ejercicio muestra como se podra solicitar las estadsticas descriptivas.
collapse (mean) age (median) systolic, by (drug)
tabulate. Para trabajar variables cualitativas como factores, sexo, grupos de edad, etc
. tabulate
drug
Drug type |
(1=placebo) |
Freq.
Percent
Cum.
------------+----------------------------------1 |
20
41.67
41.67
2 |
14
29.17
70.83
3 |
14
29.17
100.00
------------+----------------------------------Total |
48
100.00
Freq, representa al numero pacientes por tipo de droga que se reseto, percent, el porcentaje de
pacientes que fue tratado por algun tipo de droga. Cum., el porcentaje acumulado.
tabulate
1 if |
patient |
Bioestadstica
died |
Mean
Std. Dev.
Freq.
------------+-----------------------------------0 |
54.176471
5.4340971
17
1 |
56.806452
5.6475325
31
------------+-----------------------------------Total |
55.875
5.6592045
48
Table. Este comando calcula frecuencias simple, adems puede calcular otros estadstico
sealados por el usuario, utilizando la opcin contents
. table
Para poder realizar grficos tenemos el comando graph, y sus diferentes variedades segn el tipo
de grfico que se quiere realizar.
Histograma
Ejemplo:
histogram age
Fraction
.3125
0
47
67
Automticamente el programa Stata8 divide el grafico en 5 barras, depende del usuario el numero
de intervalos que se desean obtener, esto utilizando la opcin bi {graph age, bi(7) }.
Grafico de dispersin
scatter studytime age
Bioestadstica
39
1
47
67
Grafico de cajas
graph box age, over(drug)
Patient's age at start of exp.
67
47
1
Bioestadstica
Grafico de Linea
line birthrt year
45.1002
6.60003
194019431946194919521955195819611964196719701973197619791982198519881991
year
do.
Archivo donde se archivan los programas ejecutados en sesin de Stata, para ello debemos hacer
clic en la parte superior derecha de la ventana de Review y hacer clic en la opcin Save Review
Contents.