Você está na página 1de 27

INTRODUCCIN A R

Daniel Miranda

CONTENIDOS

Caractersticas de R
Instalacin
Trabajando en R (GUI para Windows)
Tipos de objetos
Lectura de datos
Manipulacin simple de datos en R

R
Corresponde ms a un marco de anlisis estadstico
que a un programa estadstico
Los anlisis operan en base a paquetes o libreras
Existen muchas libreras disponibles para diversas
funciones
Particularidad: el anlisis se orienta a objetos (detalle
ms adelante)

R
Ventajas:

Gratis
Flexible, posibilidad de aadir nuevas funciones (libreras)
Permite anlisis estadsticos avanzados (Como otros programas)
Expansin constante (Lo que puede ser una desventaja)
Posibilidad de importar/leer datos desde diferentes formatos (SPSS,
Stata, SAS, Excel, etc.)
Capacidades grficas
Disponible para distintos sistemas operativos (Windows, Mac, Linux)
Favorece compresin de los anlisis y la documentacin del proceso
de investigacin

INSTALACIN
Visitar la pgina de CRAN (Comprehensive R Archive Network)
http://cran.r-project.org/

INSTALACIN
Seleccionar versin segn sistema operativo (Ej. Windows)
Instalar "base"
En el caso de Windows, el programa R GUI (Graphical User Interface)
se agrega a la lista de programas y aparece cono de acceso desde el
escritorio.
Existen otras interfaces grficas (GUIs) para trabajar con R, como el R
Commander o Java GUI for R (Jaguar), Deducer, R-Studio, etc.
Actualizacin:
Bajar e instalar nueva versin
Copiar libreras de carpeta antigua a la nueva
Actualizar libreras (update packages)

TRABAJANDO EN R (GUI FOR WINDOWS)

Consola
Entorno bsico para
la introduccin de
comandos y la
presentacin de los
resultados

Editor
Escribir/guardar
cdigo y
comentarios al
anlisis

TRABAJANDO EN R
Desde el editor
File -> new script
Archivo en que se ingresan los comandos correspondientes a un
anlisis especfico, los cuales pueden ser guardados y
ejecutados posteriormente
Para correr los comandos desde el editor, posicionar el cursor en
la lnea respectiva y luego "ctrl r" o "F5", o con el cono de
ejecucin
Para grabar scripts: File -> save as
Por defecto graba con extensin .R, pero es slo un archivo
de formato simple (txt) que se puede abrir con cualquier
editor de texto (ej. Block de notas).
Para abrir script grabado: File -> open script

R STUDIO
Visitar la pgina de RStudio
http://www.rstudio.com

TRABAJANDO EN R STUDIO
Establecer directorio de trabajo (donde se buscan y
guardan los archivos)
getwd(): obtener directorio de trabajo actual
setwd("ruta"): establecer directorio de trabajo
Ej:
setwd("C:/Documents and Settings/DM/Mis
documentos/proyecto1")

-Nota:
- las carpetas de ruta van separadas por slash (/)y no por backslash (\)
-Para establecer un directorio raiz como rea de trabajo: setwd("C:/")

10

TRABAJANDO EN R STUDIO
Libreras
Conjunto de funciones que tienen una relacin entre ellas y que
usualmente vienen acompaadas de ficheros de ayuda
(documentacin)
Algunas libreras vienen preinstaladas, otras especficas hay que
instalarlas de acuerdo a las necesidades del usuario
Para conocer la lista de libreras instaladas: library()
Para instalar:
install.packages("librera"), en el caso que se sepa el
nombre especfico de la librera que se quiera instalar
O mediante men : Packages > Install package(s)
Las libreras se instalan slo 1 vez, pero deben ser cargadas si se
quieren utilizar en la sesin de trabajo
library(library)
11

TRABAJANDO EN R STUDIO
Instalar libreras

Luego, seleccionar mirror (Chile)


Seleccionar paquete
Para desintalar librerias: remove.packages("librera")
Para explorar libreras disponibles: http://cran.r-project.org/,
organizadas por rea en Task Views

12

TRABAJANDO EN R STUDIO
Ej: instalar librera psy
install.packages(foreign")
library(foreign)
? foreign # Ayuda
Ejecutar ejemplos de la ayuda para ver opciones y posibilidades de
la librera

13

OBJETOS
R es un programa orientado a objetos, los que son creados
por funciones, que en su forma ms general sera:
Objeto <- funcin
<- es equivalente a =
Diferentes tipos de objetos: vectores, factores, matrices,
marco de datos (entre otros)
Objetos simples:
Datos numricos
> x <- 5 # el nmero 5 es asignado al objeto x
> x
[1] 5

Carcter
> a <-

"hoy"
14

OBJETOS
Vectores
Objeto unidimensional constituido por elementos del
mismo tipo
ob1=50 #Crea objeto
ob2=35
ob3=45
#Concatena objetos en un vector
edad=c(ob1, ob2, ob3) #c es por concatenate

Ob1 # Muestra el contenido del objeto


Edad

Ejemplo de operaciones con vectores numricos


mean(edad)
summary(edad)
15

OBJETOS
Vectores: funciones estadsticas asociadas

16

OBJETOS
Factores
Modo que utiliza R para almacenar variables categricas
> sexo <- c(rep(mujer", 700), rep(varon", 569)) #
crea vector de caracteres
> sexo

Para convertir el vector en factor:


> sexo <- as.factor(sexo)
> levels(sexo)
> table(sexo)

17

LECTURA DE BASES DE DATOS


Indicndole la ruta donde se encuentra la base de
datos
data = read.table("C:/Users/Desktop/datos.txt", header=T)

Mtodo alternativo (sin indicarle la ruta donde se

encuentra la base de datos)


data = read.table(file.choose(), header=T)

Si es un archivo .csv (datos en excel delimitado por comas):


data = read.table(file.choose(), header=T, sep=", ")

18

EJEMPLO DE LECTURA DE BASES DE DATOS


> data = read.table(file.choose(), header=T)
> attach(data)
permite acceso a los datos por el nombre de las
variables
> names(data)
muestra los nombres de las variables de la base
de datos
> fix(data)
muestra en detalle toda la base de datos
(permite editar el nombre de las variables)

Se debe tener cuidado con el nombre que se le asigna a


los objetos.
R es un programa "Case sensitive", es decir, R hace
distincin entre MAYSCULAS y minsculas.
data es diferente de DATA

19

EJEMPLO DE LECTURA DE BASES DE DATOS


# Lectura de dataframe desde archivo externo (Noo se recomienda)
data=read.table(file.choose(), header=T, sep=",") # lectura base ejemp_1.cs
data
str(data)
attach(data)

# CSV (comma separated values)


dat.csv <- read.csv("http://www.ats.ucla.edu/stat/data/hsb2.csv")
View(dat.csv)
# separador tab (tab separated values)
dat.tab <- read.table("http://www.ats.ucla.edu/stat/data/hsb2.txt",
header=TRUE, sep = "\t")

20

EJEMPLO DE LECTURA DE BASES DE DATOS


library(foreign)
# Formato SPSS
dat.spss <read.spss("http://www.ats.ucla.edu/stat/data/hsb2.sav",to.data.frame=TRUE)
# Formato Stata
dat.dta <- read.dta("http://www.ats.ucla.edu/stat/data/hsb2.dta")
# Lectura de dataframe desde carpeta local
ejem= read.spss("C:/Users/DANIEL/Dropbox/PHD_Sociologia/Ayudantas/2015
Cuantitativa Avanzada I/Ayudantas 2015/ej1.sav")

21

EJEMPLO DE LECTURA DE BASES DE DATOS


# Lectura de dataframe desde carpeta local
ejem= ead.spss("C:/Users/DANIEL/Dropbox/PHD_Sociologia/Ayudantas/2015
Cuantitativa Avanzada I/Ayudantas 2015/ej1.sav")
# Algunas funciones aplicadas
names(ejem)
head(ejem)
summary(ejem)
str(ejem)

mean(ejem$conoce) # Promedio de variable


attach(ejem) # accesa variables del objeto
mean(conoce) # Promedio

22

23

ESCRITURA DE BASES DE DATOS


R tambin nos permite guardar bases de datos con
otra extensin(.txt, .csv, etc.).
>write.table(data,file="data1.csv",sep=",",row.names=FALSE,col.names=TRUE)

Nombre de la
nueva base
de datos

Base de
datos
cargada en R

Separacin por
comas (para
guardarlo en .csv)

Excluye el
nmero de filas

Incluye el
nombre de la
primera columna
(nombre de las
variables)

24

MANIPULACIN DE BASE DE DATOS


> data[1,]
> data[1:10,]
> data[,1]
> data[,1:5]
> data[1,1]
> data[1:10,1:5]
> data[c(1,3,6),]
> data[,c(2,8,9)]
> data[,-c(2)]

> data[-c(1),]
na.omit(data)
v

muestra la fila 1 del dataframe


muestra las filas 1 a 10 del dataframe
muestra la columna 1 del dataframe
muestra las columnas 1 a 5 del dataframe
muestra el dato de la fila 1 y columna 1 del
dataframe
muestra datos en las coordenadas indicadas
muestra slo los sujetos 1, 3 y 6
muestra slo las variables 2, 8 y 9
muestra todas las variables a excepcin de la
variable 2
muestra todos los sujetos a excepcin del
sujeto 1
muestra registros que no contengan missing
alues (datos perdidos).
25

MANIPULACIN DE BASE DE DATOS


Si se desea hacer una sub base, es decir, una base de
datos ms chica una vez cargada la base de datos
original se debe hacer lo siguiente:
> names(data)

> data1 = data[,c(1,5,8)]

Nueva base
de datos
llamada
data1"

Adems de mostrar el nombre de las


variables, muestra el nmero que se
le asigna a cada variable
data1 tendr slo las variables 1 ,5 y
8 de la base de datos original

Base de datos original que


contiene slo las variables
1, 5 y 8

26

EJEMPLO SESIN ANLISIS DE DATOS CON R

27

Você também pode gostar