Escolar Documentos
Profissional Documentos
Cultura Documentos
Introduccin al Anlisis de datos con R Curso para profesores de la Escuela de Estadstica de la UASD
Andrs Guerrero1
1 Profesor
Enero 10 2010
Andrs Guerrero
Contenido
Anlisis de Datos Conceptos Objetivos Caractersticas Matrz de datos Introduccin a R Generalidades Caractersticas Uso
Andrs Guerrero
Contenido
Anlisis de Datos Conceptos Objetivos Caractersticas Matrz de datos Introduccin a R Generalidades Caractersticas Uso
Andrs Guerrero
Anlisis de Datos I
Los problemas que nos presenta la vida demandan que encontremos soluciones. Buscar una solucin implica tomar decisiones. Para seleccionar entre las alternativas posibles una solucin necesitamos informacin como base para tomar decisiones. Al proporcionarnos tcnicas o procedimientos para manipular los datos que podemos recolectar acerca de un problema, el anlisis de datos nos permite obtener informacin. Analizar: Descomponer un todo en sus partes para estudiar cada parte. Datos: Representacin (codicacin o medicin) vinculada a una caracterstica (variable) relativa al problema en el que estamos interesados.
Andrs Guerrero Introduccin al anlisis de datos con R
Anlisis de Datos II
En la parte conceptual del anlisis de datos estudiamos el problema usando un modelo para representar la realidad de manera simplicada mostrando as nuestra comprensin de la misma. El modelo (que generalmente es un modelo matemtico) expresa la relacin existente entre las variables seleccionadas del problema que estudiamos. En la parte aplicada del anlisis de datos aplicamos el modelo a los datos disponibles para obtener la informacin necesaria para tomar una decisin.
Andrs Guerrero
Contenido
Anlisis de Datos Conceptos Objetivos Caractersticas Matrz de datos Introduccin a R Generalidades Caractersticas Uso
Andrs Guerrero
Objetivos del anlisis de datos (en este curso): Resumen de datos. Estadstica descriptiva. Medidas de tendencia central y de dispersin o variabilidad. Identicacin de relaciones. Anlisis de regresin y correlacin lineal. Inferencia. Comparacin de dos grupos. Prueba t (student). Existe independencia entre las variables? Prueba ji-cuadrado.
Andrs Guerrero
Objetivos del anlisis de datos (en este curso): Resumen de datos. Estadstica descriptiva. Medidas de tendencia central y de dispersin o variabilidad. Identicacin de relaciones. Anlisis de regresin y correlacin lineal. Inferencia. Comparacin de dos grupos. Prueba t (student). Existe independencia entre las variables? Prueba ji-cuadrado.
Andrs Guerrero
Objetivos del anlisis de datos (en este curso): Resumen de datos. Estadstica descriptiva. Medidas de tendencia central y de dispersin o variabilidad. Identicacin de relaciones. Anlisis de regresin y correlacin lineal. Inferencia. Comparacin de dos grupos. Prueba t (student). Existe independencia entre las variables? Prueba ji-cuadrado.
Andrs Guerrero
Contenido
Anlisis de Datos Conceptos Objetivos Caractersticas Matrz de datos Introduccin a R Generalidades Caractersticas Uso
Andrs Guerrero
Anlisis de Datos IV
Presentacin de datos: Texto Tabla Grca Tipos de datos: Cualitativos. Cuantitativos. Escalas de medicin: Nominal. Ordinal. Intervalo. Razn.
Andrs Guerrero Introduccin al anlisis de datos con R
Anlisis de Datos IV
Presentacin de datos: Texto Tabla Grca Tipos de datos: Cualitativos. Cuantitativos. Escalas de medicin: Nominal. Ordinal. Intervalo. Razn.
Andrs Guerrero Introduccin al anlisis de datos con R
Anlisis de Datos IV
Presentacin de datos: Texto Tabla Grca Tipos de datos: Cualitativos. Cuantitativos. Escalas de medicin: Nominal. Ordinal. Intervalo. Razn.
Andrs Guerrero Introduccin al anlisis de datos con R
Contenido
Anlisis de Datos Conceptos Objetivos Caractersticas Matrz de datos Introduccin a R Generalidades Caractersticas Uso
Andrs Guerrero
Anlisis de Datos V
Matriz de datos: Compuesta de n las y m columnas. Las las contienen los datos de las observaciones (objetos o sujetos bajo estudio). Las columnas contienen los datos de las variables (mediciones realizadas para cada objeto o sujeto).
Andrs Guerrero
Contenido
Anlisis de Datos Conceptos Objetivos Caractersticas Matrz de datos Introduccin a R Generalidades Caractersticas Uso
Andrs Guerrero
El entorno de computacin R
Qu es R? Historia Paradigma de programacin: Cdigo libre y programacin orientada a objetos Comunidad (red) que hace posible a R Modos de operacin: Calculadora e interpretador Ventajas y desventajas
Andrs Guerrero
Qu es R?
Entorno para analizar datos que implementa de manera especial tcnicas estadsticas (tradicionales y novedosas) Lenguaje de programacin para computacin estadstica y grcas
Andrs Guerrero
Porqu R? Propsito
Anlisis de datos. Computacin con modelos estadsticos Grcas Aprender a resolver problemas paso a paso Soluciones a problemas en reas especializadas (paquetes) Escribir funciones (algoritmos) no disponibles en software comercial
Andrs Guerrero
Contenido
Anlisis de Datos Conceptos Objetivos Caractersticas Matrz de datos Introduccin a R Generalidades Caractersticas Uso
Andrs Guerrero
Porqu R? Caractersticas I
Diseado a partir de S (con excepciones, cdigo S corre en R) Extensible va paquetes. Flexibilidad muy grande pues el usuario puede escribir sus propias funciones en R. El entusiasmo en la comunidad de R es tal que puede ser que ya exista la funcin que Ud quiere crear. Con software propietario esto es difcil, raras veces es posible. Cdigo C, C++ y FORTRAN se puede conectar y ejecutar desde R Maneja objetos Las funciones son objetos, los datos son objetos, los modelos son objetos
Andrs Guerrero Introduccin al anlisis de datos con R
Porqu R? Caractersticas II
Interpretador (lnea de comandos provee interactividad) Corre en diversas plataformas (UNIX, Windows, MAC) Compatible (tiene interfases) con lenguajes de programacin, bases de datos, etc. Historia de la sesin se guarda
Andrs Guerrero
Contenido
Anlisis de Datos Conceptos Objetivos Caractersticas Matrz de datos Introduccin a R Generalidades Caractersticas Uso
Andrs Guerrero
Porqu R? Red
Equipo central de desarrollo (R Development core team) Distribuido va CRAN www.r-project.org Licencia GNU (proyecto de cdigo libre) Gratis Cdigo fuente disponible Ampliamente usado por la comunidad acadmica Journals y publicaciones cientcas Enseanza universitaria Extensiva ayuda Manuales y Documentos contribuidos en CRAN Listas de correo Libros de texto que ejemplican su uso
Andrs Guerrero Introduccin al anlisis de datos con R
Desventajas?
Curva de aprendizaje muy inclinada. Ayuda a pensar el porqu (pensamiento crtico) Carece de GUI en la mayora de plataformas. R Commander (John Fox) disponible en Windows
Andrs Guerrero
Resumen
R es una poderosa herramienta para analizar datos, construir grcas y hacer clculos estadsticos. En este breve curso apreciaremos su versatilidad y utilidad.
Andrs Guerrero
Manejo de la sesin en R (Inicio y Fin) Manejo del ambiente de trabajo y objetos en R R como calculadora Manejando datos con R Estadstica Descriptiva (Resumen de datos) Regresin Lineal Grcas Tablas de frecuencias y datos categricos Trabajando con matrices Introduccin a la inferencia estadstica Programacin en R
Andrs Guerrero Introduccin al anlisis de datos con R
Gracias a
Donald Knuth por TEX
A Leslie Lamport por LTEX
Till Tantau por Beamer Adobe Systems por PDF Richard Gentleman y Ross Ihaka por R R Development Core Team por mantener R y a miles de acadmicos, cienticos, profesionales y voluntarios en todo el mundo por su espiritu altrusta y generoso al aportar sus esfuerzos para que estas herramientas sean una hermosa realidad para el desarrollo de la educacin y la ciencia.
Andrs Guerrero Introduccin al anlisis de datos con R