Escuela de ingeniera electrnica en telecomunicaciones y redes Probabilidad y estadstica
Informe estadstico de la Cooperativa de Ahorro y Crdito San Martin.
Daniel Chico 395
Cuarto A
Marzo Agosto
2014 INTRODUCCIN
La estadstica es una ciencia formal y una herramienta que estudia el uso y los anlisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigacin cientfica.
Distribucin normal Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales. La estadstica se divide en dos grandes reas: Estadstica descriptiva Se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, grfico circular, entre otros. Estadstica inferencial Se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas s/no (prueba de hiptesis), estimaciones de unas caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.
Tema:
Anlisis estadstico de una base de datos acerca del registro de crditos realizados por la Cooperativa de Ahorro y Crdito San Martin.
Objetivos
General
Realizar un anlisis estadstico con la intencin de obtener informacin concerniente al departamento de crditos de la Cooperativa de Ahorro y Crdito San Martin.
Especficos
Aplicar los conocimientos tericos adquiridos en el aula de clases y ponerlos en prctica en la vida real. Aplicar metodologas que nos permitan obtener resultados de los campos considerados como ms relevantes dentro de la base de datos. Analizar la informacin estadstica que arrojan las distintas metodologas aplicadas durante el anlisis Interpretar los resultados obtenidos de manera que sea comprensible para la colectividad.
Marco terico
Estadstica descriptiva La Estadstica descriptiva registra los datos en tablas y los representa en grficos. Calcula los parmetros estadsticos (medidas de centralizacin y de dispersin), que describen el conjunto estudiado.
Tablas de estadstica La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Frecuencia absoluta La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni.
Frecuencia absoluta acumulada La frecuencia absoluta acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi. Y el resultado de la frecuencia absoluta acumulada es igual al nmero de estadsticos N. Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. La suma de todos estos porcentajes da como resultado el 100% Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta
. Xi Recuento fi Fi fr Fr 27 I 1 1 0.032 0.032 28 II 2 3 0.065 0.097 29 IIIIII 6 9 0.194 0.290 30 IIIIIII 7 16 0.226 0.0516 31 IIIIIIII 8 24 0.226 0.774 32 III 3 27 0.097 0.871 33 III 3 30 0.097 0.968 34 I 1 31 0.032 1 31 1 Este tipo de tablas de frecuencias se utiliza con variables discretas.
Anlisis de la base de datos
Procedimiento
Una vez obtenida la base de datos y mediante un exhaustivo anlisis y debate se acord tomar como relevantes los siguientes campos (edad, monto, taza porcentual, sexo y ocupacin). Posteriormente usando el programa R, se vincul el mismo a la base de datos, que se encuentra en una hoja de clculo Excel, para facilitar el trabajo al ingresar sus datos de manera automtica, ya que al insertarlos de manera manual es poco fiable al trabajar con una base de datos extensa. Tambin con la ayuda de este programa y con los comandos adecuados se puede obtener resultados relevantes de cada campo seleccionado, con los cuales se puede empezar los estudios.
Pasos para la obtencin resultados
1. Primero visualizamos en la pantalla la base de datos de manera completa con todos los campos y el contenido de cada uno de estos. (>head(Datos)) A partir de lo observado en pantalla comenzaremos con nuestro anlisis estadstico acerca de los mismos y determinaremos o concluiremos varios aspectos que estos nos proporcionan.
2. Mostramos el tamao de la base de datos el cual consta de 22x478 datos. ( >dim(Datos))
3. Mostramos todos los campos que posee nuestro registro de crditos. (> attach(Datos))
4. A continuacin obtenemos la frecuencia absoluta del campo edad para conocer en cuantas categorias se divide y conocer cuntos miembros pertenecen a cada una de estas con ayuda del comando (fab_edad=table(EDAD))
5. De manera similar se calculan las diferentes frecuencias absolutas de los parmetros con los cuales estamos trabajando, como son: Monto de dinero que se presta. (fab_mont=table(MONTO)) Tasa porcentual al cual se presta el dinero (fab_tprc=table(TASA.PORCENTUAL)) Sexo de las personas quienes piden el prstamo. (fab_sex=table(SEXO)) Ocupaciones que tienen las personas que hacen uso del prstamo. (fab_ocup=table(OCUPACION))
6. Calculamos la frecuencia relativa de cada uno de los campos para saber el porcentaje de cada una de las clasificaciones conocidas de cada campo. Frecuencia relativa del campo edad (frel_edad=prop.table(fab_edad)) Frecuencia relativa del campo monto (frel_mont=prop.table(fab_mont)) Frecuencia relativa del campo taza porcentual (frel_sex=prop.table(fab_sex)) Frecuencia relativa del campo sexo (frel_tprc=prop.table(fab_tprc)) Frecuencia relativa del campo ocupacin (frel_ocup=prop.table(fab_ocup))
7. Obtenemos la frecuencia absoluta acumulada de todos los campos mencionados anteriormente, de cada una de las clasificaciones de los mismos. Frecuencia absoluta acumulada del campo edad (faa_edad=cumsum(fab_edad)) Frecuencia absoluta acumulada del campo monto (faa_mont=cumsum(fab_mont)) Frecuencia absoluta acumulada del campo taza porcentual (faa_tprc=cumsum(fab_tprc)) Frecuencia absoluta acumulada del campo sexo (faa_sex=cumsum(fab_sex) ) Frecuencia absoluta acumulada del campo ocupacin (faa_ocup=cumsum(fab_ocup))
8. Calculamos la frecuencia relativa acumulada de todos los campos mencionados anteriormente, de cada una de las clasificaciones de los mismos. Frecuencia relativa acumulada del campo edad fra_edad=cumsum(frel_edad)) Frecuencia relativa acumulada del campo monto (fra_mont=cumsum(frel_mont)) Frecuencia relativa acumulada del campo taza porcentual (fra_tprc=cumsum(frel_tprc)) Frecuencia relativa acumulada del campo sexo (fra_sex=cumsum(frel_sex) ) Frecuencia relativa acumulada del campo ocupacin (fra_ocup=cumsum(frel_ocup))
9. Procedemos a realizar relaciones entre campos edad-sexo para conocer el nmero de personas de un determinado sexo y edad que realizan los prstamos. Tabla=table(EDAD,SEXO) > Tabla=prop.table(Tabla,1)
10. Finalmente procedemos a representar de manera grfica todo lo anteriormente calculado. EDAD
Por lo observado en la grfica tanto por nmero de socios como por porcentaje se puede decir que la edad promedio en la que las personas solicitan un crdito es a los 22 aos y la edad en las que menos crditos realizan va desde los 67 a los 81 aos.
Esta grafica nos permite ver la suma de las edades en las cuales solicitan los crditos de igual manera se observa lo mencionado antes dando como resultado el nmero de clientes que solicitaron el crdito tanto en cantidad como en porcentaje.
MONTO
Se observa tanto en cantidad como en porcentaje que la mayora de socios solicita crditos con un monto promedio de 1000 dlares, y tambin que existen diferentes cifras que son las menos frecuentes al momento de solicitar un crdito.
De igual manera se observa la grfica que muestra la suma en cantidad y porcentaje de todos los montos de los prstamos que realizan los socios con el nmero de los mismos.
TASA PORCENTUAL
Esta vez se puede ver tanto en cantidad como en porcentaje que la tasa promedio porcentual que cobra la cooperativa por los crditos es del 22.5 %
.
De manera anloga a la anterior se muestra la grfica con la suma de cantidades y porcentajes de todas las tasas porcentuales que tiene la cooperativa con sus respectivos valores.
SEXO
Esta grafica nos muestra tanto en valores como en porcentajes el sexo que ms solicita crditos dentro de la cooperativa y en este caso por una diferencia pequea se puede decir que los que ms solicitan crdito son del sexo masculino.
Igualmente se manifiesta una grfica con valores y porcentajes de las suma de los sexos de los socios que pertenecen a la cooperativa y se corrobora lo antes mencionado.
OCUPACIONES
En esta grafica de ocupaciones se muestra tanto en valores como en porcentaje que la ocupacin promedio de los socios es agricultor.
De igual forma otra grafica con todas las ocupaciones en valor y porcentajes y las sumas de los mismos para aseverar que lo expuesto anteriormente es verdad.